Секвенирование белков

Секвенирование белка — это практический процесс определения аминокислотной последовательности всего или части белка или пептида . Это может служить для идентификации белка или характеристики его посттрансляционных модификаций . Обычно частичное секвенирование белка предоставляет достаточную информацию (один или несколько тегов последовательности) для его идентификации со ссылкой на базы данных последовательностей белка , полученных из концептуальной трансляции генов .

Два основных прямых метода секвенирования белков — это масс-спектрометрия и деградация Эдмана с использованием секвенатора белков (секвенатора). Методы масс-спектрометрии в настоящее время наиболее широко используются для секвенирования и идентификации белков, но деградация Эдмана остается ценным инструментом для характеристики N -конца белка .

Определение аминокислотного состава

Часто желательно знать неупорядоченный аминокислотный состав белка до того, как пытаться найти упорядоченную последовательность, так как это знание может быть использовано для облегчения обнаружения ошибок в процессе секвенирования или для различения неоднозначных результатов. Знание частоты определенных аминокислот может также использоваться для выбора протеазы , которую следует использовать для переваривания белка. Также может быть определено неправильное включение низких уровней нестандартных аминокислот (например, норлейцина) в белки. ^[1] Обобщенный метод, часто называемый аминокислотным анализом ^[2], для определения частоты аминокислот выглядит следующим образом:

Гидролизовать известное количество белка на составляющие его аминокислоты.
Разделите и количественно определите аминокислоты каким-либо способом.

Гидролиз

Гидролиз осуществляется путем нагревания образца белка в 6 М соляной кислоте до 100–110 °C в течение 24 часов или дольше. Белки со множеством объемных гидрофобных групп могут потребовать более длительного нагрева. Однако эти условия настолько интенсивны, что некоторые аминокислоты ( серин , треонин , тирозин , триптофан , глутамин и цистеин ) разрушаются. Чтобы обойти эту проблему, Biochemistry Online предлагает нагревать отдельные образцы в течение разного времени, анализировать каждый полученный раствор и экстраполировать обратно к нулевому времени гидролиза. Расталл предлагает различные реагенты для предотвращения или уменьшения деградации, такие как тиоловые реагенты или фенол для защиты триптофана и тирозина от воздействия хлора и предварительное окисление цистеина. Он также предлагает измерять количество выделяющегося аммиака для определения степени гидролиза амида .

Разделение и количественное определение

Аминокислоты могут быть разделены с помощью ионообменной хроматографии, а затем дериватизированы для облегчения их обнаружения. Чаще всего аминокислоты дериватизируются, а затем разделяются с помощью обращенно-фазовой ВЭЖХ .

Пример ионообменной хроматографии приводит NTRC с использованием сульфированного полистирола в качестве матрицы, добавлением аминокислот в кислом растворе и пропусканием буфера с постоянно увеличивающимся pH через колонку. Аминокислоты элюируются, когда pH достигает их соответствующих изоэлектрических точек . После разделения аминокислот их соответствующие количества определяются путем добавления реагента, который образует окрашенное производное. Если количество аминокислот превышает 10 нмоль, для этого можно использовать нингидрин ; он дает желтый цвет при реакции с пролином и яркий фиолетовый с другими аминокислотами. Концентрация аминокислоты пропорциональна поглощению полученного раствора. При очень малых количествах, вплоть до 10 пмоль, флуоресцентные производные могут быть образованы с использованием таких реагентов, как орто-фталальдегид (OPA) или флуорескамин .

Предколоночная дериватизация может использовать реагент Эдмана для получения производного, которое обнаруживается УФ-светом. Более высокая чувствительность достигается при использовании реагента, который генерирует флуоресцентное производное. Дериватизированные аминокислоты подвергаются обращенно-фазовой хроматографии, как правило, с использованием колонки с силикагелем C8 или C18 и оптимизированного градиента элюирования . Элюирующие аминокислоты обнаруживаются с помощью УФ- или флуоресцентного детектора, а площади пиков сравниваются с площадями пиков для дериватизированных стандартов для количественного определения каждой аминокислоты в образце.

Н-концевой аминокислотный анализ

Определение того, какая аминокислота образует N -конец пептидной цепи , полезно по двум причинам: для облегчения упорядочения последовательностей отдельных пептидных фрагментов в целую цепь, и потому что первый раунд деградации Эдмана часто загрязнен примесями и, следовательно, не дает точного определения N -концевой аминокислоты. Обобщенный метод анализа N -концевых аминокислот следующий:

Реагируйте пептидом с реагентом, который селективно метит концевую аминокислоту.
Гидролизовать белок.
Определите аминокислоту методом хроматографии и сравнения со стандартами.

Существует множество различных реагентов, которые можно использовать для маркировки терминальных аминокислот. Все они реагируют с аминогруппами и, следовательно, также связываются с аминогруппами в боковых цепях аминокислот, таких как лизин, — по этой причине необходимо быть осторожным при интерпретации хроматограмм, чтобы убедиться, что выбрано правильное место. Два из наиболее распространенных реагентов — это реагент Сэнгера ( 1-фтор-2,4-динитробензол ) и производные дансила, такие как дансилхлорид . Фенилизотиоцианат , реагент для деградации Эдмана, также можно использовать. Здесь применимы те же вопросы, что и при определении аминокислотного состава, за исключением того, что окрашивание не требуется, поскольку реагенты производят окрашенные производные, и требуется только качественный анализ. Таким образом, аминокислоту не нужно элюировать из хроматографической колонки, достаточно сравнить ее со стандартом. Еще одно соображение, которое следует учитывать, заключается в том, что поскольку все аминогруппы прореагируют с реагентом для маркировки, ионообменную хроматографию использовать нельзя, вместо этого следует использовать тонкослойную хроматографию или жидкостную хроматографию высокого давления .

Анализ С-концевых аминокислот

Число методов, доступных для анализа аминокислот C-конца, намного меньше числа доступных методов анализа N-конца. Наиболее распространенный метод заключается в добавлении карбоксипептидаз к раствору белка, взятии образцов через регулярные интервалы времени и определении терминальной аминокислоты путем анализа графика концентрации аминокислот в зависимости от времени. Этот метод будет очень полезен в случае полипептидов и заблокированных белком N-концов. Секвенирование C-конца может значительно помочь в проверке первичных структур белков, предсказанных из последовательностей ДНК, и в обнаружении любой посттрансляционной обработки продуктов генов из известных последовательностей кодонов.

деградация Эдмана

Деградация Эдмана является очень важной реакцией для секвенирования белка, поскольку она позволяет обнаружить упорядоченный аминокислотный состав белка. Автоматизированные секвенаторы Эдмана в настоящее время широко используются и способны секвенировать пептиды длиной до примерно 50 аминокислот. Ниже приведена схема реакции для секвенирования белка с помощью деградации Эдмана; некоторые из шагов подробно описаны далее.

Разрушьте любые дисульфидные мостики в белке с помощью восстановителя, например, 2-меркаптоэтанола . Защитная группа , например, иодуксусная кислота, может быть необходима для предотвращения повторного формирования связей.
Разделите и очистите отдельные цепи белкового комплекса, если их несколько.
Определите аминокислотный состав каждой цепи.
Определите конечные аминокислоты каждой цепи.
Разбейте каждую цепь на фрагменты длиной менее 50 аминокислот.
Разделите и очистите фрагменты.
Определите последовательность каждого фрагмента.
Повторите то же самое с другим рисунком декольте.
Постройте последовательность всего белка.

Расщепление на пептидные фрагменты

Пептиды длиной более 50–70 аминокислот не могут быть надежно секвенированы методом деградации Эдмана. Из-за этого длинные белковые цепи необходимо разбить на небольшие фрагменты, которые затем можно секвенировать по отдельности. Переваривание осуществляется либо эндопептидазами, такими как трипсин или пепсин , либо химическими реагентами, такими как бромциан . Различные ферменты дают разные схемы расщепления, и перекрытие между фрагментами можно использовать для построения общей последовательности.

Реакция

Пептид, который необходимо секвенировать, адсорбируется на твердой поверхности. Одним из распространенных субстратов является стекловолокно, покрытое полибреном , катионным полимером . Реагент Эдмана, фенилизотиоцианат (PITC), добавляется к адсорбированному пептиду вместе с умеренно основным буферным раствором 12% триметиламина . Он реагирует с аминогруппой N-концевой аминокислоты.

Концевую аминокислоту затем можно селективно отсоединить путем добавления безводной кислоты. Затем производное изомеризуется, давая замещенный фенилтиогидантоин, который можно смыть и идентифицировать с помощью хроматографии, и цикл можно повторить. Эффективность каждого шага составляет около 98%, что позволяет надежно определить около 50 аминокислот.

Секвенатор белка

Секвенатор белка ^[3] — это машина, которая выполняет деградацию Эдмана в автоматическом режиме. Образец белка или пептида иммобилизуется в реакционном сосуде секвенатора белка, и выполняется деградация Эдмана. Каждый цикл высвобождает и дериватизирует одну аминокислоту из N -конца белка или пептида, а затем высвобождаемое производное аминокислоты идентифицируется с помощью ВЭЖХ. Процесс секвенирования выполняется повторно для всего полипептида до тех пор, пока не будет установлена вся измеряемая последовательность или для заранее определенного количества циклов.

Идентификация методом масс-спектрометрии

Идентификация белка — это процесс присвоения имени интересующему белку (POI) на основе его аминокислотной последовательности. Обычно для идентификации белка с использованием баз данных последовательностей белков, выведенных из последовательностей ДНК их генов, экспериментально требуется определить только часть последовательности белка. Дальнейшая характеристика белка может включать подтверждение фактических N- и C-концов POI, определение вариантов последовательности и идентификацию любых присутствующих посттрансляционных модификаций.

Протеолитические переваривания

Описана общая схема идентификации белков. ^[4]^[5]

POI обычно выделяют с помощью SDS-PAGE или хроматографии .
Изолированный POI может быть химически модифицирован для стабилизации остатков цистеина (например, S-амидометилирование или S-карбоксиметилирование).
POI расщепляется специфической протеазой для получения пептидов. Трипсин , который селективно расщепляет остатки лизина или аргинина с С-конца, является наиболее часто используемой протеазой. Его преимущества включают i) частоту остатков Lys и Arg в белках, ii) высокую специфичность фермента, iii) стабильность фермента и iv) пригодность триптических пептидов для масс-спектрометрии.
Пептиды могут быть обессолены для удаления ионизируемых примесей и подвергнуты масс-спектрометрии MALDI-TOF . Прямое измерение масс пептидов может предоставить достаточную информацию для идентификации белка (см. Peptide mass fingerprinting ), но для получения информации о последовательностях пептидов часто используется дальнейшая фрагментация пептидов внутри масс-спектрометра. В качестве альтернативы пептиды могут быть обессолены и разделены обращенно-фазовой ВЭЖХ и введены в масс-спектрометр через источник ESI . LC-ESI-MS может предоставить больше информации, чем MALDI-MS для идентификации белка, но требует больше времени прибора.
В зависимости от типа масс-спектрометра фрагментация пептидных ионов может происходить посредством различных механизмов, таких как диссоциация, вызванная столкновением (CID) или пост-источниковый распад (PSD). В каждом случае структура фрагментных ионов пептида дает информацию о его последовательности.
Информация, включающая измеренную массу предполагаемых пептидных ионов и их фрагментных ионов, затем сопоставляется с рассчитанными значениями массы из концептуального (in-silico) протеолиза и фрагментации баз данных белковых последовательностей. Успешное совпадение будет найдено, если его оценка превысит пороговое значение, основанное на параметрах анализа. Даже если фактический белок не представлен в базе данных, толерантное к ошибкам сопоставление позволяет предположительно идентифицировать белок на основе сходства с гомологичными белками. Для выполнения этого анализа доступны различные программные пакеты.
Пакеты программного обеспечения обычно генерируют отчет, показывающий идентификационные данные (код доступа) каждого идентифицированного белка, его оценку соответствия и предоставляют меру относительной силы соответствия, если идентифицировано несколько белков.
Диаграмма сопоставленных пептидов в последовательности идентифицированного белка часто используется для отображения покрытия последовательности (% белка, обнаруженного как пептиды). Если POI считается значительно меньше сопоставленного белка, диаграмма может подсказать, является ли POI N- или C-концевым фрагментом идентифицированного белка.

Секвенирование de novo

Паттерн фрагментации пептида позволяет напрямую определить его последовательность с помощью секвенирования de novo . Эта последовательность может быть использована для сопоставления баз данных последовательностей белков или для исследования посттрансляционных или химических модификаций. Она может предоставить дополнительные доказательства для идентификации белков, выполненной, как указано выше.

N- и C-концы

Пептиды, сопоставленные во время идентификации белка, не обязательно включают N- или C-концы, предсказанные для сопоставленного белка. Это может быть результатом того, что N- или C-концевые пептиды трудно идентифицировать с помощью MS (например, слишком короткие или слишком длинные), посттрансляционно модифицированы (например, N-концевое ацетилирование) или действительно отличаются от предсказания. Посттрансляционные модификации или укороченные концы могут быть идентифицированы путем более тщательного изучения данных (например, de novo секвенирование). Повторный перевар с использованием протеазы другой специфичности также может быть полезен.

Посттрансляционные модификации

В то время как детальное сравнение данных MS с прогнозами, основанными на известной последовательности белка, может использоваться для определения посттрансляционных модификаций, также могут использоваться целевые подходы к получению данных. Например, специфическое обогащение фосфопептидов может помочь в идентификации участков фосфорилирования в белке. Альтернативные методы фрагментации пептидов в масс-спектрометре, такие как ETD или ECD , могут дать дополнительную информацию о последовательности.

Определение всей массы

Полная масса белка представляет собой сумму масс его аминокислотных остатков плюс масса молекулы воды и скорректирована с учетом любых посттрансляционных модификаций. Хотя белки ионизируются хуже, чем полученные из них пептиды, белок в растворе может быть подвергнут ESI-MS и его масса может быть измерена с точностью 1 часть на 20 000 или лучше. Этого часто достаточно, чтобы подтвердить концы (таким образом, что измеренная масса белка совпадает с предсказанной из его последовательности) и сделать вывод о наличии или отсутствии многих посттрансляционных модификаций.

Ограничения

Протеолиз не всегда дает набор легко анализируемых пептидов, охватывающих всю последовательность POI. Фрагментация пептидов в масс-спектрометре часто не дает ионов, соответствующих расщеплению каждой пептидной связи. Таким образом, выведенная последовательность для каждого пептида не обязательно является полной. Стандартные методы фрагментации не различают остатки лейцина и изолейцина, поскольку они изомерны.

Поскольку деградация Эдмана происходит с N-конца белка, она не будет работать, если N-конец был химически модифицирован (например, путем ацетилирования или образования пироглутаминовой кислоты). Деградация Эдмана, как правило, бесполезна для определения положений дисульфидных мостиков. Для нее также требуются количества пептидов в 1 пикомоль или выше для различимых результатов, что делает ее менее чувствительной, чем масс-спектрометрия.

Прогнозирование по последовательностям ДНК/РНК

В биологии белки производятся путем трансляции матричной РНК (мРНК) с последовательностью белка, полученной из последовательности кодонов в мРНК. Сама мРНК формируется путем транскрипции генов и может быть дополнительно модифицирована. Эти процессы достаточно изучены, чтобы использовать компьютерные алгоритмы для автоматизации предсказаний последовательностей белков из последовательностей ДНК, например, из проектов по секвенированию ДНК всего генома, и привели к созданию больших баз данных последовательностей белков, таких как UniProt . Предсказанные последовательности белков являются важным ресурсом для идентификации белков методом масс-спектрометрии.

Исторически короткие белковые последовательности (от 10 до 15 остатков), определенные деградацией Эдмана, были обратно транслированы в последовательности ДНК, которые могли быть использованы в качестве зондов или праймеров для выделения молекулярных клонов соответствующего гена или комплементарной ДНК. Затем определялась последовательность клонированной ДНК и использовалась для выведения полной аминокислотной последовательности белка.

Инструменты биоинформатики

Существуют инструменты биоинформатики, помогающие в интерпретации масс-спектров (см. секвенирование пептидов de novo ), для сравнения или анализа последовательностей белков (см. анализ последовательностей ) или для поиска в базах данных с использованием последовательностей пептидов или белков (см. BLAST ).

Приложения к криптографии

Сложность секвенирования белка была недавно предложена в качестве основы для создания программ k-time, программ, которые запускаются ровно k раз перед самоуничтожением. Такое невозможно построить исключительно в программном обеспечении, поскольку все программное обеспечение по своей сути клонируемо неограниченное количество раз.

Смотрите также

Ссылки

^ Bogosian G, Violand BN, Dorward-King EJ, Workman WE, Jung PE, Kane JF (январь 1989). «Биосинтез и включение в белок норлейцина Escherichia coli». Журнал биологической химии . 264 (1): 531–9. doi : 10.1016/S0021-9258(17)31291-7 . PMID 2642478.
^ Михаил А. Альтерман; Питер Ханзикер (2 декабря 2011 г.). Анализ аминокислот: методы и протоколы. Humana Press. ISBN 978-1-61779-444-5.
^ Эдман П., Бегг Г. (март 1967 г.). «Секвенатор белка». Европейский журнал биохимии . 1 (1): 80–91. doi : 10.1111/j.1432-1033.1967.tb00047.x . PMID 6059350.
^ Шевченко А., Томас Х., Хавлис Дж., Олсен Дж. В., Манн М. (2006). «Расщепление в геле для масс-спектрометрической характеристики белков и протеомов». Nature Protocols . 1 (6): 2856–60. doi :10.1038/nprot.2006.468. PMID 17406544. S2CID 8248224.
^ Gundry RL, White MY, Murray CI, Kane LA, Fu Q, Stanley BA, Van Eyk JE (октябрь 2009 г.). "Подготовка белков и пептидов для масс-спектрометрического анализа в рабочем процессе протеомики снизу вверх". Current Protocols in Molecular Biology . Глава 10: Unit10.25. doi :10.1002/0471142727.mb1025s88. ISBN 978-0471142720. PMC 2905857 . PMID 19816929.

Дальнейшее чтение

Steen H, Mann M (сентябрь 2004 г.). «ABC (и XYZ) пептидного секвенирования». Nature Reviews Molecular Cell Biology . 5 (9): 699–711. doi :10.1038/nrm1468. PMID 15340378. S2CID 5176895.