stringtranslate.com

Первичная структура белка

Protein primary structureProtein secondary structureProtein tertiary structureProtein quaternary structure
Изображение выше содержит кликабельные ссылки
Изображение выше содержит кликабельные ссылки
Эта диаграмма (которая является интерактивной) структуры белка использует PCNA в качестве примера. ( PDB : 1AXC ​)

Первичная структура белка — это линейная последовательность аминокислот в пептиде или белке . [1] По соглашению первичная структура белка описывается, начиная с аминоконца (N) до карбоксильного конца (C). Биосинтез белка чаще всего осуществляется рибосомами в клетках. Пептиды также могут быть синтезированы в лаборатории. Первичные структуры белка могут быть напрямую секвенированы или выведены из последовательностей ДНК .

Формирование

Биологический

Аминокислоты полимеризуются через пептидные связи, образуя длинный остов , с различными боковыми цепями аминокислот, выступающими вдоль него. В биологических системах белки производятся во время трансляции рибосомами клетки . Некоторые организмы также могут производить короткие пептиды путем нерибосомального пептидного синтеза , который часто использует аминокислоты, отличные от стандартных 20, и может быть циклизован, модифицирован и сшит.

Химический

Пептиды могут быть синтезированы химически с помощью ряда лабораторных методов. Химические методы обычно синтезируют пептиды в порядке, обратном биологическому синтезу белка (начиная с N-конца) (начиная с C-конца).

Обозначение

Последовательность белка обычно обозначается как строка букв, перечисляющая аминокислоты, начиная с амино -терминального конца до карбоксильного конца. Для представления 22 природных аминокислот, а также смесей или неоднозначных аминокислот (аналогично обозначению нуклеиновых кислот ) можно использовать как трехбуквенный код, так и однобуквенный код . [1] [2] [3]

Пептиды могут быть напрямую секвенированы или выведены из последовательностей ДНК . В настоящее время существуют большие базы данных последовательностей , которые сопоставляют известные последовательности белков.

Модификация

В целом, полипептиды являются неразветвленными полимерами, поэтому их первичная структура часто может быть определена последовательностью аминокислот вдоль их остова. Однако белки могут стать сшитыми, чаще всего дисульфидными связями , и первичная структура также требует указания сшивающих атомов, например, указания цистеинов, участвующих в дисульфидных связях белка. Другие сшивки включают десмозин .

Изомеризация

Хиральные центры полипептидной цепи могут подвергаться рацемизации . Хотя это не меняет последовательность, это влияет на химические свойства последовательности. В частности, L -аминокислоты, обычно встречающиеся в белках, могут спонтанно изомеризоваться у атома, образуя D -аминокислоты, которые не могут быть расщеплены большинством протеаз . Кроме того, пролин может образовывать стабильные транс-изомеры у пептидной связи.

Посттрансляционная модификация

Кроме того, белок может подвергаться различным посттрансляционным модификациям , которые кратко описаны здесь.

N-концевая аминогруппа полипептида может быть модифицирована ковалентно, например,

Рис. 1 N-концевое ацетилирование
Положительный заряд на N-концевой аминогруппе можно устранить, заменив ее на ацетильную группу (блокирование N-конца).
N-концевой метионин, обычно находящийся после трансляции, имеет N-конец, заблокированный формильной группой. Эта формильная группа (а иногда и сам остаток метионина, если за ним следует Gly или Ser) удаляется ферментом деформилазой.
Рис. 2 Образование пироглутамата из N-концевого глутамина
N-концевой глутамин может атаковать сам себя, образуя циклическую пироглутаматную группу.
Подобно ацетилированию. Вместо простой метильной группы миристоильная группа имеет хвост из 14 гидрофобных атомов углерода, что делает ее идеальной для прикрепления белков к клеточным мембранам .

С-концевая карбоксилатная группа полипептида также может быть модифицирована, например,

Рис. 3 С-концевое амидирование
С-конец также можно заблокировать (таким образом нейтрализовав его отрицательный заряд) путем аминирования.
Гликозилфосфатидилинозитол (GPI) — это большая гидрофобная фосфолипидная простетическая группа, которая прикрепляет белки к клеточным мембранам . Она присоединена к С-концу полипептида через амидную связь, которая затем соединяется с этаноламином, затем с различными сахарами и, наконец, с липидным фрагментом фосфатидилинозитола.

Наконец, боковые цепи пептида также могут быть модифицированы ковалентно, например,

Помимо расщепления, фосфорилирование , возможно, является наиболее важной химической модификацией белков. Фосфатная группа может быть присоединена к боковой гидроксильной группе остатков серина, треонина и тирозина, добавляя отрицательный заряд в этом месте и производя неприродную аминокислоту. Такие реакции катализируются киназами , а обратная реакция катализируется фосфатазами. Фосфорилированные тирозины часто используются в качестве «ручек», с помощью которых белки могут связываться друг с другом, тогда как фосфорилирование Ser/Thr часто вызывает конформационные изменения, предположительно из-за введенного отрицательного заряда. Эффекты фосфорилирования Ser/Thr иногда можно смоделировать, мутировав остаток Ser/Thr в глутамат.
Всеобъемлющее название для набора очень распространенных и очень гетерогенных химических модификаций. Сахарные фрагменты могут быть присоединены к гидроксильным группам боковой цепи Ser/Thr или к амидным группам боковой цепи Asn. Такие присоединения могут выполнять множество функций, начиная от повышения растворимости и заканчивая комплексным распознаванием. Все гликозилирование можно заблокировать определенными ингибиторами, такими как туникамицин .
В этой модификации боковая цепь аспарагина или аспартата атакует следующую пептидную связь, образуя симметричный промежуточный сукцинимид. Гидролиз промежуточного продукта производит либо аспартат, либо β-аминокислоту, изо(Asp). Для аспарагина любой из продуктов приводит к потере амидной группы, отсюда и «дезамидирование».
Остатки пролина могут быть гидроксилированы по любому из двух атомов, как и лизин (по одному атому). Гидроксипролин является критическим компонентом коллагена , который становится нестабильным при его потере. Реакция гидроксилирования катализируется ферментом, которому требуется аскорбиновая кислота (витамин С), дефицит которой приводит ко многим заболеваниям соединительной ткани, таким как цинга .
Несколько остатков белка могут быть метилированы, в частности, положительные группы лизина и аргинина . Остатки аргинина взаимодействуют с фосфатным остовом нуклеиновой кислоты и обычно образуют водородные связи с остатками оснований, в частности гуанином , в комплексах белок-ДНК. Остатки лизина могут быть однократно, двукратно и даже трехкратно метилированы. Однако метилирование не изменяет положительный заряд боковой цепи.
Ацетилирование аминогрупп лизина химически аналогично ацетилированию N-конца. Однако функционально ацетилирование остатков лизина используется для регулирования связывания белков с нуклеиновыми кислотами. Отмена положительного заряда лизина ослабляет электростатическое притяжение для (отрицательно заряженных) нуклеиновых кислот.
Тирозины могут сульфатироваться на своем атоме. Несколько необычно, что эта модификация происходит в аппарате Гольджи , а не в эндоплазматическом ретикулуме . Подобно фосфорилированным тирозинам, сульфатированные тирозины используются для специфического распознавания, например, в хемокиновых рецепторах на поверхности клетки. Как и в случае с фосфорилированием, сульфатирование добавляет отрицательный заряд к ранее нейтральному участку.
Гидрофобные изопреновые (например, фарнезил, геранил и геранилгеранильные группы) и пальмитоильные группы могут быть добавлены к атому остатков цистеина для прикрепления белков к клеточным мембранам . В отличие от якорей GPI и миритоила, эти группы не обязательно добавляются на концах.
Относительно редкая модификация, которая добавляет дополнительную карбоксилатную группу (и, следовательно, двойной отрицательный заряд) к боковой цепи глутамата, производя остаток Gla. Это используется для усиления связывания с «жесткими» ионами металлов, такими как кальций .
Большая группа АДФ-рибозил может быть перенесена на несколько типов боковых цепей внутри белков с гетерогенными эффектами. Эта модификация является целью для мощных токсинов разнородных бактерий, например, Vibrio cholerae , Corynebacterium diphtheriae и Bordetella pertussis .
Различные полноразмерные, свернутые белки могут быть присоединены на своих С-концах к боковым цепям аммониевых групп лизинов других белков. Убиквитин является наиболее распространенным из них и обычно сигнализирует о том, что белок, помеченный убиквитином, должен быть деградирован.

Большинство перечисленных выше модификаций полипептидов происходят посттрансляционно , то есть после того, как белок синтезирован на рибосоме , что обычно происходит в эндоплазматическом ретикулуме — субклеточной органелле эукариотической клетки.

Химики применяли к белкам и многие другие химические реакции (например, цианирование), хотя в биологических системах они не встречаются.

Расщепление и лигирование

Помимо перечисленных выше, наиболее важной модификацией первичной структуры является расщепление пептида (химическим гидролизом или протеазами ). Белки часто синтезируются в неактивной форме предшественника; как правило, N-концевой или C-концевой сегмент блокирует активный сайт белка, подавляя его функцию. Белок активируется путем отщепления ингибирующего пептида.

Некоторые белки даже обладают способностью расщеплять себя. Обычно гидроксильная группа серина (реже треонина) или тиоловая группа остатка цистеина атакуют карбонильный углерод предыдущей пептидной связи, образуя тетраэдрически связанный промежуточный продукт [классифицируемый как гидроксиоксазолидиновый (Ser/Thr) или гидрокситиазолидиновый (Cys) промежуточный продукт]. Этот промежуточный продукт имеет тенденцию возвращаться в амидную форму, вытесняя атакующую группу, поскольку амидная форма обычно благоприятствует свободной энергии (предположительно из-за сильной резонансной стабилизации пептидной группы). Однако дополнительные молекулярные взаимодействия могут сделать амидную форму менее стабильной; вместо этого вытесняется аминогруппа, в результате чего вместо пептидной связи образуется эфирная (Ser/Thr) или тиоэфирная (Cys) связь. Эта химическая реакция называется ацильным сдвигом NO.

Связь эфир/тиоэфир может быть разделена несколькими способами:

Сжатие последовательности

Сжатие аминокислотных последовательностей является сравнительно сложной задачей. Существующие специализированные компрессоры аминокислотных последовательностей являются низкими по сравнению с компрессорами последовательностей ДНК, в основном из-за характеристик данных. Например, моделирование инверсий сложнее из-за обратной потери информации (от аминокислот к последовательности ДНК). Текущий компрессор данных без потерь, который обеспечивает более высокое сжатие, — это AC2. [5] AC2 смешивает различные контекстные модели с использованием нейронных сетей и кодирует данные с использованием арифметического кодирования.

История

Предложение о том, что белки представляют собой линейные цепи α-аминокислот, было сделано почти одновременно двумя учеными на одной и той же конференции в 1902 году, 74-м заседании Общества немецких ученых и врачей, состоявшемся в Карлсбаде. Франц Хофмейстер сделал предложение утром, основываясь на своих наблюдениях за биуретовой реакцией в белках. За Хофмейстером несколько часов спустя последовал Эмиль Фишер , который собрал множество химических данных, подтверждающих модель пептидной связи. Для полноты картины, предложение о том, что белки содержат амидные связи, было сделано еще в 1882 году французским химиком Э. Гримо. [6]

Несмотря на эти данные и более поздние доказательства того, что протеолитически переваренные белки дают только олигопептиды, идея о том, что белки являются линейными, неразветвленными полимерами аминокислот, не была принята сразу. Некоторые уважаемые ученые, такие как Уильям Эстбери, сомневались, что ковалентные связи были достаточно прочными, чтобы удерживать вместе такие длинные молекулы; они боялись, что тепловые колебания разорвут такие длинные молекулы на части. Герман Штаудингер столкнулся с похожими предрассудками в 1920-х годах, когда он утверждал, что каучук состоит из макромолекул . [6]

Таким образом, возникло несколько альтернативных гипотез. Гипотеза коллоидного белка утверждала, что белки представляют собой коллоидные сборки более мелких молекул. Эта гипотеза была опровергнута в 1920-х годах ультрацентрифугированием Теодора Сведберга , показавшим, что белки имеют четко определенную, воспроизводимую молекулярную массу, и электрофоретическими измерениями Арне Тиселиуса , указывающими на то, что белки представляют собой отдельные молекулы. Вторая гипотеза, гипотеза циклола , выдвинутая Дороти Вринч , предполагала, что линейный полипептид претерпевает химическую циклол-перегруппировку C=O + HN C(OH)-N, которая сшивает его амидные группы основной цепи, образуя двумерную структуру . Другие первичные структуры белков были предложены различными исследователями, такими как дикетопиперазиновая модель Эмиля Абдерхальдена и пиррол/пиперидиновая модель Троенсегаарда в 1942 году. Хотя этим альтернативным моделям никогда не придавалось большого значения, они были окончательно опровергнуты, когда Фредерик Сэнгер успешно секвенировал инсулин [ когда? ] и кристаллографическим определением миоглобина и гемоглобина Максом Перуцем и Джоном Кендрю [ когда? ] .

Первичная структура в других молекулах

Можно сказать, что любой линейный гетерополимер имеет «первичную структуру» по аналогии с использованием термина для белков, но это использование редко по сравнению с чрезвычайно распространенным использованием в отношении белков. В РНК , которая также имеет обширную вторичную структуру , линейная цепь оснований обычно просто упоминается как «последовательность», как и в ДНК (которая обычно образует линейную двойную спираль с небольшой вторичной структурой). Другие биологические полимеры, такие как полисахариды, также можно считать имеющими первичную структуру, хотя использование не является стандартным.

Отношение к вторичной и третичной структуре

Первичная структура биологического полимера в значительной степени определяет трехмерную форму ( третичную структуру ). Последовательность белка может быть использована для прогнозирования локальных особенностей , таких как сегменты вторичной структуры или трансмембранные области. Однако сложность сворачивания белка в настоящее время не позволяет прогнозировать третичную структуру белка только по его последовательности. Знание структуры аналогичной гомологичной последовательности (например, члена того же семейства белков ) позволяет с высокой точностью прогнозировать третичную структуру с помощью моделирования гомологии . Если доступна полноразмерная последовательность белка, можно оценить его общие биофизические свойства , такие как его изоэлектрическая точка .

Семейства последовательностей часто определяются путем кластеризации последовательностей , а проекты структурной геномики направлены на создание набора репрезентативных структур, охватывающих пространство последовательностей возможных неизбыточных последовательностей.

Смотрите также

Примечания и ссылки

  1. ^ ab SANGER F (1952). "Расположение аминокислот в белках". В ML Anson; Kenneth Bailey; John T. Edsall (ред.). Advances in Protein Chemistry . Vol. 7. pp. 1–67. doi :10.1016/S0065-3233(08)60017-0. ISBN 9780120342075. PMID  14933251.
  2. ^ Aasland, Rein; Abrams, Charles; Ampe, Christophe; Ball, Linda J.; Bedford, Mark T.; Cesareni, Gianni; Gimona, Mario; Hurley, James H.; Jarchau, Thomas (2002-02-20). "Нормализация номенклатуры пептидных мотивов как лигандов модульных белковых доменов". FEBS Letters . 513 (1): 141–144. Bibcode : 2002FEBSL.513..141A. doi : 10.1016/S0014-5793(01)03295-1 . ISSN  1873-3468. PMID  11911894.
  3. ^ Aasland R, Abrams C, Ampe C, Ball LJ, Bedford MT, Cesareni G, Gimona M, Hurley JH, Jarchau T, Lehto VP, Lemmon MA, Linding R, Mayer BJ, Nagai M, Sudol M, Walter U, Winder SJ (1968-07-01). "Однобуквенное обозначение аминокислотных последовательностей*". European Journal of Biochemistry . 5 (2): 151–153. doi :10.1111/j.1432-1033.1968.tb00350.x. ISSN  1432-1033. PMID  11911894.
  4. ^ ab Хаусман, Роберт Э.; Купер, Джеффри М. (2004). Клетка: молекулярный подход . Вашингтон, округ Колумбия: ASM Press. стр. 51. ISBN 978-0-87893-214-6.
  5. ^ Silva M, Pratas D, Pinho AJ (апрель 2021 г.). "AC2: Эффективный инструмент сжатия белковой последовательности с использованием искусственных нейронных сетей и моделей кэш-хэширования". Entropy . 23 (5): 530. Bibcode :2021Entrp..23..530S. doi : 10.3390/e23050530 . PMC 8146440 . PMID  33925812. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  6. ^ ab Fruton JS (май 1979). "Ранние теории структуры белка". Ann. NY Acad. Sci . 325 (1): xiv, 1–18. Bibcode :1979NYASA.325....1F. doi :10.1111/j.1749-6632.1979.tb14125.x. PMID  378063. S2CID  39125170.