stringtranslate.com

Первичная структура белка

Protein primary structureProtein secondary structureProtein tertiary structureProtein quaternary structure
Изображение выше содержит кликабельные ссылки.
Изображение выше содержит кликабельные ссылки.
На этой диаграмме (интерактивной) структуры белка в качестве примера используется PCNA . ( PDB : 1AXC ​)

Первичная структура белка — это линейная последовательность аминокислот в пептиде или белке . [1] Обычно первичную структуру белка описывают, начиная с аминоконцевого (N) конца и заканчивая карбоксильным (C) концом. Биосинтез белка чаще всего осуществляется рибосомами в клетках. Пептиды также можно синтезировать в лаборатории. Первичные структуры белков можно секвенировать непосредственно или вывести из последовательностей ДНК .

Формирование

Биологический

Аминокислоты полимеризуются посредством пептидных связей с образованием длинной основной цепи , вдоль которой выступают различные боковые цепи аминокислот. В биологических системах белки производятся во время трансляции рибосомами клетки . Некоторые организмы также могут создавать короткие пептиды путем нерибосомального пептидного синтеза , в котором часто используются аминокислоты, отличные от стандартных 20, и которые могут быть циклизованы, модифицированы и сшиты.

Химическая

Пептиды можно синтезировать химическим путем с помощью ряда лабораторных методов. Химические методы обычно синтезируют пептиды в порядке, противоположном (начиная с С-конца) биологическому синтезу белка (начиная с N-конца).

Обозначения

Последовательность белка обычно обозначается в виде строки букв, в которой перечислены аминокислоты, начиная с аминоконца и до карбоксильного конца. Для обозначения 20 встречающихся в природе аминокислот, а также смесей или неоднозначных аминокислот можно использовать трехбуквенный или однобуквенный код (аналогично нотации нуклеиновых кислот ). [1] [2] [3]

Пептиды можно секвенировать непосредственно или вывести из последовательностей ДНК . В настоящее время существуют большие базы данных последовательностей , в которых сопоставляются известные последовательности белков.

Модификация

В общем, полипептиды представляют собой неразветвленные полимеры, поэтому их первичную структуру часто можно определить с помощью последовательности аминокислот вдоль их основной цепи. Однако белки могут сшиваться, чаще всего за счет дисульфидных связей , а первичная структура также требует указания сшивающих атомов, например, указания цистеинов , участвующих в дисульфидных связях белка. Другие сшивки включают десмозин .

изомеризация

Хиральные центры полипептидной цепи могут подвергаться рацемизации . Хотя это не меняет последовательность, оно влияет на химические свойства последовательности. В частности, L -аминокислоты, обычно встречающиеся в белках, могут спонтанно изомеризоваться по атому с образованием D -аминокислот, которые не могут быть расщеплены большинством протеаз . Кроме того, пролин может образовывать стабильные транс-изомеры по пептидной связи.

Посттрансляционная модификация

Кроме того, белок может подвергаться множеству посттрансляционных модификаций , которые кратко суммированы здесь.

N-концевая аминогруппа полипептида может быть модифицирована ковалентно, например,

Рис. 1. N-концевое ацетилирование.
Положительный заряд N-концевой аминогруппы можно устранить, заменив ее ацетильной группой (N-концевая блокировка).
N-концевой метионин, обычно обнаруживаемый после трансляции, имеет N-конец, заблокированный формильной группой. Эта формильная группа (а иногда и сам остаток метионина, если за ним следует Gly или Ser) удаляется ферментом деформилазой.
Рис. 2. Образование пироглутамата из N-концевого глутамина.
N-концевой глютамин может атаковать сам себя, образуя циклическую пироглутаматную группу.
Аналогично ацетилированию. Вместо простой метильной группы миристоильная группа имеет хвост из 14 гидрофобных атомов углерода, что делает ее идеальной для закрепления белков на клеточных мембранах .

С-концевая карбоксилатная группа полипептида также может быть модифицирована, например,

Рис. 3. С-концевое амидирование.
С-конец также может быть заблокирован (таким образом, нейтрализуя его отрицательный заряд) путем аминирования.
Гликозилфосфатидилинозитол (ГФИ) представляет собой большую гидрофобную простетическую группу фосфолипидов, которая закрепляет белки на клеточных мембранах . Он прикрепляется к С-концу полипептида посредством амидной связи, которая затем соединяется с этаноламином, затем с различными сахарами и, наконец, с липидным фрагментом фосфатидилинозитола.

Наконец, боковые цепи пептида также могут быть модифицированы ковалентно, например,

Помимо расщепления, фосфорилирование, возможно, является наиболее важной химической модификацией белков. Фосфатная группа может быть присоединена к гидроксильной группе боковой цепи остатков серина, треонина и тирозина, добавляя отрицательный заряд в этом месте и образуя неприродную аминокислоту. Такие реакции катализируются киназами , а обратная реакция катализируется фосфатазами. Фосфорилированные тирозины часто используются в качестве «ручек», с помощью которых белки могут связываться друг с другом, тогда как фосфорилирование Ser/Thr часто вызывает конформационные изменения, предположительно из-за введенного отрицательного заряда. Эффекты фосфорилирования Ser/Thr иногда можно смоделировать путем мутации остатка Ser/Thr на глутамат.
Обобщающее название для набора очень распространенных и очень гетерогенных химических модификаций. Фрагменты сахара могут быть присоединены к гидроксильным группам боковой цепи Ser/Thr или к амидным группам боковой цепи Asn. Такие присоединения могут выполнять множество функций: от повышения растворимости до комплексного распознавания. Любое гликозилирование можно блокировать с помощью определенных ингибиторов, таких как туникамицин .
В этой модификации боковая цепь аспарагина или аспартата атакует следующую пептидную связь, образуя симметричное промежуточное соединение сукцинимида. При гидролизе промежуточного продукта образуется либо аспартат, либо β-аминокислота изо(Asp). В случае аспарагина любой продукт приводит к потере амидной группы и, следовательно, к «дезамидированию».
Остатки пролина могут быть гидроксилированы по любому из двух атомов, как и лизин (по одному атому). Гидроксипролин является важным компонентом коллагена , который становится нестабильным при его потере. Реакция гидроксилирования катализируется ферментом, которому требуется аскорбиновая кислота (витамин С), дефицит которой приводит ко многим заболеваниям соединительной ткани, таким как цинга .
Некоторые белковые остатки могут быть метилированы, особенно положительные группы лизина и аргинина . Остатки аргинина взаимодействуют с фосфатным остовом нуклеиновой кислоты и обычно образуют водородные связи с основными остатками, особенно гуанином , в комплексах белок-ДНК. Остатки лизина могут быть однократно, дважды и даже трижды метилированы. Однако метилирование не меняет положительный заряд боковой цепи.
Ацетилирование аминогрупп лизина химически аналогично ацетилированию N-конца. Однако функционально ацетилирование остатков лизина используется для регулирования связывания белков с нуклеиновыми кислотами. Упразднение положительного заряда лизина ослабляет электростатическое притяжение (отрицательно заряженных) нуклеиновых кислот.
Тирозины могут сульфатироваться по атому. Несколько необычно то, что эта модификация происходит в аппарате Гольджи , а не в эндоплазматическом ретикулуме . Подобно фосфорилированным тирозинам, сульфатированные тирозины используются для специфического узнавания, например, в хемокиновых рецепторах на поверхности клетки. Как и при фосфорилировании, сульфатирование добавляет отрицательный заряд к ранее нейтральному участку.
Гидрофобные изопреновые (например, фарнезильные, геранильные и геранилгеранильные группы) и пальмитоильные группы могут быть добавлены к атому остатков цистеина для закрепления белков на клеточных мембранах . В отличие от GPI и миритоильных якорей, эти группы не обязательно добавляются на концах.
Относительно редкая модификация, которая добавляет дополнительную карбоксилатную группу (и, следовательно, двойной отрицательный заряд) к боковой цепи глутамата, образуя остаток Gla. Это используется для усиления связывания ионов «твердых» металлов, таких как кальций .
Большая группа АДФ-рибозила может переноситься на несколько типов боковых цепей белков с гетерогенными эффектами. Эта модификация является мишенью для мощных токсинов различных бактерий, например, Vibrio cholerae , Corynebacterium diphtheriae и Bordetella pertussis .
Различные полноразмерные свернутые белки могут быть присоединены на своих С-концах к аммониевым группам боковой цепи лизинов других белков. Убикитин является наиболее распространенным из них и обычно сигнализирует о том, что белок, меченный убиквитином, должен быть разрушен.

Большинство модификаций полипептидов, перечисленных выше, происходят посттрансляционно , т.е. после того, как белок был синтезирован на рибосоме , обычно происходящей в эндоплазматическом ретикулуме , субклеточной органелле эукариотической клетки.

Многие другие химические реакции (например, цианилирование) применялись химиками к белкам, хотя они не обнаружены в биологических системах.

Расщепление и лигирование

Помимо перечисленных выше, наиболее важной модификацией первичной структуры является расщепление пептидов (путем химического гидролиза или протеазами ). Белки часто синтезируются в неактивной форме-предшественнике; обычно N-концевой или C-концевой сегмент блокирует активный центр белка, подавляя его функцию. Белок активируется путем отщепления ингибирующего пептида.

Некоторые белки даже способны расщеплять себя. Обычно гидроксильная группа серина (редко треонина) или тиоловая группа остатка цистеина атакует карбонильный углерод предыдущей пептидной связи, образуя тетраэдрически связанное промежуточное соединение [классифицируемое как гидроксиоксазолидин (Ser/Thr) или гидрокситиазолидин ( Cys) промежуточный]. Это промежуточное соединение имеет тенденцию вернуться в амидную форму, вытесняя атакующую группу, поскольку свободная энергия обычно благоприятствует амидной форме (предположительно из-за сильной резонансной стабилизации пептидной группы). Однако дополнительные молекулярные взаимодействия могут сделать амидную форму менее стабильной; вместо этого аминогруппа удаляется, в результате чего вместо пептидной связи образуется сложноэфирная (Ser/Thr) или тиоэфирная (Cys) связь. Эта химическая реакция называется NO-ацильным сдвигом.

Эфирно-тиоэфирную связь можно разрешить несколькими способами:

Сжатие последовательности

Сжатие аминокислотных последовательностей является сравнительно сложной задачей. Существующие специализированные компрессоры аминокислотных последовательностей уступают компрессорам последовательностей ДНК, главным образом из-за характеристик данных. Например, моделировать инверсии сложнее из-за обратной потери информации (от аминокислот к последовательности ДНК). Текущий компрессор данных без потерь, обеспечивающий более высокий уровень сжатия, — AC2. [5] AC2 смешивает различные контекстные модели с использованием нейронных сетей и кодирует данные с помощью арифметического кодирования.

История

Предположение о том, что белки представляют собой линейные цепочки α-аминокислот, было высказано почти одновременно двумя учёными на одной и той же конференции в 1902 году, 74-м собрании Общества немецких учёных и врачей, проходившем в Карлсбаде. Франц Хофмайстер сделал это предложение утром, основываясь на своих наблюдениях за биуретовой реакцией в белках. Через несколько часов за Хофмейстером последовал Эмиль Фишер , накопивший множество химических данных, подтверждающих модель пептидной связи. Для полноты картины: предположение о наличии в белках амидных связей было сделано еще в 1882 г. французским химиком Э. Гримо. [6]

Несмотря на эти данные и более поздние доказательства того, что протеолитически расщепленные белки дают только олигопептиды, идея о том, что белки представляют собой линейные, неразветвленные полимеры аминокислот, не была принята сразу. Некоторые уважаемые ученые, такие как Уильям Эстбери, сомневались, что ковалентные связи достаточно сильны, чтобы удерживать вместе такие длинные молекулы; они боялись, что тепловые колебания расшатают такие длинные молекулы. Герман Штаудингер столкнулся с подобными предрассудками в 1920-х годах, когда утверждал, что каучук состоит из макромолекул . [6]

Таким образом, возникло несколько альтернативных гипотез. Гипотеза коллоидных белков утверждала, что белки представляют собой коллоидные совокупности более мелких молекул. Эта гипотеза была опровергнута в 1920-х годах измерениями ультрацентрифугирования Теодора Сведберга , которые показали, что белки имеют четко определенную, воспроизводимую молекулярную массу, и электрофоретическими измерениями Арне Тиселиуса , которые показали, что белки представляют собой отдельные молекулы. Вторая гипотеза, гипотеза циклола , выдвинутая Дороти Ринч , предполагала, что линейный полипептид претерпел химическую циклольную перегруппировку C=O + HN C(OH)-N, которая сшивала его основные амидные группы, образуя двумерную ткань . Другие первичные структуры белков были предложены различными исследователями, такими как модель дикетопиперазина Эмиля Абдерхалдена и модель пиррола/пиперидина Троэнсегаарда в 1942 году. Хотя эти альтернативные модели никогда не пользовались большим доверием, они были окончательно опровергнуты, когда Фредерик Сэнгер успешно секвенировал инсулин [ когда ? ] и кристаллографическим определением миоглобина и гемоглобина Максом Перутцем и Джоном Кендрю [ когда? ] .

Первичная структура в других молекулах

Можно сказать, что любой гетерополимер с линейной цепью имеет «первичную структуру» по аналогии с использованием этого термина для белков, но такое использование встречается редко по сравнению с чрезвычайно распространенным использованием в отношении белков. В РНК , которая также имеет обширную вторичную структуру , линейную цепь оснований обычно называют просто «последовательностью», как и в ДНК (которая обычно образует линейную двойную спираль с небольшой вторичной структурой). Другие биологические полимеры, такие как полисахариды, также могут считаться имеющими первичную структуру, хотя их использование не является стандартным.

Связь со вторичной и третичной структурой

Первичная структура биологического полимера во многом определяет трехмерную форму ( третичная структура ). Последовательность белка можно использовать для прогнозирования локальных особенностей , таких как сегменты вторичной структуры или трансмембранные области. Однако сложность сворачивания белка в настоящее время не позволяет предсказать третичную структуру белка только на основе его последовательности. Знание структуры сходной гомологичной последовательности (например, члена одного и того же семейства белков ) позволяет с высокой точностью предсказать третичную структуру путем моделирования гомологии . Если доступна полноразмерная последовательность белка, можно оценить его общие биофизические свойства , такие как изоэлектрическая точка .

Семейства последовательностей часто определяются путем кластеризации последовательностей , а проекты структурной геномики направлены на создание набора репрезентативных структур, чтобы охватить пространство последовательностей возможных неизбыточных последовательностей.

Смотрите также

Примечания и ссылки

  1. ^ ab САНГЕР Ф (1952). «Расположение аминокислот в белках». В М.Л. Энсоне; Кеннет Бэйли; Джон Т. Эдсолл (ред.). Достижения в области химии белков . Том. 7. С. 1–67. дои : 10.1016/S0065-3233(08)60017-0. ISBN 9780120342075. ПМИД  14933251.
  2. ^ Осланд, Рейн; Абрамс, Чарльз; Ампе, Кристоф; Болл, Линда Дж.; Бедфорд, Марк Т.; Чезарени, Джанни; Химона, Марио; Херли, Джеймс Х.; Жаршау, Томас (20 февраля 2002 г.). «Нормализация номенклатуры пептидных мотивов как лигандов модульных белковых доменов». Письма ФЭБС . 513 (1): 141–144. дои : 10.1016/S0014-5793(01)03295-1 . ISSN  1873-3468. ПМИД  11911894.
  3. ^ Осланд Р., Абрамс С., Ампе С., Болл Л.Дж., Бедфорд М.Т., Чезарени Дж., Гимона М., Херли Дж.Х., Джарчау Т., Лехто В.П., Леммон М.А., Линдинг Р., Майер Б.Дж., Нагаи М., Судол М., Уолтер У., Уиндер С.Дж. (1 июля 1968 г.). «Однобуквенное обозначение аминокислотных последовательностей *». Европейский журнал биохимии . 5 (2): 151–153. doi :10.1111/j.1432-1033.1968.tb00350.x. ISSN  1432-1033. ПМИД  11911894.
  4. ^ аб Хаусман, Роберт Э.; Купер, Джеффри М. (2004). Клетка: молекулярный подход . Вашингтон, округ Колумбия: ASM Press. п. 51. ИСБН 978-0-87893-214-6.
  5. ^ Сильва М., Пратас Д., Пиньо А.Дж. (апрель 2021 г.). «AC2: эффективный инструмент сжатия белковых последовательностей с использованием искусственных нейронных сетей и моделей кэш-хэша». Энтропия . 23 (5): 530. Бибкод : 2021Entrp..23..530S. дои : 10.3390/e23050530 . ПМЦ 8146440 . ПМИД  33925812. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  6. ^ ab Fruton JS (май 1979 г.). «Ранние теории структуры белка». Анна. Н-Й акад. Наука . 325 (1): xiv, 1–18. Бибкод : 1979NYASA.325....1F. doi :10.1111/j.1749-6632.1979.tb14125.x. PMID  378063. S2CID  39125170.