Вторичная структура белка

Вторичная структура белка — это локальная пространственная конформация основной цепи полипептида , за исключением боковых цепей. ^[1] Двумя наиболее распространенными вторичными структурными элементами являются альфа-спирали и бета-листы , хотя встречаются также бета-повороты и омега-петли . Элементы вторичной структуры обычно спонтанно образуются в качестве промежуточных продуктов перед тем, как белок сворачивается в свою трехмерную третичную структуру .

Вторичная структура формально определяется характером водородных связей между аминоводородом и карбоксильными атомами кислорода в основной цепи пептида . Альтернативно, вторичная структура может быть определена на основе регулярного рисунка двугранных углов основной цепи в конкретной области графика Рамачандрана, независимо от того, имеет ли она правильные водородные связи.

Концепция вторичной структуры была впервые введена Каем Ульриком Линдерстремом-Лангом в Стэнфорде в 1952 году. ^[2]^[3] Другие типы биополимеров , такие как нуклеиновые кислоты, также обладают характерными вторичными структурами .

Типы

Наиболее распространенными вторичными структурами являются альфа-спирали и бета-листы . Другие спирали, такие как спираль 310 и π-спираль , как рассчитано, имеют энергетически выгодную структуру водородных связей, но редко наблюдаются в природных белках, за исключением концов α-спиралей из - за неблагоприятной упаковки основной цепи в центре спирали. Другие расширенные структуры, такие как полипролиновая спираль и альфа-лист, редко встречаются в белках в нативном состоянии , но часто предполагаются как важные промежуточные соединения сворачивания белков . Крутые повороты и свободные, гибкие петли соединяют более «правильные» элементы вторичной структуры. Случайная спираль не является истинной вторичной структурой, а представляет собой класс конформаций, которые указывают на отсутствие регулярной вторичной структуры.

Аминокислоты различаются по своей способности образовывать различные элементы вторичной структуры. Пролин и глицин иногда называют «разрушителями спирали», поскольку они нарушают регулярность конформации α-спиральной основной цепи; однако оба обладают необычными конформационными способностями и обычно встречаются по очереди . Аминокислоты, которые предпочитают принимать спиральные конформации в белках, включают метионин , аланин , лейцин , глутамат и лизин («MALEK» в однобуквенном коде аминокислот ); Напротив, большие ароматические остатки ( триптофан , тирозин и фенилаланин ) и C ^β -разветвленные аминокислоты ( изолейцин , валин и треонин ) предпочитают принимать конформации β-цепи . Однако эти предпочтения недостаточно сильны, чтобы создать надежный метод предсказания вторичной структуры только на основе последовательности.

Считается, что низкочастотные коллективные вибрации чувствительны к локальной жесткости внутри белков, что показывает, что бета-структуры в целом более жесткие, чем альфа или неупорядоченные белки. ^[6]^[7] Измерения рассеяния нейтронов напрямую связали спектральную особенность на частоте ~ 1 ТГц с коллективными движениями вторичной структуры бета-бочкового белка GFP. ^[8]

Характер водородных связей во вторичных структурах может быть существенно искажен, что затрудняет автоматическое определение вторичной структуры. Существует несколько методов формального определения вторичной структуры белка (например, DSSP , ^[9] DEFINE, ^[10] STRIDE , ^[11] ScrewFit, ^[12] SST ^[13] ).

Классификация ДССП

Распределение получено из неизбыточного набора данных pdb_select (март 2006 г.); Вторичная структура, присвоенная DSSP; 8 конформационных состояний сократились до 3: H=HGI, E=EB, C=STC. Видны смеси (гауссовых) распределений, возникающие также в результате редукции состояний DSSP.

Словарь вторичной структуры белков, сокращенно DSSP, обычно используется для описания вторичной структуры белка с помощью однобуквенных кодов. Вторичная структура определяется на основе структуры водородных связей, первоначально предложенной Полингом и др. в 1951 году (до того, как какая-либо структура белка была экспериментально определена). Существует восемь типов вторичной структуры, которые определяет DSSP:

G = 3-витковая спираль ( 3 ₁₀ спираль ). Минимальная длина 3 остатка.
H = 4-витковая спираль ( α спираль ). Минимальная длина 4 остатка.
I = 5-витковая спираль ( π спираль ). Минимальная длина 5 остатков.
T = виток с водородной связью (3, 4 или 5 витков)
E = удлиненная цепь в параллельной и/или антипараллельной конформации β-листа . Минимальная длина 2 остатка.
B = остаток в изолированном β-мостике (образование одной пары водородных связей β-листа)
S = изгиб (единственное назначение, не основанное на водородных связях).
C = катушка (остатки, не находящиеся ни в одной из вышеперечисленных конформаций).

«Катушка» часто обозначается как « » (пробел), C (катушка) или «–» (тире). Спирали (G, H и I) и листовые формы должны иметь разумную длину. Это означает, что два соседних остатка в первичной структуре должны образовывать одинаковую структуру водородных связей. Если спиральная или листовая структура водородных связей слишком короткая, они обозначаются буквами T или B соответственно. Существуют и другие категории присвоения вторичной структуры белков (резкие повороты, петли Омега и т. д.), но они используются реже.

Вторичная структура определяется водородной связью , поэтому точное определение водородной связи имеет решающее значение. Стандартное определение водородной связи для вторичной структуры — это определение DSSP , которое представляет собой чисто электростатическую модель. Он приписывает заряды ± q ₁ ≈ 0,42 е карбонильному углероду и кислороду соответственно, а заряды ± q ₂ ≈ 0,20 е амидному водороду и азоту соответственно. Электростатическая энергия

E=q_{1}q_{2}\left({\frac {1}{r_{\mathrm {ON} }}}+{\frac {1}{r_{\mathrm {CH} }} }-{\frac {1}{r_{\mathrm {OH} }}}-{\frac {1}{r_{\mathrm {CN} }}}\right)\cdot 332{\text{ ккал/моль }}.

Согласно DSSP, водородная связь существует тогда и только тогда, когда E меньше -0,5 ккал/моль (-2,1 кДж/моль). Хотя формула DSSP является относительно грубым приближением физической энергии водородной связи, она обычно считается инструментом для определения вторичной структуры.

Классификация SST [13]

SST — это байесовский метод присвоения вторичной структуры данным координат белка с использованием информационного критерия Шеннона вывода минимальной длины сообщения ( MML ). SST рассматривает любое присвоение вторичной структуры как потенциальную гипотезу, которая пытается объяснить ( сжать ) данные о координатах белка. Основная идея заключается в том, что лучшее присвоение вторичной структуры — это то, которое может объяснить ( сжать ) координаты данного белка наиболее экономичным способом, таким образом связывая вывод о вторичной структуре со сжатием данных без потерь . SST точно разграничивает любую белковую цепь на области, связанные со следующими типами присвоения: ^[14]

E = (Удлиненная) прядь β-складчатого листа.
G = Правосторонняя спираль 3 10
H = правая α-спираль
I = Правосторонняя π - спираль
g = левая спираль 3 10
h = левая α-спираль
i = левая π - спираль
3 = 3 ₁₀ -подобно Терну
4 = α -подобный поворот
5 = π- как поворот
T = неопределенный поворот
С = катушка
- = Неназначенный остаток

SST обнаруживает π- и 3-10- _{спиральные} соединения со стандартными α -спиралями и автоматически собирает различные удлиненные нити в последовательные β-складчатые листы. Он обеспечивает читаемый вывод разобранных вторичных структурных элементов и соответствующий загружаемый скрипт PyMol для индивидуальной визуализации назначенных вторичных структурных элементов.

Экспериментальное определение

Содержание грубой вторичной структуры биополимера (например, «этот белок на 40% состоит из α-спирали и на 20% из β-листа ») можно оценить спектроскопически . ^{[15] Для белков распространенным методом является}круговой дихроизм в дальнем ультрафиолете (дальний УФ, 170–250 нм) . Выраженный двойной минимум при 208 и 222 нм указывает на α-спиральную структуру, тогда как одиночный минимум при 204 нм или 217 нм отражает структуру случайного клубка или β-листа соответственно. Менее распространенным методом является инфракрасная спектроскопия , которая обнаруживает различия в колебаниях связей амидных групп из-за водородных связей. Наконец, содержание вторичной структуры можно точно оценить, используя химические сдвиги первоначально неустановленного спектра ЯМР . ^[16]

Прогноз

Предсказание третичной структуры белка только на основе его аминокислотной последовательности — очень сложная задача (см. « Предсказание структуры белка »), но использование более простых определений вторичной структуры является более простым.

Ранние методы прогнозирования вторичной структуры ограничивались предсказанием трех преобладающих состояний: спираль, лист или случайный клубок. Эти методы были основаны на склонности отдельных аминокислот к образованию спиралей или листов, иногда в сочетании с правилами оценки свободной энергии образования элементов вторичной структуры. Первыми широко используемыми методами предсказания вторичной структуры белка по аминокислотной последовательности были метод Чоу-Фасмана ^[17]^[18]^[19] и метод GOR . ^[20] Хотя утверждается, что такие методы достигают точности ~60% в предсказании того, какое из трех состояний (спираль/лист/клубок) принимает остаток, слепые компьютерные оценки позже показали, что реальная точность была намного ниже. ^[21]

Значительное увеличение точности (почти до ~80%) было достигнуто за счет использования множественного выравнивания последовательностей ; знание полного распределения аминокислот, которые встречаются в определенном положении (и вблизи него, обычно ~7 остатков с каждой стороны) на протяжении эволюции , дает гораздо лучшую картину структурных тенденций вблизи этого положения. ^[22]^[23] Например, данный белок может иметь глицин в заданном положении, что само по себе может указывать на случайный клубок там. Однако множественное выравнивание последовательностей может показать, что аминокислоты, благоприятствующие спирали, встречаются в этом положении (и близлежащих положениях) в 95% гомологичных белков, охватывающих почти миллиард лет эволюции. Более того, исследуя среднюю гидрофобность в этом и близлежащих положениях, такое же выравнивание может также указывать на структуру доступности остатков для растворителя , соответствующую α-спирали. В совокупности эти факторы позволяют предположить, что глицин исходного белка имеет α-спиральную структуру, а не случайный клубок. Для объединения всех доступных данных для формирования прогноза с тремя состояниями используются несколько типов методов, включая нейронные сети , скрытые модели Маркова и машины опорных векторов . Современные методы прогнозирования также обеспечивают оценку достоверности своих прогнозов в каждой позиции.

Методы прогнозирования вторичной структуры оценивались с помощью экспериментов по критической оценке прогнозирования структуры белка (CASP) и постоянно подвергались сравнительному анализу, например, с помощью EVA (эталонный показатель) . По результатам этих тестов наиболее точными оказались методы Psipred , SAM, ^[24] PORTER, ^[25] PROF, ^[26] и SABLE. ^[27] Главной областью для улучшения, по-видимому, является предсказание β-цепей; остатки, уверенно предсказанные как β-цепи, скорее всего, таковы, но методы склонны игнорировать некоторые сегменты β-цепи (ложноотрицательные результаты). Вероятнее всего, существует верхний предел общей точности прогнозирования ~90% из-за особенностей стандартного метода ( DSSP ) назначения классов вторичной структуры (спираль/цепь/катушка) структурам PDB, по которым сравниваются прогнозы. ^[28]

Точное предсказание вторичной структуры является ключевым элементом предсказания третичной структуры во всех случаях, кроме самых простых ( моделирование гомологии ). Например, уверенно предсказанный паттерн из шести элементов вторичной структуры βαββαβ является признаком складки ферредоксина . ^[29]

Приложения

Вторичные структуры как белка, так и нуклеиновой кислоты можно использовать для содействия множественному выравниванию последовательностей . Это выравнивание можно сделать более точным за счет включения информации о вторичной структуре в дополнение к простой информации о последовательности. Иногда это менее полезно в РНК, поскольку спаривание оснований гораздо более консервативно, чем последовательность. Отдаленные связи между белками, первичные структуры которых не совпадают, иногда можно обнаружить по вторичной структуре. ^[22]

Было показано, что α-спирали более стабильны, устойчивы к мутациям и поддаются конструированию, чем β-цепи в природных белках, ^[30] таким образом, разработка функциональных белков all-α, вероятно, будет проще, чем создание белков как со спиралями, так и с нитями; недавно это было подтверждено экспериментально. ^[31]

Смотрите также

дальнейшее чтение

Брэнден С., Туз Дж. (1999). Введение в структуру белка (2-е изд.). Нью-Йорк: Garland Science. ISBN 978-0815323051.
Полинг Л. , Кори Р.Б. (1951). «Конфигурации полипептидных цепей с предпочтительной ориентацией вокруг одинарных связей: два новых плиссированных листа». Учеб. Натл. акад. наук. США . 37 (11): 729–40. Бибкод : 1951PNAS...37..729P. дои : 10.1073/pnas.37.11.729 . ПМЦ 1063460 . ПМИД 16578412.(Оригинальная статья о конформации бета-листа.)
Полинг Л. , Кори Р.Б. , Брэнсон Х.Р. (1951). «Строение белков; две спиральные конфигурации полипептидной цепи с водородными связями». Учеб. Натл. акад. наук. США . 37 (4): 205–11. Бибкод : 1951PNAS...37..205P. дои : 10.1073/pnas.37.4.205 . ПМЦ 1063337 . ПМИД 14816373.(конформации альфа- и пи-спирали, поскольку они предсказывали, что спирали невозможны.) $3_{10}$

Внешние ссылки

NetSurfP – предиктор вторичной структуры и доступности поверхности
ПРОФ
Винтовая посадка
PSSPred Программа обучения нескольких нейронных сетей для прогнозирования вторичной структуры белков.
Метасервер Genesilico Метасервер, который позволяет запускать более 20 различных предикторов вторичной структуры одним щелчком мыши.
Веб-сервер SST: теоретико-информационное (основанное на сжатии) вторичное структурное задание.