Вторичная структура белка — это локальная пространственная конформация основной цепи полипептида , за исключением боковых цепей. [1] Двумя наиболее распространенными вторичными структурными элементами являются альфа-спирали и бета-листы , хотя встречаются также бета-повороты и омега-петли . Элементы вторичной структуры обычно спонтанно образуются в качестве промежуточных продуктов перед тем, как белок сворачивается в свою трехмерную третичную структуру .
Вторичная структура формально определяется характером водородных связей между аминоводородом и карбоксильными атомами кислорода в основной цепи пептида . Альтернативно, вторичная структура может быть определена на основе регулярного рисунка двугранных углов основной цепи в конкретной области графика Рамачандрана, независимо от того, имеет ли она правильные водородные связи.
Концепция вторичной структуры была впервые введена Каем Ульриком Линдерстремом-Лангом в Стэнфорде в 1952 году. [2] [3] Другие типы биополимеров , такие как нуклеиновые кислоты, также обладают характерными вторичными структурами .
Наиболее распространенными вторичными структурами являются альфа-спирали и бета-листы . Другие спирали, такие как спираль 310 и π-спираль , как рассчитано, имеют энергетически выгодную структуру водородных связей, но редко наблюдаются в природных белках, за исключением концов α-спиралей из - за неблагоприятной упаковки основной цепи в центре спирали. Другие расширенные структуры, такие как полипролиновая спираль и альфа-лист, редко встречаются в белках в нативном состоянии , но часто предполагаются как важные промежуточные соединения сворачивания белков . Крутые повороты и свободные, гибкие петли соединяют более «правильные» элементы вторичной структуры. Случайная спираль не является истинной вторичной структурой, а представляет собой класс конформаций, которые указывают на отсутствие регулярной вторичной структуры.
Аминокислоты различаются по своей способности образовывать различные элементы вторичной структуры. Пролин и глицин иногда называют «разрушителями спирали», поскольку они нарушают регулярность конформации α-спиральной основной цепи; однако оба обладают необычными конформационными способностями и обычно встречаются по очереди . Аминокислоты, которые предпочитают принимать спиральные конформации в белках, включают метионин , аланин , лейцин , глутамат и лизин («MALEK» в однобуквенном коде аминокислот ); Напротив, большие ароматические остатки ( триптофан , тирозин и фенилаланин ) и C β -разветвленные аминокислоты ( изолейцин , валин и треонин ) предпочитают принимать конформации β-цепи . Однако эти предпочтения недостаточно сильны, чтобы создать надежный метод предсказания вторичной структуры только на основе последовательности.
Считается, что низкочастотные коллективные вибрации чувствительны к локальной жесткости внутри белков, что показывает, что бета-структуры в целом более жесткие, чем альфа или неупорядоченные белки. [6] [7] Измерения рассеяния нейтронов напрямую связали спектральную особенность на частоте ~ 1 ТГц с коллективными движениями вторичной структуры бета-бочкового белка GFP. [8]
Характер водородных связей во вторичных структурах может быть существенно искажен, что затрудняет автоматическое определение вторичной структуры. Существует несколько методов формального определения вторичной структуры белка (например, DSSP , [9] DEFINE, [10] STRIDE , [11] ScrewFit, [12] SST [13] ).
Словарь вторичной структуры белков, сокращенно DSSP, обычно используется для описания вторичной структуры белка с помощью однобуквенных кодов. Вторичная структура определяется на основе структуры водородных связей, первоначально предложенной Полингом и др. в 1951 году (до того, как какая-либо структура белка была экспериментально определена). Существует восемь типов вторичной структуры, которые определяет DSSP:
«Катушка» часто обозначается как « » (пробел), C (катушка) или «–» (тире). Спирали (G, H и I) и листовые формы должны иметь разумную длину. Это означает, что два соседних остатка в первичной структуре должны образовывать одинаковую структуру водородных связей. Если спиральная или листовая структура водородных связей слишком короткая, они обозначаются буквами T или B соответственно. Существуют и другие категории присвоения вторичной структуры белков (резкие повороты, петли Омега и т. д.), но они используются реже.
Вторичная структура определяется водородной связью , поэтому точное определение водородной связи имеет решающее значение. Стандартное определение водородной связи для вторичной структуры — это определение DSSP , которое представляет собой чисто электростатическую модель. Он приписывает заряды ± q 1 ≈ 0,42 е карбонильному углероду и кислороду соответственно, а заряды ± q 2 ≈ 0,20 е амидному водороду и азоту соответственно. Электростатическая энергия
Согласно DSSP, водородная связь существует тогда и только тогда, когда E меньше -0,5 ккал/моль (-2,1 кДж/моль). Хотя формула DSSP является относительно грубым приближением физической энергии водородной связи, она обычно считается инструментом для определения вторичной структуры.
SST — это байесовский метод присвоения вторичной структуры данным координат белка с использованием информационного критерия Шеннона вывода минимальной длины сообщения ( MML ). SST рассматривает любое присвоение вторичной структуры как потенциальную гипотезу, которая пытается объяснить ( сжать ) данные о координатах белка. Основная идея заключается в том, что лучшее присвоение вторичной структуры — это то, которое может объяснить ( сжать ) координаты данного белка наиболее экономичным способом, таким образом связывая вывод о вторичной структуре со сжатием данных без потерь . SST точно разграничивает любую белковую цепь на области, связанные со следующими типами присвоения: [14]
SST обнаруживает π- и 3-10- спиральные соединения со стандартными α -спиралями и автоматически собирает различные удлиненные нити в последовательные β-складчатые листы. Он обеспечивает читаемый вывод разобранных вторичных структурных элементов и соответствующий загружаемый скрипт PyMol для индивидуальной визуализации назначенных вторичных структурных элементов.
Содержание грубой вторичной структуры биополимера (например, «этот белок на 40% состоит из α-спирали и на 20% из β-листа ») можно оценить спектроскопически . [15] Для белков распространенным методом является круговой дихроизм в дальнем ультрафиолете (дальний УФ, 170–250 нм) . Выраженный двойной минимум при 208 и 222 нм указывает на α-спиральную структуру, тогда как одиночный минимум при 204 нм или 217 нм отражает структуру случайного клубка или β-листа соответственно. Менее распространенным методом является инфракрасная спектроскопия , которая обнаруживает различия в колебаниях связей амидных групп из-за водородных связей. Наконец, содержание вторичной структуры можно точно оценить, используя химические сдвиги первоначально неустановленного спектра ЯМР . [16]
Предсказание третичной структуры белка только на основе его аминокислотной последовательности — очень сложная задача (см. « Предсказание структуры белка »), но использование более простых определений вторичной структуры является более простым.
Ранние методы прогнозирования вторичной структуры ограничивались предсказанием трех преобладающих состояний: спираль, лист или случайный клубок. Эти методы были основаны на склонности отдельных аминокислот к образованию спиралей или листов, иногда в сочетании с правилами оценки свободной энергии образования элементов вторичной структуры. Первыми широко используемыми методами предсказания вторичной структуры белка по аминокислотной последовательности были метод Чоу-Фасмана [17] [18] [19] и метод GOR . [20] Хотя утверждается, что такие методы достигают точности ~60% в предсказании того, какое из трех состояний (спираль/лист/клубок) принимает остаток, слепые компьютерные оценки позже показали, что реальная точность была намного ниже. [21]
Значительное увеличение точности (почти до ~80%) было достигнуто за счет использования множественного выравнивания последовательностей ; знание полного распределения аминокислот, которые встречаются в определенном положении (и вблизи него, обычно ~7 остатков с каждой стороны) на протяжении эволюции , дает гораздо лучшую картину структурных тенденций вблизи этого положения. [22] [23] Например, данный белок может иметь глицин в заданном положении, что само по себе может указывать на случайный клубок там. Однако множественное выравнивание последовательностей может показать, что аминокислоты, благоприятствующие спирали, встречаются в этом положении (и близлежащих положениях) в 95% гомологичных белков, охватывающих почти миллиард лет эволюции. Более того, исследуя среднюю гидрофобность в этом и близлежащих положениях, такое же выравнивание может также указывать на структуру доступности остатков для растворителя , соответствующую α-спирали. В совокупности эти факторы позволяют предположить, что глицин исходного белка имеет α-спиральную структуру, а не случайный клубок. Для объединения всех доступных данных для формирования прогноза с тремя состояниями используются несколько типов методов, включая нейронные сети , скрытые модели Маркова и машины опорных векторов . Современные методы прогнозирования также обеспечивают оценку достоверности своих прогнозов в каждой позиции.
Методы прогнозирования вторичной структуры оценивались с помощью экспериментов по критической оценке прогнозирования структуры белка (CASP) и постоянно подвергались сравнительному анализу, например, с помощью EVA (эталонный показатель) . По результатам этих тестов наиболее точными оказались методы Psipred , SAM, [24] PORTER, [25] PROF, [26] и SABLE. [27] Главной областью для улучшения, по-видимому, является предсказание β-цепей; остатки, уверенно предсказанные как β-цепи, скорее всего, таковы, но методы склонны игнорировать некоторые сегменты β-цепи (ложноотрицательные результаты). Вероятнее всего, существует верхний предел общей точности прогнозирования ~90% из-за особенностей стандартного метода ( DSSP ) назначения классов вторичной структуры (спираль/цепь/катушка) структурам PDB, по которым сравниваются прогнозы. [28]
Точное предсказание вторичной структуры является ключевым элементом предсказания третичной структуры во всех случаях, кроме самых простых ( моделирование гомологии ). Например, уверенно предсказанный паттерн из шести элементов вторичной структуры βαββαβ является признаком складки ферредоксина . [29]
Вторичные структуры как белка, так и нуклеиновой кислоты можно использовать для содействия множественному выравниванию последовательностей . Это выравнивание можно сделать более точным за счет включения информации о вторичной структуре в дополнение к простой информации о последовательности. Иногда это менее полезно в РНК, поскольку спаривание оснований гораздо более консервативно, чем последовательность. Отдаленные связи между белками, первичные структуры которых не совпадают, иногда можно обнаружить по вторичной структуре. [22]
Было показано, что α-спирали более стабильны, устойчивы к мутациям и поддаются конструированию, чем β-цепи в природных белках, [30] таким образом, разработка функциональных белков all-α, вероятно, будет проще, чем создание белков как со спиралями, так и с нитями; недавно это было подтверждено экспериментально. [31]
Он уже представил понятия первичной, вторичной и третичной структуры белков в третьей лекции Лейна (Линдерстрам-Ланг, 1952).
Поскольку определение складки должно включать только основные вторичные структурные элементы, которые присутствуют в большинстве гомологов, мы определяем тиоредоксин-подобную складку как двухслойный α/β-сэндвич с паттерном вторичной структуры βαβββα. .