stringtranslate.com

Вторичная структура белка

Protein primary structureProtein secondary structureProtein tertiary structureProtein quaternary structure
Изображение выше содержит кликабельные ссылки.
Изображение выше содержит кликабельные ссылки.
На этой диаграмме (интерактивной) структуры белка в качестве примера используется PCNA . ( PDB : 1AXC ​)

Вторичная структура белка — это локальная пространственная конформация основной цепи полипептида , за исключением боковых цепей. [1] Двумя наиболее распространенными вторичными структурными элементами являются альфа-спирали и бета-листы , хотя встречаются также бета-повороты и омега-петли . Элементы вторичной структуры обычно спонтанно образуются в качестве промежуточных продуктов перед тем, как белок сворачивается в свою трехмерную третичную структуру .

Вторичная структура формально определяется характером водородных связей между аминоводородом и карбоксильными атомами кислорода в основной цепи пептида . Альтернативно, вторичная структура может быть определена на основе регулярного рисунка двугранных углов основной цепи в конкретной области графика Рамачандрана, независимо от того, имеет ли она правильные водородные связи.

Концепция вторичной структуры была впервые введена Каем Ульриком Линдерстремом-Лангом в Стэнфорде в 1952 году. [2] [3] Другие типы биополимеров , такие как нуклеиновые кислоты, также обладают характерными вторичными структурами .

Типы

Protein secondary structureBeta sheetAlpha helix
Изображение выше содержит кликабельные ссылки.
Изображение выше содержит кликабельные ссылки.
Интерактивная диаграмма водородных связей во вторичной структуре белка. Рисунок вверху, атомы внизу: азот — синий, кислород — красный ( PDB : 1AXC​ ​)

Наиболее распространенными вторичными структурами являются альфа-спирали и бета-листы . Другие спирали, такие как спираль 310 и π-спираль , как рассчитано, имеют энергетически выгодную структуру водородных связей, но редко наблюдаются в природных белках, за исключением концов α-спиралей из - за неблагоприятной упаковки основной цепи в центре спирали. Другие расширенные структуры, такие как полипролиновая спираль и альфа-лист, редко встречаются в белках в нативном состоянии , но часто предполагаются как важные промежуточные соединения сворачивания белков . Крутые повороты и свободные, гибкие петли соединяют более «правильные» элементы вторичной структуры. Случайная спираль не является истинной вторичной структурой, а представляет собой класс конформаций, которые указывают на отсутствие регулярной вторичной структуры.

Аминокислоты различаются по своей способности образовывать различные элементы вторичной структуры. Пролин и глицин иногда называют «разрушителями спирали», поскольку они нарушают регулярность конформации α-спиральной основной цепи; однако оба обладают необычными конформационными способностями и обычно встречаются по очереди . Аминокислоты, которые предпочитают принимать спиральные конформации в белках, включают метионин , аланин , лейцин , глутамат и лизин («MALEK» в однобуквенном коде аминокислот ); Напротив, большие ароматические остатки ( триптофан , тирозин и фенилаланин ) и C β -разветвленные аминокислоты ( изолейцин , валин и треонин ) предпочитают принимать конформации β-цепи . Однако эти предпочтения недостаточно сильны, чтобы создать надежный метод предсказания вторичной структуры только на основе последовательности.

Считается, что низкочастотные коллективные вибрации чувствительны к локальной жесткости внутри белков, что показывает, что бета-структуры в целом более жесткие, чем альфа или неупорядоченные белки. [6] [7] Измерения рассеяния нейтронов напрямую связали спектральную особенность на частоте ~ 1 ТГц с коллективными движениями вторичной структуры бета-бочкового белка GFP. [8]

Характер водородных связей во вторичных структурах может быть существенно искажен, что затрудняет автоматическое определение вторичной структуры. Существует несколько методов формального определения вторичной структуры белка (например, DSSP , [9] DEFINE, [10] STRIDE , [11] ScrewFit, [12] SST [13] ).

Классификация ДССП

Распределение получено из неизбыточного набора данных pdb_select (март 2006 г.); Вторичная структура, присвоенная DSSP; 8 конформационных состояний сократились до 3: H=HGI, E=EB, C=STC. Видны смеси (гауссовых) распределений, возникающие также в результате редукции состояний DSSP.

Словарь вторичной структуры белков, сокращенно DSSP, обычно используется для описания вторичной структуры белка с помощью однобуквенных кодов. Вторичная структура определяется на основе структуры водородных связей, первоначально предложенной Полингом и др. в 1951 году (до того, как какая-либо структура белка была экспериментально определена). Существует восемь типов вторичной структуры, которые определяет DSSP:

«Катушка» часто обозначается как « » (пробел), C (катушка) или «–» (тире). Спирали (G, H и I) и листовые формы должны иметь разумную длину. Это означает, что два соседних остатка в первичной структуре должны образовывать одинаковую структуру водородных связей. Если спиральная или листовая структура водородных связей слишком короткая, они обозначаются буквами T или B соответственно. Существуют и другие категории присвоения вторичной структуры белков (резкие повороты, петли Омега и т. д.), но они используются реже.

Вторичная структура определяется водородной связью , поэтому точное определение водородной связи имеет решающее значение. Стандартное определение водородной связи для вторичной структуры — это определение DSSP , которое представляет собой чисто электростатическую модель. Он приписывает заряды ± q 1  ≈ 0,42 е карбонильному углероду и кислороду соответственно, а заряды ± q 2  ≈ 0,20 е амидному водороду и азоту соответственно. Электростатическая энергия

Согласно DSSP, водородная связь существует тогда и только тогда, когда E меньше -0,5 ккал/моль (-2,1 кДж/моль). Хотя формула DSSP является относительно грубым приближением физической энергии водородной связи, она обычно считается инструментом для определения вторичной структуры.

Классификация SST [13]

SST — это байесовский метод присвоения вторичной структуры данным координат белка с использованием информационного критерия Шеннона вывода минимальной длины сообщения ( MML ). SST рассматривает любое присвоение вторичной структуры как потенциальную гипотезу, которая пытается объяснить ( сжать ) данные о координатах белка. Основная идея заключается в том, что лучшее присвоение вторичной структуры — это то, которое может объяснить ( сжать ) координаты данного белка наиболее экономичным способом, таким образом связывая вывод о вторичной структуре со сжатием данных без потерь . SST точно разграничивает любую белковую цепь на области, связанные со следующими типами присвоения: [14]

SST обнаруживает π- и 3-10- спиральные соединения со стандартными α -спиралями и автоматически собирает различные удлиненные нити в последовательные β-складчатые листы. Он обеспечивает читаемый вывод разобранных вторичных структурных элементов и соответствующий загружаемый скрипт PyMol для индивидуальной визуализации назначенных вторичных структурных элементов.

Экспериментальное определение

Содержание грубой вторичной структуры биополимера (например, «этот белок на 40% состоит из α-спирали и на 20% из β-листа ») можно оценить спектроскопически . [15] Для белков распространенным методом является круговой дихроизм в дальнем ультрафиолете (дальний УФ, 170–250 нм) . Выраженный двойной минимум при 208 и 222 нм указывает на α-спиральную структуру, тогда как одиночный минимум при 204 нм или 217 нм отражает структуру случайного клубка или β-листа соответственно. Менее распространенным методом является инфракрасная спектроскопия , которая обнаруживает различия в колебаниях связей амидных групп из-за водородных связей. Наконец, содержание вторичной структуры можно точно оценить, используя химические сдвиги первоначально неустановленного спектра ЯМР . [16]

Прогноз

Предсказание третичной структуры белка только на основе его аминокислотной последовательности — очень сложная задача (см. « Предсказание структуры белка »), но использование более простых определений вторичной структуры является более простым.

Ранние методы прогнозирования вторичной структуры ограничивались предсказанием трех преобладающих состояний: спираль, лист или случайный клубок. Эти методы были основаны на склонности отдельных аминокислот к образованию спиралей или листов, иногда в сочетании с правилами оценки свободной энергии образования элементов вторичной структуры. Первыми широко используемыми методами предсказания вторичной структуры белка по аминокислотной последовательности были метод Чоу-Фасмана [17] [18] [19] и метод GOR . [20] Хотя утверждается, что такие методы достигают точности ~60% в предсказании того, какое из трех состояний (спираль/лист/клубок) принимает остаток, слепые компьютерные оценки позже показали, что реальная точность была намного ниже. [21]

Значительное увеличение точности (почти до ~80%) было достигнуто за счет использования множественного выравнивания последовательностей ; знание полного распределения аминокислот, которые встречаются в определенном положении (и вблизи него, обычно ~7 остатков с каждой стороны) на протяжении эволюции , дает гораздо лучшую картину структурных тенденций вблизи этого положения. [22] [23] Например, данный белок может иметь глицин в заданном положении, что само по себе может указывать на случайный клубок там. Однако множественное выравнивание последовательностей может показать, что аминокислоты, благоприятствующие спирали, встречаются в этом положении (и близлежащих положениях) в 95% гомологичных белков, охватывающих почти миллиард лет эволюции. Более того, исследуя среднюю гидрофобность в этом и близлежащих положениях, такое же выравнивание может также указывать на структуру доступности остатков для растворителя , соответствующую α-спирали. В совокупности эти факторы позволяют предположить, что глицин исходного белка имеет α-спиральную структуру, а не случайный клубок. Для объединения всех доступных данных для формирования прогноза с тремя состояниями используются несколько типов методов, включая нейронные сети , скрытые модели Маркова и машины опорных векторов . Современные методы прогнозирования также обеспечивают оценку достоверности своих прогнозов в каждой позиции.

Методы прогнозирования вторичной структуры оценивались с помощью экспериментов по критической оценке прогнозирования структуры белка (CASP) и постоянно подвергались сравнительному анализу, например, с помощью EVA (эталонный показатель) . По результатам этих тестов наиболее точными оказались методы Psipred , SAM, [24] PORTER, [25] PROF, [26] и SABLE. [27] Главной областью для улучшения, по-видимому, является предсказание β-цепей; остатки, уверенно предсказанные как β-цепи, скорее всего, таковы, но методы склонны игнорировать некоторые сегменты β-цепи (ложноотрицательные результаты). Вероятнее всего, существует верхний предел общей точности прогнозирования ~90% из-за особенностей стандартного метода ( DSSP ) назначения классов вторичной структуры (спираль/цепь/катушка) структурам PDB, по которым сравниваются прогнозы. [28]

Точное предсказание вторичной структуры является ключевым элементом предсказания третичной структуры во всех случаях, кроме самых простых ( моделирование гомологии ). Например, уверенно предсказанный паттерн из шести элементов вторичной структуры βαββαβ является признаком складки ферредоксина . [29]

Приложения

Вторичные структуры как белка, так и нуклеиновой кислоты можно использовать для содействия множественному выравниванию последовательностей . Это выравнивание можно сделать более точным за счет включения информации о вторичной структуре в дополнение к простой информации о последовательности. Иногда это менее полезно в РНК, поскольку спаривание оснований гораздо более консервативно, чем последовательность. Отдаленные связи между белками, первичные структуры которых не совпадают, иногда можно обнаружить по вторичной структуре. [22]

Было показано, что α-спирали более стабильны, устойчивы к мутациям и поддаются конструированию, чем β-цепи в природных белках, [30] таким образом, разработка функциональных белков all-α, вероятно, будет проще, чем создание белков как со спиралями, так и с нитями; недавно это было подтверждено экспериментально. [31]

Смотрите также

Рекомендации

  1. ^ Sun PD, Foster CE, Boyington JC (май 2004 г.). «Обзор структурных и функциональных складок белка». Современные протоколы в науке о белках . 17 (1): Раздел 17.1. дои : 10.1002/0471140864.ps1701s35. ПМК  7162418 . ПМИД  18429251.
  2. ^ Линдерстрем-Ланг КУ (1952). Медицинские лекции Лейна: Белки и ферменты . Издательство Стэнфордского университета. п. 115. АСИН  B0007J31SC.
  3. ^ Шеллман Дж.А., Шеллман К.Г. (1997). «Кай Ульрик Линдерстрем-Ланг (1896–1959)». Белковая наука . 6 (5): 1092–100. дои : 10.1002/pro.5560060516. ПМК 2143695 . PMID  9144781. Он уже представил понятия первичной, вторичной и третичной структуры белков в третьей лекции Лейна (Линдерстрам-Ланг, 1952). 
  4. ^ Боттомли С (2004). «Интерактивное руководство по структуре белка». Архивировано из оригинала 1 марта 2011 года . Проверено 9 января 2011 г.
  5. ^ Шульц Г.Е., Ширмер Р.Х. (1979). Принципы строения белка. Нью-Йорк: Springer-Verlag. ISBN 0-387-90386-0. ОСЛК  4498269.
  6. ^ Пертикароли С., Никелс Дж.Д., Элерс Г., О'Нил Х., Чжан К., Соколов А.П. (октябрь 2013 г.). «Вторичная структура и жесткость модельных белков». Мягкая материя . 9 (40): 9548–56. Бибкод : 2013SMat....9.9548P. дои : 10.1039/C3SM50807B. ПМИД  26029761.
  7. ^ Пертикароли С., Никелс Дж.Д., Элерс Г., Соколов А.П. (июнь 2014 г.). «Жесткость, вторичная структура и универсальность бозонного пика в белках». Биофизический журнал . 106 (12): 2667–74. Бибкод : 2014BpJ...106.2667P. дои : 10.1016/j.bpj.2014.05.009. ПМК 4070067 . ПМИД  24940784. 
  8. ^ Никельс Дж.Д., Пертикароли С., О'Нил Х., Чжан К., Элерс Г., Соколов А.П. (2013). «Когерентное рассеяние нейтронов и коллективная динамика в белке, GFP». Биофиз. Дж . 105 (9): 2182–87. Бибкод : 2013BpJ...105.2182N. дои : 10.1016/j.bpj.2013.09.029. ПМЦ 3824694 . ПМИД  24209864. 
  9. ^ Кабш В., Сандер С. (декабрь 1983 г.). «Словарь вторичной структуры белков: распознавание образов водородных связей и геометрических особенностей». Биополимеры . 22 (12): 2577–637. дои : 10.1002/bip.360221211. PMID  6667333. S2CID  29185760.
  10. ^ Ричардс FM, Кундрот CE (1988). «Идентификация структурных мотивов по данным координат белков: вторичная структура и супервторичная структура первого уровня». Белки . 3 (2): 71–84. дои : 10.1002/прот.340030202. PMID  3399495. S2CID  29126855.
  11. ^ Фришман Д., Аргос П. (декабрь 1995 г.). «Научное определение вторичной структуры белка» (PDF) . Белки . 23 (4): 566–79. CiteSeerX 10.1.1.132.9420 . дои : 10.1002/прот.340230412. PMID  8749853. S2CID  17487756. Архивировано из оригинала (PDF) 13 июня 2010 г. 
  12. ^ Каллигари, Пенсильвания, Кнеллер Г.Р. (декабрь 2012 г.). «ScrewFit: сочетание локализации и описания вторичной структуры белка». Acta Crystallographica Раздел D. 68 (Часть 12): 1690–3. дои : 10.1107/s0907444912039029. ПМИД  23151634.
  13. ^ аб Конагурту А.С., Леск А.М., Эллисон Л. (июнь 2012 г.). «Вывод о вторичной структуре по минимальной длине сообщения на основе данных о координатах белка». Биоинформатика . 28 (12): i97–i105. doi : 10.1093/биоинформатика/bts223. ПМК 3371855 . ПМИД  22689785. 
  14. ^ "Веб-сервер SST" . Проверено 17 апреля 2018 г.
  15. ^ Пелтон Дж.Т., Маклин Л.Р. (2000). «Спектроскопические методы анализа вторичной структуры белков». Анальный. Биохим . 277 (2): 167–76. дои : 10.1006/abio.1999.4320. ПМИД  10625503.
  16. ^ Мейлер Дж., Бейкер Д. (2003). «Быстрое определение складки белка с использованием неназначенных данных ЯМР». Учеб. Натл. акад. наук. США . 100 (26): 15404–09. Бибкод : 2003PNAS..10015404M. дои : 10.1073/pnas.2434121100 . ПМК 307580 . ПМИД  14668443. 
  17. ^ Чоу П.Ю., Фасман Г.Д. (январь 1974 г.). «Прогнозирование конформации белка». Биохимия . 13 (2): 222–45. дои : 10.1021/bi00699a002. ПМИД  4358940.
  18. ^ Чоу П.Ю., Фасман Г.Д. (1978). «Эмпирические предсказания конформации белка». Ежегодный обзор биохимии . 47 : 251–76. doi : 10.1146/annurev.bi.47.070178.001343. ПМИД  354496.
  19. ^ Чоу П.Ю., Фасман Г.Д. (1978). «Предсказание вторичной структуры белков по их аминокислотной последовательности». Достижения энзимологии и смежных областей молекулярной биологии . Достижения в энзимологии и смежных областях молекулярной биологии. Том. 47. С. 45–148. дои : 10.1002/9780470122921.ch2. ISBN 9780470122921. ПМИД  364941.
  20. ^ Гарнье Дж., Осгуторп-ди-джей, Робсон Б. (март 1978 г.). «Анализ точности и применения простых методов предсказания вторичной структуры глобулярных белков». Журнал молекулярной биологии . 120 (1): 97–120. дои : 10.1016/0022-2836(78)90297-8. ПМИД  642007.
  21. ^ Кабш В., Сандер С. (май 1983 г.). «Насколько точны предсказания вторичной структуры белка?». Письма ФЭБС . 155 (2): 179–82. дои : 10.1016/0014-5793(82)80597-8. PMID  6852232. S2CID  41477827.
  22. ^ ab Simossis VA, Heringa J (август 2004 г.). «Интеграция предсказания вторичной структуры белка и множественного выравнивания последовательностей». Современная наука о белках и пептидах . 5 (4): 249–66. дои : 10.2174/1389203043379675. ПМИД  15320732.
  23. ^ Пировано В., Херинга Дж. (2010). «Прогнозирование вторичной структуры белка». Методы интеллектуального анализа данных для наук о жизни . Методы молекулярной биологии. Том. 609. стр. 327–48. дои : 10.1007/978-1-60327-241-4_19. ISBN 978-1-60327-240-7. ПМИД  20221928.
  24. ^ Карплюс К (2009). «SAM-T08, предсказание структуры белка на основе HMM». Нуклеиновые кислоты Рез . 37 (проблема с веб-сервером): W492–97. дои : 10.1093/nar/gkp403. ПМК 2703928 . ПМИД  19483096. 
  25. ^ Полластри Г., МакЛисахт А. (2005). «Портер: новый точный сервер для прогнозирования вторичной структуры белков». Биоинформатика . 21 (8): 1719–20. doi : 10.1093/биоинформатика/bti203 . hdl : 2262/39594 . ПМИД  15585524.
  26. ^ Яхдав Г, Клоппманн Э, Каян Л, Хехт М, Гольдберг Т, Хэмп Т, Хёнигшмид П, Шафферханс А, Роос М, Бернхофер М, Рихтер Л, Ашкенази Х, Пунта М, Шлезингер А, Бромберг Ю, Шнайдер Р, Вриенд Г, Сандер С, Бен-Тал Н, Рост Б (2014). «PredictProtein — открытый ресурс для онлайн-прогноза структурных и функциональных особенностей белков». Нуклеиновые кислоты Рез . 42 (проблема с веб-сервером): W337–43. дои : 10.1093/nar/gku366. ПМК 4086098 . ПМИД  24799431. 
  27. ^ Адамчак Р., Поролло А., Меллер Дж. (2005). «Сочетание предсказания вторичной структуры и доступности растворителей в белках». Белки . 59 (3): 467–75. дои : 10.1002/prot.20441. PMID  15768403. S2CID  13267624.
  28. ^ Кихара Д (август 2005 г.). «Влияние дальнодействующих взаимодействий на формирование вторичной структуры белков». Белковая наука . 14 (8): 1955–963. дои : 10.1110/ps.051479505. ПМК 2279307 . ПМИД  15987894. 
  29. ^ Ци Ю, Гришин Н.В. (2005). «Структурная классификация тиоредоксин-подобных складчатых белков» (PDF) . Белки . 58 (2): 376–88. CiteSeerX 10.1.1.644.8150 . дои : 10.1002/прот.20329. PMID  15558583. S2CID  823339. Поскольку определение складки должно включать только основные вторичные структурные элементы, которые присутствуют в большинстве гомологов, мы определяем тиоредоксин-подобную складку как двухслойный α/β-сэндвич с паттерном вторичной структуры βαβββα. . 
  30. ^ Абрусан Г., Марш Дж.А. (декабрь 2016 г.). «Альфа-спирали более устойчивы к мутациям, чем бета-цепи». PLOS Вычислительная биология . 12 (12): e1005242. Бибкод : 2016PLSCB..12E5242A. дои : 10.1371/journal.pcbi.1005242 . ПМК 5147804 . ПМИД  27935949. 
  31. ^ Роклин Г.Дж., Чидьяусику Т.М., Горешник И., Форд А., Хоулистон С., Лемак А. и др. (июль 2017 г.). «Глобальный анализ сворачивания белков с использованием массово-параллельного проектирования, синтеза и тестирования». Наука . 357 (6347): 168–175. Бибкод : 2017Sci...357..168R. doi : 10.1126/science.aan0693. ПМЦ 5568797 . ПМИД  28706065. 

дальнейшее чтение

Внешние ссылки