stringtranslate.com

Вторичная структура белка

Protein primary structureProtein secondary structureProtein tertiary structureProtein quaternary structure
Изображение выше содержит кликабельные ссылки
Изображение выше содержит кликабельные ссылки
Эта диаграмма (которая является интерактивной) структуры белка использует PCNA в качестве примера. ( PDB : 1AXC ​)

Вторичная структура белка — это локальная пространственная конформация полипептидного остова , исключая боковые цепи. [1] Два наиболее распространенных вторичных структурных элемента — это альфа-спирали и бета-слои , хотя бета-повороты и омега-петли также встречаются. Элементы вторичной структуры обычно спонтанно образуются как промежуточные продукты до того, как белок свернется в свою трехмерную третичную структуру .

Вторичная структура формально определяется рисунком водородных связей между атомами водорода аминогруппы и атомами кислорода карбоксила в пептидном остове . Вторичная структура может быть альтернативно определена на основе регулярного рисунка двугранных углов остова в определенной области графика Рамачандрана независимо от того, имеет ли он правильные водородные связи.

Концепция вторичной структуры была впервые введена Каем Ульриком Линдерстрём-Лангом в Стэнфорде в 1952 году. [2] [3] Другие типы биополимеров , такие как нуклеиновые кислоты, также обладают характерными вторичными структурами .

Типы

Protein secondary structureBeta sheetAlpha helix
Изображение выше содержит кликабельные ссылки
Изображение выше содержит кликабельные ссылки
Интерактивная диаграмма водородных связей во вторичной структуре белка. Мультфильм вверху, атомы внизу с азотом в синем, кислород в красном ( PDB : 1AXC​ ​)

Наиболее распространенными вторичными структурами являются альфа-спирали и бета-слои . Другие спирали, такие как спираль 3 10 и π-спираль , как подсчитано, имеют энергетически выгодные модели водородных связей, но редко наблюдаются в природных белках, за исключением концов α-спиралей из-за неблагоприятной упаковки остова в центре спирали. Другие протяженные структуры, такие как полипролиновая спираль и альфа-слои, редки в белках в нативном состоянии, но часто предполагаются как важные промежуточные продукты сворачивания белка . Плотные повороты и свободные, гибкие петли связывают более «регулярные» элементы вторичной структуры. Случайная спираль не является истинной вторичной структурой, но представляет собой класс конформаций, которые указывают на отсутствие регулярной вторичной структуры.

Аминокислоты различаются по своей способности образовывать различные элементы вторичной структуры. Пролин и глицин иногда называют «разрушителями спиралей», потому что они нарушают регулярность конформации α-спиральной основы; однако оба обладают необычными конформационными способностями и обычно встречаются в поворотах . Аминокислоты, которые предпочитают принимать спиральные конформации в белках, включают метионин , аланин , лейцин , глутамат и лизин («MALEK» в однобуквенных кодах аминокислот ); напротив, большие ароматические остатки ( триптофан , тирозин и фенилаланин ) и C β -разветвленные аминокислоты ( изолейцин , валин и треонин ) предпочитают принимать конформации β-цепи . Однако эти предпочтения недостаточно сильны, чтобы создать надежный метод прогнозирования вторичной структуры только по последовательности.

Низкочастотные коллективные колебания, как полагают, чувствительны к локальной жесткости внутри белков, показывая, что бета-структуры в целом более жесткие, чем альфа или неупорядоченные белки. [6] [7] Измерения нейтронного рассеяния напрямую связали спектральную особенность на частоте ~1 ТГц с коллективными движениями вторичной структуры бета-бочонкового белка GFP. [8]

Модели водородных связей во вторичных структурах могут быть существенно искажены, что затрудняет автоматическое определение вторичной структуры. Существует несколько методов формального определения вторичной структуры белка (например, DSSP , [9] DEFINE, [10] STRIDE , [11] ScrewFit, [12] SST [13] ).

Классификация DSSP

Распределение получено из неизбыточного набора данных pdb_select (март 2006 г.); Вторичная структура назначена DSSP; 8 конформационных состояний сведены к 3 состояниям: H=HGI, E=EB, C=STC. Видны смеси (гауссовых) распределений, также полученные в результате сокращения состояний DSSP.

Словарь вторичной структуры белка, сокращенно DSSP, обычно используется для описания вторичной структуры белка с помощью однобуквенных кодов. Вторичная структура определяется на основе моделей водородных связей, как было первоначально предложено Полингом и др. в 1951 году (до того, как какая-либо структура белка была экспериментально определена). Существует восемь типов вторичной структуры, которые определяет DSSP:

«Катушка» часто кодируется как « » (пробел), C (катушка) или «–» (тире). Спирали (G, H и I) и конформации листов должны иметь разумную длину. Это означает, что 2 соседних остатка в первичной структуре должны образовывать одинаковую схему водородных связей. Если схема водородных связей спирали или листа слишком короткая, они обозначаются как T или B соответственно. Существуют и другие категории назначения вторичной структуры белка (резкие повороты, петли Омега и т. д.), но они используются реже.

Вторичная структура определяется водородной связью , поэтому точное определение водородной связи имеет решающее значение. Стандартное определение водородной связи для вторичной структуры — это DSSP , которая является чисто электростатической моделью. Она присваивает заряды ± q 1  ≈ 0,42 e карбонильному углероду и кислороду соответственно, и заряды ± q 2  ≈ 0,20 e амидному водороду и азоту соответственно. Электростатическая энергия равна

Согласно DSSP, водородная связь существует тогда и только тогда, когда E меньше −0,5 ккал/моль (−2,1 кДж/моль). Хотя формула DSSP является относительно грубым приближением физической энергии водородной связи, она обычно принимается как инструмент для определения вторичной структуры.

ССТ[13]классификация

SST — это байесовский метод назначения вторичной структуры данным координат белка с использованием информационного критерия Шеннона для вывода минимальной длины сообщения ( MML ). SST рассматривает любое назначение вторичной структуры как потенциальную гипотезу, которая пытается объяснить ( сжать ) заданные данные координат белка. Основная идея заключается в том, что лучшее назначение вторичной структуры — это то, которое может объяснить ( сжать ) координаты заданных координат белка наиболее экономичным способом, тем самым связывая вывод вторичной структуры со сжатием данных без потерь . SST точно разграничивает любую цепь белка на области, связанные со следующими типами назначения: [14]

SST обнаруживает π и 3 10 спиральные колпачки для стандартных α -спиралей и автоматически собирает различные удлиненные нити в последовательные β-складчатые листы. Он обеспечивает читаемый вывод рассеченных вторичных структурных элементов и соответствующий загружаемый скрипт PyMol для визуализации назначенных вторичных структурных элементов по отдельности.

Экспериментальное определение

Грубое содержание вторичной структуры биополимера (например, «этот белок на 40% состоит из α-спирали и на 20% из β-слоя ») можно оценить спектроскопически . [15] Для белков распространенным методом является дальний ультрафиолетовый (дальний УФ, 170–250 нм) круговой дихроизм . Выраженный двойной минимум при 208 и 222 нм указывает на α-спиральную структуру, тогда как одиночный минимум при 204 нм или 217 нм отражает структуру случайной спирали или β-слоя соответственно. Менее распространенным методом является инфракрасная спектроскопия , которая обнаруживает различия в колебаниях связей амидных групп из-за водородных связей. Наконец, содержание вторичной структуры можно точно оценить с помощью химических сдвигов изначально не назначенного спектра ЯМР . [16]

Прогноз

Предсказание третичной структуры белка только по его аминокислотной последовательности является очень сложной задачей (см. прогнозирование структуры белка ), но использование более простых определений вторичной структуры является более поддающимся решению.

Ранние методы предсказания вторичной структуры ограничивались предсказанием трех преобладающих состояний: спирали, листа или случайной спирали. Эти методы основывались на склонностях отдельных аминокислот к образованию спирали или листа, иногда в сочетании с правилами оценки свободной энергии формирования элементов вторичной структуры. Первыми широко используемыми методами предсказания вторичной структуры белка из аминокислотной последовательности были метод Чжоу-Фасмана [17] [18] [19] и метод GOR . [20] Хотя такие методы заявляли о достижении ~60% точности в предсказании того, какое из трех состояний (спираль/лист/спираль) принимает остаток, слепые вычислительные оценки позже показали, что фактическая точность была намного ниже. [21]

Значительное увеличение точности (почти до ~80%) было достигнуто за счет использования множественного выравнивания последовательностей ; знание полного распределения аминокислот, которые встречаются в позиции (и в ее окрестностях, обычно ~7 остатков с каждой стороны) на протяжении всей эволюции, дает гораздо лучшую картину структурных тенденций вблизи этой позиции. [22] [23] Для иллюстрации, данный белок может иметь глицин в данной позиции, что само по себе может предполагать случайную спираль там. Однако множественное выравнивание последовательностей может показать, что благоприятствующие спирали аминокислоты встречаются в этой позиции (и близлежащих позициях) в 95% гомологичных белков, охватывающих почти миллиард лет эволюции. Более того, исследуя среднюю гидрофобность в этой и близлежащих позициях, то же самое выравнивание может также предполагать модель доступности остатка растворителя, соответствующую α-спирали. Взятые вместе, эти факторы предполагают, что глицин исходного белка принимает α-спиральную структуру, а не случайную спираль. Для объединения всех доступных данных с целью формирования 3-х позиционного прогноза используются несколько типов методов, включая нейронные сети , скрытые марковские модели и машины опорных векторов . Современные методы прогнозирования также предоставляют оценку достоверности для своих прогнозов в каждой позиции.

Методы предсказания вторичной структуры были оценены с помощью экспериментов по критической оценке предсказания структуры белка (CASP) и постоянно проверялись, например, с помощью EVA (тест) . На основе этих тестов наиболее точными методами оказались Psipred , SAM, [24] PORTER, [25] PROF, [26] и SABLE. [27] Главной областью для улучшения, по-видимому, является предсказание β-цепей; остатки, уверенно предсказанные как β-цепь, вероятно, таковыми и являются, но методы склонны упускать некоторые сегменты β-цепи (ложноотрицательные результаты). Вероятно, существует верхний предел точности предсказания в ~90% в целом из-за особенностей стандартного метода ( DSSP ) для назначения классов вторичной структуры (спираль/цепь/клубок) структурам PDB, с которыми сравниваются предсказания. [28]

Точное предсказание вторичной структуры является ключевым элементом в предсказании третичной структуры во всех случаях, кроме самых простых ( моделирование гомологии ). Например, уверенно предсказанный шаблон из шести элементов вторичной структуры βαββαβ является сигнатурой ферредоксиновой складки. [29]

Приложения

Как вторичные структуры белков, так и нуклеиновых кислот могут быть использованы для помощи в выравнивании множественных последовательностей . Эти выравнивания могут быть сделаны более точными за счет включения информации о вторичной структуре в дополнение к простой информации о последовательности. Иногда это менее полезно в РНК, поскольку спаривание оснований гораздо более консервативно, чем последовательность. Отдаленные связи между белками, первичные структуры которых не поддаются выравниванию, иногда можно обнаружить с помощью вторичной структуры. [22]

Было показано, что α-спирали более стабильны, устойчивы к мутациям и поддаются конструированию, чем β-цепи в природных белках [30] , поэтому проектирование функциональных полностью α-белков, вероятно, будет проще, чем проектирование белков как со спиралями, так и с цепями; это было недавно подтверждено экспериментально. [31]

Смотрите также

Ссылки

  1. ^ Sun PD, Foster CE, Boyington JC (май 2004). "Обзор структурных и функциональных складок белков". Current Protocols in Protein Science . 17 (1): Unit 17.1. doi :10.1002/0471140864.ps1701s35. PMC  7162418. PMID  18429251 .
  2. ^ Linderstrøm-Lang KU (1952). Медицинские лекции Лейн: белки и ферменты . Stanford University Press. стр. 115. ASIN  B0007J31SC.
  3. ^ Schellman JA, Schellman CG (1997). "Kaj Ulrik Linderstrøm-Lang (1896–1959)". Protein Sci . 6 (5): 1092–100. doi :10.1002/pro.5560060516. PMC 2143695 . PMID  9144781. Он уже ввел понятия первичной, вторичной и третичной структуры белков в третьей лекции Лейн (Линдерстром-Ланг, 1952) 
  4. ^ Bottomley S (2004). "Интерактивный учебник по структуре белка". Архивировано из оригинала 1 марта 2011 г. Получено 9 января 2011 г.
  5. ^ Шульц GE, Ширмер RH (1979). Принципы структуры белка. Нью-Йорк: Springer-Verlag. ISBN 0-387-90386-0. OCLC  4498269.
  6. ^ Perticaroli S, Nickels JD, Ehlers G, O'Neill H, Zhang Q, Sokolov AP (октябрь 2013 г.). «Вторичная структура и жесткость в модельных белках». Soft Matter . 9 (40): 9548–56. Bibcode :2013SMat....9.9548P. doi :10.1039/C3SM50807B. PMID  26029761.
  7. ^ Perticaroli S, Nickels JD, Ehlers G, Sokolov AP (июнь 2014 г.). «Жесткость, вторичная структура и универсальность бозонного пика в белках». Biophysical Journal . 106 (12): 2667–74. Bibcode :2014BpJ...106.2667P. doi :10.1016/j.bpj.2014.05.009. PMC 4070067 . PMID  24940784. 
  8. ^ Nickels JD, Perticaroli S, O'Neill H, Zhang Q, Ehlers G, Sokolov AP (2013). «Когерентное рассеяние нейтронов и коллективная динамика в белке, GFP». Biophys. J . 105 (9): 2182–87. Bibcode :2013BpJ...105.2182N. doi :10.1016/j.bpj.2013.09.029. PMC 3824694 . PMID  24209864. 
  9. ^ Kabsch W, Sander C (декабрь 1983 г.). «Словарь вторичной структуры белка: распознавание образов водородно-связанных и геометрических особенностей». Биополимеры . 22 (12): 2577–637. doi :10.1002/bip.360221211. PMID  6667333. S2CID  29185760.
  10. ^ Ричардс FM, Кундрот CE (1988). «Идентификация структурных мотивов из данных координат белков: вторичная структура и супервторичная структура первого уровня». Белки . 3 (2): 71–84. doi :10.1002/prot.340030202. PMID  3399495. S2CID  29126855.
  11. ^ Frishman D, Argos P (декабрь 1995 г.). «Назначение вторичной структуры белка на основе знаний» (PDF) . Белки . 23 (4): 566–79. CiteSeerX 10.1.1.132.9420 . doi :10.1002/prot.340230412. PMID  8749853. S2CID  17487756. Архивировано из оригинала (PDF) 2010-06-13. 
  12. ^ Calligari PA, Kneller GR (декабрь 2012 г.). «ScrewFit: объединение локализации и описания вторичной структуры белка». Acta Crystallographica Section D. 68 ( Pt 12): 1690–3. doi :10.1107/s0907444912039029. PMID  23151634.
  13. ^ ab Konagurthu AS, Lesk AM, Allison L (июнь 2012 г.). «Вывод минимальной длины сообщения вторичной структуры из данных координат белка». Биоинформатика . 28 (12): i97–i105. doi :10.1093/bioinformatics/bts223. PMC 3371855. PMID  22689785 . 
  14. ^ "SST web server" . Получено 17 апреля 2018 г. .
  15. ^ Pelton JT, McLean LR (2000). «Спектроскопические методы анализа вторичной структуры белка». Anal. Biochem . 277 (2): 167–76. doi :10.1006/abio.1999.4320. PMID  10625503.
  16. ^ Meiler J, Baker D (2003). "Быстрое определение сгиба белка с использованием нераспределенных данных ЯМР". Proc. Natl. Acad. Sci. USA . 100 (26): 15404–09. Bibcode : 2003PNAS..10015404M. doi : 10.1073/pnas.2434121100 . PMC 307580. PMID  14668443 . 
  17. ^ Chou PY, Fasman GD (январь 1974). «Предсказание конформации белка». Биохимия . 13 (2): 222–45. doi :10.1021/bi00699a002. PMID  4358940.
  18. ^ Chou PY, Fasman GD (1978). «Эмпирические предсказания конформации белка». Annual Review of Biochemistry . 47 : 251–76. doi :10.1146/annurev.bi.47.070178.001343. PMID  354496.
  19. ^ Chou PY, Fasman GD (1978). "Предсказание вторичной структуры белков по их аминокислотной последовательности". Advances in Enzymology and Related Areas of Molecular Biology . Advances in Enzymology - and Related Areas of Molecular Biology. Vol. 47. pp. 45–148. doi :10.1002/9780470122921.ch2. ISBN 9780470122921. PMID  364941.
  20. ^ Гарнье Дж., Осгуторп Д.Дж., Робсон Б. (март 1978 г.). «Анализ точности и последствий простых методов прогнозирования вторичной структуры глобулярных белков». Журнал молекулярной биологии . 120 (1): 97–120. doi :10.1016/0022-2836(78)90297-8. PMID  642007.
  21. ^ Kabsch W, Sander C (май 1983). «Насколько хороши предсказания вторичной структуры белка?». FEBS Letters . 155 (2): 179–82. doi :10.1016/0014-5793(82)80597-8. PMID  6852232. S2CID  41477827.
  22. ^ ab Simossis VA, Heringa J (август 2004 г.). «Интеграция предсказания вторичной структуры белка и множественного выравнивания последовательностей». Current Protein & Peptide Science . 5 (4): 249–66. doi :10.2174/1389203043379675. PMID  15320732.
  23. ^ Pirovano W, Heringa J (2010). "Предсказание вторичной структуры белка". Методы интеллектуального анализа данных для наук о жизни . Методы в молекулярной биологии. Т. 609. С. 327–48. doi :10.1007/978-1-60327-241-4_19. ISBN 978-1-60327-240-7. PMID  20221928.
  24. ^ Karplus K (2009). "SAM-T08, предсказание структуры белка на основе HMM". Nucleic Acids Res . 37 (выпуск веб-сервера): W492–97. doi :10.1093/nar/gkp403. PMC 2703928. PMID  19483096 . 
  25. ^ Полластри Г., МакЛисахт А. (2005). «Портер: новый, точный сервер для предсказания вторичной структуры белка». Биоинформатика . 21 (8): 1719–20. doi : 10.1093/bioinformatics/bti203 . hdl : 2262/39594 . PMID  15585524.
  26. ^ Yachdav G, Kloppmann E, Kajan L, Hecht M, Goldberg T, Hamp T, Hönigschmid P, Schafferhans A, Roos M, Bernhofer M, Richter L, Ashkenazy H, Punta M, Schlessinger A, Bromberg Y, Schneider R, Vriend G, Sander C, Ben-Tal N, Rost B (2014). "PredictProtein — открытый ресурс для онлайн-предсказания структурных и функциональных характеристик белков". Nucleic Acids Res . 42 (выпуск веб-сервера): W337–43. doi :10.1093/nar/gku366. PMC 4086098. PMID 24799431  . 
  27. ^ Адамчак Р., Поролло А., Меллер Дж. (2005). «Объединение предсказания вторичной структуры и доступности растворителя в белках». Белки . 59 (3): 467–75. doi :10.1002/prot.20441. PMID  15768403. S2CID  13267624.
  28. ^ Кихара Д. (август 2005 г.). «Влияние дальнодействующих взаимодействий на формирование вторичной структуры белков». Protein Science . 14 (8): 1955–963. doi :10.1110/ps.051479505. PMC 2279307 . PMID  15987894. 
  29. ^ Qi Y, Grishin NV (2005). "Structural classification of thioredoxin-like fold proteins" (PDF) . Proteins . 58 (2): 376–88. CiteSeerX 10.1.1.644.8150 . doi :10.1002/prot.20329. PMID  15558583. S2CID  823339. Поскольку определение складки должно включать только основные вторичные структурные элементы, которые присутствуют в большинстве гомологов, мы определяем тиоредоксин-подобную складку как двухслойный α/β-сэндвич с рисунком вторичной структуры βαβββα. 
  30. ^ Abrusán G, Marsh JA (декабрь 2016 г.). «Альфа-спирали более устойчивы к мутациям, чем бета-цепи». PLOS Computational Biology . 12 (12): e1005242. Bibcode : 2016PLSCB..12E5242A. doi : 10.1371/journal.pcbi.1005242 . PMC 5147804. PMID  27935949 . 
  31. ^ Rocklin GJ, Chidyausiku TM, Goreshnik I, Ford A, Houliston S, Lemak A и др. (Июль 2017 г.). «Глобальный анализ сворачивания белков с использованием массивно-параллельного проектирования, синтеза и тестирования». Science . 357 (6347): 168–175. Bibcode :2017Sci...357..168R. doi :10.1126/science.aan0693. PMC 5568797 . PMID  28706065. 

Дальнейшее чтение

Внешние ссылки