Выше, вторичная структурная консервация 80 членов клана протеаз PA (суперсемейство). H обозначает α-спираль , E обозначает β-слой , L обозначает петлю. Ниже, консервация последовательности для того же выравнивания. Стрелки указывают на остатки каталитической триады . Выровнено на основе структуры с помощью DALI
Суперсемейства белков идентифицируются с использованием ряда методов. Близкородственные члены могут быть идентифицированы с помощью методов, отличных от тех, которые необходимы для группировки наиболее эволюционно расходящихся членов.
Сходство последовательностей
Исторически, сходство различных аминокислотных последовательностей было наиболее распространенным методом вывода гомологии . [5] Сходство последовательностей считается хорошим предиктором родства, поскольку схожие последовательности, скорее всего, являются результатом дупликации генов и дивергентной эволюции , а не результатом конвергентной эволюции . Аминокислотная последовательность, как правило, более консервативна, чем последовательность ДНК (из-за вырожденного генетического кода ), поэтому это более чувствительный метод обнаружения. Поскольку некоторые аминокислоты имеют схожие свойства (например, заряд, гидрофобность, размер), консервативные мутации , которые их заменяют, часто нейтральны для функции. Наиболее консервативные области последовательности белка часто соответствуют функционально важным областям, таким как каталитические сайты и сайты связывания, поскольку эти области менее толерантны к изменениям последовательности.
Использование сходства последовательностей для вывода гомологии имеет несколько ограничений. Не существует минимального уровня сходства последовательностей, гарантированного для создания идентичных структур. В течение длительных периодов эволюции родственные белки могут не показывать обнаруживаемого сходства последовательностей друг с другом. Последовательности со множеством вставок и делеций также иногда могут быть трудно выровнены и, таким образом, идентифицировать гомологичные области последовательностей. Например, в клане протеаз PA ни один остаток не сохраняется через суперсемейство, даже те, что находятся в каталитической триаде . И наоборот, отдельные семейства, составляющие суперсемейство, определяются на основе их выравнивания последовательностей, например, семейство протеаз C04 в клане PA.
Тем не менее, сходство последовательностей является наиболее часто используемой формой доказательства для вывода о родстве, поскольку число известных последовательностей значительно превосходит число известных третичных структур . [6] При отсутствии структурной информации сходство последовательностей ограничивает пределы того, какие белки могут быть отнесены к суперсемейству. [6]
Структурное сходство
Структура гораздо более эволюционно консервативна, чем последовательность, так что белки с очень похожими структурами могут иметь совершенно разные последовательности. [7] В течение очень длительных эволюционных временных масштабов очень немногие остатки показывают обнаруживаемую консервацию аминокислотной последовательности, однако вторичные структурные элементы и третичные структурные мотивы высоко консервативны. Некоторая динамика белка [8] и конформационные изменения структуры белка также могут быть сохранены, как это видно в суперсемействе серпинов . [9] Следовательно, третичная структура белка может быть использована для обнаружения гомологии между белками, даже если в их последовательностях не осталось никаких доказательств родства. Программы структурного выравнивания , такие как DALI , используют трехмерную структуру интересующего белка для поиска белков со схожими складками. [10] Однако в редких случаях родственные белки могут эволюционировать так, чтобы стать структурно несходными [11], и родство может быть выведено только другими методами. [12] [13] [14]
Механистическое сходство
Каталитический механизм ферментов в пределах суперсемейства обычно сохраняется, хотя субстратная специфичность может существенно различаться. [15] Каталитические остатки также имеют тенденцию встречаться в том же порядке в последовательности белка. [16] Для семейств в пределах клана протеаз PA, хотя и наблюдалась дивергентная эволюция остатков каталитической триады, используемых для выполнения катализа, все члены используют схожий механизм для выполнения ковалентного, нуклеофильного катализа на белках, пептидах или аминокислотах. [17] Однако одного механизма недостаточно для вывода о родстве. Некоторые каталитические механизмы конвергентно развивались несколько раз независимо и, таким образом, образуют отдельные суперсемейства, [18] [19] [20] а в некоторых суперсемействах демонстрируется ряд различных (хотя часто химически схожих) механизмов. [15] [21]
Эволюционное значение
Суперсемейства белков представляют текущие пределы нашей способности определять общее происхождение. [22] Они являются крупнейшей эволюционной группой, основанной на прямых доказательствах , которые в настоящее время возможны. Поэтому они относятся к самым древним эволюционным событиям, изучаемым в настоящее время. Некоторые суперсемейства имеют членов, присутствующих во всех царствах жизни , что указывает на то, что последний общий предок этого суперсемейства был в последнем универсальном общем предке всей жизни (LUCA). [23]
Члены суперсемейства могут быть в разных видах, при этом предковый белок является формой белка, существовавшего в предковом виде ( ортология ). И наоборот, белки могут быть в одном и том же виде, но эволюционировать из одного белка, ген которого был продублирован в геноме ( паралогия ).
Диверсификация
Большинство белков содержат несколько доменов. От 66 до 80% эукариотических белков имеют несколько доменов, в то время как около 40-60% прокариотических белков имеют несколько доменов. [5] Со временем многие суперсемейства доменов смешались. Фактически, очень редко можно найти «последовательно изолированные суперсемейства». [5] [1] Когда домены объединяются, порядок доменов от N-конца к C-концу («архитектура домена») обычно хорошо сохраняется. Кроме того, количество комбинаций доменов, наблюдаемых в природе, мало по сравнению с количеством возможностей, что предполагает, что отбор действует на все комбинации. [5]
Члены имеют сэндвич-подобную структуру из двух слоев антипараллельных β-нитей ( Ig-fold ) и участвуют в распознавании, связывании и адгезии . [30] [31]
Члены группы имеют высокоэнергетическую напряженную складку, которая может претерпевать значительные конформационные изменения , что обычно используется для ингибирования сериновых и цистеиновых протеаз путем нарушения их структуры. [9]
Члены имеют общую структуру большого α 8 β 8 бочонка. Это одна из самых распространенных структур белков , и монофильность этого суперсемейства все еще оспаривается. [35] [36]
Ресурсы суперсемейства белков
Несколько биологических баз данных документируют суперсемейства белков и белковые складки, например:
Pfam — База данных семейств белков с выравниваниями и HMM
PROSITE - База данных доменов, семейств и функциональных участков белков
PASS2 - Выравнивание белков как структурных суперсемейств v2
SUPERFAMILY - Библиотека HMM, представляющих суперсемейства, и база данных аннотаций (суперсемейств и семейств) для всех полностью секвенированных организмов.
SCOP и CATH — Классификации белковых структур на суперсемейства, семейства и домены
Аналогично существуют алгоритмы, которые ищут в PDB белки со структурной гомологией целевой структуры, например:
DALI — структурное выравнивание на основе метода матрицы выравнивания расстояний
^ ab Holm L, Rosenström P (июль 2010 г.). «Сервер Dali: картирование сохранения в 3D». Nucleic Acids Research . 38 (выпуск веб-сервера): W545–9. doi :10.1093/nar/gkq366. PMC 2896194. PMID 20457744 .
^ abc Rawlings ND, Barrett AJ, Bateman A (январь 2012 г.). "MEROPS: база данных протеолитических ферментов, их субстратов и ингибиторов". Nucleic Acids Research . 40 (выпуск базы данных): D343–50. doi :10.1093/nar/gkr987. PMC 3245014. PMID 22086950.
^ Henrissat B, Bairoch A (июнь 1996 г.). «Обновление классификации гликозилгидролаз на основе последовательностей». The Biochemical Journal . 316 (Pt 2): 695–6. doi :10.1042/bj3160695. PMC 1217404. PMID 8687420 .
^ "Clustal FAQ #Symbols". Clustal . Архивировано из оригинала 24 октября 2016 года . Получено 8 декабря 2014 года .
^ abcd Han JH, Batey S, Nickson AA, Teichmann SA, Clarke J (апрель 2007 г.). «Сворачивание и эволюция многодоменных белков». Nature Reviews Molecular Cell Biology . 8 (4): 319–30. doi :10.1038/nrm2144. PMID 17356578. S2CID 13762291.
^ ab Pandit SB, Gosar D, Abhiman S, Sujatha S, Dixit SS, Mhatre NS, Sowdhamini R, Srinivasan N (январь 2002 г.). "SUPFAM — база данных потенциальных взаимосвязей суперсемейств белков, полученных путем сравнения семейств, основанных на последовательностях и структурах: последствия для структурной геномики и аннотации функций в геномах". Nucleic Acids Research . 30 (1): 289–93. doi :10.1093/nar/30.1.289. PMC 99061 . PMID 11752317.
^ Orengo CA, Thornton JM (2005). «Семейства белков и их эволюция — структурная перспектива». Annual Review of Biochemistry . 74 (1): 867–900. doi :10.1146/annurev.biochem.74.082803.133029. PMID 15954844.
^ Liu Y, Bahar I (сентябрь 2012 г.). «Эволюция последовательностей коррелирует со структурной динамикой». Молекулярная биология и эволюция . 29 (9): 2253–63. doi :10.1093/molbev/mss097. PMC 3424413. PMID 22427707 .
^ ab Silverman GA, Bird PI, Carrell RW, Church FC, Coughlin PB, Gettins PG, Irving JA, Lomas DA, Luke CJ, Moyer RW, Pemberton PA, Remold-O'Donnell E, Salvesen GS, Travis J, Whisstock JC (сентябрь 2001 г.). «Серпины — это расширяющееся суперсемейство структурно схожих, но функционально разнообразных белков. Эволюция, механизм ингибирования, новые функции и пересмотренная номенклатура». Журнал биологической химии . 276 (36): 33293–6. doi : 10.1074/jbc.R100016200 . PMID 11435447.
^ Holm L, Laakso LM (июль 2016 г.). «Обновление сервера Dali». Nucleic Acids Research . 44 (W1): W351–5. doi :10.1093/nar/gkw357. PMC 4987910. PMID 27131377 .
^ Паскуаль-Гарсия А., Абиа Д., Ортис АР., Бастолла У. (2009). «Переход между дискретным и непрерывным пространством структур белка: взгляд на автоматическую классификацию и сети структур белка». PLOS Computational Biology . 5 (3): e1000331. Bibcode : 2009PLSCB...5E0331P. doi : 10.1371/journal.pcbi.1000331 . PMC 2654728. PMID 19325884 .
^ Ли Д, Чжан Л, Инь Х, Сюй Х, Саткоски Траск Дж, Смит ДГ, Ли И, Ян М, Чжу Кью (июнь 2014 г.). «Эволюция дефензинов α и θ приматов, выявленная путем анализа геномов». Molecular Biology Reports . 41 (6): 3859–66. doi :10.1007/s11033-014-3253-z. PMID 24557891. S2CID 14936647.
^ Кришна СС, Гришин НВ (апрель 2005). «Структурный дрейф: возможный путь к изменению укладки белка». Биоинформатика . 21 (8): 1308–10. doi : 10.1093/bioinformatics/bti227 . PMID 15604105.
^ Bryan PN, Orban J (август 2010). «Белки, которые переключают складки». Current Opinion in Structural Biology . 20 (4): 482–8. doi :10.1016/j.sbi.2010.06.002. PMC 2928869. PMID 20591649 .
^ ab Dessailly, Benoit H.; Dawson, Natalie L.; Das, Sayoni; Orengo, Christine A. (2017), «Разнообразие функций в складках и суперсемействах», From Protein Structure to Function with Bioinformatics , Springer Netherlands, стр. 295–325, doi :10.1007/978-94-024-1069-3_9, ISBN9789402410679
^ Echave J, Spielman SJ, Wilke CO (февраль 2016 г.). «Причины вариации эволюционной скорости среди участков белка». Nature Reviews. Genetics . 17 (2): 109–21. doi :10.1038/nrg.2015.18. PMC 4724262. PMID 26781812 .
^ Shafee T, Gatti-Lafranconi P, Minter R, Hollfelder F (сентябрь 2015 г.). «Эволюция восстановления гандикапа приводит к химически универсальной, нуклеофильно-разрешительной протеазе». ChemBioChem . 16 (13): 1866–1869. doi :10.1002/cbic.201500295. PMC 4576821 . PMID 26097079.
^ Buller AR, Townsend CA (февраль 2013 г.). «Внутренние эволюционные ограничения на структуру протеазы, ацилирование фермента и идентичность каталитической триады». Труды Национальной академии наук Соединенных Штатов Америки . 110 (8): E653–61. Bibcode : 2013PNAS..110E.653B. doi : 10.1073 /pnas.1221050110 . PMC 3581919. PMID 23382230.
^ Coutinho PM, Deleury E, Davies GJ, Henrissat B (апрель 2003 г.). «Развивающаяся иерархическая классификация семейств гликозилтрансфераз». Журнал молекулярной биологии . 328 (2): 307–17. doi :10.1016/S0022-2836(03)00307-3. PMID 12691742.
^ Zámocký M, Hofbauer S, Schaffner I, Gasselhuber B, Nicolussi A, Soudi M, Pirker KF, Furtmüller PG, Obinger C (май 2015 г.). «Независимая эволюция четырех суперсемейств гем-пероксидазы». Архив биохимии и биофизики . 574 : 108–19. doi : 10.1016/j.abb.2014.12.025. PMC 4420034. PMID 25575902 .
^ Акива, Эяль; Браун, Шошана; Альмонасид, Дэниел Э.; Барбер, Алан Э.; Кастер, Эшли Ф.; Хикс, Майкл А.; Хуан, Конрад К.; Лаук, Флориан; Машияма, Сьюзан Т. (2013-11-23). "База данных связей структура–функция". Nucleic Acids Research . 42 (D1): D521–D530. doi :10.1093/nar/gkt1130. ISSN 0305-1048. PMC 3965090. PMID 24271399 .
^ Shakhnovich BE, Deeds E, Delisi C, Shakhnovich E (март 2005 г.). «Структура белка и эволюционная история определяют топологию пространства последовательностей». Genome Research . 15 (3): 385–92. arXiv : q-bio/0404040 . doi :10.1101/gr.3133605. PMC 551565 . PMID 15741509.
^ Ranea JA, Sillero A, Thornton JM, Orengo CA (октябрь 2006 г.). «Эволюция суперсемейства белков и последний универсальный общий предок (LUCA)». Журнал молекулярной эволюции . 63 (4): 513–25. Bibcode :2006JMolE..63..513R. doi :10.1007/s00239-005-0289-7. hdl :10261/78338. PMID 17021929. S2CID 25258028.
^ Carr PD, Ollis DL (2009). «Складка альфа/бета-гидролазы: обновление». Protein and Peptide Letters . 16 (10): 1137–48. doi :10.2174/092986609789071298. PMID 19508187.
^ Nardini M, Dijkstra BW (декабрь 1999 г.). «Ферменты сворачивания альфа/бета-гидролазы: семейство продолжает расти». Current Opinion in Structural Biology . 9 (6): 732–7. doi :10.1016/S0959-440X(99)00037-8. PMID 10607665.
^ "SCOP". Архивировано из оригинала 29 июля 2014 года . Получено 28 мая 2014 года .
^ Mohamed MF, Hollfelder F (январь 2013 г.). «Эффективная, перекрестная каталитическая разнородность среди ферментов, катализирующих перенос фосфорила». Biochimica et Biophysica Acta (BBA) - Белки и протеомика . 1834 (1): 417–24. doi :10.1016/j.bbapap.2012.07.015. PMID 22885024.
^ Branden C, Tooze J (1999). Введение в структуру белка (2-е изд.). Нью-Йорк: Garland Pub. ISBN978-0815323051.
^ Bolognesi M, Onesti S, Gatti G, Coda A, Ascenzi P, Brunori M (февраль 1989). "Миоглобин Aplysia limacina. Кристаллографический анализ при разрешении 1,6 А". Журнал молекулярной биологии . 205 (3): 529–44. doi :10.1016/0022-2836(89)90224-6. PMID 2926816.
^ Bork P, Holm L, Sander C (сентябрь 1994 г.). «Иммуноглобулиновая складка. Структурная классификация, паттерны последовательностей и общее ядро». Журнал молекулярной биологии . 242 (4): 309–20. doi :10.1006/jmbi.1994.1582. PMID 7932691.
^ Bazan JF, Fletterick RJ (ноябрь 1988 г.). «Вирусные цистеиновые протеазы гомологичны трипсиноподобному семейству сериновых протеаз: структурные и функциональные последствия». Труды Национальной академии наук Соединенных Штатов Америки . 85 (21): 7872–6. Bibcode : 1988PNAS...85.7872B. doi : 10.1073/pnas.85.21.7872 . PMC 282299. PMID 3186696 .
^ Vetter IR, Wittinghofer A (ноябрь 2001 г.). «Переключатель связывания гуаниновых нуклеотидов в трех измерениях». Science . 294 (5545): 1299–304. Bibcode :2001Sci...294.1299V. doi :10.1126/science.1062023. PMID 11701921. S2CID 6636339.
^ Аткинсон, Джемма К.; Тенсон, Танель; Гаврилюк, Василий (2011-08-09). "Суперсемейство гомологов RelA/SpoT (RSH): распределение и функциональная эволюция синтетаз и гидролаз ppGpp на древе жизни". PLOS ONE . 6 (8): e23479. Bibcode :2011PLoSO...623479A. doi : 10.1371/journal.pone.0023479 . ISSN 1932-6203. PMC 3153485 . PMID 21858139.
^ Nagano N, Orengo CA, Thornton JM (август 2002 г.). «Одна складка со многими функциями: эволюционные отношения между семействами стволов TIM на основе их последовательностей, структур и функций». Журнал молекулярной биологии . 321 (5): 741–65. doi :10.1016/s0022-2836(02)00649-6. PMID 12206759.
^ Фарбер Г. (1993). «α/β-бочка, полная эволюционных проблем». Current Opinion in Structural Biology . 3 (3): 409–412. doi :10.1016/S0959-440X(05)80114-9.
Внешние ссылки
Медиа, связанные с Protein supersemies на Wikimedia Commons