Тандемные повторы белков

Распространенные примеры структур белковых тандемных повторов: домен повторов WD40 бета-TrCP (зеленый), домен повторов, богатый лейцином TLR2 ( красный), домен повторов броненосца бета -катенина (синий), домен повторов анкирина ANKRA2 (оранжевый), домен повторов kelch Keap1 (желтый) и домен повторов HEAT регуляторной субъединицы PP2A R1a (пурпурный).

Массив белковых тандемных повторов определяется как несколько (по крайней мере две) смежных копий, имеющих одинаковые или похожие мотивы последовательности . Эти периодические последовательности генерируются внутренними дупликациями как в кодирующих, так и в некодирующих геномных последовательностях. Повторяющиеся единицы белковых тандемных повторов значительно разнообразны, начиная от повторения одной аминокислоты до доменов из 100 или более остатков. ^[1]^[2]

«Повторения» в белках

В белках «повтор» — это любой блок последовательности, который повторяется более одного раза в последовательности , либо в идентичной, либо в очень похожей форме. Степень сходства может быть очень изменчивой, при этом некоторые повторы сохраняют только несколько консервативных положений аминокислот и характерную длину. Сильно вырожденные повторы может быть очень трудно обнаружить только по последовательности. Структурное сходство может помочь идентифицировать повторяющиеся паттерны в последовательности.

Структура

Повторяемость сама по себе ничего не говорит о структуре белка. Как «правило большого пальца», короткие повторяющиеся последовательности (например, те, длина которых меньше 10 аминокислот) могут быть внутренне неупорядоченными и не являться частью каких-либо сложенных доменов белка . Повторы, длина которых составляет не менее 30–40 аминокислот, с гораздо большей вероятностью будут сложены как часть домена. Такие длинные повторы часто указывают на наличие соленоидного домена в белке.

Примерно половина областей тандемных повторов имеют внутренне неупорядоченную конформацию, будучи естественно развернутыми. ^[3]^[4]^[5] Примерами неупорядоченных повторяющихся последовательностей являются 7-мерные пептидные повторы, обнаруженные в субъединице RPB1 РНК -полимеразы II , ^[6] или тандемные линейные мотивы связывания бета-катенина или аксина в APC (аденоматозный полипоз толстой кишки). ^[7] Другая половина областей со стабильной трехмерной структурой имеет множество форм и функций. ^[8]^{[9] Примерами коротких повторов, демонстрирующих упорядоченные структуры, являются}повтор коллагена из трех остатков или повтор пентапептида из пяти остатков , который образует структуру бета-спирали .

Классификация

В зависимости от длины повторяющихся единиц их белковые структуры можно разделить на пять классов: ^[8]^[9]

Кристаллические агрегаты, образованные областями с 1 или 2 длинными повторами остатков, архетипичные области низкой сложности
волокнистые структуры, стабилизированные межцепочечными взаимодействиями с 3-7 повторами остатков
удлиненные структуры с повторами от 5 до 40 остатков, в которых преобладают соленоидные белки
закрытые (не удлиненные) структуры с повторами из 30-60 остатков в виде тороидных повторов
структуры из бусин на нитке с типичным размером повторов более 50 остатков, которые уже достаточно велики, чтобы независимо складываться в стабильные домены.

Функция

Некоторые известные примеры белков с тандемными повторами — коллаген , который играет ключевую роль в организации внеклеточного матрикса; альфа-спиральные спиральные спирали, имеющие структурные и олигомеризационные функции; белки с богатыми лейцином повторами , которые специфически связывают некоторые глобулярные белки своими вогнутыми поверхностями; и белки с цинковыми пальцами , которые регулируют экспрессию генов путем связывания ДНК .

Тандемные повторы белков часто функционируют как модули взаимодействия белок-белок. Повтор WD40 является ярким примером этой функции. ^[10]

Распределение в протеомах

Тандемные повторы повсеместно распространены в протеомах и встречаются по крайней мере в 14% всех белков. ^[11] Например, они присутствуют почти в каждом третьем человеческом белке и даже в каждом втором белке Plasmodium falciparum или Dictyostelium discoideum . ^[11]^[12] Тандемные повторы с короткими повторяющимися единицами (особенно гомоповторы) встречаются чаще других. ^[11]

Методы аннотации

Тандемные повторы белков могут быть обнаружены либо из последовательности, либо из структуры. Для идентификации повторяющихся белков были созданы специальные методы. ^[13]

Стратегии на основе последовательностей, основанные на поиске гомологии ^[14] или назначении домена, ^[15]^[16] в основном недооценивают TR из-за наличия сильно вырожденных повторяющихся единиц. ^[17] Недавнее исследование по пониманию и улучшению покрытия Pfam человеческого протеома ^[17] показало, что пять из десяти крупнейших кластеров последовательностей, не аннотированных Pfam, являются повторяющимися областями. В качестве альтернативы методы, не требующие предварительных знаний для обнаружения повторяющихся подстрок, могут быть основаны на самосравнении, ^[18]^[19] кластеризации ^[20] ^[21] или скрытых марковских моделях. ^[22]^[23] Некоторые другие полагаются на измерения сложности ^[13] или используют преимущества метапоиска для объединения выходных данных из разных источников. ^[24]^[25]

Вместо этого методы, основанные на структуре, используют модульность доступных структур PDB для распознавания повторяющихся элементов. ^[26]^[27]^[28]^[29]^[30]

Ссылки

^ Heringa J (июнь 1998). «Обнаружение внутренних повторов: насколько они распространены?». Current Opinion in Structural Biology . 8 (3): 338–45. doi :10.1016/s0959-440x(98)80068-7. PMID 9666330.
^ Andrade MA, Ponting CP, Gibson TJ, Bork P (май 2000). «Метод идентификации белковых повторов на основе гомологии с использованием статистических оценок значимости». Журнал молекулярной биологии . 298 (3): 521–37. doi :10.1006/jmbi.2000.3684. PMID 10772867.
^ Tompa P (сентябрь 2003 г.). «Внутренне неструктурированные белки эволюционируют путем повторного расширения». BioEssays . 25 (9): 847–55. doi :10.1002/bies.10324. PMID 12938174. S2CID 32684524.
^ Simon M, Hancock JM (2009). «Тандемные и криптические повторы аминокислот накапливаются в неупорядоченных областях белков». Genome Biology . 10 (6): R59. doi : 10.1186/gb-2009-10-6-r59 . PMC 2718493. PMID 19486509 .
^ Jorda J, Xue B, Uversky VN, Kajava AV (июнь 2010 г.). «Тандемные повторы белков — чем совершеннее, тем менее структурированы» (PDF) . The FEBS Journal . 277 (12): 2673–82. doi :10.1111/j.1742-4658.2010.07684.x. PMC 2928880. PMID 20553501 .
^ Meyer PA, Ye P, Zhang M, Suh MH, Fu J (июнь 2006 г.). «Фазирование РНК-полимеразы II с использованием внутренне связанных атомов Zn: обновленная структурная модель». Structure . 14 (6): 973–82. doi : 10.1016/j.str.2006.04.003 . PMID 16765890.
^ Liu J, Xing Y, Hinds TR, Zheng J, Xu W (июнь 2006 г.). «Третий 20-аминокислотный повтор — самый прочный сайт связывания APC с бета-катенином». J. Mol. Biol . 360 (1): 133–44. doi :10.1016/j.jmb.2006.04.064. PMID 16753179.
^ ab Kajava AV (сентябрь 2012 г.). «Тандемные повторы в белках: от последовательности к структуре». Журнал структурной биологии . 179 (3): 279–88. doi :10.1016/j.jsb.2011.08.009. PMID 21884799.
^ ab Paladin L, Hirsh L, Piovesan D, Andrade-Navarro MA, Kajava AV, Tosatto SC (январь 2017 г.). "RepeatsDB 2.0: улучшенная аннотация, классификация, поиск и визуализация структур повторяющихся белков". Nucleic Acids Research . 45 (D1): D308–D312. doi :10.1093/nar/gkw1136. PMC 5210593 . PMID 27899671.
^ Stirnimann CU, Petsalaki E, Russell RB, Müller CW (октябрь 2010 г.). «Белки WD40 стимулируют клеточные сети». Trends in Biochemical Sciences . 35 (10): 565–74. doi :10.1016/j.tibs.2010.04.003. PMID 20451393.
^ abc Marcotte EM, Pellegrini M, Yeates TO, Eisenberg D (октябрь 1999). «Перепись белковых повторов». Журнал молекулярной биологии . 293 (1): 151–60. doi :10.1006/jmbi.1999.3136. PMID 10512723.
^ Пеллегрини М (2015). «Тандемные повторы в белках: алгоритмы прогнозирования и биологическая роль». Frontiers in Bioengineering and Biotechnology . 3 : 143. doi : 10.3389/fbioe.2015.00143 . PMC 4585158. PMID 26442257 .
^ ab Pellegrini M, Renda ME, Vecchio A (2012). "Ab initio обнаружение нечетких тандемных повторов аминокислот в белковых последовательностях". BMC Bioinformatics . 13 (Suppl 3): S8. doi : 10.1186/1471-2105-13-S3-S8 . PMC 3402919. PMID 22536906 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Andrade MA, Ponting CP, Gibson TJ, Bork P (2000). «Метод идентификации белковых повторов на основе гомологии с использованием статистических оценок значимости». J Mol Biol . 298 (3): 521–37. doi :10.1006/jmbi.2000.3684. PMID 10772867.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ El-Gebali S, Mistry J, Bateman A, Eddy SR, Luciani A, Potter SC; и др. (2019). «База данных семейств белков Pfam в 2019 году». Nucleic Acids Res . 47 (D1): D427–D432. doi :10.1093/nar/gky995. PMC 6324024. PMID 30357350 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Mitchell AL, Attwood TK, Babbitt PC, Blum M, Bork P, Bridge A; et al. (2019). «InterPro в 2019 году: улучшение покрытия, классификации и доступа к аннотациям последовательностей белков». Nucleic Acids Res . 47 (D1): D351–D360. doi :10.1093/nar/gky1100. PMC 6323941. PMID 30398656 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ ab Mistry J, Coggill P, Eberhardt RY, Deiana A, Giansanti A, Finn RD; и др. (2013). «Проблема увеличения охвата Pfam человеческого протеома». База данных (Оксфорд) . 2013 : bat023. doi :10.1093/database/bat023. PMC 3630804. PMID 23603847 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Хегер А., Холм Л. (2000). «Быстрое автоматическое обнаружение и выравнивание повторов в последовательностях белков». Белки . 41 (2): 224–37. doi :10.1002/1097-0134(20001101)41:2<224::aid-prot70>3.0.co;2-z. PMID 10966575. S2CID 21757391.
^ Szklarczyk R, Heringa J (2004). «Отслеживание повторов с использованием значимости и транзитивности». Биоинформатика . 20 (Приложение 1): i311-7. doi : 10.1093/bioinformatics/bth911 . PMID 15262814.
^ Newman AM, Cooper JB (2007). "XSTREAM: практический алгоритм для идентификации и моделирования архитектуры тандемных повторов в белковых последовательностях". BMC Bioinformatics . 8 : 382. doi : 10.1186/1471-2105-8-382 . PMC 2233649. PMID 17931424 .
^ Jorda J, Kajava AV (2009). "T-REKS: идентификация тандемных повторов в последовательностях с помощью алгоритма на основе K-meanS". Биоинформатика . 25 (20): 2632–8. doi : 10.1093/bioinformatics/btp482 . PMID 19671691.
^ Söding J, Remmert M, Biegert A (2006). "HHrep: de novo обнаружение повторов белка и происхождение стволов TIM". Nucleic Acids Res . 34 (выпуск веб-сервера): W137-42. doi :10.1093/nar/gkl130. PMC 1538828. PMID 16844977 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Бигерт А., Сёдинг Дж. (2008). «Идентификация de novo сильно расходящихся белковых повторов с помощью вероятностной согласованности». Биоинформатика . 24 (6): 807–14. doi : 10.1093/bioinformatics/btn039 . hdl : 11858/00-001M-0000-0017-DADF-9 . PMID 18245125.
^ Грубер М., Сёдинг Дж., Лупас А. Н. (2005). "REPPER--повторы и их периодичность в фибриллярных белках". Nucleic Acids Res . 33 (выпуск веб-сервера): W239-43. doi :10.1093/nar/gki405. PMC 1160166. PMID 15980460 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Шапер Э., Анисимова М. (2015). «Эволюция и функция тандемных повторов белков в растениях». New Phytol . 206 (1): 397–410. doi : 10.1111/nph.13184 . PMID 25420631. S2CID 20656455.
^ Авраам AL, Роча EP, Потье J (2008). «Swelfe: детектор внутренних повторов в последовательностях и структурах». Биоинформатика . 24 (13): 1536–7. doi :10.1093/bioinformatics/btn234. PMC 2718673. PMID 18487242 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Sabarinathan R, Basu R, Sekar K (2010). «ProSTRIP: метод поиска подобных структурных повторов в трехмерных структурах белков». Comput Biol Chem . 34 (2): 126–30. doi :10.1016/j.compbiolchem.2010.03.006. PMID 20430700.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Уолш И, Сирокко Ф.Г., Минервини Г., Ди Доменико Т., Феррари К., Тосатто СК. (2012). «RAPHAEL: распознавание, периодичность и назначение вставок структур соленоидных белков». Биоинформатика . 28 (24): 3257–64. doi : 10.1093/bioinformatics/bts550 . PMID 22962341.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Hrabe T, Godzik A (2014). «ConSole: использование модульности контактных карт для определения местоположения соленоидных доменов в белковых структурах». BMC Bioinformatics . 15 : 119. doi : 10.1186/1471-2105-15-119 . PMC 4021314. PMID 24766872 .
^ Do Viet P, Roche DB, Kajava AV (2015). «TAPO: комбинированный метод идентификации тандемных повторов в белковых структурах». FEBS Lett . 589 (19 Pt A): 2611–9. doi : 10.1016/j.febslet.2015.08.025 . PMID 26320412. S2CID 28423787.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )

Внешние ссылки

RepeatsDB: база данных аннотированных тандемных повторяющихся структур белков