stringtranslate.com

Тандемные повторы белков

Распространенные примеры структур белковых тандемных повторов: домен повторов WD40 бета-TrCP (зеленый), домен повторов, богатый лейцином TLR2 ( красный), домен повторов броненосца бета -катенина (синий), домен повторов анкирина ANKRA2 (оранжевый), домен повторов kelch Keap1 (желтый) и домен повторов HEAT регуляторной субъединицы PP2A R1a (пурпурный).

Массив белковых тандемных повторов определяется как несколько (по крайней мере две) смежных копий, имеющих одинаковые или похожие мотивы последовательности . Эти периодические последовательности генерируются внутренними дупликациями как в кодирующих, так и в некодирующих геномных последовательностях. Повторяющиеся единицы белковых тандемных повторов значительно разнообразны, начиная от повторения одной аминокислоты до доменов из 100 или более остатков. [1] [2]

Схематическое изображение последовательности тандемного повтора.

«Повторения» в белках

Пример множественного выравнивания последовательностей пентапептидного повтора, приводящего к структуре тандемного повтора

В белках «повтор» — это любой блок последовательности, который повторяется более одного раза в последовательности , либо в идентичной, либо в очень похожей форме. Степень сходства может быть очень изменчивой, при этом некоторые повторы сохраняют только несколько консервативных аминокислотных позиций и характерную длину. Сильно вырожденные повторы может быть очень трудно обнаружить только по последовательности. Структурное сходство может помочь идентифицировать повторяющиеся паттерны в последовательности.

Структура

Повторяемость сама по себе ничего не говорит о структуре белка. Как «правило большого пальца», короткие повторяющиеся последовательности (например, те, что длиной менее 10 аминокислот) могут быть внутренне неупорядоченными и не являться частью каких-либо сложенных доменов белка . Повторы, которые имеют длину не менее 30–40 аминокислот, с гораздо большей вероятностью будут сложены как часть домена. Такие длинные повторы часто указывают на наличие соленоидного домена в белке.

Примерно половина областей тандемных повторов имеют внутренне неупорядоченную конформацию, будучи естественно развернутыми. [3] [4] [5] Примерами неупорядоченных повторяющихся последовательностей являются 7-мерные пептидные повторы, обнаруженные в субъединице RPB1 РНК -полимеразы II , [6] или тандемные линейные мотивы связывания бета-катенина или аксина в APC (аденоматозный полипоз толстой кишки). [7] Другая половина областей со стабильной трехмерной структурой имеет множество форм и функций. [8] [9] Примерами коротких повторов, демонстрирующих упорядоченные структуры, являются повтор коллагена из трех остатков или повтор пентапептида из пяти остатков , который образует структуру бета-спирали .

Классификация

В зависимости от длины повторяющихся единиц их белковые структуры можно разделить на пять классов: [8] [9]

  1. Кристаллические агрегаты, образованные областями с 1 или 2 длинными повторами остатков, архетипичные области низкой сложности
  2. волокнистые структуры, стабилизированные межцепочечными взаимодействиями с 3-7 повторами остатков
  3. удлиненные структуры с повторами от 5 до 40 остатков, в которых преобладают соленоидные белки
  4. закрытые (не удлиненные) структуры с повторами из 30-60 остатков в виде тороидных повторов
  5. структуры из бусин на нитке с типичным размером повторов более 50 остатков, которые уже достаточно велики, чтобы независимо складываться в стабильные домены.

Функция

Некоторые известные примеры белков с тандемными повторами — коллаген , который играет ключевую роль в организации внеклеточного матрикса; альфа-спиральные спиральные спирали, имеющие структурные и олигомеризационные функции; богатые лейцином повторяющиеся белки, которые специфически связывают некоторые глобулярные белки своими вогнутыми поверхностями; и белки с цинковыми пальцами , которые регулируют экспрессию генов путем связывания с ДНК .

Тандемные повторы белков часто функционируют как модули взаимодействия белок-белок. Повтор WD40 является ярким примером этой функции. [10]

Распределение в протеомах

Тандемные повторы повсеместно распространены в протеомах и встречаются по крайней мере в 14% всех белков. [11] Например, они присутствуют почти в каждом третьем человеческом белке и даже в каждом втором белке Plasmodium falciparum или Dictyostelium discoideum . [11] [12] Тандемные повторы с короткими повторяющимися единицами (особенно гомоповторы) встречаются чаще других. [11]

Методы аннотации

Тандемные повторы белков могут быть обнаружены либо из последовательности, либо из структуры. Для идентификации повторяющихся белков были созданы специальные методы. [13]

Стратегии на основе последовательностей, основанные на поиске гомологии [14] или назначении домена, [15] [16] в основном недооценивают TR из-за наличия сильно вырожденных повторяющихся единиц. [17] Недавнее исследование по пониманию и улучшению покрытия Pfam человеческого протеома [17] показало, что пять из десяти крупнейших кластеров последовательностей, не аннотированных Pfam, являются повторяющимися областями. В качестве альтернативы методы, не требующие предварительных знаний для обнаружения повторяющихся подстрок, могут быть основаны на самосравнении, [18] [19] кластеризации [20] [21] или скрытых марковских моделях. [22] [23] Некоторые другие полагаются на измерения сложности [13] или используют преимущества метапоиска для объединения выходных данных из разных источников. [24] [25]

Вместо этого методы, основанные на структуре, используют модульность доступных структур PDB для распознавания повторяющихся элементов. [26] [27] [28] [29] [30]

Ссылки

  1. ^ Heringa J (июнь 1998). «Обнаружение внутренних повторов: насколько они распространены?». Current Opinion in Structural Biology . 8 (3): 338–45. doi :10.1016/s0959-440x(98)80068-7. PMID  9666330.
  2. ^ Andrade MA, Ponting CP, Gibson TJ, Bork P (май 2000). «Метод идентификации белковых повторов на основе гомологии с использованием статистических оценок значимости». Журнал молекулярной биологии . 298 (3): 521–37. doi :10.1006/jmbi.2000.3684. PMID  10772867.
  3. ^ Tompa P (сентябрь 2003 г.). «Внутренне неструктурированные белки эволюционируют путем повторного расширения». BioEssays . 25 (9): 847–55. doi :10.1002/bies.10324. PMID  12938174. S2CID  32684524.
  4. ^ Simon M, Hancock JM (2009). «Тандемные и криптические повторы аминокислот накапливаются в неупорядоченных областях белков». Genome Biology . 10 (6): R59. doi : 10.1186/gb-2009-10-6-r59 . PMC 2718493. PMID  19486509 . 
  5. ^ Jorda J, Xue B, Uversky VN, Kajava AV (июнь 2010 г.). «Тандемные повторы белков — чем совершеннее, тем менее структурированы» (PDF) . The FEBS Journal . 277 (12): 2673–82. doi :10.1111/j.1742-4658.2010.07684.x. PMC 2928880. PMID  20553501 . 
  6. ^ Meyer PA, Ye P, Zhang M, Suh MH, Fu J (июнь 2006 г.). «Фазирование РНК-полимеразы II с использованием внутренне связанных атомов Zn: обновленная структурная модель». Structure . 14 (6): 973–82. doi : 10.1016/j.str.2006.04.003 . PMID  16765890.
  7. ^ Liu J, Xing Y, Hinds TR, Zheng J, Xu W (июнь 2006 г.). «Третий 20-аминокислотный повтор — самый прочный сайт связывания APC с бета-катенином». J. Mol. Biol . 360 (1): 133–44. doi :10.1016/j.jmb.2006.04.064. PMID  16753179.
  8. ^ ab Kajava AV (сентябрь 2012 г.). «Тандемные повторы в белках: от последовательности к структуре». Журнал структурной биологии . 179 (3): 279–88. doi :10.1016/j.jsb.2011.08.009. PMID  21884799.
  9. ^ ab Paladin L, Hirsh L, Piovesan D, Andrade-Navarro MA, Kajava AV, Tosatto SC (январь 2017 г.). "RepeatsDB 2.0: улучшенная аннотация, классификация, поиск и визуализация структур повторяющихся белков". Nucleic Acids Research . 45 (D1): D308–D312. doi :10.1093/nar/gkw1136. PMC 5210593 . PMID  27899671. 
  10. ^ Stirnimann CU, Petsalaki E, Russell RB, Müller CW (октябрь 2010 г.). «Белки WD40 стимулируют клеточные сети». Trends in Biochemical Sciences . 35 (10): 565–74. doi :10.1016/j.tibs.2010.04.003. PMID  20451393.
  11. ^ abc Marcotte EM, Pellegrini M, Yeates TO, Eisenberg D (октябрь 1999). «Перепись белковых повторов». Журнал молекулярной биологии . 293 (1): 151–60. doi :10.1006/jmbi.1999.3136. PMID  10512723.
  12. ^ Пеллегрини М (2015). «Тандемные повторы в белках: алгоритмы прогнозирования и биологическая роль». Frontiers in Bioengineering and Biotechnology . 3 : 143. doi : 10.3389/fbioe.2015.00143 . PMC 4585158. PMID  26442257 . 
  13. ^ ab Pellegrini M, Renda ME, Vecchio A (2012). "Ab initio обнаружение нечетких тандемных повторов аминокислот в белковых последовательностях". BMC Bioinformatics . 13 (Suppl 3): S8. doi : 10.1186/1471-2105-13-S3-S8 . PMC 3402919. PMID  22536906 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  14. ^ Andrade MA, Ponting CP, Gibson TJ, Bork P (2000). «Метод идентификации белковых повторов на основе гомологии с использованием статистических оценок значимости». J Mol Biol . 298 (3): 521–37. doi :10.1006/jmbi.2000.3684. PMID  10772867.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  15. ^ El-Gebali S, Mistry J, Bateman A, Eddy SR, Luciani A, Potter SC; и др. (2019). «База данных семейств белков Pfam в 2019 году». Nucleic Acids Res . 47 (D1): D427–D432. doi :10.1093/nar/gky995. PMC 6324024. PMID 30357350  . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  16. ^ Mitchell AL, Attwood TK, Babbitt PC, Blum M, Bork P, Bridge A; et al. (2019). «InterPro в 2019 году: улучшение покрытия, классификации и доступа к аннотациям последовательностей белков». Nucleic Acids Res . 47 (D1): D351–D360. doi :10.1093/nar/gky1100. PMC 6323941. PMID  30398656 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  17. ^ ab Mistry J, Coggill P, Eberhardt RY, Deiana A, Giansanti A, Finn RD; и др. (2013). «Проблема увеличения охвата Pfam человеческого протеома». База данных (Оксфорд) . 2013 : bat023. doi :10.1093/database/bat023. PMC 3630804. PMID  23603847 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  18. ^ Хегер А., Холм Л. (2000). «Быстрое автоматическое обнаружение и выравнивание повторов в последовательностях белков». Белки . 41 (2): 224–37. doi :10.1002/1097-0134(20001101)41:2<224::aid-prot70>3.0.co;2-z. PMID  10966575. S2CID  21757391.
  19. ^ Szklarczyk R, Heringa J (2004). «Отслеживание повторов с использованием значимости и транзитивности». Биоинформатика . 20 (Приложение 1): i311-7. doi : 10.1093/bioinformatics/bth911 . PMID  15262814.
  20. ^ Newman AM, Cooper JB (2007). "XSTREAM: практический алгоритм для идентификации и моделирования архитектуры тандемных повторов в белковых последовательностях". BMC Bioinformatics . 8 : 382. doi : 10.1186/1471-2105-8-382 . PMC 2233649. PMID  17931424 . 
  21. ^ Jorda J, Kajava AV (2009). "T-REKS: идентификация тандемных повторов в последовательностях с помощью алгоритма на основе K-meanS". Биоинформатика . 25 (20): 2632–8. doi : 10.1093/bioinformatics/btp482 . PMID  19671691.
  22. ^ Söding J, Remmert M, Biegert A (2006). "HHrep: de novo обнаружение повторов белка и происхождение стволов TIM". Nucleic Acids Res . 34 (выпуск веб-сервера): W137-42. doi :10.1093/nar/gkl130. PMC 1538828. PMID 16844977  . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  23. ^ Бигерт А., Сёдинг Дж. (2008). «Идентификация de novo сильно расходящихся белковых повторов с помощью вероятностной согласованности». Биоинформатика . 24 (6): 807–14. doi : 10.1093/bioinformatics/btn039 . hdl : 11858/00-001M-0000-0017-DADF-9 . PMID  18245125.
  24. ^ Грубер М., Сёдинг Дж., Лупас А. Н. (2005). "REPPER--повторы и их периодичность в фибриллярных белках". Nucleic Acids Res . 33 (выпуск веб-сервера): W239-43. doi :10.1093/nar/gki405. PMC 1160166. PMID  15980460 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  25. ^ Шапер Э., Анисимова М. (2015). «Эволюция и функция тандемных повторов белков в растениях». New Phytol . 206 (1): 397–410. doi : 10.1111/nph.13184 . PMID  25420631. S2CID  20656455.
  26. ^ Авраам AL, Роча EP, Потье J (2008). «Swelfe: детектор внутренних повторов в последовательностях и структурах». Биоинформатика . 24 (13): 1536–7. doi :10.1093/bioinformatics/btn234. PMC 2718673. PMID  18487242 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  27. ^ Sabarinathan R, Basu R, Sekar K (2010). «ProSTRIP: метод поиска подобных структурных повторов в трехмерных структурах белков». Comput Biol Chem . 34 (2): 126–30. doi :10.1016/j.compbiolchem.2010.03.006. PMID  20430700.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  28. ^ Уолш И, Сирокко Ф.Г., Минервини Г., Ди Доменико Т., Феррари К., Тосатто СК. (2012). «RAPHAEL: распознавание, периодичность и назначение вставок структур соленоидных белков». Биоинформатика . 28 (24): 3257–64. doi : 10.1093/bioinformatics/bts550 . PMID  22962341.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  29. ^ Hrabe T, Godzik A (2014). «ConSole: использование модульности контактных карт для определения местоположения соленоидных доменов в белковых структурах». BMC Bioinformatics . 15 : 119. doi : 10.1186/1471-2105-15-119 . PMC 4021314. PMID  24766872 . 
  30. ^ Do Viet P, Roche DB, Kajava AV (2015). «TAPO: комбинированный метод идентификации тандемных повторов в белковых структурах». FEBS Lett . 589 (19 Pt A): 2611–9. doi : 10.1016/j.febslet.2015.08.025 . PMID  26320412. S2CID  28423787.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )

Внешние ссылки