stringtranslate.com

Семейство белков

Семейство циклофилинов человека , представленное структурами доменов изомераз некоторых его членов

Семейство белков — это группа эволюционно связанных белков . Во многих случаях семейство белков имеет соответствующее семейство генов , в котором каждый ген кодирует соответствующий белок с соотношением 1:1. Термин «семейство белков» не следует путать с семейством , как оно используется в таксономии.

Белки в семействе происходят от общего предка и обычно имеют схожие трехмерные структуры , функции и значительное сходство последовательностей . [1] [2] Сходство последовательностей (обычно аминокислотных последовательностей) является одним из наиболее распространенных показателей гомологии или общего эволюционного происхождения. [3] [4] Некоторые структуры для оценки значимости сходства между последовательностями используют методы выравнивания последовательностей . Белки, которые не имеют общего предка, вряд ли покажут статистически значимое сходство последовательностей, что делает выравнивание последовательностей мощным инструментом для идентификации членов семейств белков. [3] [4] Иногда семейства группируются в более крупные клады , называемые суперсемействами , на основе структурного сходства, даже если нет идентифицируемой гомологии последовательностей.

В настоящее время определено более 60 000 семейств белков [5], хотя неоднозначность определения «семейства белков» приводит к тому, что разные исследователи дают весьма разные цифры.

Терминология и использование

Термин «семейство белков» имеет широкое применение и может применяться к большим группам белков с едва заметным сходством последовательностей, а также к узким группам белков с почти идентичной последовательностью, функцией и структурой. Чтобы различать эти случаи, используется иерархическая терминология. На самом высоком уровне классификации находятся суперсемейства белков , которые группируют отдаленно родственные белки, часто на основе их структурного сходства. [6] [7] [8] [9] Далее следуют семейства белков, которые относятся к белкам с общим эволюционным происхождением, демонстрируемым значительным сходством последовательностей . [2] [10] Подсемейства могут быть определены внутри семейств для обозначения близкородственных белков, которые имеют схожие или идентичные функции. [11] Например, суперсемейство, такое как клан протеаз PA , имеет меньшую консервативность последовательностей, чем семейство C04 внутри него.

Выше, сохранение последовательности 250 членов клана протеаз PA ( суперсемейство ). Ниже, сохранение последовательности 70 членов семейства протеаз C04: стрелки указывают на остатки каталитической триады , выровненные на основе структуры с помощью DALI .

Белковые домены и мотивы

Семейства белков были впервые распознаны, когда большинство структурно понятых белков были небольшими, однодоменными белками, такими как миоглобин , гемоглобин и цитохром c . С тех пор было обнаружено много белков с несколькими независимыми структурными и функциональными единицами, называемыми доменами . Из-за эволюционной перетасовки различные домены в белке развивались независимо. Это привело к сосредоточению внимания на семействах доменов белков. Несколько онлайн-ресурсов посвящены идентификации и каталогизации этих доменов. [12] [13]

Различные области белка имеют различные функциональные ограничения. Например, активный сайт фермента требует, чтобы определенные аминокислотные остатки были точно ориентированы. Интерфейс связывания белок-белок может состоять из большой поверхности с ограничениями на гидрофобность или полярность аминокислотных остатков. Функционально ограниченные области белков развиваются медленнее, чем неограниченные области, такие как поверхностные петли, что приводит к появлению блоков консервативной последовательности при сравнении последовательностей семейства белков (см. множественное выравнивание последовательностей ). Эти блоки чаще всего называют мотивами, хотя используются и многие другие термины (блоки, сигнатуры, отпечатки пальцев и т. д.). Несколько онлайн-ресурсов посвящены идентификации и каталогизации белковых мотивов. [14]

Эволюция семейств белков

Согласно текущему консенсусу, семейства белков возникают двумя способами. Во-первых, разделение родительского вида на два генетически изолированных вида-потомка позволяет гену/белку независимо накапливать вариации ( мутации ) в этих двух линиях. Это приводит к появлению семейства ортологичных белков, обычно с консервативными мотивами последовательностей. Во-вторых, дупликация гена может создать вторую копию гена (называемую паралогом ) . Поскольку исходный ген все еще способен выполнять свою функцию, дублированный ген может свободно расходиться и приобретать новые функции (путем случайной мутации).

Определенные семейства генов/белков, особенно у эукариот , подвергаются экстремальным расширениям и сокращениям в ходе эволюции, иногда в сочетании с дупликациями всего генома . Расширения менее вероятны, а потери более вероятны для внутренне неупорядоченных белков и для доменов белков, гидрофобные аминокислоты которых находятся дальше от оптимальной степени дисперсии вдоль первичной последовательности. [15] Это расширение и сокращение семейств белков является одной из существенных особенностей эволюции генома , но ее важность и последствия в настоящее время неясны.

Филогенетическое дерево суперсемейства RAS: Это дерево было создано с помощью FigTree (бесплатное онлайн-программное обеспечение).

Использование и значение семейств белков

По мере увеличения общего числа секвенированных белков и расширения интереса к анализу протеома продолжаются усилия по организации белков в семейства и описанию их компонентных доменов и мотивов. Надежная идентификация семейств белков имеет решающее значение для филогенетического анализа, функциональной аннотации и исследования разнообразия функций белков в данной филогенетической ветви. Инициатива по функциям ферментов использует семейства и суперсемейства белков в качестве основы для разработки стратегии на основе последовательности/структуры для крупномасштабного функционального назначения ферментов неизвестной функции. [16] Алгоритмические средства для установления семейств белков в крупномасштабном масштабе основаны на понятии сходства.

Ресурсы семейства белков

Многие биологические базы данных каталогизируют семейства белков и позволяют пользователям сопоставлять последовательности запросов с известными семействами. К ним относятся:

Аналогично существует множество алгоритмов поиска в базах данных, например:

Смотрите также

Семейства белков

Ссылки

  1. ^ "Что такое семейства белков? Классификация белков". EMBL-EBI . Получено 2023-11-14 .
  2. ^ ab Orengo, Christine; Bateman, Alex (2013). "Введение". В Orengo, Christine; Bateman, Alex (ред.). Семейства белков: взаимосвязь последовательности, структуры и функции белков . Hoboken, New Jersey: John Wiley & Sons, Inc. стр. vii–xi. doi :10.1002/9781118743089.fmatter. ISBN 9781118743089.
  3. ^ ab Pearson, William R. (2013). «Введение в поиск сходства последовательностей («гомологии»). Current Protocols in Bioinformatics . 3 : 3.1.1–3.1.8. doi :10.1002/0471250953.bi0301s42. ISSN  1934-3396. PMC 3820096. PMID 23749753  . 
  4. ^ ab Chen, Junjie; Guo, Mingyue; Wang, Xiaolong; Liu, Bin (2018-03-01). «Комплексный обзор и сравнение различных вычислительных методов для обнаружения удаленной гомологии белков». Briefings in Bioinformatics . 19 (2): 231–244. doi :10.1093/bib/bbw108. ISSN  1477-4054. PMID  27881430.
  5. ^ Кунин, Виктор; Дела, Ильдефонсо; Энрайт, Антон Дж.; де Лоренцо, Виктор; Узунис, Христос А. (2003). «Мириады белковых семейств, и их количество продолжает расти». Геномная биология . 4 (2): 401. doi : 10.1186/gb-2003-4-2-401 . ISSN  1474-760X. ПМК 151299 . ПМИД  12620116. 
  6. ^ Dayhoff, MO (декабрь 1974). «Компьютерный анализ последовательностей белков». Federation Proceedings . 33 (12): 2314–6. PMID  4435228.
  7. ^ Дайхофф, Миссури; Маклафлин, П.Дж.; Баркер, туалет; Хант, LT (1975). «Эволюция последовательностей внутри суперсемейств белков». Die Naturwissenschaften . 62 (4): 154–161. Бибкод : 1975NW.....62..154D. дои : 10.1007/BF00608697. S2CID  40304076.
  8. ^ Dayhoff, MO (август 1976). «Происхождение и эволюция суперсемейств белков». Federation Proceedings . 35 (10): 2132–8. PMID  181273.
  9. ^ Оренго, Кристин А.; Торнтон, Джанет М. (2005-06-01). «Семейства белков и их эволюция — структурная перспектива». Annual Review of Biochemistry . 74 (1): 867–900. doi :10.1146/annurev.biochem.74.082803.133029. ISSN  0066-4154. PMID  15954844.
  10. ^ Veeramachaneni, Vamsi; Makałowski, Wojciech (2004). «Визуализация сходства последовательностей семейств белков». Genome Research . 14 (6): 1160–1169. doi : 10.1101/gr.2079204 . ISSN  1088-9051. PMC 419794. PMID 15140831  . 
  11. ^ Холм, Лииса; Хегер, Андреас (2013). «Автоматизированные подходы на основе последовательностей для идентификации семейств доменов». В Оренге, Кристин; Бейтман, Алекс (ред.). Семейства белков: взаимосвязь последовательности, структуры и функции белков . Хобокен, Нью-Джерси: John Wiley & Sons, Inc. стр. 1–24. doi : 10.1002/9781118743089.ch1. ISBN 9781118743089. S2CID  85641264.
  12. ^ Ван, Янь; Чжан, Ханг; Чжун, Хаолинь; Сюэ, Чжидун (01.01.2021). «Методы идентификации доменов белков и онлайн-ресурсы». Computational and Structural Biotechnology Journal . 19 : 1145–1153. doi : 10.1016/j.csbj.2021.01.041 . ISSN  2001-0370. PMC 7895673. PMID  33680357 . 
  13. ^ Бейтман, Алекс (2013). «Классификация последовательностей семейств белков: Pfam и другие ресурсы». В Orengo, Christine; Бейтман, Алекс (ред.). Семейства белков: взаимосвязь последовательности, структуры и функции белков . Хобокен, Нью-Джерси: John Wiley & Sons, Inc. стр. 25–36. doi :10.1002/9781118743089.ch2. ISBN 9781118743089.
  14. ^ Mulder, Nicola J.; Apweiler, Rolf (2001-12-19). "Инструменты и ресурсы для идентификации семейств белков, доменов и мотивов". Genome Biology . 3 (1): reviews2001.1. doi : 10.1186/gb-2001-3-1-reviews2001 . ISSN  1474-760X. PMC 150457. PMID 11806833  . 
  15. ^ Джеймс, Дженнифер Э.; Нельсон, Пол Г.; Масел, Джоанна (4 апреля 2023 г.). «Дифференциальное сохранение доменов Pfam способствует долгосрочным эволюционным тенденциям». Молекулярная биология и эволюция . 40 (4): msad073. doi :10.1093/molbev/msad073. PMC 10089649. PMID  36947137 . 
  16. ^ Gerlt, John A.; Allen, Karen N.; Almo, Steven C.; Armstrong, Richard N.; Babbitt, Patricia C.; Cronan, John E.; Dunaway-Mariano, Debra; Imker, Heidi J.; Jacobson, Matthew P.; Minor, Wladek; Poulter, C. Dale; Raushel, Frank M.; Sali, Andrej; Shoichet, Brian K.; Sweedler, Jonathan V. (2011-11-22). "Инициатива по ферментативной функции". Biochemistry . 50 (46): 9950–9962. doi :10.1021/bi201312u. ISSN  0006-2960. PMC 3238057. PMID 21999478  . 
  17. ^ Gandhimathi, A.; Nair, Anu G.; Sowdhamini, R. (2012). "PASS2 версия 4: обновление базы данных структурно-основанных выравниваний последовательностей суперсемейств структурных доменов". Nucleic Acids Research . 40 (D1): D531–D534. doi :10.1093/nar/gkr1096. ISSN  1362-4962. PMC 3245109 . PMID  22123743. 
  18. ^ Эммс, Дэвид М.; Келли, Стивен (2015-08-06). "OrthoFinder: Решение фундаментальных смещений в сравнениях целых геномов значительно повышает точность вывода ортогрупп". Genome Biology . 16 (1): 157. doi : 10.1186/s13059-015-0721-2 . ISSN  1474-760X. PMC 4531804 . PMID  26243257. 
  19. ^ Эммс, Дэвид М.; Келли, Стивен (14.11.2019). «OrthoFinder: Филогенетическая ортология для сравнительной геномики». Genome Biology . 20 (1): 238. doi : 10.1186/s13059-019-1832-y . ISSN  1474-760X. PMC 6857279. PMID 31727128  . 

Внешние ссылки