Семейство белков — это группа эволюционно связанных белков . Во многих случаях семейство белков имеет соответствующее семейство генов , в котором каждый ген кодирует соответствующий белок с соотношением 1:1. Термин «семейство белков» не следует путать с семейством , как оно используется в таксономии.
Белки в семействе происходят от общего предка и обычно имеют схожие трехмерные структуры , функции и значительное сходство последовательностей . [1] [2] Сходство последовательностей (обычно аминокислотных последовательностей) является одним из наиболее распространенных показателей гомологии или общего эволюционного происхождения. [3] [4] Некоторые структуры для оценки значимости сходства между последовательностями используют методы выравнивания последовательностей . Белки, которые не имеют общего предка, вряд ли покажут статистически значимое сходство последовательностей, что делает выравнивание последовательностей мощным инструментом для идентификации членов семейств белков. [3] [4] Иногда семейства группируются в более крупные клады , называемые суперсемействами , на основе структурного сходства, даже если нет идентифицируемой гомологии последовательностей.
В настоящее время определено более 60 000 семейств белков [5], хотя неоднозначность определения «семейства белков» приводит к тому, что разные исследователи дают весьма разные цифры.
Терминология и использование
Термин «семейство белков» имеет широкое применение и может применяться к большим группам белков с едва заметным сходством последовательностей, а также к узким группам белков с почти идентичной последовательностью, функцией и структурой. Чтобы различать эти случаи, используется иерархическая терминология. На самом высоком уровне классификации находятся суперсемейства белков , которые группируют отдаленно родственные белки, часто на основе их структурного сходства. [6] [7] [8] [9] Далее следуют семейства белков, которые относятся к белкам с общим эволюционным происхождением, демонстрируемым значительным сходством последовательностей . [2] [10] Подсемейства могут быть определены внутри семейств для обозначения близкородственных белков, которые имеют схожие или идентичные функции. [11] Например, суперсемейство, такое как клан протеаз PA , имеет меньшую консервативность последовательностей, чем семейство C04 внутри него.
Семейства белков были впервые распознаны, когда большинство структурно понятых белков были небольшими, однодоменными белками, такими как миоглобин , гемоглобин и цитохром c . С тех пор было обнаружено много белков с несколькими независимыми структурными и функциональными единицами, называемыми доменами . Из-за эволюционной перетасовки различные домены в белке развивались независимо. Это привело к сосредоточению внимания на семействах доменов белков. Несколько онлайн-ресурсов посвящены идентификации и каталогизации этих доменов. [12] [13]
Различные области белка имеют различные функциональные ограничения. Например, активный сайт фермента требует, чтобы определенные аминокислотные остатки были точно ориентированы. Интерфейс связывания белок-белок может состоять из большой поверхности с ограничениями на гидрофобность или полярность аминокислотных остатков. Функционально ограниченные области белков развиваются медленнее, чем неограниченные области, такие как поверхностные петли, что приводит к появлению блоков консервативной последовательности при сравнении последовательностей семейства белков (см. множественное выравнивание последовательностей ). Эти блоки чаще всего называют мотивами, хотя используются и многие другие термины (блоки, сигнатуры, отпечатки пальцев и т. д.). Несколько онлайн-ресурсов посвящены идентификации и каталогизации белковых мотивов. [14]
Эволюция семейств белков
Согласно текущему консенсусу, семейства белков возникают двумя способами. Во-первых, разделение родительского вида на два генетически изолированных вида-потомка позволяет гену/белку независимо накапливать вариации ( мутации ) в этих двух линиях. Это приводит к появлению семейства ортологичных белков, обычно с консервативными мотивами последовательностей. Во-вторых, дупликация гена может создать вторую копию гена (называемую паралогом ) . Поскольку исходный ген все еще способен выполнять свою функцию, дублированный ген может свободно расходиться и приобретать новые функции (путем случайной мутации).
Определенные семейства генов/белков, особенно у эукариот , подвергаются экстремальным расширениям и сокращениям в ходе эволюции, иногда в сочетании с дупликациями всего генома . Расширения менее вероятны, а потери более вероятны для внутренне неупорядоченных белков и для доменов белков, гидрофобные аминокислоты которых находятся дальше от оптимальной степени дисперсии вдоль первичной последовательности. [15] Это расширение и сокращение семейств белков является одной из существенных особенностей эволюции генома , но ее важность и последствия в настоящее время неясны.
Использование и значение семейств белков
По мере увеличения общего числа секвенированных белков и расширения интереса к анализу протеома продолжаются усилия по организации белков в семейства и описанию их компонентных доменов и мотивов. Надежная идентификация семейств белков имеет решающее значение для филогенетического анализа, функциональной аннотации и исследования разнообразия функций белков в данной филогенетической ветви. Инициатива по функциям ферментов использует семейства и суперсемейства белков в качестве основы для разработки стратегии на основе последовательности/структуры для крупномасштабного функционального назначения ферментов неизвестной функции. [16] Алгоритмические средства для установления семейств белков в крупномасштабном масштабе основаны на понятии сходства.
Ресурсы семейства белков
Многие биологические базы данных каталогизируют семейства белков и позволяют пользователям сопоставлять последовательности запросов с известными семействами. К ним относятся:
Pfam — База данных семейств белков с выравниваниями и HMM
PROSITE - База данных доменов, семейств и функциональных участков белков
SUPERFAMILY - Библиотека HMM, представляющих суперсемейства, и база данных аннотаций (суперсемейств и семейств) для всех полностью секвенированных организмов.
SCOP и CATH — Классификации белковых структур на суперсемейства, семейства и домены
Аналогично существует множество алгоритмов поиска в базах данных, например:
^ "Что такое семейства белков? Классификация белков". EMBL-EBI . Получено 2023-11-14 .
^ ab Orengo, Christine; Bateman, Alex (2013). "Введение". В Orengo, Christine; Bateman, Alex (ред.). Семейства белков: взаимосвязь последовательности, структуры и функции белков . Hoboken, New Jersey: John Wiley & Sons, Inc. стр. vii–xi. doi :10.1002/9781118743089.fmatter. ISBN9781118743089.
^ ab Pearson, William R. (2013). «Введение в поиск сходства последовательностей («гомологии»). Current Protocols in Bioinformatics . 3 : 3.1.1–3.1.8. doi :10.1002/0471250953.bi0301s42. ISSN 1934-3396. PMC 3820096. PMID 23749753 .
^ ab Chen, Junjie; Guo, Mingyue; Wang, Xiaolong; Liu, Bin (2018-03-01). «Комплексный обзор и сравнение различных вычислительных методов для обнаружения удаленной гомологии белков». Briefings in Bioinformatics . 19 (2): 231–244. doi :10.1093/bib/bbw108. ISSN 1477-4054. PMID 27881430.
^ Кунин, Виктор; Дела, Ильдефонсо; Энрайт, Антон Дж.; де Лоренцо, Виктор; Узунис, Христос А. (2003). «Мириады белковых семейств, и их количество продолжает расти». Геномная биология . 4 (2): 401. doi : 10.1186/gb-2003-4-2-401 . ISSN 1474-760X. ПМК 151299 . ПМИД 12620116.
^ Dayhoff, MO (декабрь 1974). «Компьютерный анализ последовательностей белков». Federation Proceedings . 33 (12): 2314–6. PMID 4435228.
^ Dayhoff, MO (август 1976). «Происхождение и эволюция суперсемейств белков». Federation Proceedings . 35 (10): 2132–8. PMID 181273.
^ Оренго, Кристин А.; Торнтон, Джанет М. (2005-06-01). «Семейства белков и их эволюция — структурная перспектива». Annual Review of Biochemistry . 74 (1): 867–900. doi :10.1146/annurev.biochem.74.082803.133029. ISSN 0066-4154. PMID 15954844.
^ Veeramachaneni, Vamsi; Makałowski, Wojciech (2004). «Визуализация сходства последовательностей семейств белков». Genome Research . 14 (6): 1160–1169. doi : 10.1101/gr.2079204 . ISSN 1088-9051. PMC 419794. PMID 15140831 .
^ Холм, Лииса; Хегер, Андреас (2013). «Автоматизированные подходы на основе последовательностей для идентификации семейств доменов». В Оренге, Кристин; Бейтман, Алекс (ред.). Семейства белков: взаимосвязь последовательности, структуры и функции белков . Хобокен, Нью-Джерси: John Wiley & Sons, Inc. стр. 1–24. doi : 10.1002/9781118743089.ch1. ISBN9781118743089. S2CID 85641264.
^ Бейтман, Алекс (2013). «Классификация последовательностей семейств белков: Pfam и другие ресурсы». В Orengo, Christine; Бейтман, Алекс (ред.). Семейства белков: взаимосвязь последовательности, структуры и функции белков . Хобокен, Нью-Джерси: John Wiley & Sons, Inc. стр. 25–36. doi :10.1002/9781118743089.ch2. ISBN9781118743089.
^ Mulder, Nicola J.; Apweiler, Rolf (2001-12-19). "Инструменты и ресурсы для идентификации семейств белков, доменов и мотивов". Genome Biology . 3 (1): reviews2001.1. doi : 10.1186/gb-2001-3-1-reviews2001 . ISSN 1474-760X. PMC 150457. PMID 11806833 .
^ Джеймс, Дженнифер Э.; Нельсон, Пол Г.; Масел, Джоанна (4 апреля 2023 г.). «Дифференциальное сохранение доменов Pfam способствует долгосрочным эволюционным тенденциям». Молекулярная биология и эволюция . 40 (4): msad073. doi :10.1093/molbev/msad073. PMC 10089649. PMID 36947137 .
^ Gerlt, John A.; Allen, Karen N.; Almo, Steven C.; Armstrong, Richard N.; Babbitt, Patricia C.; Cronan, John E.; Dunaway-Mariano, Debra; Imker, Heidi J.; Jacobson, Matthew P.; Minor, Wladek; Poulter, C. Dale; Raushel, Frank M.; Sali, Andrej; Shoichet, Brian K.; Sweedler, Jonathan V. (2011-11-22). "Инициатива по ферментативной функции". Biochemistry . 50 (46): 9950–9962. doi :10.1021/bi201312u. ISSN 0006-2960. PMC 3238057. PMID 21999478 .
^ Gandhimathi, A.; Nair, Anu G.; Sowdhamini, R. (2012). "PASS2 версия 4: обновление базы данных структурно-основанных выравниваний последовательностей суперсемейств структурных доменов". Nucleic Acids Research . 40 (D1): D531–D534. doi :10.1093/nar/gkr1096. ISSN 1362-4962. PMC 3245109 . PMID 22123743.
^ Эммс, Дэвид М.; Келли, Стивен (2015-08-06). "OrthoFinder: Решение фундаментальных смещений в сравнениях целых геномов значительно повышает точность вывода ортогрупп". Genome Biology . 16 (1): 157. doi : 10.1186/s13059-015-0721-2 . ISSN 1474-760X. PMC 4531804 . PMID 26243257.
^ Эммс, Дэвид М.; Келли, Стивен (14.11.2019). «OrthoFinder: Филогенетическая ортология для сравнительной геномики». Genome Biology . 20 (1): 238. doi : 10.1186/s13059-019-1832-y . ISSN 1474-760X. PMC 6857279. PMID 31727128 .
Внешние ссылки
Медиа, связанные с семействами белков на Wikimedia Commons