Консервированные сигнатурные вставки и делеции ( CSI ) в белковых последовательностях представляют собой важную категорию молекулярных маркеров для понимания филогенетических отношений. [1] [2] CSI, вызванные редкими генетическими изменениями, представляют собой полезные филогенетические маркеры, которые обычно имеют определенный размер и с обеих сторон окружены консервативными областями для обеспечения их надежности. В то время как индели могут быть произвольными вставками или делециями, CSI определяются как только те белковые индели, которые присутствуют в консервативных областях белка. [2] [3] [4] [5]
CSI, которые ограничены определенной кладой или группой видов, как правило, являются хорошими филогенетическими маркерами общего эволюционного происхождения. [2] Из-за редкости и высокоспецифичной природы таких изменений менее вероятно, что они могли возникнуть независимо либо путем конвергентной , либо параллельной эволюции (т. е. гомоплазии) и, следовательно, скорее всего, представляют собой синапоморфию . Другие сопутствующие факторы, такие как различия в скорости эволюции на разных участках или среди разных видов, также обычно не влияют на интерпретацию CSI. [2] [3] Определяя наличие или отсутствие CSI у видов, не входящих в группу, можно сделать вывод о том, была ли предковая форма CSI вставкой или делецией, и это можно использовать для разработки укорененных филогенетических отношений между организмами. [1] [2]
CSI обнаруживаются путем поиска общих изменений в филогенетическом дереве , построенном из последовательностей белков. Было обнаружено, что большинство CSI, которые были идентифицированы, имеют высокую прогностическую ценность при добавлении новых последовательностей, сохраняя специфичность для первоначально идентифицированных кладов видов. Их можно использовать для идентификации как известных, так и ранее неизвестных видов, принадлежащих к этим группам в различных средах. [3] По сравнению с порядками ветвления дерева, которые могут различаться в зависимости от метода, конкретные CSI обеспечивают более конкретные ограничения , которые вычислительно дешевле применять. [6]
Группоспецифичные CSI обычно являются общими для разных видов, принадлежащих к определенному таксону (например, роду, семейству, классу, отряду, типу), но они не присутствуют в других группах. Эти CSI, скорее всего, были введены в предка группы видов до того, как члены таксонов разошлись. Они предоставляют молекулярные средства для различения членов определенного таксона от всех других организмов. [2] [5]
На рисунке 1 показан пример 5aa CSI, обнаруженного у всех видов, принадлежащих к таксону X. Это отличительная характеристика этого таксона, поскольку она не обнаружена ни у одного другого вида. Эта сигнатура, вероятно, была введена в общего предка видов из этого таксона. Аналогично другие группоспецифические сигнатуры (не показаны) могут быть общими либо для A1 и A2, либо для B1 и B2 и т. д., или даже для X1 и X2 или для X3 и X4 и т. д. Группы A, B, C, D и X на этой диаграмме могут соответствовать различным бактериальным или эукариотическим типам. [7]
Группоспецифические CSI использовались в прошлом для определения филогенетической связи ряда бактериальных филумов и подгрупп внутри них. Например, вставка из 3 аминокислот была уникальной для членов филума Thermotogota (ранее Thermotogae) в существенном 50S рибосомальном белке L7/L12 , в пределах высококонсервативной области (82-124 аминокислоты). Этого нет ни у одного другого вида бактерий, и его можно использовать для характеристики членов Thermotogota от всех других бактерий. Группоспецифические CSI также использовались для характеристики подгрупп внутри Thermotogota. [8]
Основные CSI — это те, в которых консервативная вставка или делеция является общей для нескольких основных типов, но отсутствует в других типах. [2]
На рисунке 2 показан пример 5aa CSI, обнаруженного в консервативной области, которая обычно присутствует у видов, принадлежащих к типам X, Y и Z, но отсутствует в других типах (A, B и C). Эта сигнатура указывает на специфическую связь таксонов X, Y и Z, а также A, B и C. На основании наличия или отсутствия такой индели у видов внешней группы (а именно, архей) можно сделать вывод, является ли индель вставкой или делецией, и какая из этих двух групп A, B, C или X, Y, Z является предковой. [7]
Основные CSI использовались в прошлом для определения филогенетической связи ряда бактериальных филумов. Большой CSI около 150-180 аминокислот в пределах консервативной области Gyrase B (между аминокислотами 529-751) обычно разделяется различными видами Pseudomonadota , Chlamydiota , Planctomycetota и Aquificota . Этот CSI отсутствует в других предковых бактериальных филумах, а также в Archaea . [9] Аналогично большой CSI около 100 аминокислот в гомологах RpoB (между аминокислотами 919-1058) присутствует в различных видах, принадлежащих Pseudomonadota, Bacteroidota , Chlorobiota , Chlamydiota , Planctomycetota и Aquificota. Этот CSI отсутствует в других предковых бактериальных филумах, а также в Archaea. [10] [11] В обоих случаях можно сделать вывод, что группы, в которых отсутствует CSI, являются предковыми.
Ключевым вопросом в бактериальной филогении является понимание того, как различные виды бактерий связаны друг с другом и их порядок ветвления от общего предка. В настоящее время большинство филогенетических деревьев основаны на 16S рРНК или других генах/белках. Эти деревья не всегда способны решать ключевые филогенетические вопросы с высокой степенью уверенности. [12] [13] [14] [15] [16] Однако в последние годы открытие и анализ консервативных инделей (CSI) во многих универсально распространенных белках помогли в этом поиске. Генетические события, ведущие к ним, постулируются как произошедшие в важных эволюционных точках ветвления, и их модели распределения видов предоставляют ценную информацию относительно порядка ветвления и взаимосвязей между различными бактериальными типами. [1] [2] [8]
Недавно филогенетическая связь группы Thermotogota была охарактеризована на основе подхода CSI. Ранее не было известно никаких биохимических или молекулярных маркеров , которые могли бы четко отличать виды этого типа от всех других бактерий. Было обнаружено более 60 CSI, которые были специфичны для всего типа Thermotogota или его различных подгрупп. Из них 18 CSI присутствуют только в различных видах Thermotogota и обеспечивают молекулярные маркеры для типа. Кроме того, было много CSI, которые были специфичны для различных подгрупп Thermotogota. Еще 12 CSI были специфичны для клады, состоящей из различных видов Thermotogota, за исключением Tt. Lettingae. В то время как 14 CSI были специфичны для клады, состоящей из родов Fervidobacterium и Thermosipho , а 18 CSI были специфичны для рода Thermosiphon . [ необходима цитата ]
Наконец, было сообщено о 16 CSI, которые были общими либо для некоторых, либо для всех видов Thermotogota, либо для некоторых видов из других таксонов, таких как Archaea , Aquificota , Bacillota , Pseudomonadota , Deinococcota , Fusobacteriota , Dictyoglomota , Chloroflexota и эукариоты . Общее присутствие некоторых из этих CSI может быть связано с латеральным переносом генов (LGT) между этими группами. Однако количество CSI, которые обычно являются общими с другими таксонами, намного меньше тех, которые специфичны для Thermotogota, и они не демонстрируют какой-либо специфической закономерности. Следовательно, они не оказывают существенного влияния на различие Thermotogota. [8]
Мезофильные Thermoproteota были недавно помещены в новый тип Archaea , называемый Nitrososphaerota (ранее Thaumarchaeota). Однако существует очень мало молекулярных маркеров, которые могут отличить эту группу архей от типа Thermoproteota (ранее Crenarchaeota). Было проведено подробное филогенетическое исследование с использованием подхода CSI, чтобы отличить эти типы в молекулярных терминах. 6 CSI были уникально обнаружены у различных Nitrososphaerota, а именно Cenarchaeum symbiosum , Nitrosopumilus maritimus и ряда некультивируемых морских Thermoproteota. Было обнаружено 3 CSI, которые обычно были общими для видов, принадлежащих Nitrososphaerota и Thermoproteota. Кроме того, было обнаружено несколько CSI, которые являются специфическими для различных порядков Thermoproteota — 3 CSI для Sulfolobales , 5 CSI для Thermoproteales , и, наконец, 2 CSI, общие для Sulfolobales и Desulfurococcales . Описанные сигнатуры предоставляют новые способы различения Thermoproteota и Nitrososphaerota, кроме того, их можно использовать в качестве инструмента для классификации и идентификации родственных видов. [17]
Члены порядка Pasteurellales в настоящее время различаются в основном на основе их положения в разветвлении дерева 16srRNA. В настоящее время известно очень мало молекулярных маркеров, которые могут отличать членов этого порядка от других бактерий. Недавно был использован подход CSI для выяснения филогенетических отношений между видами в этом порядке; было обнаружено более 40 CSI, которые были уникальными для всех или большинства видов. В пределах этого Pasteurellales образуются две основные клады: клада I, охватывающая Aggregatibacter , Pasteurella , Actinobacillus succinogenes , Mannheimia succiniciproducens , Haemophilus influenzae и Haemophilus somnus , была поддержана 13 CSI. Clade II, охватывающий Actinobacillus pleuropneumoniae , Actinobacillus minor , Haemophilus ducreyi , Mannheimia haemolytica и Haemophilus parasuis , был поддержан 9 CSI. На основании этих результатов было предложено разделить Pasteurellales из его текущего одного семейства на два разных. Кроме того, описанные сигнатуры предоставят новые способы идентификации неоткрытых видов Pasteurellales. [18]
Класс Gammaproteobacteria образует одну из крупнейших групп бактерий. В настоящее время он отличается от других бактерий исключительно филогенетическими деревьями на основе 16s рРНК . Не известно никаких молекулярных характеристик, уникальных для класса или его различных подгрупп. Было проведено подробное исследование на основе CSI, чтобы лучше понять филогению этого класса. Во-первых, было создано филогенетическое дерево на основе конкатенированных последовательностей ряда универсально распространенных белков. Порядок ветвления различных порядков класса Gammaproteobacteria ( от самых последних до самых ранних расхождений) был следующим: Enterobacteriales > Pasteurellales > Vibrionales , Aeromonadales > Alteromonadales > Oceanospirillales , Pseudomonadales > Chromatiales, Legionellales , Methylococcales , Xanthomonadales , Cardiobacteriales , Thiotrichales . Кроме того, были обнаружены 4 CSI, которые были уникальными для большинства видов класса Gammaproteobacteria. Делеция 2 аминокислот в трансформилазе AICAR была уникальной для всех гаммапротеобактерий, за исключением Francisella tularensis . Делеция 4 аминокислот в b-субъединице РНК-полимеразы и делеция 1 аминокислоты в рибосомальном белке L16 были обнаружены уникально для различных видов, принадлежащих к порядкам Enterobacteriales, Pasteurellales, Vibrionales, Aeromonadales и Alteromonadales, но не были обнаружены у других гаммапротеобактерий. Наконец, делеция 2 аминокислот в лейцил-тРНК-синтетазе обычно присутствовала в вышеуказанных порядках класса Gammaproteobacteria и у некоторых членов порядка Oceanospirillales. [19] Другое исследование на основе CSI также выявило 4 CSI, которые являются эксклюзивными для порядка Xanthomonadales. Взятые вместе, эти два факта показывают, что Xanthomonadales является монофилетической группой , которая является предковой по отношению к другим Gammaproteobacteria, что дополнительно показывает, что Xanthomonadales является независимым подразделением и представляет собой одну из самых глубоко разветвленных линий внутри клады Gammaproteobacteria. [4] [19]
{{cite web}}
: CS1 maint: бот: исходный статус URL неизвестен ( ссылка )