stringtranslate.com

Сохраненные индели подписи

Консервированные сигнатурные вставки и делеции ( CSI ) в белковых последовательностях представляют собой важную категорию молекулярных маркеров для понимания филогенетических отношений. [1] [2] CSI, вызванные редкими генетическими изменениями, представляют собой полезные филогенетические маркеры, которые обычно имеют определенный размер и с обеих сторон окружены консервативными областями для обеспечения их надежности. В то время как индели могут быть произвольными вставками или делециями, CSI определяются как только те белковые индели, которые присутствуют в консервативных областях белка. [2] [3] [4] [5]

CSI, которые ограничены определенной кладой или группой видов, как правило, являются хорошими филогенетическими маркерами общего эволюционного происхождения. [2] Из-за редкости и высокоспецифичной природы таких изменений менее вероятно, что они могли возникнуть независимо либо путем конвергентной , либо параллельной эволюции (т. е. гомоплазии) и, следовательно, скорее всего, представляют собой синапоморфию . Другие сопутствующие факторы, такие как различия в скорости эволюции на разных участках или среди разных видов, также обычно не влияют на интерпретацию CSI. [2] [3] Определяя наличие или отсутствие CSI у видов, не входящих в группу, можно сделать вывод о том, была ли предковая форма CSI вставкой или делецией, и это можно использовать для разработки укорененных филогенетических отношений между организмами. [1] [2]

CSI обнаруживаются путем поиска общих изменений в филогенетическом дереве , построенном из последовательностей белков. Было обнаружено, что большинство CSI, которые были идентифицированы, имеют высокую прогностическую ценность при добавлении новых последовательностей, сохраняя специфичность для первоначально идентифицированных кладов видов. Их можно использовать для идентификации как известных, так и ранее неизвестных видов, принадлежащих к этим группам в различных средах. [3] По сравнению с порядками ветвления дерева, которые могут различаться в зависимости от метода, конкретные CSI обеспечивают более конкретные ограничения , которые вычислительно дешевле применять. [6]

Типы

Специфический для группы

Рисунок 1: Пример специфической для группы консервативной сигнатурной индели (CSI), специфичной для видов из таксона X. Черточки в выравниваниях указывают на присутствие аминокислоты, идентичной той, что указана в верхней строке.

Группоспецифичные CSI обычно являются общими для разных видов, принадлежащих к определенному таксону (например, роду, семейству, классу, отряду, типу), но они не присутствуют в других группах. Эти CSI, скорее всего, были введены в предка группы видов до того, как члены таксонов разошлись. Они предоставляют молекулярные средства для различения членов определенного таксона от всех других организмов. [2] [5]

На рисунке 1 показан пример 5aa CSI, обнаруженного у всех видов, принадлежащих к таксону X. Это отличительная характеристика этого таксона, поскольку она не обнаружена ни у одного другого вида. Эта сигнатура, вероятно, была введена в общего предка видов из этого таксона. Аналогично другие группоспецифические сигнатуры (не показаны) могут быть общими либо для A1 и A2, либо для B1 и B2 и т. д., или даже для X1 и X2 или для X3 и X4 и т. д. Группы A, B, C, D и X на этой диаграмме могут соответствовать различным бактериальным или эукариотическим типам. [7]

Группоспецифические CSI использовались в прошлом для определения филогенетической связи ряда бактериальных филумов и подгрупп внутри них. Например, вставка из 3 аминокислот была уникальной для членов филума Thermotogota (ранее Thermotogae) в существенном 50S рибосомальном белке L7/L12 , в пределах высококонсервативной области (82-124 аминокислоты). Этого нет ни у одного другого вида бактерий, и его можно использовать для характеристики членов Thermotogota от всех других бактерий. Группоспецифические CSI также использовались для характеристики подгрупп внутри Thermotogota. [8]

Многогрупповой или основной

Рисунок 2: Мультигрупповая или Mainline Conserved signature indel (CSI). Черточки указывают на присутствие аминокислоты, идентичной той, что в верхней строке.

Основные CSI — это те, в которых консервативная вставка или делеция является общей для нескольких основных типов, но отсутствует в других типах. [2]

На рисунке 2 показан пример 5aa CSI, обнаруженного в консервативной области, которая обычно присутствует у видов, принадлежащих к типам X, Y и Z, но отсутствует в других типах (A, B и C). Эта сигнатура указывает на специфическую связь таксонов X, Y и Z, а также A, B и C. На основании наличия или отсутствия такой индели у видов внешней группы (а именно, архей) можно сделать вывод, является ли индель вставкой или делецией, и какая из этих двух групп A, B, C или X, Y, Z является предковой. [7]

Основные CSI использовались в прошлом для определения филогенетической связи ряда бактериальных филумов. Большой CSI около 150-180 аминокислот в пределах консервативной области Gyrase B (между аминокислотами 529-751) обычно разделяется различными видами Pseudomonadota , Chlamydiota , Planctomycetota и Aquificota . Этот CSI отсутствует в других предковых бактериальных филумах, а также в Archaea . [9] Аналогично большой CSI около 100 аминокислот в гомологах RpoB (между аминокислотами 919-1058) присутствует в различных видах, принадлежащих Pseudomonadota, Bacteroidota , Chlorobiota , Chlamydiota , Planctomycetota и Aquificota. Этот CSI отсутствует в других предковых бактериальных филумах, а также в Archaea. [10] [11] В обоих случаях можно сделать вывод, что группы, в которых отсутствует CSI, являются предковыми.

Эволюционные исследования на основе CSI

Рисунок 3: Связанное дерево белков, показывающее филогенетическую связь группы Thermotogota. Указано количество CSI, которые поддерживают порядок ветвления.
Рисунок 4: Сцепленное дерево белков, показывающее филогенетическую связь двух типов архей. Указано количество CSI, которые поддерживают порядок ветвления.
Рисунок 5: Связанное дерево белков, показывающее филогенетическую связь группы Pasteurellales. Указано количество CSI, которые поддерживают порядок ветвления.

Ключевым вопросом в бактериальной филогении является понимание того, как различные виды бактерий связаны друг с другом и их порядок ветвления от общего предка. В настоящее время большинство филогенетических деревьев основаны на 16S рРНК или других генах/белках. Эти деревья не всегда способны решать ключевые филогенетические вопросы с высокой степенью уверенности. [12] [13] [14] [15] [16] Однако в последние годы открытие и анализ консервативных инделей (CSI) во многих универсально распространенных белках помогли в этом поиске. Генетические события, ведущие к ним, постулируются как произошедшие в важных эволюционных точках ветвления, и их модели распределения видов предоставляют ценную информацию относительно порядка ветвления и взаимосвязей между различными бактериальными типами. [1] [2] [8]

Термотогота

Недавно филогенетическая связь группы Thermotogota была охарактеризована на основе подхода CSI. Ранее не было известно никаких биохимических или молекулярных маркеров , которые могли бы четко отличать виды этого типа от всех других бактерий. Было обнаружено более 60 CSI, которые были специфичны для всего типа Thermotogota или его различных подгрупп. Из них 18 CSI присутствуют только в различных видах Thermotogota и обеспечивают молекулярные маркеры для типа. Кроме того, было много CSI, которые были специфичны для различных подгрупп Thermotogota. Еще 12 CSI были специфичны для клады, состоящей из различных видов Thermotogota, за исключением Tt. Lettingae. В то время как 14 CSI были специфичны для клады, состоящей из родов Fervidobacterium и Thermosipho , а 18 CSI были специфичны для рода Thermosiphon . [ необходима цитата ]

Наконец, было сообщено о 16 CSI, которые были общими либо для некоторых, либо для всех видов Thermotogota, либо для некоторых видов из других таксонов, таких как Archaea , Aquificota , Bacillota , Pseudomonadota , Deinococcota , Fusobacteriota , Dictyoglomota , Chloroflexota и эукариоты . Общее присутствие некоторых из этих CSI может быть связано с латеральным переносом генов (LGT) между этими группами. Однако количество CSI, которые обычно являются общими с другими таксонами, намного меньше тех, которые специфичны для Thermotogota, и они не демонстрируют какой-либо специфической закономерности. Следовательно, они не оказывают существенного влияния на различие Thermotogota. [8]

Археи

Мезофильные Thermoproteota были недавно помещены в новый тип Archaea , называемый Nitrososphaerota (ранее Thaumarchaeota). Однако существует очень мало молекулярных маркеров, которые могут отличить эту группу архей от типа Thermoproteota (ранее Crenarchaeota). Было проведено подробное филогенетическое исследование с использованием подхода CSI, чтобы отличить эти типы в молекулярных терминах. 6 CSI были уникально обнаружены у различных Nitrososphaerota, а именно Cenarchaeum symbiosum , Nitrosopumilus maritimus и ряда некультивируемых морских Thermoproteota. Было обнаружено 3 CSI, которые обычно были общими для видов, принадлежащих Nitrososphaerota и Thermoproteota. Кроме того, было обнаружено несколько CSI, которые являются специфическими для различных порядков Thermoproteota — 3 CSI для Sulfolobales , 5 CSI для Thermoproteales , и, наконец, 2 CSI, общие для Sulfolobales и Desulfurococcales . Описанные сигнатуры предоставляют новые способы различения Thermoproteota и Nitrososphaerota, кроме того, их можно использовать в качестве инструмента для классификации и идентификации родственных видов. [17]

Пастереллы

Члены порядка Pasteurellales в настоящее время различаются в основном на основе их положения в разветвлении дерева 16srRNA. В настоящее время известно очень мало молекулярных маркеров, которые могут отличать членов этого порядка от других бактерий. Недавно был использован подход CSI для выяснения филогенетических отношений между видами в этом порядке; было обнаружено более 40 CSI, которые были уникальными для всех или большинства видов. В пределах этого Pasteurellales образуются две основные клады: клада I, охватывающая Aggregatibacter , Pasteurella , Actinobacillus succinogenes , Mannheimia succiniciproducens , Haemophilus influenzae и Haemophilus somnus , была поддержана 13 CSI. Clade II, охватывающий Actinobacillus pleuropneumoniae , Actinobacillus minor , Haemophilus ducreyi , Mannheimia haemolytica и Haemophilus parasuis , был поддержан 9 CSI. На основании этих результатов было предложено разделить Pasteurellales из его текущего одного семейства на два разных. Кроме того, описанные сигнатуры предоставят новые способы идентификации неоткрытых видов Pasteurellales. [18]

Гаммапротеобактерии

Класс Gammaproteobacteria образует одну из крупнейших групп бактерий. В настоящее время он отличается от других бактерий исключительно филогенетическими деревьями на основе 16s рРНК . Не известно никаких молекулярных характеристик, уникальных для класса или его различных подгрупп. Было проведено подробное исследование на основе CSI, чтобы лучше понять филогению этого класса. Во-первых, было создано филогенетическое дерево на основе конкатенированных последовательностей ряда универсально распространенных белков. Порядок ветвления различных порядков класса Gammaproteobacteria ( от самых последних до самых ранних расхождений) был следующим: Enterobacteriales > Pasteurellales > Vibrionales , Aeromonadales > Alteromonadales > Oceanospirillales , Pseudomonadales > Chromatiales, Legionellales , Methylococcales , Xanthomonadales , Cardiobacteriales , Thiotrichales . Кроме того, были обнаружены 4 CSI, которые были уникальными для большинства видов класса Gammaproteobacteria. Делеция 2 аминокислот в трансформилазе AICAR была уникальной для всех гаммапротеобактерий, за исключением Francisella tularensis . Делеция 4 аминокислот в b-субъединице РНК-полимеразы и делеция 1 аминокислоты в рибосомальном белке L16 были обнаружены уникально для различных видов, принадлежащих к порядкам Enterobacteriales, Pasteurellales, Vibrionales, Aeromonadales и Alteromonadales, но не были обнаружены у других гаммапротеобактерий. Наконец, делеция 2 аминокислот в лейцил-тРНК-синтетазе обычно присутствовала в вышеуказанных порядках класса Gammaproteobacteria и у некоторых членов порядка Oceanospirillales. [19] Другое исследование на основе CSI также выявило 4 CSI, которые являются эксклюзивными для порядка Xanthomonadales. Взятые вместе, эти два факта показывают, что Xanthomonadales является монофилетической группой , которая является предковой по отношению к другим Gammaproteobacteria, что дополнительно показывает, что Xanthomonadales является независимым подразделением и представляет собой одну из самых глубоко разветвленных линий внутри клады Gammaproteobacteria. [4] [19]

Смотрите также

Ссылки

  1. ^ abc Baldauf, SL (1993). «Животные и грибы — ближайшие родственники друг друга: конгруэнтные доказательства из нескольких белков». Труды Национальной академии наук . 90 (24): 11558–11562. Bibcode : 1993PNAS ...9011558B. doi : 10.1073/pnas.90.24.11558 . PMC  48023. PMID  8265589.
  2. ^ abcdefgh Gupta, Radhey S. (1998). «Филогении белков и последовательности сигнатур: переоценка эволюционных отношений между архебактериями, эубактериями и эукариотами». Microbiology and Molecular Biology Reviews . 62 (4): 1435–91. doi :10.1128 / MMBR.62.4.1435-1491.1998. PMC 98952. PMID  9841678. 
  3. ^ abc Gupta, Radhey S.; Griffiths, Emma (2002). «Критические вопросы бактериальной филогении». Теоретическая популяционная биология . 61 (4): 423–34. doi :10.1006/tpbi.2002.1589. PMID  12167362.
  4. ^ аб Кутиньо-Хименес, Аня М.; Мартинс-Пинейру, Маринальва; Лима, Ванесса К.; Мартин-Торне, Александр; Моралес, Ослейдис Г.; Менк, Карлос FM (2010). «Эволюционное размещение Xanthomonadales на основе консервативных сигнатурных последовательностей белков». Молекулярная филогенетика и эволюция . 54 (2): 524–34. дои : 10.1016/j.ympev.2009.09.026 . ПМИД  19786109.
  5. ^ ab Rokas, Antonis; Holland, Peter WH (2000). «Редкие геномные изменения как инструмент филогенетики». Trends in Ecology & Evolution . 15 (11): 454–459. doi :10.1016/S0169-5347(00)01967-4. PMID  11050348.
  6. ^ Gupta, Radhey S.; Kanter-Eivin, David A. (9 мая 2023 г.). «Сервер AppIndels.com: веб-инструмент для идентификации известных таксон-специфичных консервативных сигнатурных инделей в последовательностях генома. Проверка его полезности путем прогнозирования таксономической принадлежности >700 неклассифицированных штаммов видов Bacillus». Международный журнал систематической и эволюционной микробиологии . 73 (5). doi : 10.1099/ijsem.0.005844. PMID  37159410.
  7. ^ ab Gupta, Radhey. "Conserved Inserts and Deletions in Protein Sequences". Бактериальная филогения . Лаборатория Гупты. Архивировано из оригинала 15 сентября 2011 г. Получено 2 апреля 2012 г.{{cite web}}: CS1 maint: бот: исходный статус URL неизвестен ( ссылка )
  8. ^ abc Гупта, Рэдхи С.; Бхандари, Вайбхав (2011). «Филогения и молекулярные признаки типа Thermotogae и его подгрупп». Антони ван Левенгук . 100 (1): 1–34. doi : 10.1007/s10482-011-9576-z. PMID  21503713. S2CID  24995263.
  9. ^ Гриффитс, Э.; Гупта, Р.С. (2007). «Филогения и общие консервативные вставки в белках свидетельствуют о том, что Verrucomicrobia являются ближайшими известными свободноживущими родственниками хламидий». Микробиология . 153 (8): 2648–54. doi : 10.1099/mic.0.2007/009118-0 . PMID  17660429.
  10. ^ Гупта, Радхей С. (2003). «Эволюционные отношения среди фотосинтезирующих бактерий». Photosynthesis Research . 76 (1–3): 173–83. doi :10.1023/A:1024999314839. PMID  16228576. S2CID  38460308.
  11. ^ Гриффитс, Эмма; Гупта, Радхей С. (2004). «Сигнатурные последовательности в разнообразных белках свидетельствуют о поздней дивергенции порядка Aquificales» (PDF) . Международная микробиология . 7 (1): 41–52. PMID  15179606.
  12. ^ Браун, Джеймс Р.; Дуади, Кристоф Дж.; Италия, Майкл Дж.; Маршалл, Уильям Э.; Стэнхоуп, Майкл Дж. (2001). «Универсальные деревья, основанные на больших комбинированных наборах данных о последовательностях белков». Nature Genetics . 28 (3): 281–5. doi :10.1038/90129. PMID  11431701. S2CID  8516570.
  13. ^ Кавальер-Смит, Т. (2002). «Неомуранское происхождение архебактерий, негибактериальный корень универсального дерева и бактериальная мегаклассификация». Международный журнал систематической и эволюционной микробиологии . 52 (1): 7–76. doi : 10.1099/00207713-52-1-7 . PMID  11837318.
  14. ^ Ciccarelli, FD; Doerks, T; Von Mering, C; Creevey, CJ; Snel, B; Bork, P (2006). «К автоматической реконструкции высокоразрешенного древа жизни». Science . 311 (5765): 1283–7. Bibcode :2006Sci...311.1283C. CiteSeerX 10.1.1.381.9514 . doi :10.1126/science.1123061. PMID  16513982. S2CID  1615592. 
  15. ^ Добен, В.; Гуи, М.; Перьер, Г. (2002). «Филогеномный подход к бактериальной филогении: доказательства наличия ядра генов, имеющих общую историю». Genome Research . 12 (7): 1080–90. doi :10.1101/gr.187002. PMC 186629 . PMID  12097345. 
  16. ^ Эйзен, Джонатан А. (1995). «Белок RecA как модельная молекула для молекулярно-систематических исследований бактерий: сравнение деревьев RecA и 16S рРНК из одного вида». Журнал молекулярной эволюции . 41 (6): 1105–23. Bibcode : 1995JMolE..41.1105E. doi : 10.1007/bf00173192. PMC 3188426. PMID  8587109 . 
  17. ^ Гупта, Рэдхи С.; Шами, Али (2010). «Молекулярные подписи Crenarchaeota и Thaumarchaeota». Антони ван Левенгук . 99 (2): 133–57. дои : 10.1007/s10482-010-9488-3. PMID  20711675. S2CID  12874800.
  18. ^ Naushad, Hafiz Sohail; Gupta, Radhey S. (2011). «Молекулярные сигнатуры (консервативные индели) в белковых последовательностях, которые специфичны для порядка Pasteurellales и отличают две его основные клады». Antonie van Leeuwenhoek . 101 (1): 105–24. doi :10.1007/s10482-011-9628-4. PMID  21830122. S2CID  15114511.
  19. ^ ab Гао, Б.; Мохан, Р.; Гупта, Р.С. (2009). «Филогеномика и белковые сигнатуры, объясняющие эволюционные связи между гаммапротеобактериями». Международный журнал систематической и эволюционной микробиологии . 59 (2): 234–47. doi : 10.1099/ijs.0.002741-0 . PMID  19196760.