stringtranslate.com

Вывод о горизонтальном переносе генов

Горизонтальный или латеральный перенос генов (ГПГ или ЛГП) — это передача частей геномной ДНК между организмами посредством процесса, отделенного от вертикального наследования . При наличии событий ГПГ различные фрагменты генома являются результатом различных эволюционных историй. Поэтому это может усложнить исследования эволюционного родства линий и видов. Кроме того, поскольку ГПГ может привносить в геномы радикально отличающиеся генотипы из отдаленных линий или даже новые гены , несущие новые функции, он является основным источником фенотипических инноваций и механизмом адаптации ниши . Например, особое значение для здоровья человека имеет латеральный перенос детерминант устойчивости к антибиотикам и патогенности , что приводит к появлению патогенных линий. [1]

Вывод горизонтального переноса генов посредством вычислительной идентификации событий ГПГ основан на исследовании состава последовательности или эволюционной истории генов. Методы, основанные на составе последовательности («параметрические»), ищут отклонения от геномного среднего, тогда как подходы, основанные на эволюционной истории (« филогенетические »), идентифицируют гены, эволюционная история которых существенно отличается от истории вида- хозяина . Оценка и сравнительный анализ методов вывода ГПГ обычно основаны на смоделированных геномах, для которых известна истинная история. На реальных данных разные методы, как правило, выводят разные события ГПГ, и в результате может быть сложно установить все, кроме простых и четких событий ГПГ.

Обзор

Концептуальный обзор методов вывода ГПГ. (1) Параметрические методы выводят ГПГ путем вычисления статистики, в данном случае содержания GC, для скользящего окна и сравнения ее с типичным диапазоном по всему геному, в данном случае обозначенным между двумя красными горизонтальными линиями. Регионы с нетипичными значениями выводятся как перенесенные горизонтально. (2) Филогенетические подходы опираются на различия между генами и эволюцией дерева видов, которые являются результатом ГПГ. Явные филогенетические методы реконструируют деревья генов и выводят события ГПГ, которые, вероятно, привели к этому конкретному дереву генов. Неявные филогенетические методы обходят реконструкцию дерева генов, например, путем рассмотрения расхождений между попарными расстояниями между генами и соответствующими им видами.

Горизонтальный перенос генов впервые наблюдался в 1928 году в эксперименте Фредерика Гриффита : показав, что вирулентность может передаваться от вирулентных к невирулентным штаммам Streptococcus pneumoniae , Гриффит продемонстрировал, что генетическая информация может горизонтально передаваться между бактериями посредством механизма, известного как трансформация . [2] Аналогичные наблюдения в 1940-х [3] и 1950-х годах [4] показали доказательства того, что конъюгация и трансдукция являются дополнительными механизмами горизонтального переноса генов. [5]

Для вывода событий ГПГ, которые не обязательно приводят к фенотипическим изменениям, большинство современных методов основаны на анализе данных геномной последовательности. Эти методы можно в целом разделить на две группы: параметрические и филогенетические методы. Параметрические методы ищут разделы генома, которые значительно отличаются от геномного среднего, например, содержание GC или использование кодонов . [6] Филогенетические методы изучают эволюционные истории вовлеченных генов и выявляют конфликтующие филогении. Филогенетические методы можно далее разделить на те, которые явно реконструируют и сравнивают филогенетические деревья , и те, которые используют суррогатные меры вместо филогенетических деревьев. [7]

Главной особенностью параметрических методов является то, что они полагаются только на изучаемый геном, чтобы вывести события ГПГ, которые могли произойти в его родословной. Это было значительным преимуществом в ранние времена эры секвенирования, когда для сравнительных методов было доступно немного близкородственных геномов. Однако, поскольку они полагаются на единообразие сигнатуры хозяина, чтобы вывести события ГПГ, неучет внутригеномной изменчивости хозяина приведет к завышенным прогнозам — пометке собственных сегментов как возможных событий ГПГ. [8] Аналогично, перенесенные сегменты должны демонстрировать сигнатуру донора и существенно отличаться от реципиента. [6] Более того, геномные сегменты чужеродного происхождения подвержены тем же мутационным процессам, что и остальная часть генома хозяина, и поэтому разница между ними имеет тенденцию исчезать со временем, процесс, называемый улучшением. [9] Это ограничивает способность параметрических методов обнаруживать древние ГПГ.

Филогенетические методы извлекают выгоду из недавней доступности многих секвенированных геномов . Действительно, как и для всех сравнительных методов, филогенетические методы могут интегрировать информацию из нескольких геномов и, в частности, интегрировать их с использованием модели эволюции. Это дает им возможность лучше характеризовать события ГПГ, которые они выводят, в частности, путем обозначения вида-донора и времени переноса. Однако модели имеют ограничения и должны использоваться осторожно. Например, конфликтующие филогении могут быть результатом событий, не учтенных моделью, таких как нераспознанная паралогия из-за дупликации , за которой следует потеря генов . Кроме того, многие подходы полагаются на референтное дерево видов, которое, как предполагается, известно, когда во многих случаях бывает трудно получить надежное дерево. Наконец, вычислительные затраты на реконструкцию многих деревьев генов/видов могут быть непомерно дорогими. Филогенетические методы, как правило, применяются к генам или белковым последовательностям как к основным эволюционным единицам, что ограничивает их способность обнаруживать ГПГ в регионах за пределами или через границы генов.

Из-за их взаимодополняющих подходов — и часто неперекрывающихся наборов кандидатов ГПГ — объединение прогнозов параметрических и филогенетических методов может дать более полный набор генов-кандидатов ГПГ . Действительно, было сообщено, что объединение различных параметрических методов значительно улучшает качество прогнозов. [10] [11] Более того, при отсутствии полного набора истинно горизонтально перенесенных генов, расхождения между различными методами [12] [13] могут быть разрешены путем объединения параметрических и филогенетических методов. Однако объединение выводов из нескольких методов также влечет за собой риск увеличения ложноположительного уровня . [14]

Параметрические методы

Параметрические методы для вывода HGT используют характеристики последовательности генома, специфичные для определенных видов или клад , также называемые геномными сигнатурами . Если фрагмент генома сильно отклоняется от геномной сигнатуры, это является признаком потенциального горизонтального переноса. Например, поскольку бактериальное содержание GC попадает в широкий диапазон, содержание GC сегмента генома является простой геномной сигнатурой. Обычно используемые геномные сигнатуры включают нуклеотидный состав, [15] частоты олигонуклеотидов , [16] или структурные особенности генома. [17]

Для обнаружения HGT с использованием параметрических методов геномная сигнатура хозяина должна быть четко распознаваемой. Однако геном хозяина не всегда однороден в отношении сигнатуры генома: например, содержание GC в третьей позиции кодона ниже вблизи конца репликации [ 18 ] , а содержание GC имеет тенденцию быть выше в высокоэкспрессируемых генах . [19] Неучет такой внутригеномной изменчивости у хозяина может привести к завышенным прогнозам, отмечая нативные сегменты как кандидатов HGT. [8] Более крупные скользящие окна могут учитывать эту изменчивость за счет сниженной способности обнаруживать более мелкие области HGT. [12]

Не менее важно, что горизонтально перенесенные сегменты должны демонстрировать геномную сигнатуру донора. Это может быть не так для древних переносов, где перенесенные последовательности подвергаются тем же мутационным процессам, что и остальная часть генома хозяина, что потенциально приводит к тому, что их отличительные сигнатуры «улучшаются» [9] и становятся необнаруживаемыми с помощью параметрических методов. Например, Bdellovibrio bacteriovorus , хищная δ-Proteobacterium , имеет однородное содержание GC, и можно сделать вывод, что ее геном устойчив к HGT. [20] Однако последующий анализ с использованием филогенетических методов выявил ряд древних событий HGT в геноме B. bacteriovorus . [21] Аналогично, если вставленный сегмент был ранее улучшен в геноме хозяина, как в случае вставок профага , [22] параметрические методы могут не предсказать эти события HGT. Кроме того, состав донора должен значительно отличаться от состава реципиента, чтобы быть идентифицированным как ненормальный, состояние, которое может быть пропущено в случае короткого или среднего ГПГ, которые являются наиболее распространенными. Кроме того, сообщалось, что недавно приобретенные гены, как правило, богаче AT, чем средний показатель реципиента, [15] , что указывает на то, что различия в сигнатуре содержания GC могут быть результатом неизвестных мутационных процессов после приобретения, а не генома донора.

Нуклеотидный состав

Среднее содержание GC кодирующих областей по сравнению с размером генома для выбранных бактерий. Существует значительная вариация среднего содержания GC между видами, что делает его релевантным в качестве геномной сигнатуры.

Содержание ГЦ бактерий колеблется в широких пределах: у Ca. Zinderia Insecticola содержание ГЦ составляет 13,5% [23] , а у Anaeromyxobacter dehalogenans — 75%. [24] Даже в пределах близкородственной группы α-Proteobacteria значения варьируются от приблизительно 30% до 65%. [25] Эти различия можно использовать при обнаружении событий горизонтального переноса генов, поскольку значительно отличающееся содержание ГЦ для сегмента генома может быть признаком чужеродного происхождения. [15]

Спектр олигонуклеотидов

Спектр олигонуклеотидов (или частоты k-меров ) измеряет частоту всех возможных последовательностей нуклеотидов определенной длины в геноме. Он имеет тенденцию меньше варьироваться внутри геномов, чем между геномами, и поэтому может также использоваться в качестве геномной сигнатуры. [26] Отклонение от этой сигнатуры предполагает, что геномный сегмент мог попасть в результате горизонтального переноса.

Спектр олигонуклеотидов во многом обязан своей дискриминационной способностью числу возможных олигонуклеотидов: если n — размер словаря, а w — размер олигонуклеотида, то число возможных отдельных олигонуклеотидов равно n w ; например, существует 4 5 =1024 возможных пентануклеотидов. Некоторые методы могут улавливать сигнал, записанный в мотивах переменного размера, [27] таким образом улавливая как редкие, так и дискриминационные мотивы вместе с частыми, но более распространенными.

Смещение использования кодонов , мера, связанная с частотами кодонов , была одним из первых методов обнаружения, используемых в методических оценках ГПГ. [16] Этот подход требует генома хозяина, который содержит смещение в сторону определенных синонимичных кодонов (разные кодоны, которые кодируют одну и ту же аминокислоту), которое явно отличается от смещения, обнаруженного в геноме донора. Простейшим олигонуклеотидом, используемым в качестве геномной сигнатуры, является динуклеотид, например, третий нуклеотид в кодоне и первый нуклеотид в следующем кодоне представляют собой динуклеотид, наименее ограниченный предпочтением аминокислот и использованием кодона. [28]

Важно оптимизировать размер скользящего окна, в котором следует подсчитывать частоту олигонуклеотидов: большее скользящее окно будет лучше буферизировать изменчивость в геноме хозяина за счет худшего обнаружения более мелких областей HGT. [29] Сообщалось о хорошем компромиссе с использованием частот тетрануклеотидов в скользящем окне 5  кб с шагом 0,5 кб. [30]

Удобным методом моделирования геномных сигнатур олигонуклеотидов является использование цепей Маркова . Матрица вероятностей перехода может быть получена для эндогенных и приобретенных генов, [31] из которой могут быть получены байесовские апостериорные вероятности для определенных участков ДНК. [32]

Конструктивные особенности

Так же, как нуклеотидный состав молекулы ДНК может быть представлен последовательностью букв, ее структурные особенности могут быть закодированы в числовой последовательности. Структурные особенности включают энергии взаимодействия между соседними парами оснований, [ 33] угол скручивания, который делает два основания пары некопланарными , [ 34] или деформируемость ДНК, вызванная белками, формирующими хроматин. [35]

Автокорреляционный анализ некоторых из этих числовых последовательностей показывает характерные периодичности в полных геномах. [36] Фактически , после обнаружения археоподобных областей в термофильной бактерии Thermotoga maritima , [37] спектры периодичности этих областей были сравнены со спектрами периодичности гомологичных областей в архее Pyrococcus horikoshii . [17] Выявленные сходства в периодичности были сильными подтверждающими доказательствами в пользу случая массивного горизонтального переноса генов между бактериями и царствами архей . [17]

Геномный контекст

Существование геномных островов , коротких (обычно длиной 10–200 кб) областей генома, которые были приобретены горизонтально, подтверждает возможность идентифицировать неродные гены по их местоположению в геноме. [38] Например, ген неоднозначного происхождения, который является частью неродного оперона, может считаться неродным. В качестве альтернативы, фланкирующие повторяющиеся последовательности или наличие близлежащих интеграз или транспозаз могут указывать на неродной регион. [39] Сообщалось, что подход машинного обучения , сочетающий сканирование частоты олигонуклеотидов с контекстной информацией, эффективен при идентификации геномных островов. [40] В другом исследовании контекст использовался в качестве вторичного индикатора после удаления генов, которые, как полагают, являются нативными или ненативными, с помощью других параметрических методов. [10]

Филогенетические методы

Использование филогенетического анализа для обнаружения ГПГ было продвинуто благодаря доступности многих новых секвенированных геномов. Филогенетические методы обнаруживают несоответствия в генной и видовой эволюционной истории двумя способами: явно, путем реконструкции генного дерева и согласования его с референтным видовым деревом, или неявно, путем изучения аспектов, которые коррелируют с эволюционной историей рассматриваемых генов, например, закономерности присутствия/отсутствия у разных видов или неожиданно короткие или далекие попарные эволюционные расстояния.

Явные филогенетические методы

Целью явных филогенетических методов является сравнение генных деревьев с соответствующими им деревьями видов. В то время как слабо подкрепленные различия между генными и видовыми деревьями могут быть вызваны неопределенностью вывода, статистически значимые различия могут указывать на события ГПГ. Например, если два гена из разных видов разделяют самый последний предковый соединительный узел в генном дереве, но соответствующие виды разнесены в видовом дереве, можно вызвать событие ГПГ. Такой подход может дать более подробные результаты, чем параметрические подходы, поскольку потенциально можно определить вовлеченный вид, время и направление переноса.

Как более подробно обсуждается ниже, филогенетические методы варьируются от простых методов, просто идентифицирующих несоответствия между генными и видовыми деревьями, до механистических моделей, выводящих вероятные последовательности событий ГПГ. Промежуточная стратегия подразумевает деконструкцию генного дерева на более мелкие части, пока каждая из них не будет соответствовать видовому дереву (спектральные подходы генома).

Явные филогенетические методы полагаются на точность входных корневых генных и видовых деревьев, однако их может быть сложно построить. [41] Даже когда нет сомнений во входных деревьях, конфликтующие филогении могут быть результатом эволюционных процессов, отличных от ГПГ, таких как дупликации и потери, заставляя эти методы ошибочно выводить события ГПГ, когда паралогия является правильным объяснением. Аналогично, при наличии неполной сортировки по родословной явные филогенетические методы могут ошибочно выводить события ГПГ. [42] Вот почему некоторые явные методы, основанные на моделях, проверяют несколько эволюционных сценариев, включающих различные виды событий, и сравнивают их соответствие с данными, заданными экономными или вероятностными критериями.

Тесты топологий

Для обнаружения наборов генов, которые плохо соответствуют референтному дереву, можно использовать статистические тесты топологии, такие как тесты Кишино–Хасегавы (KH), [43], Симодайры–Хасегавы (SH), [44] и Approximately Unbiased (AU) [45] . Эти тесты оценивают вероятность выравнивания последовательности генов , когда референтная топология задана как нулевая гипотеза.

Отклонение референтной топологии является указанием на то, что эволюционная история для этого семейства генов не соответствует референтному дереву. Когда эти несоответствия не могут быть объяснены с использованием небольшого числа негоризонтальных событий, таких как потеря гена и дупликация, выводится событие горизонтального переноса генов.

Один из таких анализов проверял наличие ГПГ в группах гомологов линии γ-Proteobacterial . [46] Шесть референтных деревьев были реконструированы с использованием либо высококонсервативных последовательностей малых субъединиц рибосомальной РНК, либо консенсуса доступных деревьев генов, либо конкатенированных выравниваний ортологов . Неспособность отклонить шесть оцененных топологий и отклонение семи альтернативных топологий были интерпретированы как доказательство небольшого числа событий ГПГ в выбранных группах.

Тесты топологии выявляют различия в топологии дерева, принимая во внимание неопределенность в выводе дерева, но они не пытаются сделать вывод о том, как возникли различия. Чтобы вывести специфику конкретных событий, требуются методы спектрального генома или обрезки поддерева и повторной трансплантации .

Спектральные подходы генома

Для определения местоположения событий горизонтального переноса генов спектральные подходы разлагают генное дерево на подструктуры (например, двойные части или квартеты) и выявляют те из них, которые соответствуют или не соответствуют видовому дереву.

Двудольные структуры Удаление одного ребра из справочного дерева создает два несвязанных поддерева, каждое из которых представляет собой непересекающийся набор узлов — двудольную структуру. Если двудольная структура присутствует как в генном, так и в видовом дереве, она совместима; в противном случае она конфликтует. Эти конфликты могут указывать на событие горизонтального переноса генов или могут быть результатом неопределенности в выводе генного дерева. Чтобы уменьшить неопределенность, двудольный анализ обычно фокусируется на сильно поддерживаемых двудольных структурах, таких как те, которые связаны с ветвями со значениями бутстрапа или апостериорными вероятностями выше определенных пороговых значений. Любое семейство генов, в котором обнаружено одно или несколько конфликтующих, но сильно поддерживаемых двудольных структур, рассматривается как кандидат на горизонтальный перенос генов. [47] [48] [49]

Разложение квартета Квартеты — это деревья, состоящие из четырех листьев. В разветвленных (полностью разрешенных) деревьях каждая внутренняя ветвь индуцирует квартет, листья которого являются либо поддеревьями исходного дерева, либо фактическими листьями исходного дерева. Если топология квартета, извлеченного из дерева эталонного вида, встроена в генное дерево, квартет совместим с генным деревом. Наоборот, несовместимые сильно поддерживаемые квартеты указывают на потенциальные события горизонтального переноса генов. [50] Методы картирования квартетов гораздо более эффективны с вычислительной точки зрения и естественным образом обрабатывают гетерогенное представление таксонов среди семейств генов, что делает их хорошей основой для разработки крупномасштабных сканирований для горизонтального переноса генов, ищущих магистрали совместного использования генов в базах данных сотен полных геномов. [51] [52]

Обрезка и пересадка поддеревьев

Механистический способ моделирования события ГПГ на референтном дереве заключается в том, чтобы сначала отрезать внутреннюю ветвь, т. е. обрезать дерево, а затем повторно привить ее на другое ребро, операция, называемая обрезкой и повторной прививкой поддерева (SPR). [53] Если генное дерево топологически согласуется с исходным референтным деревом, редактирование приводит к несоответствию. Аналогично, когда исходное генное дерево не согласуется с референтным деревом, можно получить последовательную топологию с помощью серии из одной или нескольких операций обрезки и повторной прививки, примененных к референтному дереву. Интерпретируя путь редактирования обрезки и повторной прививки, можно пометить узлы-кандидаты ГПГ и вывести геномы хозяина и донора. [49] [48] [54] Чтобы избежать ложноположительных событий ГПГ из-за неопределенной топологии генного дерева, оптимальный «путь» операций SPR можно выбрать среди нескольких возможных комбинаций, учитывая поддержку ветвей в генном дереве. Слабо поддерживаемые ребра генного дерева можно игнорировать априори [55] или поддержку можно использовать для вычисления критерия оптимальности. [49] [56] [57] [58]

Поскольку преобразование одного дерева в другое с помощью минимального количества операций SPR является NP-Hard , [59] решение проблемы становится значительно сложнее по мере рассмотрения большего количества узлов. Вычислительная задача заключается в поиске оптимального пути редактирования, т. е. того, который требует наименьшего количества шагов, [60] [61] и при решении проблемы используются различные стратегии. Например, алгоритм HorizStory уменьшает проблему, сначала устраняя согласованные узлы; [62] рекурсивная обрезка и повторная прививка согласовывают опорное дерево с генным деревом, а оптимальные правки интерпретируются как события HGT. Методы SPR, включенные в пакет реконструкции супердерева SPRSupertrees, существенно сокращают время поиска оптимального набора операций SPR, рассматривая несколько локализованных подзадач в больших деревьях с помощью подхода кластеризации. [63] T -REX (веб-сервер) включает в себя ряд методов обнаружения HGT [56] (в основном основанных на SPR) и позволяет пользователям вычислять поддержку начальной загрузки предполагаемых передач. [49]

Методы согласования на основе моделей

Согласование генных и видовых деревьев подразумевает отображение эволюционных событий на генных деревьях таким образом, чтобы они соответствовали видовому дереву. Существуют различные модели согласования, различающиеся по типам событий, которые они рассматривают для объяснения несоответствий между топологиями генных и видовых деревьев. Ранние методы моделировали исключительно горизонтальные переносы (T). [53] [57] [56] Более поздние также учитывают события дупликации (D), потери (L), неполной сортировки по линиям (ILS) или гомологичной рекомбинации (HR). Сложность заключается в том, что при допущении нескольких типов событий количество возможных согласований быстро увеличивается. Например, конфликтующие топологии генного дерева могут быть объяснены в терминах одного события горизонтального переноса или нескольких событий дупликации и потери. Обе альтернативы можно считать правдоподобным согласованием в зависимости от частоты этих соответствующих событий вдоль видового дерева.

Методы согласования могут полагаться на экономную или вероятностную структуру для вывода наиболее вероятного сценария(ов), где относительная стоимость/вероятность событий D, T, L может быть зафиксирована априори или оценена на основе данных. [64] Пространство согласований DTL и их экономные затраты, которые могут быть чрезвычайно обширны для больших многокопийных генных генных деревьев, могут быть эффективно исследованы с помощью алгоритмов динамического программирования . [64] [65] [66] В некоторых программах топология генного дерева может быть уточнена, если неясно, соответствует ли она лучшему эволюционному сценарию, а также исходному выравниванию последовательностей. [65] [67] [68] Более уточненные модели учитывают смещенную частоту ГПГ между близкородственными линиями, [69] отражая потерю эффективности HR с филогенетическим расстоянием, [70] для ILS , [71] или тот факт, что фактический донор большинства ГПГ принадлежит к вымершим или невыбранным линиям. [72] Дальнейшие расширения моделей DTL разрабатываются в направлении комплексного описания процессов эволюции генома. В частности, некоторые из них рассматривают горизонтальные в нескольких масштабах — моделирование независимой эволюции фрагментов генов [73] или распознавание совместной эволюции нескольких генов (например, из-за совместного переноса) внутри и между геномами. [74] [75] [76]

Неявные филогенетические методы

В отличие от явных филогенетических методов, которые сравнивают соответствие между генными и видовыми деревьями, неявные филогенетические методы сравнивают эволюционные расстояния или сходство последовательностей. Здесь неожиданно короткое или большое расстояние от заданной ссылки по сравнению со средним может указывать на событие горизонтального переноса генов. Поскольку построение дерева не требуется, неявные подходы, как правило, проще и быстрее явных методов.

Однако неявные методы могут быть ограничены несоответствиями между правильной филогенией и рассматриваемыми эволюционными расстояниями. Например, наиболее похожая последовательность, полученная с помощью наиболее высоко оцененного BLAST- хита, не всегда является эволюционно ближайшей. [77]

Верхнее совпадение последовательности у отдаленного вида

Простой способ идентификации событий ГПГ — поиск совпадений последовательностей с высоким показателем в отдаленно родственных видах. Например, анализ лучших результатов BLAST последовательностей белков в бактериях Thermotoga maritima показал, что большинство результатов были в археях, а не в близкородственных бактериях, что предполагает обширный ГПГ между ними; [37] эти прогнозы позже были подтверждены анализом структурных особенностей молекулы ДНК. [17]

Однако этот метод ограничен обнаружением относительно недавних событий ГПГ. Действительно, если ГПГ произошел у общего предка двух или более видов, включенных в базу данных, ближайшее совпадение будет находиться в пределах этой клады, и поэтому ГПГ не будет обнаружен методом. Таким образом, порог минимального числа чужеродных верхних совпадений BLAST для наблюдения, чтобы решить, что ген был перенесен, сильно зависит от таксономического покрытия баз данных последовательностей. Поэтому экспериментальные настройки, возможно, должны быть определены специальным образом. [78]

Несоответствие между генными и видовыми расстояниями

Гипотеза молекулярных часов утверждает, что гомологичные гены эволюционируют с приблизительно постоянной скоростью у разных видов. [79] Если рассматривать только гомологичные гены, связанные через события видообразования (называемые «ортологичными» генами), их базовое дерево по определению должно соответствовать видовому дереву. Поэтому, предполагая молекулярные часы, эволюционное расстояние между ортологичными генами должно быть приблизительно пропорционально эволюционным расстояниям между их соответствующими видами. Если предполагаемая группа ортологов содержит ксенологов (пары генов, связанных через горизонтальный перенос генов), пропорциональность эволюционных расстояний может сохраняться только среди ортологов, но не ксенологов. [80]

Простые подходы сравнивают распределение оценок сходства конкретных последовательностей и их ортологичных аналогов у других видов; ГПГ выводятся из выбросов. [81] [82] Более сложный метод DLIGHT («Вывод горизонтально перенесенных генов на основе расстояния») одновременно учитывает влияние ГПГ на все последовательности в группах предполагаемых ортологов: [7] если тест отношения правдоподобия гипотезы ГПГ по сравнению с гипотезой об отсутствии ГПГ является значимым, выводится предполагаемое событие ГПГ. Кроме того, метод позволяет выводить потенциальные виды доноров и реципиентов и обеспечивает оценку времени с момента события ГПГ.

Филогенетические профили

Группа ортологичных или гомологичных генов может быть проанализирована с точки зрения наличия или отсутствия членов группы в референтных геномах; такие паттерны называются филогенетическими профилями . [83] Чтобы найти события ГПГ, филогенетические профили сканируются на предмет необычного распределения генов. Отсутствие гомолога у некоторых членов группы близкородственных видов является указанием на то, что исследуемый ген мог появиться в результате события ГПГ. Например, три факультативно симбиотических штамма Frankia sp. имеют поразительно разные размеры: 5,43 Мбн, 7,50 Мбн и 9,04 Мбн, в зависимости от диапазона их хозяев. [84] Было обнаружено, что отмеченные части генов, специфичных для штамма, не имеют значительного совпадения в референтной базе данных и, возможно, были приобретены путем переноса ГПГ от других бактерий. Аналогично, три фенотипически различных штамма Escherichia coli ( уропатогенный , энтерогеморрагический и доброкачественный) разделяют около 40% общего объединенного генофонда , а остальные 60% являются штаммоспецифичными генами и, следовательно, кандидатами на горизонтальный перенос генов. [85] Дополнительным доказательством того, что эти гены являются результатом горизонтального переноса генов, стали их поразительно отличающиеся паттерны использования кодонов от основных генов и отсутствие сохранения порядка генов (сохранение порядка типично для вертикально эволюционировавших генов). [85] Таким образом, наличие/отсутствие гомологов (или их эффективное количество) может использоваться программами для реконструкции наиболее вероятного эволюционного сценария вдоль древа видов. Так же, как и в случае с методами согласования, этого можно достичь с помощью экономной [86] или вероятностной оценки числа событий приобретения и потери. [87] [88] Модели можно усложнять, добавляя процессы, такие как усечение генов, [89] , а также моделируя неоднородность скоростей приобретения и потери в разных родословных [90] и/или семействах генов. [88] [91]

Кластеры полиморфных сайтов

Гены обычно рассматриваются как основные единицы, передаваемые посредством события горизонтального переноса генов. Однако горизонтальный перенос генов также может происходить внутри генов. Например, было показано, что горизонтальный перенос между близкородственными видами приводит к большему обмену фрагментами ORF , [92] [93] типу переноса, называемому генной конверсией , опосредованному гомологичной рекомбинацией. Анализ группы из четырех штаммов Escherichia coli и двух штаммов Shigella flexneri показал, что участки последовательности, общие для всех шести штаммов, содержат полиморфные сайты , последствия гомологичной рекомбинации. [94] Таким образом, кластеры избытка полиморфных сайтов могут использоваться для обнаружения следов ДНК, рекомбинированной с дальним родственником. [95] Однако этот метод обнаружения ограничен сайтами, общими для всех анализируемых последовательностей, ограничивая анализ группой близкородственных организмов.

Оценка

Существование многочисленных и разнообразных методов вывода ГПГ поднимает вопрос о том, как проверять отдельные выводы и как сравнивать различные методы.

Основная проблема заключается в том, что, как и в случае с другими типами филогенетических выводов, фактическая эволюционная история не может быть установлена ​​с уверенностью. В результате сложно получить репрезентативный тестовый набор событий ГПГ. Кроме того, методы вывода ГПГ значительно различаются по информации, которую они рассматривают, и часто выявляют несовместимые группы кандидатов ГПГ: [6] [96] неясно, в какой степени пересечение , объединение или какая-либо другая комбинация отдельных методов влияет на ложноположительные и ложноотрицательные показатели. [14]

Параметрические и филогенетические методы опираются на разные источники информации; поэтому трудно делать общие заявления об их относительной производительности. Однако можно ссылаться на концептуальные аргументы. В то время как параметрические методы ограничены анализом одного или пары геномов, филогенетические методы предоставляют естественную основу для использования информации, содержащейся в нескольких геномах. Во многих случаях сегменты геномов, выведенные как ГПГ на основе их аномального состава, также могут быть распознаны как таковые на основе филогенетического анализа или через их простое отсутствие в геномах родственных организмов. Кроме того, филогенетические методы опираются на явные модели эволюции последовательностей, которые предоставляют хорошо понятную основу для вывода параметров, проверки гипотез и выбора модели. Это отражено в литературе, которая имеет тенденцию отдавать предпочтение филогенетическим методам как стандарту доказательства ГПГ. [97] [98] [99] [100] Таким образом, использование филогенетических методов представляется предпочтительным стандартом, особенно с учетом того, что увеличение вычислительной мощности в сочетании с усовершенствованиями алгоритмов сделало их более поддающимися обработке, [63] [72] и что все более плотная выборка геномов придает этим тестам большую мощность.

Рассматривая филогенетические методы, были приняты несколько подходов к проверке отдельных выводов ГПГ и методов сравнительного анализа, обычно полагающихся на различные формы моделирования . Поскольку истина известна в моделировании, количество ложных положительных и ложных отрицательных результатов легко вычислить. Однако моделирование данных не решает проблему тривиально, поскольку истинная степень ГПГ в природе остается в значительной степени неизвестной, а указание скоростей ГПГ в моделируемой модели всегда опасно. Тем не менее, исследования, включающие сравнение нескольких филогенетических методов в рамках моделирования, могут обеспечить количественную оценку их соответствующих характеристик и, таким образом, помочь биологу в выборе объективно правильных инструментов. [58]

Стандартные инструменты для моделирования эволюции последовательностей вдоль деревьев, такие как INDELible [101] или PhyloSim [102], могут быть адаптированы для моделирования ГПГ. События ГПГ приводят к конфликту соответствующих деревьев генов с деревом видов. Такие события ГПГ можно моделировать посредством обрезки поддеревьев и перестройки перестроек дерева видов. [55] Однако важно моделировать данные, которые достаточно реалистичны, чтобы быть репрезентативными для задачи, предоставляемой реальными наборами данных, и поэтому моделирование в рамках сложных моделей является предпочтительным. Была разработана модель для моделирования деревьев генов с гетерогенными процессами замещения в дополнение к возникновению переноса и учета того факта, что перенос может исходить от ныне вымерших донорских линий. [103] В качестве альтернативы симулятор эволюции генома ALF [104] напрямую генерирует семейства генов, подверженные ГПГ, путем учета всего спектра эволюционных сил на базовом уровне, но в контексте полного генома. Учитывая смоделированные последовательности, которые имеют HGT, анализ этих последовательностей с использованием интересующих методов и сравнение их результатов с известной истиной позволяет изучить их производительность. Аналогично, тестирование методов на последовательности, о которой известно, что она не имеет HGT, позволяет изучить ложноположительные показатели.

Моделирование событий ГПГ также может быть выполнено путем манипулирования самими биологическими последовательностями. Искусственные химерные геномы могут быть получены путем вставки известных чужеродных генов в случайные позиции генома хозяина. [12] [105] [106] [107] Донорские последовательности вставляются в хозяина неизменными или могут быть дополнительно развиты путем моделирования, [7] например, с использованием инструментов, описанных выше.

Одно важное предостережение относительно моделирования как способа оценки различных методов заключается в том, что моделирование основано на сильных упрощающих предположениях, которые могут благоприятствовать определенным методам. [108]

Смотрите также

Ссылки

Эта статья была адаптирована из следующего источника по лицензии CC BY 4.0 (2015) (отчеты рецензента): Мэтт Равенхолл; Нивес Шкунца; Флоран Лассаль; Кристоф Дессимо (май 2015 г.). "Inferring horizontal gene transfer". PLOS Computational Biology . 11 (5): e1004095. doi : 10.1371/JOURNAL.PCBI.1004095 . ISSN  1553-734X. PMC 4462595.  PMID 26020646.  Wikidata Q21045419  .

  1. ^ Хирамацу К, Куи Л, Курода М, Ито Т (октябрь 2001 г.). «Возникновение и эволюция метициллин-резистентного золотистого стафилококка ». Тенденции в микробиологии . 9 (10): 486–93. doi :10.1016/s0966-842x(01)02175-8. PMID  11597450.
  2. ^ Гриффит Ф. (январь 1928 г.). «Значение типов пневмококков». Журнал гигиены . 27 (2): 113–59. doi :10.1017/s0022172400031879. PMC 2167760. PMID  20474956 . 
  3. ^ Tatum EL, Lederberg J (июнь 1947 г.). «Рекомбинация генов в бактерии Escherichia coli». Журнал бактериологии . 53 (6): 673–84. doi :10.1128/JB.53.6.673-684.1947. PMC 518375. PMID  16561324 . 
  4. ^ Zinder ND , Lederberg J (ноябрь 1952 г.). «Генетический обмен у сальмонелл». Журнал бактериологии . 64 (5): 679–99. doi : 10.1128/JB.64.5.679-699.1952. PMC 169409. PMID  12999698. 
  5. ^ Jones D, Sneath PH (март 1970). «Генетический перенос и бактериальная таксономия». Bacteriological Reviews . 34 (1): 40–81. doi :10.1128/MMBR.34.1.40-81.1970. PMC 378348. PMID  4909647 . 
  6. ^ abc Lawrence JG, Ochman H (январь 2002). «Примирение многих граней горизонтального переноса генов». Trends in Microbiology . 10 (1): 1–4. doi :10.1016/s0966-842x(01)02282-x. PMID  11755071.
  7. ^ abc Dessimoz C, Margadant D, Gonnet GH (2008). "DLIGHT – обнаружение бокового переноса генов с использованием попарных эволюционных расстояний в статистической структуре". Исследования в области вычислительной молекулярной биологии . Конспект лекций по информатике. Том 4955. С. 315–330. doi :10.1007/978-3-540-78839-3_27. ISBN 978-3-540-78838-6. S2CID  12776750.
  8. ^ ab Guindon S, Perrière G (сентябрь 2001 г.). «Вариация содержания внутригеномных оснований является потенциальным источником смещений при поиске горизонтально перенесенных генов». Молекулярная биология и эволюция . 18 (9): 1838–40. doi : 10.1093/oxfordjournals.molbev.a003972 . PMID  11504864.
  9. ^ ab Lawrence JG, Ochman H (апрель 1997 г.). «Улучшение бактериальных геномов: скорости изменения и обмена». Journal of Molecular Evolution . 44 (4): 383–97. Bibcode :1997JMolE..44..383L. CiteSeerX 10.1.1.590.7214 . doi :10.1007/pl00006158. PMID  9089078. S2CID  7928957. 
  10. ^ ab Azad RK, Lawrence JG (май 2011 г.). «К более надежным методам обнаружения чужеродных генов». Nucleic Acids Research . 39 (9): e56. doi :10.1093/nar/gkr059. PMC 3089488. PMID  21297116 . 
  11. ^ Xiong D, Xiao F, Liu L, Hu K, Tan Y, He S, Gao X (2012). «К лучшему обнаружению горизонтально перенесенных генов путем эффективного комбинирования необычных свойств». PLOS ONE . ​​7 (8): e43126. Bibcode :2012PLoSO...743126X. doi : 10.1371/journal.pone.0043126 . PMC 3419211 . PMID  22905214. 
  12. ^ abc Becq J, Churlaud C, Deschavanne P (апрель 2010 г.). "Тест параметрических методов обнаружения горизонтальных переносов". PLOS ONE . ​​5 (4): e9989. Bibcode :2010PLoSO...5.9989B. doi : 10.1371/journal.pone.0009989 . PMC 2848678 . PMID  20376325. 
  13. ^ Попцова М (2009). «Тестирование филогенетических методов для выявления горизонтального переноса генов». Горизонтальный перенос генов . Методы в молекулярной биологии. Т. 532. С. 227–40. doi :10.1007/978-1-60327-853-9_13. ISBN 978-1-60327-852-2. PMID  19271188.
  14. ^ ab Poptsova MS, Gogarten JP (март 2007 г.). "Сила филогенетических подходов в обнаружении горизонтально перенесенных генов". BMC Evolutionary Biology . 7 (1): 45. Bibcode :2007BMCEE...7...45P. doi : 10.1186/1471-2148-7-45 . PMC 1847511 . PMID  17376230. 
  15. ^ abc Daubin V, Lerat E, Perrière G (2003). «Источник латерально перенесенных генов в бактериальных геномах». Genome Biology . 4 (9): R57. doi : 10.1186/gb-2003-4-9-r57 . PMC 193657. PMID  12952536 . 
  16. ^ ab Lawrence JG, Ochman H (август 1998 г.). «Молекулярная археология генома Escherichia coli». Труды Национальной академии наук Соединенных Штатов Америки . 95 (16): 9413–7. Bibcode : 1998PNAS...95.9413L. doi : 10.1073/pnas.95.16.9413 . PMC 21352. PMID  9689094 . 
  17. ^ abcd Worning P, Jensen LJ, Nelson KE, Brunak S, Ussery DW (февраль 2000 г.). «Структурный анализ последовательности ДНК: доказательства латерального переноса генов у Thermotoga maritima». Nucleic Acids Research . 28 (3): 706–9. doi :10.1093/nar/28.3.706. PMC 102551. PMID  10637321 . 
  18. ^ Deschavanne P, Filipski J (апрель 1995). «Корреляция содержания GC с временем репликации и механизмами репарации в слабо выраженных генах E.coli». Nucleic Acids Research . 23 (8): 1350–3. doi :10.1093/nar/23.8.1350. PMC 306860. PMID  7753625 . 
  19. ^ Wuitschick JD, Karrer KM (1999). «Анализ содержания геномных G + C, использования кодонов, контекста инициирующего кодона и сайтов терминации трансляции в Tetrahymena thermophila». Журнал эукариотической микробиологии . 46 (3): 239–47. doi :10.1111/j.1550-7408.1999.tb05120.x. PMID  10377985. S2CID  28836138.
  20. ^ Рендулик С., Джагтап П., Розинус А., Эппингер М., Баар С., Ланц С. и др. (январь 2004 г.). «Хищник без маски: жизненный цикл Bdellovibrio бактериоворуса с точки зрения генома». Наука . 303 (5658): 689–92. Бибкод : 2004Sci...303..689R. дои : 10.1126/science.1093027. PMID  14752164. S2CID  38154836.
  21. ^ Gophna U, Charlebois RL, Doolittle WF (февраль 2006 г.). «Древний латеральный перенос генов в эволюции Bdellovibrio bacteriovorus». Trends in Microbiology . 14 (2): 64–9. doi :10.1016/j.tim.2005.12.008. PMID  16413191.
  22. ^ Vernikos GS, Thomson NR, Parkhill J (2007). «Генетический поток с течением времени в линии Salmonella». Genome Biology . 8 (6): R100. doi : 10.1186/gb-2007-8-6-r100 . PMC 2394748. PMID  17547764 . 
  23. ^ McCutcheon JP, Moran NA (2010). «Функциональная конвергенция в редуцированных геномах бактериальных симбионтов, охватывающая 200 млн лет эволюции». Genome Biology and Evolution . 2 : 708–18. doi :10.1093/gbe/evq055. PMC 2953269. PMID 20829280  . 
  24. ^ Liu Z, Venkatesh SS, Maley CC (октябрь 2008 г.). «Охват пространства последовательностей, энтропия геномов и потенциал обнаружения нечеловеческой ДНК в образцах человека». BMC Genomics . 9 : 509. doi : 10.1186/1471-2164-9-509 . PMC 2628393 . PMID  18973670. 
  25. ^ Бентли SD, Паркхилл J (2004). «Сравнительная геномная структура прокариот». Annual Review of Genetics . 38 : 771–92. doi : 10.1146/annurev.genet.38.072902.094318. PMID  15568993. S2CID  5524251.
  26. ^ Карлин С., Бердж К. (июль 1995 г.). «Крайние значения относительного содержания динуклеотидов: геномная сигнатура». Тенденции в генетике . 11 (7): 283–90. doi : 10.1016/S0168-9525(00)89076-9 . PMID  7482779.
  27. ^ Vernikos GS, Parkhill J (сентябрь 2006 г.). «Интерполированные мотивы переменного порядка для идентификации горизонтально приобретенной ДНК: пересмотр островов патогенности сальмонелл». Биоинформатика . 22 (18): 2196–203. doi : 10.1093/bioinformatics/btl369 . PMID  16837528.
  28. ^ Хупер SD, Берг OG (март 2002 г.). «Обнаружение генов с атипичной нуклеотидной последовательностью в микробных геномах». Журнал молекулярной эволюции . 54 (3): 365–75. Bibcode : 2002JMolE..54..365H. doi : 10.1007/s00239-001-0051-8. PMID  11847562. S2CID  6872232.
  29. ^ Deschavanne PJ, Giron A, Vilain J, Fagot G, Fertil B (октябрь 1999 г.). «Геномная сигнатура: характеристика и классификация видов, оцененная с помощью представления последовательностей в виде игры хаоса». Молекулярная биология и эволюция . 16 (10): 1391–9. doi : 10.1093/oxfordjournals.molbev.a026048 . PMID  10563018.
  30. ^ Dufraigne C, Fertil B, Lespinats S, Giron A, Deschavanne P (январь 2005 г.). «Обнаружение и характеристика горизонтальных переносов у прокариот с использованием геномной сигнатуры». Nucleic Acids Research . 33 (1): e6. doi :10.1093/nar/gni004. PMC 546175. PMID 15653627  . 
  31. ^ Cortez D, Forterre P, Gribaldo S (2009). «Скрытый резервуар интегративных элементов является основным источником недавно приобретенных чужеродных генов и ORF в архейных и бактериальных геномах». Genome Biology . 10 (6): R65. doi : 10.1186 /gb-2009-10-6-r65 . PMC 2718499. PMID  19531232. 
  32. ^ Nakamura Y, Itoh T, Matsuda H, Gojobori T (июль 2004 г.). «Искаженные биологические функции горизонтально перенесенных генов в прокариотических геномах». Nature Genetics . 36 (7): 760–6. doi : 10.1038/ng1381 . PMID  15208628.
  33. ^ Орнштейн Р. Л., Рейн Р. (октябрь 1978 г.). «Оптимизированная потенциальная функция для расчета энергий взаимодействия нуклеиновых кислот I. укладка оснований». Биополимеры . 17 (10): 2341–60. doi :10.1002/bip.1978.360171005. PMID  24624489. S2CID  13063636.
  34. ^ el Hassan MA, Calladine CR (май 1996). «Пропеллерное скручивание пар оснований и конформационная подвижность динуклеотидных шагов в ДНК». Журнал молекулярной биологии . 259 (1): 95–103. doi :10.1006/jmbi.1996.0304. PMID  8648652.
  35. ^ Olson WK, Gorin AA, Lu XJ, Hock LM, Zhurkin VB (сентябрь 1998 г.). «Деформируемость, зависящая от последовательности ДНК, выведенная из комплексов кристаллов белок-ДНК». Труды Национальной академии наук Соединенных Штатов Америки . 95 (19): 11163–8. Bibcode : 1998PNAS...9511163O. doi : 10.1073 /pnas.95.19.11163 . PMC 21613. PMID  9736707. 
  36. ^ Herzel H, Weiss O, Trifonov EN (март 1999). «Периодичность 10-11 п.н. в полных геномах отражает структуру белка и укладку ДНК». Биоинформатика . 15 (3): 187–93. doi : 10.1093/bioinformatics/15.3.187 . PMID  10222405.
  37. ^ ab Nelson KE, Clayton RA, Gill SR, Gwinn ML, Dodson RJ, Haft DH и др. (май 1999 г.). «Доказательства латерального переноса генов между археями и бактериями из последовательности генома Thermotoga maritima». Nature . 399 (6734): 323–9. Bibcode :1999Natur.399..323N. doi :10.1038/20601. PMID  10360571. S2CID  4420157.
  38. ^ Langille MG, Hsiao WW, Brinkman FS (май 2010 г.). «Обнаружение геномных островов с использованием биоинформатических подходов». Nature Reviews. Microbiology . 8 (5): 373–82. doi :10.1038/nrmicro2350. PMID  20395967. S2CID  2373228.
  39. ^ Хакер Дж., Блюм-Олер Г., Мюльдорфер И., Цхэпе Х. (март 1997 г.). «Острова патогенности вирулентных бактерий: структура, функция и влияние на эволюцию микробов». Молекулярная микробиология . 23 (6): 1089–97. doi : 10.1046/j.1365-2958.1997.3101672.x . PMID  9106201. S2CID  27524815.
  40. ^ Vernikos GS, Parkhill J (февраль 2008 г.). «Разрешение структурных особенностей геномных островов: подход машинного обучения». Genome Research . 18 (2): 331–42. doi :10.1101/gr.7004508. PMC 2203631 . PMID  18071028. 
  41. ^ Altenhoff AM, Dessimoz C (2012). "Вывод ортологии и паралогии" (PDF) . Эволюционная геномика . Методы в молекулярной биологии. Т. 855. Тотова, Нью-Джерси: Humana Press. С. 259–79. doi :10.1007/978-1-61779-582-4_9. ISBN 978-1-61779-581-7. PMID  22407712.
  42. ^ Than C, Ruths D, Innan H, Nakhleh L (май 2007 г.). «Смешивающие факторы при обнаружении HGT: статистическая ошибка, эффекты коалесценции и множественные решения». Журнал вычислительной биологии . 14 (4): 517–35. CiteSeerX 10.1.1.121.7834 . doi :10.1089/cmb.2007.A010. PMID  17572027. 
  43. ^ Goldman N, Anderson JP, Rodrigo AG (декабрь 2000 г.). «Проверки топологий в филогенетике на основе правдоподобия». Systematic Biology . 49 (4): 652–70. doi : 10.1080/106351500750049752 . PMID  12116432.
  44. ^ Shimodaira H, Hasegawa M (1999). «Множественные сравнения логарифмических правдоподобий с применением к филогенетическому выводу». Молекулярная биология и эволюция . 16 (8): 1114–1116. doi : 10.1093/oxfordjournals.molbev.a026201 .
  45. ^ Shimodaira H (июнь 2002 г.). «Приблизительно беспристрастный тест выбора филогенетического дерева». Systematic Biology . 51 (3): 492–508. doi :10.1080/10635150290069913. PMID  12079646. S2CID  11586099.
  46. ^ Lerat E, Daubin V, Moran NA (октябрь 2003 г.). «От генных деревьев к организменной филогении у прокариот: случай гамма-протеобактерий». PLOS Biology . 1 (1): E19. doi : 10.1371/journal.pbio.0000019 . PMC 193605. PMID 12975657  . 
  47. ^ Жаксыбаева О, Хамель Л, Рэймонд Дж, Гогартен ДжП (2004). «Визуализация филогенетического содержания пяти геномов с использованием декапентагональных карт». Genome Biology . 5 (3): R20. doi : 10.1186 /gb-2004-5-3-r20 . PMC 395770. PMID  15003123. 
  48. ^ ab Beiko RG, Harlow TJ, Ragan MA (октябрь 2005 г.). «Дороги обмена генами у прокариот». Труды Национальной академии наук Соединенных Штатов Америки . 102 (40): 14332–7. Bibcode : 2005PNAS..10214332B. doi : 10.1073/pnas.0504068102 . PMC 1242295. PMID  16176988 . 
  49. ^ abcd Boc A, Philippe H, Makarenkov V (март 2010 г.). «Вывод и проверка событий горизонтального переноса генов с использованием двудольного различия». Systematic Biology . 59 (2). Oxford University Press: 195–211. doi : 10.1093/sysbio/syp103 . PMID  20525630.
  50. ^ Жаксыбаева О, Гогартен Дж. П., Шарлебуа Р. Л., Дулиттл В. Ф., Папке РТ (сентябрь 2006 г.). «Филогенетический анализ геномов цианобактерий: количественная оценка событий горизонтального переноса генов». Genome Research . 16 (9): 1099–108. doi :10.1101/gr.5322306. PMC 1557764 . PMID  16899658. 
  51. ^ Bansal MS, Banay G, Gogarten JP, Shamir R (сентябрь 2011 г.). «Обнаружение магистралей горизонтального переноса генов». Журнал вычислительной биологии . 18 (9): 1087–114. CiteSeerX 10.1.1.418.3658 . doi :10.1089/cmb.2011.0066. PMID  21899418. 
  52. ^ Bansal MS, Banay G, Harlow TJ, Gogarten JP, Shamir R (март 2013 г.). «Систематический вывод о магистралях горизонтального переноса генов у прокариот». Биоинформатика . 29 (5): 571–9. doi : 10.1093/bioinformatics/btt021 . PMID  23335015.
  53. ^ ab Hallett MT, Lagergren J. RECOMB 2001. Монреаль: ACM; 2001. Эффективные алгоритмы для задач горизонтального переноса генов; стр. 149–156.
  54. ^ Baroni M, Grünewald S, Moulton V, Semple C (август 2005 г.). «Ограничение числа событий гибридизации для последовательной эволюционной истории». Журнал математической биологии . 51 (2): 171–82. doi :10.1007/s00285-005-0315-9. hdl : 10092/12222 . PMID  15868201. S2CID  3180904.
  55. ^ ab Beiko RG, Hamilton N (февраль 2006 г.). "Филогенетическая идентификация событий латерального генетического переноса". BMC Evolutionary Biology . 6 (1): 15. Bibcode : 2006BMCEE...6...15B. doi : 10.1186/1471-2148-6-15 . PMC 1431587. PMID  16472400 . 
  56. ^ abc Boc A, Diallo AB, Makarenkov V (июль 2012 г.). "T-REX: веб-сервер для вывода, проверки и визуализации филогенетических деревьев и сетей". Nucleic Acids Research . 40 (W1). Oxford University Press: W573-9. doi :10.1093/nar/gks485. PMC 3394261. PMID  22675075 . 
  57. ^ ab Nakhleh L, Ruths DA, Wang L: RIATA-HGT: быстрая и точная эвристика для реконструкции горизонтального переноса генов. COCOON, 16–29 августа 2005 г.; Куньмин 2005 г.
  58. ^ ab Abby SS, Tannier E, Gouy M, Daubin V (июнь 2010 г.). «Обнаружение латеральных переносов генов путем статистического согласования филогенетических лесов». BMC Bioinformatics . 11 : 324. doi : 10.1186/1471-2105-11-324 . PMC 2905365. PMID  20550700 . 
  59. ^ Хики Г., Дене Ф., Рау-Чаплин А., Блуин К. (февраль 2008 г.). «Вычисление расстояния SPR для некорневых деревьев». Evolutionary Bioinformatics Online . 4 : 17–27. doi :10.4137/ebo.s419. PMC 2614206. PMID  19204804 . 
  60. ^ Hein J, Jiang T, Wang L, Zhang K (1996). «О сложности сравнения эволюционных деревьев». Discrete Applied Mathematics . 71 (1–3): 153–169. doi : 10.1016/S0166-218X(96)00062-5 .
  61. ^ Allen BL, Steel M (2001). «Операции переноса поддеревьев и их индуцированные метрики на эволюционных деревьях». Annals of Combinatorics . 5 : 1–15. CiteSeerX 10.1.1.24.8389 . doi :10.1007/s00026-001-8006-8. S2CID  2934442. 
  62. ^ MacLeod D, Charlebois RL, Doolittle F, Bapteste E (апрель 2005 г.). «Вывод вероятных событий латерального переноса генов посредством сравнения филогенетических деревьев путем рекурсивной консолидации и перестройки». BMC Evolutionary Biology . 5 : 27. doi : 10.1186/1471-2148-5-27 . PMC 1087482. PMID  15819979 . 
  63. ^ ab Whidden C, Zeh N, Beiko RG (июль 2014 г.). «Супердеревья на основе расстояния обрезки и пересадки поддеревьев». Systematic Biology . 63 (4): 566–81. doi :10.1093/sysbio/syu023. PMC 4055872 . PMID  24695589. 
  64. ^ ab Doyon JP, Hamel S, Chauve C (2012). «Эффективный метод исследования пространства согласований генного дерева/видового дерева в вероятностной структуре» (PDF) . IEEE/ACM Transactions on Computational Biology and Bioinformatics . 9 (1): 26–39. doi :10.1109/TCBB.2011.64. PMID  21464510. S2CID  2493991.
  65. ^ ab David LA, Alm EJ (январь 2011 г.). «Быстрые эволюционные инновации во время генетической экспансии архея» (PDF) . Nature . 469 (7328): 93–6. Bibcode :2011Natur.469...93D. doi :10.1038/nature09649. hdl : 1721.1/61263 . PMID  21170026. S2CID  4420725.
  66. ^ Szöllosi GJ, Boussau B, Abby SS, Tannier E, Daubin V (октябрь 2012 г.). «Филогенетическое моделирование горизонтального переноса генов реконструирует схему и относительное время видообразования». Труды Национальной академии наук Соединенных Штатов Америки . 109 (43): 17513–8. Bibcode : 2012PNAS..10917513S. doi : 10.1073/pnas.1202997109 . PMC 3491530. PMID  23043116 . 
  67. ^ Nguyen TH, Ranwez V, Pointet S, Chifolleau AM, Doyon JP, Berry V (апрель 2013 г.). «Согласование и локальная перестройка генного дерева могут быть взаимовыгодными». Алгоритмы для молекулярной биологии . 8 (1): 12. doi : 10.1186/1748-7188-8-12 . PMC 3871789. PMID  23566548 . 
  68. ^ Szöllosi GJ, Tannier E, Lartillot N, Daubin V (май 2013 г.). «Латеральный перенос генов от мертвых». Systematic Biology . 62 (3): 386–97. arXiv : 1211.4606 . doi :10.1093/sysbio/syt003. PMC 3622898 . PMID  23355531. 
  69. ^ Bansal MS, Alm EJ, Kellis M (июнь 2012 г.). "Эффективные алгоритмы для проблемы согласования с дупликацией генов, горизонтальным переносом и потерей". Биоинформатика . 28 (12): i283-91. doi :10.1093/bioinformatics/bts225. PMC 3371857. PMID  22689773 . 
  70. ^ Majewski J, Zawadzki P, Pickerill P, Cohan FM, Dowson CG (февраль 2000 г.). «Барьеры генетического обмена между бактериальными видами: трансформация Streptococcus pneumoniae». Журнал бактериологии . 182 (4): 1016–23. doi :10.1128/jb.182.4.1016-1023.2000. PMC 94378. PMID  10648528 . 
  71. ^ Sjöstrand J, Tofigh A, Daubin V, Arvestad L, Sennblad B, Lagergren J (май 2014 г.). «Байесовский метод анализа горизонтального переноса генов». Systematic Biology . 63 (3): 409–20. doi : 10.1093/sysbio/syu007 . PMID  24562812.
  72. ^ ab Szöllõsi GJ, Rosikiewicz W, Boussau B, Tannier E, Daubin V (ноябрь 2013 г.). «Эффективное исследование пространства согласованных генных деревьев». Systematic Biology . 62 (6): 901–12. arXiv : 1306.2167 . Bibcode :2013arXiv1306.2167S. doi :10.1093/sysbio/syt054. PMC 3797637 . PMID  23925510. 
  73. ^ Haggerty LS, Jachiet PA, Hanage WP, Fitzpatrick DA, Lopez P, O'Connell MJ и др. (март 2014 г.). «Плюралистическое описание гомологии: адаптация моделей к данным». Молекулярная биология и эволюция . 31 (3): 501–16. doi :10.1093/molbev/mst228. PMC 3935183. PMID  24273322 . 
  74. ^ Szöllősi GJ, Tannier E, Daubin V, Boussau B (январь 2015 г.). "Вывод генных деревьев с помощью видовых деревьев". Systematic Biology . 64 (1): e42-62. doi :10.1093/sysbio/syu048. PMC 4265139. PMID  25070970 . 
  75. ^ Lassalle F, Planel R, Penel S, Chapulliot D, Barbe V, Dubost A и др. (декабрь 2017 г.). «Оценка предкового генома раскрывает историю экологической диверсификации в Agrobacterium». Genome Biology and Evolution . 9 (12): 3413–3431. doi :10.1093/gbe/evx255. PMC 5739047. PMID  29220487 . 
  76. ^ Duchemin W, Anselmetti Y, Patterson M, Ponty Y, Bérard S, Chauve C и др. (май 2017 г.). «DeCoSTAR: Реконструкция предковой организации генов или геномов с использованием согласованных филогений». Genome Biology and Evolution . 9 (5): 1312–1319. doi :10.1093/gbe/evx069. PMC 5441342. PMID 28402423  . 
  77. ^ Koski LB, Golding GB (июнь 2001 г.). «Ближайший удар BLAST часто не является ближайшим соседом». Journal of Molecular Evolution . 52 (6): 540–2. Bibcode :2001JMolE..52..540K. doi :10.1007/s002390010184. PMID  11443357. S2CID  24848333.
  78. ^ Wisniewski-Dyé F, Borziak K, Khalsa-Moyers G, Alexandre G, Sukharnikov LO, Wuichet K и др. (декабрь 2011 г.). Richardson PM (ред.). "Azospirillum genomes reveal transition of bacteria from aquatic to terrestrial environments". PLOS Genetics . 7 (12): e1002430. doi : 10.1371/journal.pgen.1002430 . PMC 3245306 . PMID  22216014. 
  79. ^ Цукеркандл, Э. и Полинг, Л. Б. 1965. Эволюционная дивергенция и конвергенция в белках. В Bryson, V. и Vogel, HJ (редакторы). Эволюция генов и белков. Academic Press, Нью-Йорк. С. 97–166.
  80. ^ Новичков ПС, Омельченко МВ, Гельфанд МС, Миронов АА, Вольф ЮИ, Кунин ЕВ (октябрь 2004 г.). "Genome-wide molecular clock and horizontal gene transfer in bacteria evolution". Journal of Bacteriology . 186 (19): 6575–85. doi :10.1128/JB.186.19.6575-6585.2004. PMC 516599 . PMID  15375139. 
  81. ^ Lawrence JG, Hartl DL (июль 1992 г.). «Вывод горизонтального генетического переноса из молекулярных данных: подход с использованием бутстрапа». Genetics . 131 (3): 753–60. doi :10.1093/genetics/131.3.753. PMC 1205046 . PMID  1628816. 
  82. ^ Clarke GD, Beiko RG, Ragan MA, Charlebois RL (апрель 2002 г.). «Вывод геномных деревьев с использованием фильтра для устранения филогенетически несогласованных последовательностей и матрицы расстояний на основе средних нормализованных оценок BLASTP». Журнал бактериологии . 184 (8): 2072–80. doi :10.1128/jb.184.8.2072-2080.2002. PMC 134965. PMID  11914337 . 
  83. ^ Pellegrini M, Marcotte EM, Thompson MJ, Eisenberg D, Yeates TO (апрель 1999). «Определение функций белков с помощью сравнительного геномного анализа: филогенетические профили белков». Труды Национальной академии наук Соединенных Штатов Америки . 96 (8): 4285–8. Bibcode :1999PNAS...96.4285P. doi : 10.1073/pnas.96.8.4285 . PMC 16324 . PMID  10200254. 
  84. ^ Normand P, Lapierre P, Tisa LS, Gogarten JP, Alloisio N, Bagnarol E и др. (январь 2007 г.). «Характеристики генома факультативно симбиотических штаммов Frankia sp. отражают диапазон хозяев и биогеографию растений-хозяев». Genome Research . 17 (1): 7–15. doi :10.1101/gr.5798407. PMC 1716269 . PMID  17151343. 
  85. ^ ab Welch RA, Burland V, Plunkett G, Redford P, Roesch P, Rasko D, et al. (декабрь 2002 г.). «Обширная мозаичная структура, выявленная с помощью полной последовательности генома уропатогенной Escherichia coli». Труды Национальной академии наук Соединенных Штатов Америки . 99 (26): 17020–4. Bibcode :2002PNAS...9917020W. doi : 10.1073/pnas.252529799 . PMC 139262 . PMID  12471157. 
  86. ^ Csűrös MS (2008). "Реконструкция предков с помощью асимметричной экономии Вагнера по непрерывным признакам и квадратичной экономии по распределениям". Сравнительная геномика . Конспект лекций по информатике. Том 5267. С. 72–86. doi :10.1007/978-3-540-87989-3_6. ISBN 978-3-540-87988-6. S2CID  10717969.
  87. ^ Pagel M (октябрь 1999). «Вывод исторических закономерностей биологической эволюции». Nature . 401 (6756): 877–84. Bibcode :1999Natur.401..877P. doi :10.1038/44766. hdl : 2027.42/148253 . PMID  10553904. S2CID  205034365.
  88. ^ ab Csurös M, Miklós I (сентябрь 2009 г.). «Упрощение и крупные предковые геномы у архей, выведенные с помощью филогенетической модели рождения и смерти». Молекулярная биология и эволюция . 26 (9): 2087–95. doi :10.1093/molbev/msp123. PMC 2726834. PMID  19570746 . 
  89. ^ Hao W, Golding GB (сентябрь 2010 г.). «Вывод потока бактериального генома с учетом усеченных генов». Genetics . 186 (1): 411–26. doi :10.1534/genetics.110.118448. PMC 2940306 . PMID  20551435. 
  90. ^ Hao W, Golding GB (май 2006). «Судьба латерально перенесенных генов: жизнь на скоростной трассе к адаптации или смерти». Genome Research . 16 (5): 636–43. doi :10.1101/gr.4746406. PMC 1457040. PMID  16651664 . 
  91. ^ Хао В., Голдинг ГБ (май 2008 г.). «Раскрытие вариации скорости горизонтального переноса генов в ходе эволюции бактериального генома». BMC Genomics . 9 : 235. doi : 10.1186/1471-2164-9-235 . PMC 2426709. PMID  18492275. 
  92. ^ Ochman H, Lawrence JG, Groisman EA (май 2000). «Латеральный перенос генов и природа бактериальных инноваций». Nature . 405 (6784): 299–304. Bibcode :2000Natur.405..299O. doi :10.1038/35012500. PMID  10830951. S2CID  85739173.
  93. ^ Papke RT, Koenig JE, Rodríguez-Valera F, Doolittle WF (декабрь 2004 г.). «Частая рекомбинация в популяции Halorubrum в солончаках». Science . 306 (5703): 1928–9. Bibcode :2004Sci...306.1928P. doi :10.1126/science.1103289. PMID  15591201. S2CID  21595153.
  94. ^ Mau B, Glasner JD, Darling AE, Perna NT (2006). "Обнаружение и анализ гомологичной рекомбинации в масштабе генома среди секвенированных штаммов Escherichia coli". Genome Biology . 7 (5): R44. doi : 10.1186/gb-2006-7-5-r44 . PMC 1779527. PMID  16737554 . 
  95. ^ Дидело X, Фалуш Д (март 2007 г.). «Вывод о бактериальной микроэволюции с использованием данных о мультилокусных последовательностях». Генетика . 175 (3): 1251–66. doi :10.1534/genetics.106.063305. PMC 1840087. PMID  17151252 . 
  96. ^ Раган МА (июль 2001 г.). «О суррогатных методах обнаружения латерального переноса генов». FEMS Microbiology Letters . 201 (2): 187–91. doi : 10.1111/j.1574-6968.2001.tb10755.x . PMID  11470360.
  97. ^ Раган МА, Харлоу ТДж, Бейко РГ (январь 2006 г.). «Выявляют ли различные суррогатные методы события латерального генетического переноса разного относительного возраста?». Тенденции в микробиологии . 14 (1): 4–8. doi :10.1016/j.tim.2005.11.004. PMID  16356716.
  98. ^ Kechris KJ, Lin JC, Bickel PJ, Glazer AN (июнь 2006 г.). «Количественное исследование возникновения латерального переноса генов с использованием генов фиксации азота в качестве примера». Труды Национальной академии наук Соединенных Штатов Америки . 103 (25): 9584–9. Bibcode : 2006PNAS..103.9584K. doi : 10.1073/pnas.0603534103 . PMC 1480450. PMID  16769896 . 
  99. ^ Moran NA, Jarvik T (апрель 2010 г.). «Латеральный перенос генов от грибов лежит в основе производства каротиноидов у тлей». Science . 328 (5978): 624–7. Bibcode :2010Sci...328..624M. doi :10.1126/science.1187113. PMID  20431015. S2CID  14785276.
  100. ^ Danchin EG, Rosso MN, Vieira P, de Almeida-Engler J, Coutinho PM, Henrissat B, Abad P (октябрь 2010 г.). «Множественные латеральные переносы генов и дупликации способствовали способности нематод паразитировать на растениях». Труды Национальной академии наук Соединенных Штатов Америки . 107 (41): 17651–6. Bibcode : 2010PNAS..10717651D. doi : 10.1073/pnas.1008486107 . PMC 2955110. PMID  20876108 . 
  101. ^ Fletcher W, Yang Z (август 2009 г.). «INDELible: гибкий симулятор эволюции биологической последовательности». Молекулярная биология и эволюция . 26 (8): 1879–88. doi :10.1093/molbev/msp098. PMC 2712615. PMID  19423664 . 
  102. ^ Sipos B, Massingham T, Jordan GE, Goldman N (апрель 2011 г.). "PhyloSim - Моделирование эволюции последовательностей методом Монте-Карло в среде статистических вычислений R". BMC Bioinformatics . 12 : 104. doi : 10.1186/1471-2105-12-104 . PMC 3102636. PMID  21504561 . 
  103. ^ Galtier N (август 2007). «Модель горизонтального переноса генов и проблема бактериальной филогении». Systematic Biology . 56 (4): 633–42. doi : 10.1080/10635150701546231 . PMID  17661231.
  104. ^ Dalquen DA, Anisimova M, Gonnet GH, Dessimoz C (апрель 2012 г.). "ALF — структура моделирования для эволюции генома". Молекулярная биология и эволюция . 29 (4): 1115–23. doi :10.1093/molbev/msr268. PMC 3341827. PMID  22160766 . 
  105. ^ Cortez DQ, Lazcano A, Becerra A (2005). «Сравнительный анализ методологий обнаружения горизонтально перенесенных генов: переоценка моделей Маркова первого порядка». In Silico Biology . 5 (5–6): 581–92. PMID  16610135.
  106. ^ Tsirigos A, Rigoutsos I (2005). «Новый вычислительный метод обнаружения событий горизонтального переноса генов». Nucleic Acids Research . 33 (3): 922–33. doi :10.1093/nar/gki187. PMC 549390. PMID  15716310 . 
  107. ^ Azad RK, Lawrence JG (ноябрь 2005 г.). «Использование искусственных геномов при оценке методов обнаружения атипичных генов». PLOS Computational Biology . 1 (6): e56. Bibcode : 2005PLSCB...1...56A. doi : 10.1371/journal.pcbi.0010056 . PMC 1282332. PMID  16292353 . 
  108. ^ Iantorno S, Gori K, Goldman N, Gil M, Dessimoz C (2014). «Кто наблюдает за стражами? Оценка эталонов для множественного выравнивания последовательностей». Методы множественного выравнивания последовательностей . Методы в молекулярной биологии. Т. 1079. С. 59–73. arXiv : 1211.2160 . doi :10.1007/978-1-62703-646-7_4. ISBN 978-1-62703-645-0. PMID  24170395. S2CID  2363657.