Филогенетическое дерево

Филогенетическое дерево , филогения или эволюционное дерево — это графическое представление, которое показывает историю эволюции между набором видов или таксонов в течение определенного времени. ^[3]^[4] Другими словами, это диаграмма ветвления или дерево , показывающее эволюционные отношения между различными биологическими видами или другими объектами, основанные на сходствах и различиях в их физических или генетических характеристиках. В эволюционной биологии вся жизнь на Земле теоретически является частью единого филогенетического дерева, что указывает на общее происхождение . Филогенетика - это изучение филогенетических деревьев. Основная задача — найти филогенетическое дерево, отражающее оптимальное эволюционное происхождение между набором видов или таксонов. Вычислительная филогенетика (также филогенетический вывод) фокусируется на алгоритмах, участвующих в поиске оптимального филогенетического дерева в филогенетическом ландшафте. ^[3]^[4]

Филогенетические деревья могут быть укорененными и неукорененными. В корневом филогенетическом дереве каждый узел с потомками представляет предполагаемого самого последнего общего предка этих потомков ^[5] , а длины ребер в некоторых деревьях можно интерпретировать как оценки времени. Каждый узел называется таксономической единицей. Внутренние узлы обычно называют гипотетическими таксономическими единицами, поскольку их невозможно наблюдать напрямую. Деревья полезны в таких областях биологии, как биоинформатика , систематика и филогенетика . Некорневые деревья иллюстрируют только родство листовых узлов и не требуют знания или предположения о родовом корне.

История

Идея древа жизни возникла из древних представлений о лестничном переходе от низших форм жизни к высшим (например, в Великой Цепи Бытия ). Ранние изображения «ветвящихся» филогенетических деревьев включают «палеонтологическую карту», показывающую геологические взаимоотношения между растениями и животными в книге Эдварда Хичкока « Элементарная геология» (первое издание: 1840 г.).

Чарльз Дарвин представил схематическое эволюционное «дерево» в своей книге 1859 года «Происхождение видов» . Спустя столетие биологи-эволюционисты все еще используют древовидные диаграммы для изображения эволюции , поскольку такие диаграммы эффективно передают концепцию, согласно которой видообразование происходит посредством адаптивного и полуслучайного разделения линий.

Термин филогенетический , или филогения , происходит от двух древнегреческих слов φῦλον ( phûlon ), означающих «раса, родословная», и γένεσις ( genesis ), означающих «происхождение, источник». ^[6]^[7]

Характеристики

Укорененное дерево

Корневое филогенетическое дерево (см. два рисунка вверху) — это направленное дерево с уникальным узлом — корнем — соответствующим (обычно вменяемому ) самому последнему общему предку всех объектов на листьях дерева. Корневой узел не имеет родительского узла, но является родительским для всех остальных узлов дерева. Таким образом, корень является узлом степени 2, в то время как другие внутренние узлы имеют минимальную степень 3 (где «степень» здесь относится к общему количеству входящих и исходящих ребер).

Наиболее распространенным методом укоренения деревьев является использование непротиворечивой внешней группы — достаточно близкой, чтобы можно было сделать выводы на основе данных о признаках или молекулярного секвенирования, но достаточно далекой, чтобы быть явной внешней группой. Другой метод — укоренение средней точки, или дерево также можно укоренить с помощью модели нестационарной подстановки . ^[8]

Неукорененное дерево

Неукорененное филогенетическое древо миозина , суперсемейства белков [ ^9]

Некорневые деревья иллюстрируют родство листовых узлов, не делая предположений о происхождении. Они не требуют знания или предположения о родовом корне. ^[10] Некорневые деревья всегда можно создать из корневых, просто опустив корень. Напротив, определение корня неукорененного дерева требует некоторых средств идентификации происхождения. Обычно это делается путем включения внешней группы во входные данные, чтобы корень обязательно находился между внешней группой и остальными таксонами в дереве, или путем введения дополнительных предположений об относительных скоростях эволюции в каждой ветви, например приложения гипотезы молекулярных часов . ^[11]

Раздвоение против раздвоения

Как корневые, так и некорневые деревья могут быть как раздвоенными , так и многоветвистыми. Корневое разветвляющееся дерево имеет ровно два потомка, возникающих из каждого внутреннего узла (то есть оно образует бинарное дерево ), а некорневое разветвляющееся дерево принимает форму некорневого бифуркационного дерева , свободного дерева , имеющего ровно три соседа в каждом внутреннем узле. Напротив, корневое разветвленное дерево может иметь более двух дочерних элементов в некоторых узлах, а некорневое разветвленное дерево может иметь более трех соседей в некоторых узлах.

Маркированные и немаркированные

Деревья с корнями и без корней могут быть как помеченными, так и не помеченными. Помеченное дерево имеет определенные значения, присвоенные его листьям, тогда как немаркированное дерево, иногда называемое формой дерева, определяет только топологию. Некоторые деревья на основе последовательностей, построенные на основе небольшого геномного локуса, такие как Phylotree ^[12] , содержат внутренние узлы, помеченные предполагаемыми предковыми гаплотипами.

Перечисление деревьев

Число возможных деревьев для заданного количества листовых узлов зависит от конкретного типа дерева, но всегда больше помеченных деревьев, чем немаркированных, разветвленных деревьев больше, чем раздвоенных, и больше корневых деревьев, чем некорневых. Последнее различие наиболее значимо с биологической точки зрения; оно возникает потому, что на неукорененном дереве много мест, куда можно пустить корень. Для раздвоенных помеченных деревьев общее количество корневых деревьев равно:

(2n-3)!!={\frac {(2n-3)!}{2^{n-2}(n-2)!}}

для представляет количество конечных узлов. ^[13]

n\geq 2

n

Для разветвляющихся помеченных деревьев общее количество некорневых деревьев составляет: ^[13]

(2n-5)!!={\frac {(2n-5)!}{2^{n-3}(n-3)!}}

для .

n\geq 3

Среди помеченных разветвляющихся деревьев количество некорневых деревьев с листьями равно числу корневых деревьев с листьями. ^[4] $n$ $n-1$

Количество деревьев с укорененными корнями быстро растет в зависимости от количества кончиков. Для 10 вершин имеется больше, чем возможно, разветвляющихся деревьев, причем число разветвляющихся деревьев растет быстрее, примерно на 10 вершин. Последних в 7 раз больше, чем первых. $34\times 10^{6}$

Особые виды деревьев

Дендрограмма

Дендрограмма — это общее название дерева, филогенетического или нет, а, следовательно, и схематического представления филогенетического дерева . ^[14]

Кладограмма

Кладограмма представляет собой только образец ветвления ; т. е. длина его ветвей не отражает время или относительную величину изменения символов, а его внутренние узлы не представляют предков. ^[15]

Филограмма

Филограмма — это филогенетическое дерево, длина ветвей которого пропорциональна степени изменения признаков. ^[17]

Хронограмма — это филогенетическое дерево, которое явно представляет время через длину его ветвей. ^[18]

Дальгренограмма

Дальгренограмма — это диаграмма , представляющая собой поперечное сечение филогенетического дерева.

Филогенетическая сеть

Филогенетическая сеть — это, строго говоря, не дерево, а скорее более общий граф или ориентированный ациклический граф в случае корневых сетей. Они используются для преодоления некоторых ограничений, присущих деревьям.

Схема шпинделя

Диаграмму веретена, или пузырьковую диаграмму, часто называют ромерограммой, в честь ее популяризации американским палеонтологом Альфредом Ромером . ^[19] Он представляет таксономическое разнообразие (ширина по горизонтали) в зависимости от геологического времени (вертикальная ось), чтобы отразить изменение численности различных таксонов во времени. Однако диаграмма веретена не является эволюционным деревом: ^[20] таксономические веретена скрывают фактические отношения родительского таксона с дочерним таксоном ^[19] и имеют недостаток, заключающийся в вовлечении парафилии родительской группы. ^[21] Этот тип диаграммы больше не используется в первоначально предложенной форме. ^[21]

Коралл жизни

Дарвин ^[22] также отметил, что коралл может быть более подходящей метафорой, чем дерево . Действительно, филогенетические кораллы полезны для изображения прошлой и настоящей жизни и имеют некоторые преимущества перед деревьями (допускаются анастомозы и т. д.). ^[21]

Строительство

Филогенетические деревья, состоящие из нетривиального числа входных последовательностей, строятся с использованием методов вычислительной филогенетики . Методы матрицы расстояний, такие как соединение соседей или UPGMA , которые вычисляют генетическое расстояние на основе множественных выравниваний последовательностей , являются наиболее простыми в реализации, но не задействуют эволюционную модель. Многие методы выравнивания последовательностей, такие как ClustalW, также создают деревья, используя более простые алгоритмы (т. е. основанные на расстоянии) построения деревьев. Максимальная экономия — еще один простой метод оценки филогенетических деревьев, но он подразумевает неявную модель эволюции (т. е. экономию). Более продвинутые методы используют критерий оптимальности максимального правдоподобия , часто в рамках байесовской структуры , и применяют явную модель эволюции для оценки филогенетического дерева. ^[4] Идентификация оптимального дерева с использованием многих из этих методов является NP-сложной задачей , ^[4] поэтому эвристические методы поиска и оптимизации используются в сочетании с функциями оценки дерева для определения достаточно хорошего дерева, которое соответствует данным.

Методы построения деревьев можно оценить по нескольким критериям: ^[23]

эффективность (сколько времени занимает вычисление ответа, сколько памяти требуется?)
мощность (эффективно ли используются данные или информация тратится впустую?)
последовательность (сойдется ли он к одному и тому же ответу неоднократно, если каждый раз давать разные данные для одной и той же модельной задачи?)
надежность (хорошо ли он справляется с нарушениями предположений базовой модели?)
фальсифицируемость (предупреждает ли нас, что его использовать нецелесообразно, т. е. когда предположения нарушаются?)

Методы построения деревьев также привлекли внимание математиков. Деревья также можно строить с помощью Т-теории . ^[24]

Форматы файлов

Деревья могут быть закодированы в различных форматах, каждый из которых должен представлять вложенную структуру дерева. Они могут кодировать или не кодировать длину ветвей и другие функции. Стандартизированные форматы имеют решающее значение для распространения и совместного использования деревьев, не полагаясь на графический вывод, который трудно импортировать в существующее программное обеспечение. Обычно используемые форматы:

Ограничения филогенетического анализа

Хотя филогенетические деревья, созданные на основе секвенированных генов или геномных данных у разных видов, могут дать представление об эволюции, этот анализ имеет важные ограничения. Самое главное, что деревья, которые они создают, не обязательно являются правильными – они не обязательно точно отражают историю эволюции включенных в них таксонов. Как и любой научный результат, они подлежат фальсификации путем дальнейшего изучения (например, сбора дополнительных данных, анализа существующих данных улучшенными методами). Данные, на которых они основаны, могут быть зашумлены ; ^[25] анализ может быть затруднен генетической рекомбинацией , ^[26] горизонтальным переносом генов , ^[27] гибридизацией между видами, которые не были ближайшими соседями на дереве до того, как произошла гибридизация, конвергентной эволюцией и консервативными последовательностями .

Кроме того, существуют проблемы с базированием анализа на одном типе признаков, например, на одном гене или белке , или только на морфологическом анализе, поскольку такие деревья, построенные на основе другого несвязанного источника данных, часто отличаются от первого, и поэтому необходима большая осторожность. в установлении филогенетических связей между видами. Это наиболее справедливо в отношении генетического материала, который подвергается латеральному переносу генов и рекомбинации , где разные блоки гаплотипов могут иметь разную историю. В этих типах анализа выходное дерево филогенетического анализа отдельного гена представляет собой оценку филогении гена (т. е. генного дерева), а не филогении таксонов ( т. е. дерева видов), из которых были выбраны эти признаки. в идеале оба должны быть очень близки. По этой причине в серьезных филогенетических исследованиях обычно используются комбинации генов, происходящих из разных геномных источников (например, из митохондриальных или пластидных или ядерных геномов) ^[28] или генов, которые, как ожидается, будут эволюционировать в различных режимах селекции, так что гомоплазия (ложная гомология ) вряд ли станет результатом естественного отбора.

Когда вымершие виды включаются в анализ в качестве конечных узлов (а не, например, для ограничения внутренних узлов), считается, что они не представляют прямых предков каких-либо существующих видов. Вымершие виды обычно не содержат высококачественной ДНК .

Диапазон полезных материалов ДНК расширился с развитием технологий экстракции и секвенирования. Разработка технологий, способных выводить последовательности из более мелких фрагментов или пространственных структур продуктов деградации ДНК, еще больше расширит диапазон ДНК, считающейся полезной.

Филогенетические деревья также могут быть выведены на основе ряда других типов данных, включая морфологию, наличие или отсутствие определенных типов генов, события вставки и удаления, а также любые другие наблюдения, которые, как считается, содержат эволюционный сигнал.

Филогенетические сети используются, когда раздвоенные деревья не подходят из-за этих осложнений, которые предполагают более сетчатую эволюционную историю отобранных организмов.

Смотрите также

Клад
кладистика
Вычислительная филогенетика
Эволюционная биология
Эволюционная таксономия
Обобщенное выравнивание дерева
Список программного обеспечения для филогенетики
Список программного обеспечения для визуализации филогенетического дерева
PANDIT , биологическая база данных, охватывающая белковые домены.
Филогенетические сравнительные методы
Филогенетическое примирение
Таксономический ранг

дальнейшее чтение

Шух, RT и АВЗ Брауэр. 2009. Биологическая систематика: принципы и приложения (2-е изд.) ISBN 978-0-8014-4799-0.
Мануэль Лима , Книга деревьев: визуализация отраслей знаний , 2014, Princeton Architectural Press, Нью-Йорк.
MEGA — бесплатная программа для рисования филогенетических деревьев.
Гонтье, Н. 2011. «Изображение Древа Жизни: философские и исторические корни эволюционных древовидных диаграмм». Эволюция, Образование, Пропаганда 4: 515–538.

Внешние ссылки

Викискладе есть медиафайлы, связанные с филогенетическими деревьями .

Изображений

Y-хромосома человека 2002 Филогенетическое древо
iTOL: интерактивное древо жизни
Филогенетическое древо искусственных организмов, эволюционировавших на компьютерах. Архивировано 22 февраля 2016 г. на Wayback Machine.
Филограмма эвтерийных млекопитающих Миямото и Гудмана.

Общий

Обзор различных методов визуализации дерева доступен на сайте Page, RDM (2011). «Пространство, время, форма: просмотр Древа Жизни». Тенденции в экологии и эволюции . 27 (2): 113–120. дои : 10.1016/j.tree.2011.12.002. ПМИД 22209094.
OneZoom: Tree of Life — все живые виды в виде интуитивно понятного и масштабируемого исследователя фракталов (адаптивный дизайн)
Откройте для себя жизнь Интерактивное дерево, основанное на проекте Национального научного фонда США «Сборка древа жизни».
Филокод
Множественное выравнивание 139 последовательностей миозина и филогенетическое древо
Веб-проект «Древо жизни»
Филогенетический вывод на сервере T-REX
База данных таксономии NCBI[1]
ETE: среда Python для исследования деревьев. Это программная библиотека для анализа, управления и визуализации филогенетических деревьев. Ссылка.
Ежедневно обновляемое древо (последовательной) жизни Фанг, Х.; Оутс, Мэн; Петика, РБ; Гринвуд, Дж. М.; Сардар, Эй Джей; Рэкхэм, OJL; Донохью, PCJ; Стаматакис, А.; Де Лима Мораис, окружной прокурор; Гоф, Дж. (2013). «Ежедневно обновляемое древо (секвенированной) жизни как справочник для исследований генома». Научные отчеты . 3 : 2015. Бибкод : 2013NatSR...3E2015F. дои : 10.1038/srep02015. ПМК 6504836 . ПМИД 23778980.