Филогенетическое дерево , филогения или эволюционное дерево — это графическое представление, которое показывает историю эволюции между набором видов или таксонов в течение определенного времени. [3] [4] Другими словами, это диаграмма ветвления или дерево , показывающее эволюционные отношения между различными биологическими видами или другими объектами, основанные на сходствах и различиях в их физических или генетических характеристиках. В эволюционной биологии вся жизнь на Земле теоретически является частью единого филогенетического дерева, что указывает на общее происхождение . Филогенетика - это изучение филогенетических деревьев. Основная задача — найти филогенетическое дерево, отражающее оптимальное эволюционное происхождение между набором видов или таксонов. Вычислительная филогенетика (также филогенетический вывод) фокусируется на алгоритмах, участвующих в поиске оптимального филогенетического дерева в филогенетическом ландшафте. [3] [4]
Филогенетические деревья могут быть укорененными и неукорененными. В корневом филогенетическом дереве каждый узел с потомками представляет предполагаемого самого последнего общего предка этих потомков [5] , а длины ребер в некоторых деревьях можно интерпретировать как оценки времени. Каждый узел называется таксономической единицей. Внутренние узлы обычно называют гипотетическими таксономическими единицами, поскольку их невозможно наблюдать напрямую. Деревья полезны в таких областях биологии, как биоинформатика , систематика и филогенетика . Некорневые деревья иллюстрируют только родство листовых узлов и не требуют знания или предположения о родовом корне.
Идея древа жизни возникла из древних представлений о лестничном переходе от низших форм жизни к высшим (например, в Великой Цепи Бытия ). Ранние изображения «ветвящихся» филогенетических деревьев включают «палеонтологическую карту», показывающую геологические взаимоотношения между растениями и животными в книге Эдварда Хичкока « Элементарная геология» (первое издание: 1840 г.).
Чарльз Дарвин представил схематическое эволюционное «дерево» в своей книге 1859 года «Происхождение видов» . Спустя столетие биологи-эволюционисты все еще используют древовидные диаграммы для изображения эволюции , поскольку такие диаграммы эффективно передают концепцию, согласно которой видообразование происходит посредством адаптивного и полуслучайного разделения линий.
Термин филогенетический , или филогения , происходит от двух древнегреческих слов φῦλον ( phûlon ), означающих «раса, родословная», и γένεσις ( genesis ), означающих «происхождение, источник». [6] [7]
Корневое филогенетическое дерево (см. два рисунка вверху) — это направленное дерево с уникальным узлом — корнем — соответствующим (обычно вменяемому ) самому последнему общему предку всех объектов на листьях дерева. Корневой узел не имеет родительского узла, но является родительским для всех остальных узлов дерева. Таким образом, корень является узлом степени 2, в то время как другие внутренние узлы имеют минимальную степень 3 (где «степень» здесь относится к общему количеству входящих и исходящих ребер).
Наиболее распространенным методом укоренения деревьев является использование непротиворечивой внешней группы — достаточно близкой, чтобы можно было сделать выводы на основе данных о признаках или молекулярного секвенирования, но достаточно далекой, чтобы быть явной внешней группой. Другой метод — укоренение средней точки, или дерево также можно укоренить с помощью модели нестационарной подстановки . [8]
Некорневые деревья иллюстрируют родство листовых узлов, не делая предположений о происхождении. Они не требуют знания или предположения о родовом корне. [10] Некорневые деревья всегда можно создать из корневых, просто опустив корень. Напротив, определение корня неукорененного дерева требует некоторых средств идентификации происхождения. Обычно это делается путем включения внешней группы во входные данные, чтобы корень обязательно находился между внешней группой и остальными таксонами в дереве, или путем введения дополнительных предположений об относительных скоростях эволюции в каждой ветви, например приложения гипотезы молекулярных часов . [11]
Как корневые, так и некорневые деревья могут быть как раздвоенными , так и многоветвистыми. Корневое разветвляющееся дерево имеет ровно два потомка, возникающих из каждого внутреннего узла (то есть оно образует бинарное дерево ), а некорневое разветвляющееся дерево принимает форму некорневого бифуркационного дерева , свободного дерева , имеющего ровно три соседа в каждом внутреннем узле. Напротив, корневое разветвленное дерево может иметь более двух дочерних элементов в некоторых узлах, а некорневое разветвленное дерево может иметь более трех соседей в некоторых узлах.
Деревья с корнями и без корней могут быть как помеченными, так и не помеченными. Помеченное дерево имеет определенные значения, присвоенные его листьям, тогда как немаркированное дерево, иногда называемое формой дерева, определяет только топологию. Некоторые деревья на основе последовательностей, построенные на основе небольшого геномного локуса, такие как Phylotree [12] , содержат внутренние узлы, помеченные предполагаемыми предковыми гаплотипами.
Число возможных деревьев для заданного количества листовых узлов зависит от конкретного типа дерева, но всегда больше помеченных деревьев, чем немаркированных, разветвленных деревьев больше, чем раздвоенных, и больше корневых деревьев, чем некорневых. Последнее различие наиболее значимо с биологической точки зрения; оно возникает потому, что на неукорененном дереве много мест, куда можно пустить корень. Для раздвоенных помеченных деревьев общее количество корневых деревьев равно:
Для разветвляющихся помеченных деревьев общее количество некорневых деревьев составляет: [13]
Среди помеченных разветвляющихся деревьев количество некорневых деревьев с листьями равно числу корневых деревьев с листьями. [4]
Количество деревьев с укорененными корнями быстро растет в зависимости от количества кончиков. Для 10 вершин имеется больше, чем возможно, разветвляющихся деревьев, причем число разветвляющихся деревьев растет быстрее, примерно на 10 вершин. Последних в 7 раз больше, чем первых.
Дендрограмма — это общее название дерева, филогенетического или нет, а, следовательно, и схематического представления филогенетического дерева . [14]
Кладограмма представляет собой только образец ветвления ; т. е. длина его ветвей не отражает время или относительную величину изменения символов, а его внутренние узлы не представляют предков. [15]
Филограмма — это филогенетическое дерево, длина ветвей которого пропорциональна степени изменения признаков. [17]
Хронограмма — это филогенетическое дерево, которое явно представляет время через длину его ветвей. [18]
Дальгренограмма — это диаграмма , представляющая собой поперечное сечение филогенетического дерева.
Филогенетическая сеть — это, строго говоря, не дерево, а скорее более общий граф или ориентированный ациклический граф в случае корневых сетей. Они используются для преодоления некоторых ограничений, присущих деревьям.
Диаграмму веретена, или пузырьковую диаграмму, часто называют ромерограммой, в честь ее популяризации американским палеонтологом Альфредом Ромером . [19] Он представляет таксономическое разнообразие (ширина по горизонтали) в зависимости от геологического времени (вертикальная ось), чтобы отразить изменение численности различных таксонов во времени. Однако диаграмма веретена не является эволюционным деревом: [20] таксономические веретена скрывают фактические отношения родительского таксона с дочерним таксоном [19] и имеют недостаток, заключающийся в вовлечении парафилии родительской группы. [21] Этот тип диаграммы больше не используется в первоначально предложенной форме. [21]
Дарвин [22] также отметил, что коралл может быть более подходящей метафорой, чем дерево . Действительно, филогенетические кораллы полезны для изображения прошлой и настоящей жизни и имеют некоторые преимущества перед деревьями (допускаются анастомозы и т. д.). [21]
Филогенетические деревья, состоящие из нетривиального числа входных последовательностей, строятся с использованием методов вычислительной филогенетики . Методы матрицы расстояний, такие как соединение соседей или UPGMA , которые вычисляют генетическое расстояние на основе множественных выравниваний последовательностей , являются наиболее простыми в реализации, но не задействуют эволюционную модель. Многие методы выравнивания последовательностей, такие как ClustalW, также создают деревья, используя более простые алгоритмы (т. е. основанные на расстоянии) построения деревьев. Максимальная экономия — еще один простой метод оценки филогенетических деревьев, но он подразумевает неявную модель эволюции (т. е. экономию). Более продвинутые методы используют критерий оптимальности максимального правдоподобия , часто в рамках байесовской структуры , и применяют явную модель эволюции для оценки филогенетического дерева. [4] Идентификация оптимального дерева с использованием многих из этих методов является NP-сложной задачей , [4] поэтому эвристические методы поиска и оптимизации используются в сочетании с функциями оценки дерева для определения достаточно хорошего дерева, которое соответствует данным.
Методы построения деревьев можно оценить по нескольким критериям: [23]
Методы построения деревьев также привлекли внимание математиков. Деревья также можно строить с помощью Т-теории . [24]
Деревья могут быть закодированы в различных форматах, каждый из которых должен представлять вложенную структуру дерева. Они могут кодировать или не кодировать длину ветвей и другие функции. Стандартизированные форматы имеют решающее значение для распространения и совместного использования деревьев, не полагаясь на графический вывод, который трудно импортировать в существующее программное обеспечение. Обычно используемые форматы:
Хотя филогенетические деревья, созданные на основе секвенированных генов или геномных данных у разных видов, могут дать представление об эволюции, этот анализ имеет важные ограничения. Самое главное, что деревья, которые они создают, не обязательно являются правильными – они не обязательно точно отражают историю эволюции включенных в них таксонов. Как и любой научный результат, они подлежат фальсификации путем дальнейшего изучения (например, сбора дополнительных данных, анализа существующих данных улучшенными методами). Данные, на которых они основаны, могут быть зашумлены ; [25] анализ может быть затруднен генетической рекомбинацией , [26] горизонтальным переносом генов , [27] гибридизацией между видами, которые не были ближайшими соседями на дереве до того, как произошла гибридизация, конвергентной эволюцией и консервативными последовательностями .
Кроме того, существуют проблемы с базированием анализа на одном типе признаков, например, на одном гене или белке , или только на морфологическом анализе, поскольку такие деревья, построенные на основе другого несвязанного источника данных, часто отличаются от первого, и поэтому необходима большая осторожность. в установлении филогенетических связей между видами. Это наиболее справедливо в отношении генетического материала, который подвергается латеральному переносу генов и рекомбинации , где разные блоки гаплотипов могут иметь разную историю. В этих типах анализа выходное дерево филогенетического анализа отдельного гена представляет собой оценку филогении гена (т. е. генного дерева), а не филогении таксонов ( т. е. дерева видов), из которых были выбраны эти признаки. в идеале оба должны быть очень близки. По этой причине в серьезных филогенетических исследованиях обычно используются комбинации генов, происходящих из разных геномных источников (например, из митохондриальных или пластидных или ядерных геномов) [28] или генов, которые, как ожидается, будут эволюционировать в различных режимах селекции, так что гомоплазия (ложная гомология ) вряд ли станет результатом естественного отбора.
Когда вымершие виды включаются в анализ в качестве конечных узлов (а не, например, для ограничения внутренних узлов), считается, что они не представляют прямых предков каких-либо существующих видов. Вымершие виды обычно не содержат высококачественной ДНК .
Диапазон полезных материалов ДНК расширился с развитием технологий экстракции и секвенирования. Разработка технологий, способных выводить последовательности из более мелких фрагментов или пространственных структур продуктов деградации ДНК, еще больше расширит диапазон ДНК, считающейся полезной.
Филогенетические деревья также могут быть выведены на основе ряда других типов данных, включая морфологию, наличие или отсутствие определенных типов генов, события вставки и удаления, а также любые другие наблюдения, которые, как считается, содержат эволюционный сигнал.
Филогенетические сети используются, когда раздвоенные деревья не подходят из-за этих осложнений, которые предполагают более сетчатую эволюционную историю отобранных организмов.