Филогенетическое дерево , филогения или эволюционное дерево — это графическое представление, которое показывает эволюционную историю между набором видов или таксонов в течение определенного времени. [1] [2] Другими словами, это разветвленная диаграмма или дерево , показывающее эволюционные отношения между различными биологическими видами или другими сущностями на основе сходств и различий в их физических или генетических характеристиках. В эволюционной биологии вся жизнь на Земле теоретически является частью одного филогенетического дерева, что указывает на общее происхождение . Филогенетика — это изучение филогенетических деревьев. Основная задача состоит в том, чтобы найти филогенетическое дерево, представляющее оптимальное эволюционное происхождение между набором видов или таксонов. Вычислительная филогенетика (также вывод филогении) фокусируется на алгоритмах, участвующих в поиске оптимального филогенетического дерева в филогенетическом ландшафте. [1] [2]
Филогенетические деревья могут быть укорененными или неукорененными. В укорененном филогенетическом дереве каждый узел с потомками представляет предполагаемого самого последнего общего предка этих потомков, [3] а длины ребер в некоторых деревьях могут интерпретироваться как оценки времени. Каждый узел называется таксономической единицей. Внутренние узлы обычно называются гипотетическими таксономическими единицами, поскольку их нельзя наблюдать напрямую. Деревья полезны в таких областях биологии, как биоинформатика , систематика и филогенетика . Неукорененные деревья иллюстрируют только родство листовых узлов и не требуют знания или выведения предкового корня.
Идея древа жизни возникла из древних представлений о лестничном прогрессе от низших к высшим формам жизни (например, в Великой Цепи Бытия ). Ранние представления о «ветвящихся» филогенетических деревьях включают «палеонтологическую схему», показывающую геологические связи между растениями и животными в книге «Элементарная геология » Эдварда Хичкока (первое издание: 1840).
Чарльз Дарвин представил схематическое эволюционное «дерево» в своей книге 1859 года «О происхождении видов » . Более века спустя биологи-эволюционисты все еще используют древовидные диаграммы для изображения эволюции , поскольку такие диаграммы эффективно передают концепцию того, что видообразование происходит посредством адаптивного и полуслучайного разделения линий.
Термин «филогенетический » или «филогения » происходит от двух древнегреческих слов φῦλον ( phûlon ), что означает «раса, родословная», и γένεσις ( génesis ), что означает «происхождение, источник». [4] [5]
Укорененное филогенетическое дерево (см. два рисунка вверху) — это направленное дерево с уникальным узлом — корнем — соответствующим (обычно вмененному ) самому последнему общему предку всех сущностей на листьях дерева. У корневого узла нет родительского узла, но он служит родителем всех других узлов в дереве. Таким образом, корень является узлом степени 2 , в то время как другие внутренние узлы имеют минимальную степень 3 (где «степень» здесь относится к общему числу входящих и исходящих ребер). [ необходима цитата ]
Наиболее распространенным методом укоренения деревьев является использование непротиворечивой внешней группы — достаточно близкой, чтобы сделать вывод из данных о признаках или молекулярного секвенирования, но достаточно далекой, чтобы быть четкой внешней группой. Другой метод — укоренение в средней точке, или дерево также может быть укоренено с использованием нестационарной модели замещения . [6]
Некорневые деревья иллюстрируют родство листовых узлов без предположений о происхождении. Они не требуют, чтобы корень предка был известен или выведен. [8] Некорневые деревья всегда можно сгенерировать из корневых, просто опустив корень. Напротив, выведение корня некорневого дерева требует некоторых средств идентификации происхождения. Обычно это делается путем включения внешней группы во входные данные, так что корень обязательно находится между внешней группой и остальными таксонами в дереве, или путем введения дополнительных предположений об относительных скоростях эволюции на каждой ветви, таких как применение гипотезы молекулярных часов . [9]
Как корневые, так и некорневые деревья могут быть либо бифурцирующими , либо мультифурцирующими. Корневое бифурцирующее дерево имеет ровно два потомка, возникающих из каждого внутреннего узла (то есть оно образует бинарное дерево ), а некорневое бифурцирующее дерево принимает форму некорневого бинарного дерева , свободного дерева с ровно тремя соседями в каждом внутреннем узле. Напротив, корневое мультифурцирующее дерево может иметь более двух потомков в некоторых узлах, а некорневое мультифурцирующее дерево может иметь более трех соседей в некоторых узлах. [ необходима цитата ]
Как укорененные, так и неукорененные деревья могут быть либо помечены, либо не помечены. У помеченного дерева есть определенные значения, назначенные его листьям, в то время как не помеченное дерево, иногда называемое формой дерева, определяет только топологию. Некоторые деревья на основе последовательностей, построенные из небольшого геномного локуса, такие как Phylotree, [10] имеют внутренние узлы, помеченные предполагаемыми предковыми гаплотипами.
Число возможных деревьев для заданного числа листовых узлов зависит от конкретного типа дерева, но всегда существует больше маркированных деревьев, чем немаркированных, больше многоветвистых, чем разветвленных, и больше корневых, чем некорневых. Последнее различие является наиболее биологически значимым; оно возникает из-за того, что на некорневом дереве есть много мест, куда можно поместить корень. Для разветвленных маркированных деревьев общее число корневых деревьев равно:
Для разветвленных помеченных деревьев общее количество некорневых деревьев равно: [11]
Среди помеченных разветвляющихся деревьев число некорневых деревьев с листьями равно числу корневых деревьев с листьями. [2]
Число корневых деревьев быстро растет в зависимости от числа наконечников. Для 10 наконечников существует больше, чем возможных разветвленных деревьев, а число многоветвистых деревьев растет быстрее, причем последних примерно в 7 раз больше, чем первых.
Дендрограмма — это общее название дерева, филогенетического или нет, а также схематического представления филогенетического дерева. [12]
Кладограмма представляет собой только схему ветвления; то есть длина ее ветвей не отражает время или относительное количество изменений признаков, а ее внутренние узлы не отражают предков. [ 13]
Филограмма — это филогенетическое дерево, длина ветвей которого пропорциональна количеству изменений признаков. [14]
Хронограмма — это филогенетическое дерево, которое явно представляет время через длину своих ветвей. [15]
Дальгренограмма — это диаграмма, представляющая собой поперечное сечение филогенетического дерева. [ необходима ссылка ]
Филогенетическая сеть, строго говоря, не является деревом, а скорее более общим графом или направленным ациклическим графом в случае корневых сетей. Они используются для преодоления некоторых ограничений, присущих деревьям.
Диаграмма веретена, или пузырьковая диаграмма, часто называется ромерограммой после ее популяризации американским палеонтологом Альфредом Ромером . [17] Она представляет таксономическое разнообразие (горизонтальная ширина) против геологического времени (вертикальная ось), чтобы отразить изменение распространенности различных таксонов с течением времени. Диаграмма веретена не является эволюционным деревом: [18] таксономические веретена скрывают фактические отношения родительского таксона к дочернему таксону [17] и имеют недостаток, заключающийся в том, что они включают парафилию родительской группы. [19] Этот тип диаграммы больше не используется в форме, изначально предложенной. [19]
Дарвин [20] также упомянул, что коралл может быть более подходящей метафорой, чем дерево . Действительно, филогенетические кораллы полезны для изображения прошлой и настоящей жизни, и у них есть некоторые преимущества перед деревьями ( допускаются анастомозы и т. д.). [19]
Филогенетические деревья, составленные из нетривиального числа входных последовательностей, строятся с использованием методов вычислительной филогенетики . Методы матрицы расстояний, такие как присоединение соседей или UPGMA , которые вычисляют генетическое расстояние из множественных выравниваний последовательностей , являются наиболее простыми в реализации, но не вызывают эволюционную модель. Многие методы выравнивания последовательностей, такие как ClustalW, также создают деревья, используя более простые алгоритмы (т. е. основанные на расстоянии) построения деревьев. Максимальная экономия — еще один простой метод оценки филогенетических деревьев, но подразумевает неявную модель эволюции (т. е. экономию). Более продвинутые методы используют критерий оптимальности максимального правдоподобия , часто в рамках байесовского подхода , и применяют явную модель эволюции к оценке филогенетического дерева. [2] Определение оптимального дерева с использованием многих из этих методов является NP-трудным , [2] поэтому эвристические методы поиска и оптимизации используются в сочетании с функциями оценки деревьев для определения достаточно хорошего дерева, которое соответствует данным.
Методы построения деревьев можно оценить на основе нескольких критериев: [21]
Методы построения деревьев также привлекли внимание математиков. Деревья также могут быть построены с использованием Т-теории . [22]
Деревья могут быть закодированы в ряде различных форматов, все из которых должны представлять вложенную структуру дерева. Они могут или не могут кодировать длины ветвей и другие характеристики. Стандартизированные форматы имеют решающее значение для распространения и обмена деревьями без использования графического вывода, который трудно импортировать в существующее программное обеспечение. Обычно используемые форматы:
Хотя филогенетические деревья, созданные на основе секвенированных генов или геномных данных у разных видов, могут обеспечить эволюционное понимание, эти анализы имеют важные ограничения. Самое главное, что деревья, которые они генерируют, не обязательно правильны — они не обязательно точно представляют эволюционную историю включенных таксонов. Как и любой научный результат, они могут быть фальсифицированы дальнейшим изучением (например, сбором дополнительных данных, анализом существующих данных с помощью улучшенных методов). Данные, на которых они основаны, могут быть зашумленными ; [23] анализ может быть запутан генетической рекомбинацией , [24] горизонтальным переносом генов , [25] гибридизацией между видами, которые не были ближайшими соседями на дереве до того, как произошла гибридизация, и консервативными последовательностями .
Кроме того, существуют проблемы с обоснованием анализа на основе одного типа признака, например, одного гена или белка , или только на основе морфологического анализа, поскольку такие деревья, построенные на основе другого неродственного источника данных, часто отличаются от первого, и поэтому требуется большая осторожность при выведении филогенетических связей между видами. Это наиболее справедливо для генетического материала, который подвергается латеральному переносу генов и рекомбинации , где различные блоки гаплотипа могут иметь разную историю. В этих типах анализа выходное дерево филогенетического анализа одного гена является оценкой филогении гена (т. е. генного дерева), а не филогении таксонов ( т. е. видового дерева), из которых были отобраны эти признаки, хотя в идеале оба должны быть очень близки. По этой причине серьезные филогенетические исследования обычно используют комбинацию генов, которые происходят из разных геномных источников (например, из митохондриальных или пластидных геномов по сравнению с ядерными геномами) [26] или генов, которые, как ожидается, будут развиваться в разных селективных режимах, так что гомоплазия (ложная гомология ) вряд ли станет результатом естественного отбора.
Когда вымершие виды включаются в анализ в качестве конечных узлов (а не, например, для ограничения внутренних узлов), они считаются не представляющими прямых предков каких-либо существующих видов. Вымершие виды обычно не содержат высококачественную ДНК .
Диапазон полезных материалов ДНК расширился с развитием технологий извлечения и секвенирования. Разработка технологий, способных выводить последовательности из более мелких фрагментов или из пространственных моделей продуктов деградации ДНК, еще больше расширит диапазон ДНК, считающихся полезными.
Филогенетические деревья также можно вывести из ряда других типов данных, включая морфологию, наличие или отсутствие определенных типов генов, события вставки и удаления, а также любые другие наблюдения, которые, как считается, содержат эволюционный сигнал.
Филогенетические сети используются в тех случаях, когда разветвленные деревья не подходят из-за этих сложностей, которые предполагают более сетчатую эволюционную историю отобранных организмов.
Аннотация отсутствует.