Кладограмма

Кладограмма (от греч. clados «ветвь» и gramma «характер») — это диаграмма, используемая в кладистике для отображения отношений между организмами. Однако кладограмма не является эволюционным деревом , поскольку она не показывает, как предки связаны с потомками, и не показывает, насколько они изменились, поэтому многие различные эволюционные деревья могут соответствовать одной и той же кладограмме. ^[1]^[2]^[3]^[4]^[5] Кладограмма использует линии, которые ответвляются в разных направлениях, заканчиваясь на кладе , группе организмов с последним общим предком . Существует много форм кладограмм, но все они имеют линии, которые ответвляются от других линий. Линии можно проследить до того места, где они ответвляются. Эти точки ответвления представляют собой гипотетического предка (не фактическую сущность), который, как можно предположить, демонстрирует черты, общие для терминальных таксонов выше него. ^[4]^[6] Этот гипотетический предок мог бы затем предоставить подсказки о порядке эволюции различных признаков, адаптации и других эволюционных повествованиях о предках. Хотя традиционно такие кладограммы создавались в основном на основе морфологических признаков, данные секвенирования ДНК и РНК и вычислительная филогенетика теперь очень часто используются при создании кладограмм, как сами по себе, так и в сочетании с морфологией.

Создание кладограммы

Молекулярные и морфологические данные

Характеристики, используемые для создания кладограммы, можно грубо разделить на морфологические (синапсидный череп, теплокровные, хорда , одноклеточные и т. д.) или молекулярные (ДНК, РНК или другая генетическая информация). ^[7] До появления секвенирования ДНК кладистический анализ в основном использовал морфологические данные. Поведенческие данные (для животных) также могут быть использованы. ^[8]

Поскольку секвенирование ДНК стало дешевле и проще, молекулярная систематика стала все более популярным способом выведения филогенетических гипотез. ^[9] Использование критерия экономии — лишь один из нескольких методов выведения филогении из молекулярных данных. Такие подходы, как максимальное правдоподобие , которые включают явные модели эволюции последовательностей, являются нехенниговскими способами оценки данных последовательностей. Другим мощным методом реконструкции филогений является использование геномных ретротранспозонных маркеров , которые, как считается, менее подвержены проблеме реверсии , которая преследует данные последовательностей. Также обычно предполагается, что у них низкая частота гомоплазий, поскольку когда-то считалось, что их интеграция в геном была полностью случайной; однако, по крайней мере иногда, это не так.

Апоморфия в кладистике. Эта диаграмма показывает "A" и "C" как предковые состояния, а "B", "D" и "E" как состояния, которые присутствуют в терминальных таксонах. Обратите внимание, что на практике предковые состояния не известны *априори* (как показано в этом эвристическом примере), но должны быть выведены из паттерна общих состояний, наблюдаемых в терминалах. Учитывая, что каждый терминал в этом примере имеет уникальное состояние, в действительности мы не смогли бы сделать никаких окончательных выводов о предковых состояниях (кроме того факта, что существование ненаблюдаемых состояний "A" и "C" было бы неэкономными выводами!)

Плезиоморфии и синапоморфии

Исследователи должны решить, какие состояния характера являются «предковыми» ( плезиоморфии ), а какие — производными ( синапоморфии ), поскольку только синапоморфные состояния характера предоставляют доказательства группировки. ^[10] Это определение обычно делается путем сравнения с состояниями характера одной или нескольких внешних групп . Состояния, общие для внешней группы и некоторых членов внутренней группы, являются симплезиоморфиями; состояния, которые присутствуют только в подмножестве внутренней группы, являются синапоморфиями. Обратите внимание, что состояния характера, уникальные для одного терминала (аутапоморфии), не предоставляют доказательств группировки. Выбор внешней группы является решающим шагом в кладистическом анализе, поскольку различные внешние группы могут создавать деревья с совершенно разной топологией.

Гомоплазии

Гомоплазия — это состояние признака, которое разделяют два или более таксонов по какой-то причине, отличной от общего происхождения. ^[11] Двумя основными типами гомоплазии являются конвергенция (эволюция «одного и того же» признака по крайней мере в двух различных линиях) и реверсия (возврат к состоянию предкового признака). Признаки, которые явно гомопластичны, такие как белый мех в разных линиях арктических млекопитающих, не должны включаться в качестве признака в филогенетический анализ, поскольку они не вносят никакого вклада в наше понимание взаимоотношений. Однако гомоплазия часто не очевидна при осмотре самого признака (как, например, в последовательности ДНК), а затем обнаруживается по его несоответствию (неэкономному распределению) на наиболее экономной кладограмме. Обратите внимание, что признаки, которые являются гомопластичными, все еще могут содержать филогенетический сигнал . ^[12]

Известным примером гомоплазии, вызванной конвергентной эволюцией, является признак «наличие крыльев». Хотя крылья птиц, летучих мышей и насекомых выполняют одну и ту же функцию, каждое из них развивалось независимо, как можно увидеть по их анатомии . Если бы птица, летучая мышь и крылатое насекомое были оценены по признаку «наличие крыльев», гомоплазия была бы введена в набор данных, и это потенциально могло бы запутать анализ, возможно, приведя к ложной гипотезе о родственных связях. Конечно, единственная причина, по которой гомоплазия распознается в первую очередь, заключается в том, что существуют другие признаки, которые подразумевают модель родственных связей, раскрывающую ее гомопластическое распределение.

Что не является кладограммой

Кладограмма — это схематический результат анализа, который группирует таксоны на основе только синапоморфий. Существует много других филогенетических алгоритмов, которые обрабатывают данные несколько иначе и приводят к филогенетическим деревьям, которые выглядят как кладограммы, но не являются кладограммами. Например, фенетические алгоритмы, такие как UPGMA и Neighbor-Joining, группируют по общему сходству и рассматривают как синапоморфии, так и симплезиоморфии как доказательство группировки. Полученные диаграммы являются фенограммами, а не кладограммами. Аналогично, результаты методов, основанных на моделях (подходы максимального правдоподобия или байесовский подход), которые учитывают как порядок ветвления, так и «длину ветви», учитывают как синапоморфии, так и аутапоморфии как доказательство за или против группировки. Диаграммы, полученные в результате такого анализа, также не являются кладограммами. ^[13]

Выбор кладограммы

Существует несколько алгоритмов для определения «лучшей» кладограммы. ^[14] Большинство алгоритмов используют метрику для измерения того, насколько кладограмма-кандидат соответствует данным. Большинство алгоритмов кладограмм используют математические методы оптимизации и минимизации.

В общем случае алгоритмы генерации кладограмм должны быть реализованы в виде компьютерных программ, хотя некоторые алгоритмы можно выполнять вручную, если наборы данных невелики (например, всего несколько видов и несколько характеристик).

Некоторые алгоритмы полезны только тогда, когда характерные данные являются молекулярными (ДНК, РНК); другие алгоритмы полезны только тогда, когда характерные данные являются морфологическими. Другие алгоритмы могут использоваться, когда характерные данные включают как молекулярные, так и морфологические данные.

Алгоритмы для кладограмм или других типов филогенетических деревьев включают в себя метод наименьших квадратов , метод объединения соседей , метод экономии , метод максимального правдоподобия и байесовский вывод .

Биологи иногда используют термин «экономия» для определенного вида алгоритма генерации кладограммы, а иногда как общий термин для всех филогенетических алгоритмов. ^[15]

Алгоритмы, которые выполняют задачи оптимизации (например, построение кладограмм), могут быть чувствительны к порядку, в котором представлены входные данные (список видов и их характеристики). Ввод данных в разных порядках может привести к тому, что один и тот же алгоритм будет выдавать разные «лучшие» кладограммы. В таких ситуациях пользователь должен вводить данные в разных порядках и сравнивать результаты.

Использование разных алгоритмов на одном наборе данных иногда может приводить к получению разных «лучших» кладограмм, поскольку каждый алгоритм может иметь уникальное определение того, что является «лучшим».

Из-за астрономического числа возможных кладограмм алгоритмы не могут гарантировать, что решение является наилучшим решением в целом. Неоптимальная кладограмма будет выбрана, если программа остановится на локальном минимуме, а не на желаемом глобальном минимуме. ^[16] Чтобы помочь решить эту проблему, многие алгоритмы кладограмм используют подход имитации отжига, чтобы увеличить вероятность того, что выбранная кладограмма является оптимальной. ^[17]

Базальное положение — это направление основания (или корня) укорененного филогенетического дерева или кладограммы. Базальная клада — это самая ранняя клада (данного таксономического ранга[a]), ответвляющаяся в пределах более крупной клады.

Статистика

Тест на разницу в длине несоответствия (или тест на однородность разбиения)

Тест на разницу в длине несоответствия (ILD) — это измерение того, как сочетание различных наборов данных (например, морфологических и молекулярных, пластидных и ядерных генов) способствует более длинному дереву. Он измеряется путем первого расчета общей длины дерева каждого раздела и их суммирования. Затем производятся репликации путем создания случайно собранных разделов, состоящих из исходных разделов. Длины суммируются. Значение p 0,01 получается для 100 репликаций, если 99 репликаций имеют более длинные объединенные длины деревьев.

Измерение гомоплазии

Некоторые меры пытаются измерить количество гомоплазии в наборе данных относительно дерева ^[18], хотя не всегда ясно, какое именно свойство эти меры стремятся количественно оценить ^[19].

Индекс согласованности

Индекс согласованности (CI) измеряет согласованность дерева с набором данных — меру минимального количества гомоплазии, подразумеваемой деревом. ^[20] Он рассчитывается путем подсчета минимального количества изменений в наборе данных и деления его на фактическое количество изменений, необходимых для кладограммы. ^[20] Индекс согласованности также может быть рассчитан для отдельного символа i , обозначаемого c _i .

Помимо отражения количества гомоплазии, метрика также отражает количество таксонов в наборе данных ^[21], (в меньшей степени) количество символов в наборе данных ^[22], степень, в которой каждый символ несет филогенетическую информацию ^[23] , и способ, которым кодируются аддитивные символы, что делает его непригодным для использования по назначению. ^[24]

c _i занимает диапазон от 1 до 1/[ n.taxa /2] в двоичных символах с равномерным распределением состояний; его минимальное значение больше, когда состояния распределены неравномерно. ^[23]^[18] В общем случае для двоичного или недвоичного символа с , c _i занимает диапазон от 1 до . ^[23] $n.states$ $(n.states-1)/(n.taxa-\lceil n.taxa/n.states\rceil )$

Индекс удержания

Индекс сохранения (RI) был предложен как улучшение CI "для определенных приложений" ^[25]. Эта метрика также подразумевает измерение количества гомоплазии, но также измеряет, насколько хорошо синапоморфии объясняют дерево. Он рассчитывается путем взятия (максимального количества изменений на дереве за вычетом количества изменений на дереве) и деления на (максимальное количество изменений на дереве за вычетом минимального количества изменений в наборе данных).

Перемасштабированный индекс согласованности (RC) получается путем умножения CI на RI; по сути, это расширяет диапазон CI таким образом, что его минимальное теоретически достижимое значение перемасштабируется до 0, а его максимальное значение остается на уровне 1. ^[18]^[25] Индекс гомоплазии (HI) просто равен 1 − CI.

Коэффициент избытка гомоплазии

Это измеряет количество гомоплазии, наблюдаемое на дереве, относительно максимального количества гомоплазии, которое теоретически может присутствовать – 1 − (наблюдаемый избыток гомоплазии) / (максимальный избыток гомоплазии). ^[22] Значение 1 указывает на отсутствие гомоплазии; 0 представляет столько гомоплазии, сколько было бы в полностью случайном наборе данных, а отрицательные значения указывают на еще большее количество гомоплазии (и, как правило, встречаются только в надуманных примерах). ^[22] HER представлен как наилучшая доступная в настоящее время мера гомоплазии. ^[18]^[26]

Смотрите также

Ссылки

^ Майр, Эрнст (2009). «Кладистический анализ или кладистическая классификация?». Журнал зоологической систематики и эволюционных исследований . 12 : 94–128. doi : 10.1111/j.1439-0469.1974.tb00160.x .
^ Фут, Майк (весна 1996 г.). «О вероятности предков в ископаемых остатках». Палеобиология . 22 (2): 141–51. doi :10.1017/S0094837300016146. JSTOR 2401114. S2CID 89032582.
^ Дейрат, Бенуа (лето 2005 г.). «Отношения предков и потомков и реконструкция древа жизни». Палеобиология . 31 (3): 347–53. doi :10.1666/0094-8373(2005)031[0347:aratro]2.0.co;2. JSTOR 4096939. S2CID 54988538.
^ ab Посада, Дэвид; Крэндалл, Кит А. (2001). «Внутривидовые генеалогии генов: деревья, прививающиеся в сети». Тенденции в экологии и эволюции . 16 (1): 37–45. doi :10.1016/S0169-5347(00)02026-7. PMID 11146143.
^ Подани, Янош (2013). «Древовидное мышление, время и топология: комментарии по интерпретации древовидных диаграмм в эволюционной/филогенетической систематике» (PDF) . Кладистика . 29 (3): 315–327. doi :10.1111/j.1096-0031.2012.00423.x. PMID 34818822. S2CID 53357985. Архивировано (PDF) из оригинала 21.09.2017.
^ Шух, Рэндалл Т. (2000). Биологическая систематика: принципы и приложения . Издательство Корнеллского университета. ISBN 978-0-8014-3675-8.^{[ нужна страница ]}
^ ДеСалль, Роб (2002). Методы молекулярной систематики и эволюции . Биркхаузер. ISBN 978-3-7643-6257-7.^{[ нужна страница ]}
^ Венцель, Джон В. (1992). «Поведенческая гомология и филогения». Annu. Rev. Ecol. Syst . 23 : 361–381. doi :10.1146/annurev.es.23.110192.002045.
^ Хиллис, Дэвид (1996). Молекулярная систематика . Синаур. ISBN 978-0-87893-282-5.^{[ нужна страница ]}
^ Хенниг, Вилли (1966). Филогенетическая систематика . Издательство Иллинойсского университета.
^ Вест-Эберхард, Мэри Джейн (2003). Пластичность развития и эволюция . Oxford Univ. Press. С. 353–376. ISBN 978-0-19-512235-0.
^ Калерсё, Мари; Альберт, Виктор А.; Фаррис, Джеймс С. (1999). «Гомоплазия увеличивает филогенетическую структуру». Cladistics . 15 : 91–93. doi :10.1111/j.1096-0031.1999.tb00400.x. S2CID 85905559.
^ Брауэр, Эндрю ВЗ (2016). «Что является кладограммой, а что нет?». Cladistics . 32 (5): 573–576. doi : 10.1111/cla.12144 . PMID 34740305. S2CID 85725091.
^ Китчинг, Ян (1998). Кладистика: теория и практика анализа экономии . Oxford University Press. ISBN 978-0-19-850138-1.^{[ нужна страница ]}
^ Стюарт, Каро-Бет (1993). «Силы и подводные камни бережливости». Nature . 361 (6413): 603–7. Bibcode :1993Natur.361..603S. doi :10.1038/361603a0. PMID 8437621. S2CID 4350103.
^ Фоли, Питер (1993). Кладистика: Практический курс систематики. Oxford Univ. Press. стр. 66. ISBN 978-0-19-857766-9.
^ Никсон, Кевин С. (1999). «Храповик экономии, новый метод быстрого анализа экономии». Cladistics . 15 (4): 407–414. doi :10.1111/j.1096-0031.1999.tb00277.x. PMID 34902938. S2CID 85720264.
^ abcd рассмотрено в Archie, James W. (1996). "Measures of Homoplasy". В Sanderson, Michael J.; Hufford, Larry (ред.). Homoplasy . стр. 153–188. doi :10.1016/B978-012618030-5/50008-3. ISBN 9780126180305.
^ Чанг, Джозеф Т.; Ким, Джунхён (1996). «Измерение гомоплазии: стохастический взгляд». Гомоплазия . С. 189–203. doi :10.1016/b978-012618030-5/50009-5. ISBN 9780126180305.
^ ab Kluge, AG; Farris, JS (1969). «Количественная филетика и эволюция бесхвостых амфибий». Systematic Zoology . 18 (1): 1–32. doi :10.2307/2412407. JSTOR 2412407.
^ Арчи, Дж. В.; Фельзенштейн, Дж. (1993). «Число эволюционных шагов на случайных и минимальных по длине деревьях для случайных эволюционных данных». Теоретическая популяционная биология . 43 : 52–79. doi :10.1006/tpbi.1993.1003.
^ abc Archie, JW (1989). «Соотношения избытка гомоплазии: новые индексы для измерения уровней гомоплазии в филогенетической систематике и критика индекса согласованности». Систематическая зоология . 38 (3): 253–269. doi :10.2307/2992286. JSTOR 2992286.
^ abc Hoyal Cuthill, Jennifer F.; Braddy, Simon J.; Donoghue, Philip CJ (2010). "Формула для максимально возможных шагов в многосостояниях признаков: изоляция эффектов параметров матрицы на меры эволюционной конвергенции". Cladistics . 26 (1): 98–102. doi : 10.1111/j.1096-0031.2009.00270.x . PMID 34875753. S2CID 53320612.
^ Сандерсон, М.Дж.; Донохью, М.Дж. (1989). «Закономерности вариаций в уровнях гомоплазии». Эволюция . 43 (8): 1781–1795. doi :10.2307/2409392. JSTOR 2409392. PMID 28564338.
^ ab Farris, JS (1989). «Индекс удержания и перемасштабированный индекс согласованности». Cladistics . 5 (4): 417–419. doi :10.1111/j.1096-0031.1989.tb00573.x. PMID 34933481. S2CID 84287895.
^ Хойал Катхилл, Дженнифер (2015). «Размер пространства состояний признаков влияет на возникновение и обнаружение гомоплазии: моделирование вероятности несовместимости для неупорядоченных филогенетических признаков». Журнал теоретической биологии . 366 : 24–32. Bibcode : 2015JThBi.366...24H. doi : 10.1016/j.jtbi.2014.10.033. PMID 25451518.

Внешние ссылки

Медиафайлы по теме «Кладограммы» на Wikimedia Commons