Байесовский вывод филогении объединяет информацию в априорной вероятности и в правдоподобии данных для создания так называемой апостериорной вероятности деревьев, которая является вероятностью того, что дерево является правильным с учетом данных, априорной вероятности и модели правдоподобия. Байесовский вывод был введен в молекулярную филогенетику в 1990-х годах тремя независимыми группами: Брюсом Ранналой и Цзихэном Яном в Беркли [1] [2] Бобом Мау в Мэдисоне [3] и Шуйин Ли в Университете Айовы [4] , последние двое в то время были аспирантами. Этот подход стал очень популярным с момента выпуска программного обеспечения MrBayes в 2001 году [5] и в настоящее время является одним из самых популярных методов в молекулярной филогенетике.
Байесовский вывод о филогенетических предпосылках и основах
Байесовский вывод относится к вероятностному методу, разработанному преподобным Томасом Байесом на основе теоремы Байеса . Опубликованная посмертно в 1763 году, она была первым выражением обратной вероятности и основой байесовского вывода. Независимо, не зная о работе Байеса, Пьер-Симон Лаплас разработал теорему Байеса в 1774 году. [6]
Байесовский вывод или метод обратной вероятности был стандартным подходом в статистическом мышлении до начала 1900-х годов, пока RA Fisher не разработал то, что сейчас известно как классический/частотный/фишеровский вывод. Вычислительные трудности и философские возражения препятствовали широкому принятию байесовского подхода до 1990-х годов, когда алгоритмы Монте-Карло с цепями Маркова (MCMC) произвели революцию в байесовских вычислениях.
Байесовский подход к филогенетической реконструкции объединяет априорную вероятность дерева P(A) с вероятностью данных (B) для получения апостериорного распределения вероятностей на деревьях P(A|B). [7] Апостериорная вероятность дерева будет вероятностью того, что дерево является правильным, учитывая априорную вероятность, данные и правильность модели правдоподобия.
Методы MCMC можно описать в три этапа: во-первых, используя стохастический механизм, предлагается новое состояние для цепи Маркова . Во-вторых, вычисляется вероятность того, что это новое состояние будет правильным. В-третьих, предлагается новая случайная величина (0,1). Если это новое значение меньше вероятности принятия, то новое состояние принимается, и состояние цепи обновляется. Этот процесс выполняется тысячи или миллионы раз. Количество посещений одного дерева в ходе цепочки является приближением его апостериорной вероятности. Некоторые из наиболее распространенных алгоритмов, используемых в методах MCMC, включают алгоритмы Метрополиса–Гастингса, Метрополис-связующий MCMC (MC³) и алгоритм LOCAL Ларже и Саймона.
Алгоритм Метрополиса–Гастингса
Одним из наиболее распространенных методов MCMC является алгоритм Метрополиса–Гастингса , [8] модифицированная версия оригинального алгоритма Метрополиса. [9] Это широко используемый метод для случайной выборки из сложных и многомерных вероятностей распределения. Алгоритм Метрополиса описывается следующими шагами: [10] [11]
Начальное дерево T i выбирается случайным образом.
Из коллекции деревьев выбирается соседнее дерево T j .
Отношение R вероятностей (или функций плотности вероятности) T j и T i вычисляется следующим образом: R = f(T j )/f(T i )
Если R ≥ 1, то T j принимается в качестве текущего дерева.
Если R < 1, то T j принимается в качестве текущего дерева с вероятностью R, в противном случае сохраняется T i .
На этом этапе процесс повторяется с шага 2 N раз.
Алгоритм продолжает работать до тех пор, пока не достигнет равновесного распределения. Он также предполагает, что вероятность предложения нового дерева T j , когда мы находимся в старом состоянии дерева T i , равна вероятности предложения T i , когда мы находимся в T j . Если это не так, применяются поправки Гастингса. Цель алгоритма Метрополиса-Гастингса — создать набор состояний с определенным распределением, пока марковский процесс не достигнет стационарного распределения. Алгоритм состоит из двух компонентов:
Потенциальный переход из одного состояния в другое (i → j) с использованием функции вероятности перехода q i,j
Движение цепи в состояние j с вероятностью α i,j и сохранение в i с вероятностью 1 – α i,j . [2]
MCMC, связанный с метрополией
Алгоритм MCMC, связанный с Метрополисом (MC³) [12], был предложен для решения практической проблемы перемещения цепи Маркова через пики, когда целевое распределение имеет несколько локальных пиков, разделенных низкими долинами, которые, как известно, существуют в пространстве дерева. Это имеет место во время эвристического поиска по дереву по критериям максимальной экономии (MP), максимального правдоподобия (ML) и минимальной эволюции (ME), и то же самое можно ожидать для стохастического поиска по дереву с использованием MCMC. Эта проблема приведет к тому, что выборки не будут правильно приближаться к апостериорной плотности. (MC³) улучшает смешивание цепей Маркова при наличии нескольких локальных пиков в апостериорной плотности. Он запускает несколько (m) цепей параллельно, каждая для n итераций и с различными стационарными распределениями , , где первое, является целевой плотностью, в то время как , выбираются для улучшения смешивания. Например, можно выбрать инкрементный нагрев в форме:
так что первая цепь является холодной цепью с правильной целевой плотностью, в то время как цепи являются нагретыми цепями. Обратите внимание, что повышение плотности до степени с имеет эффект выравнивания распределения, аналогичного нагреванию металла. В таком распределении легче перемещаться между пиками (разделенными долинами), чем в исходном распределении. После каждой итерации предлагается обмен состояниями между двумя случайно выбранными цепями через шаг типа Метрополиса. Пусть будет текущим состоянием в цепи , . Обмен между состояниями цепей и принимается с вероятностью:
В конце прогона используются выходные данные только холодной цепи, в то время как выходные данные горячих цепей отбрасываются. Эвристически горячие цепи будут довольно легко посещать локальные пики, а обмен состояниями между цепями позволит холодной цепи иногда перескакивать через долины, что приведет к лучшему смешиванию. Однако, если нестабильна, предлагаемые обмены будут редко приниматься. Это причина использования нескольких цепей, которые отличаются только инкрементно.
Очевидным недостатком алгоритма является то, что цепочки запускаются, и только одна цепочка используется для вывода. По этой причине идеально подходит для реализации на параллельных машинах, поскольку каждая цепочка в целом потребует одинакового количества вычислений на итерацию.
ЛОКАЛЬНЫЙ алгоритм Ларже и Саймона
Алгоритмы LOCAL [13] предлагают вычислительное преимущество по сравнению с предыдущими методами и демонстрируют, что байесовский подход способен оценивать неопределенность с практической точки зрения в более крупных деревьях. Алгоритм LOCAL является усовершенствованием алгоритма GLOBAL, представленного в работе Mau, Newton и Larget (1999) [14] , в котором все длины ветвей изменяются в каждом цикле. Алгоритмы LOCAL изменяют дерево, выбирая внутреннюю ветвь дерева случайным образом. Узлы на концах этой ветви соединены с двумя другими ветвями. Один из каждой пары выбирается случайным образом. Представьте себе, что вы берете эти три выбранных ребра и натягиваете их как бельевую веревку слева направо, где направление (влево/вправо) также выбирается случайным образом. Две конечные точки первой выбранной ветви будут иметь поддерево, висящее как кусок одежды, натянутый на веревку. Алгоритм действует путем умножения трех выбранных ветвей на общую случайную величину, сродни растяжению или сжатию бельевой веревки. Наконец, самое левое из двух висящих поддеревьев отсоединяется и снова прикрепляется к бельевой веревке в месте, выбранном равномерно и случайно. Это будет дерево-кандидат.
Предположим, что мы начали с выбора внутренней ветви длиной , которая отделяет таксоны и от остальных. Предположим также, что мы (случайным образом) выбрали ветви длиной и с каждой стороны, и что мы сориентировали эти ветви. Пусть , будет текущей длиной бельевой веревки. Мы выбираем новую длину , где — равномерная случайная величина на . Тогда для алгоритма LOCAL вероятность принятия может быть вычислена как:
Оценка конвергенции
Чтобы оценить длину ветви 2-таксонного дерева в JC, в котором сайты неизменны и изменчивы, предположим экспоненциальное априорное распределение со скоростью . Плотность равна . Вероятности возможных шаблонов сайтов следующие:
для неизменных участков, и
Таким образом, ненормализованное апостериорное распределение имеет вид:
или, альтернативно,
Обновить длину ветви, выбрав новое значение равномерно случайным образом из окна полуширины, центрированного на текущем значении:
где равномерно распределено между и . Вероятность принятия равна:
Пример: , . Мы сравним результаты для двух значений , и . В каждом случае мы начнем с начальной длины и обновим длину по временам.
Максимальная экономия и максимальное правдоподобие
Существует множество подходов к реконструкции филогенетических деревьев, каждый из которых имеет свои преимущества и недостатки, и нет однозначного ответа на вопрос «какой метод лучше?». Максимальная экономия (MP) и максимальное правдоподобие (ML) являются традиционными методами, широко используемыми для оценки филогений, и оба используют информацию о символах напрямую, как и байесовские методы.
Максимальная экономичность восстанавливает одно или несколько оптимальных деревьев на основе матрицы дискретных признаков для определенной группы таксонов и не требует модели эволюционных изменений. MP дает наиболее простое объяснение для заданного набора данных, реконструируя филогенетическое дерево, которое включает как можно меньше изменений в последовательностях. Поддержка ветвей дерева представлена процентом бутстрепа . По той же причине, по которой он широко использовался, своей простотой, MP также подвергся критике и был отодвинут на задний план методами машинного обучения и байесовскими методами. MP представляет несколько проблем и ограничений. Как показал Фельзенштейн (1978), MP может быть статистически непоследовательным, [15] что означает, что по мере накопления все большего количества данных (например, длины последовательности) результаты могут сходиться на неправильном дереве и приводить к притяжению длинных ветвей , филогенетическому явлению, когда таксоны с длинными ветвями (многочисленные изменения состояний признаков) имеют тенденцию казаться более тесно связанными в филогении, чем они есть на самом деле. Для морфологических данных недавние исследования моделирования показывают, что экономия может быть менее точной, чем деревья, построенные с использованием байесовских подходов, [16] возможно, из-за чрезмерной точности, [17] хотя это и оспаривается. [18] Исследования с использованием новых методов моделирования продемонстрировали, что различия между методами вывода являются результатом стратегии поиска и используемого метода консенсуса, а не используемой оптимизации. [19]
Как и в случае максимальной экономии, максимальное правдоподобие будет оценивать альтернативные деревья. Однако он учитывает вероятность того, что каждое дерево объясняет заданные данные на основе модели эволюции. В этом случае выбирается дерево с наибольшей вероятностью объяснения данных среди других. [20] Другими словами, он сравнивает, как разные деревья предсказывают наблюдаемые данные. Введение модели эволюции в анализы ML дает преимущество перед MP, поскольку учитываются вероятность нуклеотидных замен и скорости этих замен, что объясняет филогенетические связи таксонов более реалистичным образом. Важным соображением этого метода является длина ветви, которую экономия игнорирует, при этом изменения с большей вероятностью происходят вдоль длинных ветвей, чем вдоль коротких. Этот подход может устранить притяжение длинных ветвей и объяснить большую согласованность ML по сравнению с MP. Хотя многие считают его лучшим подходом к выводу филогений с теоретической точки зрения, ML требует больших вычислительных затрат, и практически невозможно исследовать все деревья, поскольку их слишком много. Байесовский вывод также включает в себя модель эволюции, и его основные преимущества перед MP и МО заключаются в том, что он более эффективен с вычислительной точки зрения, чем традиционные методы, он количественно оценивает и устраняет источник неопределенности, а также способен включать в себя сложные модели эволюции.
Подводные камни и противоречия
Значения бутстрепа против апостериорных вероятностей. Было замечено, что значения поддержки бутстрепа, рассчитанные с помощью экономии или максимального правдоподобия, имеют тенденцию быть ниже, чем апостериорные вероятности, полученные с помощью байесовского вывода. [21] [22] [23] [24] [25] Это приводит к ряду вопросов, таких как: приводят ли апостериорные вероятности к чрезмерной уверенности в результатах? [26] Являются ли значения бутстрепа более надежными, чем апостериорные вероятности? Одним из фактов, лежащих в основе этого противоречия, является то, что все данные используются во время байесовского анализа и расчета апостериорных вероятностей, в то время как природа бутстрепа означает, что в большинстве реплик бутстрепа будут отсутствовать некоторые исходные данные. В результате двураздельные части (ветви), поддерживаемые относительно небольшим количеством символов в наборе данных, могут получить очень высокие апостериорные вероятности, но умеренную или даже низкую поддержку бутстрепа, поскольку многие реплики бутстрепа не содержат достаточного количества критических символов для получения двураздельной части.
Противоречие использования априорных вероятностей. Использование априорных вероятностей для байесовского анализа многими рассматривалось как преимущество, поскольку оно обеспечивает способ включения информации из источников, отличных от анализируемых данных. Однако, когда такая внешняя информация отсутствует, приходится использовать априорную, даже если невозможно использовать статистическое распределение для представления полного невежества. Также вызывает беспокойство то, что байесовские апостериорные вероятности могут отражать субъективные мнения, когда априорная вероятность произвольна и субъективна.
Выбор модели. Результаты байесовского анализа филогении напрямую коррелируют с выбранной моделью эволюции, поэтому важно выбрать модель, которая соответствует наблюдаемым данным, в противном случае выводы в филогении будут ошибочными. Многие ученые поднимали вопросы об интерпретации байесовского вывода, когда модель неизвестна или неверна. Например, чрезмерно упрощенная модель может давать более высокие апостериорные вероятности. [21] [27]
Программное обеспечение MrBayes
MrBayes — это бесплатный программный инструмент, который выполняет байесовский вывод филогении. Первоначально он был написан Джоном П. Хюльзенбеком и Фредериком Ронквистом в 2001 году . [28] По мере роста популярности байесовских методов MrBayes стал одним из программных продуктов, которые выбирают многие специалисты по молекулярной филогенетике. Он предлагается для операционных систем Macintosh, Windows и UNIX и имеет интерфейс командной строки. Программа использует стандартный алгоритм MCMC, а также связанный с Metropolis вариант MCMC. MrBayes считывает выровненные матрицы последовательностей (ДНК или аминокислот) в стандартном формате NEXUS . [29]
MrBayes использует MCMC для аппроксимации апостериорных вероятностей деревьев. [9] Пользователь может изменять предположения модели замены, априорные данные и детали анализа MC³. Он также позволяет пользователю удалять и добавлять таксоны и символы в анализ. Программа включает, среди нескольких нуклеотидных моделей, самую стандартную модель замены ДНК, 4x4, также называемую JC69, которая предполагает, что изменения между нуклеотидами происходят с равной вероятностью. [30] Он также реализует ряд 20x20 моделей замены аминокислот и кодонных моделей замены ДНК. Он предлагает различные методы для ослабления предположения о равных скоростях замен по всем нуклеотидным сайтам. [31] MrBayes также может выводить предковые состояния, приспосабливаясь к неопределенности филогенетического дерева и параметров модели.
MrBayes 3 [32] был полностью реорганизованной и реструктурированной версией оригинального MrBayes. Главной новинкой была способность программного обеспечения учитывать неоднородность наборов данных. Эта новая структура позволяет пользователю смешивать модели и использовать преимущества эффективности байесовского анализа MCMC при работе с различными типами данных (например, белковыми, нуклеотидными и морфологическими). По умолчанию он использует Metropolis-Coupling MCMC.
MrBayes 3.2 был выпущен в 2012 году [33] Новая версия позволяет пользователям запускать несколько анализов параллельно. Она также обеспечивает более быстрые вычисления правдоподобия и позволяет делегировать эти вычисления графическим процессорам (GPU). Версия 3.2 предоставляет более широкие возможности вывода, совместимые с FigTree и другими просмотрщиками деревьев.
Список программного обеспечения для филогенетики
В этой таблице приведены некоторые из наиболее распространенных программ филогенетического анализа, используемых для вывода филогений в рамках байесовского подхода. Некоторые из них не используют исключительно байесовские методы.
Приложения
Байесовский вывод широко использовался молекулярными филогенетиками для широкого круга приложений. Некоторые из них включают:
Вывод филогений. [43] [44]
Вывод и оценка неопределенности филогений. [45]
Вывод об эволюции предкового состояния характера. [46] [47]
Вывод о предковых территориях. [48]
Молекулярный анализ датирования. [49] [50]
Модель динамики видового разнообразия и вымирания [51]
Выяснить закономерности распространения патогенов. [52]
Вывод об эволюции фенотипических признаков. [53] [54]
Ссылки
^ Раннала, Брюс; Ян, Цзихэн (сентябрь 1996 г.). «Распределение вероятностей молекулярных эволюционных деревьев: новый метод филогенетического вывода». Журнал молекулярной эволюции . 43 (3): 304–311. Bibcode : 1996JMolE..43..304R. doi : 10.1007/BF02338839. PMID 8703097. S2CID 8269826.
^ ab Yang, Z.; Rannala, B. (1 июля 1997 г.). «Байесовский филогенетический вывод с использованием последовательностей ДНК: метод Монте-Карло с использованием цепей Маркова». Молекулярная биология и эволюция . 14 (7): 717–724. doi : 10.1093/oxfordjournals.molbev.a025811 . PMID 9214744.
^ Мау, Боб; Ньютон, Майкл А.; Ларже, Брет (март 1999 г.). «Байесовский филогенетический вывод с помощью методов Монте-Карло на основе цепей Маркова». Биометрия . 55 (1): 1–12. doi : 10.1111/j.0006-341x.1999.00001.x . JSTOR 2533889. PMID 11318142. S2CID 932887.
^ Ли, Шуйин; Перл, Деннис К.; Досс, Хани (июнь 2000 г.). «Построение филогенетического дерева с использованием метода Монте-Карло с цепями Маркова». Журнал Американской статистической ассоциации . 95 (450): 493–508. doi :10.1080/01621459.2000.10474227. JSTOR 2669394. S2CID 122459537.
^ Хюльзенбек, Дж. П.; Ронквист, Ф. (1 августа 2001 г.). «MRBAYES: байесовский вывод филогенетических деревьев». Биоинформатика . 17 (8): 754–755. doi : 10.1093/bioinformatics/17.8.754 . PMID 11524383.
^ Лаплас П. (1774). «Memoire sur la Probabilite des Causes par les Evenements». Королевская академия наук . 6 : 621–656. НАИД 10010866843.Перевод на английский язык: Stigler SM (1986). «Мемуары о вероятности причин событий». Статистическая наука . 1 (3): 359–378. doi : 10.1214/ss/1177013620 .
^ Насименто, Фабрисия Ф.; Рейс, Марио дос; Ян, Цзыхэн (октябрь 2017 г.). «Руководство биолога по байесовскому филогенетическому анализу». Экология и эволюция природы . 1 (10): 1446–1454. Бибкод : 2017NatEE...1.1446N. дои : 10.1038/s41559-017-0280-x. ПМК 5624502 . ПМИД 28983516.
^ Hastings WK (апрель 1970 г.). «Методы выборки Монте-Карло с использованием цепей Маркова и их приложения». Biometrika . 57 (1): 97–109. Bibcode : 1970Bimka..57...97H. doi : 10.1093/biomet/57.1.97.
^ ab Metropolis N, Rosenbluth AW, Rosenbluth MN, Teller AH, Teller E (июнь 1953 г.). «Вычисления уравнений состояния на быстрых вычислительных машинах». Журнал химической физики . 21 (6): 1087–92. Bibcode : 1953JChPh..21.1087M. doi : 10.1063/1.1699114. OSTI 4390578. S2CID 1046577.
^ Yang Z (2014). Молекулярная эволюция: статистический подход . Оксфорд, Англия: Oxford University Press.
^ Geyer CJ (1991). "Марковская цепь Монте-Карло максимальное правдоподобие". В Keramidas EM, Kaufman SM (ред.). Computing Science and Statistics: Proceedings of the 23rd Symposium on the Interface . Fairfax Station: Interface Foundation. стр. 156–163. OCLC 26603816.
^ Ларджет Б., Саймон Д. Л. (июнь 1999 г.). «Марковские цепные алгоритмы Монте-Карло для байесовского анализа филогенетических деревьев». Молекулярная биология и эволюция . 16 (6): 750–9. doi : 10.1093/oxfordjournals.molbev.a026160 .
^ Mau B, Newton MA, Larget B (март 1999). «Байесовский филогенетический вывод с помощью методов Монте-Карло на основе цепей Маркова». Биометрия . 55 (1): 1–12. doi : 10.1111/j.0006-341x.1999.00001.x . PMID 11318142. S2CID 932887.
^ Felsenstein J (декабрь 1978 г.). «Случаи, в которых методы экономии или совместимости будут определенно вводящими в заблуждение». Systematic Zoology . 27 (4): 401–10. doi :10.1093/sysbio/27.4.401.
^ Касторани MC, Рид DC, Раймонди PT, Альберто F, Белл TW, Кавано KC и др. (январь 2017 г.). «Колебания плодовитости популяции обусловливают изменчивость демографической связанности и динамику метапопуляции». Труды. Биологические науки . 284 (1847): 20162086. doi :10.1098/rspb.2016.2086. PMC 5310032. PMID 28123088 .
^ O'Reilly JE, Puttick MN, Parry L, Tanner AR, Tarver JE, Fleming J, Pisani D, Donoghue PC (апрель 2016 г.). «Байесовские методы превосходят экономичность, но за счет точности в оценке филогении по дискретным морфологическим данным». Biology Letters . 12 (4): 20160081. doi :10.1098/rsbl.2016.0081. PMC 4881353 . PMID 27095266.
^ Goloboff PA, Torres A, Arias JS (2018). «Взвешенная экономия превосходит другие методы филогенетического вывода в моделях, подходящих для морфологии». Cladistics . 34 (4): 407–437. doi : 10.1111/cla.12205 . hdl : 11336/57822 . ISSN 0748-3007. PMID 34649370.
^ Keating JN, Sansom RS, Sutton MD, Knight CG, Garwood RJ (февраль 2020 г.). «Морфологическая филогенетика, оцененная с использованием новых эволюционных симуляций». Systematic Biology . 69 (5): 897–912. doi : 10.1093/sysbio/syaa012 . PMC 7440746. PMID 32073641 .
^ Swofford DL, Olsen GJ, Waddell PJ, Hillis DM (1996). «Филогенетический вывод». В Hillis DM, Moritz C, Mable BK (ред.). Молекулярная систематика, 2-е издание . Sunderland, MA: Sinauer. стр. 407–514. ISBN9780878932825.
^ ab Suzuki Y, Glazko GV, Nei M (декабрь 2002 г.). «Излишняя достоверность молекулярных филогений, полученных с помощью байесовской филогенетики». Труды Национальной академии наук Соединенных Штатов Америки . 99 (25): 16138–43. Bibcode :2002PNAS...9916138S. doi : 10.1073/pnas.212646199 . PMC 138578 . PMID 12451182.
^ Альфаро М. Э., Золлер С., Лутцони Ф. (февраль 2003 г.). «Байес или бутстрап? Исследование моделирования, сравнивающее эффективность выборки Монте-Карло байесовской цепи Маркова и бутстрапа при оценке филогенетической достоверности». Молекулярная биология и эволюция . 20 (2): 255–66. doi : 10.1093/molbev/msg028 . PMID 12598693.
^ Douady CJ, Delsuc F, Boucher Y, Doolittle WF, Douzery EJ (февраль 2003 г.). «Сравнение байесовских и максимально правдоподобных бутстрап-мер филогенетической надежности». Молекулярная биология и эволюция . 20 (2): 248–54. doi : 10.1093/molbev/msg042 . PMID 12598692.
^ Гарсия-Сандовал Р. (январь 2014 г.). «Почему некоторые клады имеют низкие частоты бутстрепа и высокие байесовские апостериорные вероятности». Israel Journal of Ecology & Evolution . 60 (1): 41–4. doi :10.1080/15659801.2014.937900.
^ Yang, Z. (18 апреля 2007 г.). «Парадокс справедливого баланса, парадокс звездного дерева и байесовская филогенетика». Молекулярная биология и эволюция . 24 (8): 1639–1655. doi : 10.1093/molbev/msm081 . PMID 17488737.
^ Ян, Цзихэн; Чжу, Тяньци (20 февраля 2018 г.). «Байесовский выбор неверно определенных моделей является излишне самонадеянным и может привести к ложным апостериорным вероятностям для филогенетических деревьев». Труды Национальной академии наук . 115 (8): 1854–1859. Bibcode : 2018PNAS..115.1854Y. doi : 10.1073/pnas.1712673115 . PMC 5828583. PMID 29432193 .
^ Эриксон П., Свенблад Б., Бриттон Т., Оксельман Б. (октябрь 2003 г.). «Надежность байесовских апостериорных вероятностей и частот бутстрапа в филогенетике». Systematic Biology . 52 (5): 665–73. doi : 10.1080/10635150390235485 . PMID 14530133.
^ Huelsenbeck JP, Ronquist F (август 2001 г.). «MRBAYES: байесовский вывод филогенетических деревьев». Биоинформатика . 17 (8). Оксфорд, Англия: 754–5. doi : 10.1093/bioinformatics/17.8.754 . PMID 11524383.
^ Maddison DR, Swofford DL, Maddison WP (декабрь 1997 г.). «NEXUS: расширяемый формат файла для систематической информации». Systematic Biology . 46 (4): 590–621. doi : 10.1093/sysbio/46.4.590 . PMID 11975335.
^ Jukes TH, Cantor CR (1969). Эволюция белковых молекул . Нью-Йорк: Academic Press. С. 21–132.
^ Yang Z (ноябрь 1993 г.). «Оценка максимального правдоподобия филогении из последовательностей ДНК, когда скорости замены различаются по сайтам». Молекулярная биология и эволюция . 10 (6): 1396–401. doi : 10.1093/oxfordjournals.molbev.a040082 . PMID 8277861.
^ Ronquist F, Huelsenbeck JP (август 2003 г.). «MrBayes 3: Байесовский филогенетический вывод в смешанных моделях». Биоинформатика . 19 (12). Оксфорд, Англия: 1572–4. doi : 10.1093/bioinformatics/btg180 . PMID 12912839.
^ Ronquist F, Teslenko M, van der Mark P, Ayres DL, Darling A, Höhna S, Larget B, Liu L, Suchard MA, Huelsenbeck JP (май 2012 г.). «MrBayes 3.2: эффективный байесовский филогенетический вывод и выбор модели в большом модельном пространстве». Systematic Biology . 61 (3): 539–42. doi :10.1093/sysbio/sys029. PMC 3329765 . PMID 22357727.
^ Drummond AJ, Suchard MA, Xie D, Rambaut A (август 2012 г.). «Байесовская филогенетика с BEAUti и BEAST 1.7». Молекулярная биология и эволюция . 29 (8): 1969–73. doi :10.1093/molbev/mss075. PMC 3408070. PMID 22367748 .
^ Bouckaert R, Heled J, Kühnert D, Vaughan T, Wu CH, Xie D, Suchard MA, Rambaut A, Drummond AJ (апрель 2014 г.). "BEAST 2: программная платформа для байесовского эволюционного анализа". PLOS Computational Biology . 10 (4): e1003537. Bibcode : 2014PLSCB..10E3537B. doi : 10.1371/journal.pcbi.1003537 . PMC 3985171. PMID 24722319 .
^ Lartillot N, Philippe H (июнь 2004 г.). «Модель байесовской смеси для гетерогенностей между сайтами в процессе замены аминокислот». Молекулярная биология и эволюция . 21 (6): 1095–109. doi : 10.1093/molbev/msh112 . PMID 15014145.
^ Suchard MA, Redelings BD (август 2006 г.). «BAli-Phy: одновременный байесовский вывод выравнивания и филогении». Биоинформатика . 22 (16): 2047–8. doi : 10.1093/bioinformatics/btl175 . PMID 16679334.
^ Ané C , Larget B, Baum DA, Smith SD, Rokas A (февраль 2007 г.). «Байесовская оценка согласованности среди генных деревьев». Молекулярная биология и эволюция . 24 (2): 412–26. doi : 10.1093/molbev/msl170 . PMID 17095535.
^ Wilson IJ, Weale ME, Balding DJ (июнь 2003 г.). «Выводы из данных ДНК: истории популяций, эволюционные процессы и вероятности судебного соответствия». Журнал Королевского статистического общества, серия A (Статистика в обществе) . 166 (2): 155–88. doi : 10.1111/1467-985X.00264 .
^ Pagel M, Meade A (июнь 2006 г.). «Байесовский анализ коррелированной эволюции дискретных признаков методом Монте-Карло с обратимым скачком цепи Маркова». The American Naturalist . 167 (6): 808–25. doi :10.1086/503444. PMID 16685633. S2CID 205984494.
^ Лорд Э., Леклерк М., Бок А., Диалло АБ., Макаренков В. (2012). «Armadillo 1.1: оригинальная платформа рабочего процесса для проектирования и проведения филогенетического анализа и моделирования». PLOS ONE . 7 (1): e29903. Bibcode : 2012PLoSO...729903L. doi : 10.1371/journal.pone.0029903 . PMC 3256230. PMID 22253821 .
^ Milne I, Lindner D, Bayer M, Husmeier D, McGuire G, Marshall DF, Wright F (январь 2009 г.). "TOPALi v2: богатый графический интерфейс для эволюционного анализа множественных выравниваний на кластерах HPC и многоядерных настольных компьютерах". Bioinformatics . 25 (1): 126–7. doi :10.1093/bioinformatics/btn575. PMC 2638937 . PMID 18984599.
^ Алонсо Р., Кроуфорд А.Дж., Бермингем Э. (март 2012 г.). «Молекулярная филогения эндемичной радиации кубинских жаб (Bufonidae: Peltophryne) на основе митохондриальных и ядерных генов». Журнал биогеографии . 39 (3): 434–51. Bibcode : 2012JBiog..39..434A. doi : 10.1111/j.1365-2699.2011.02594.x. S2CID 4152245.
^ Антонелли А, Санмартин I (октябрь 2011 г.). «Массовое вымирание, постепенное похолодание или быстрая радиация? Реконструкция пространственно-временной эволюции древнего рода покрытосеменных Hedyosmum (Chloranthaceae) с использованием эмпирических и имитационных подходов». Systematic Biology . 60 (5): 596–615. doi : 10.1093/sysbio/syr062 . hdl : 10261/34829 . PMID 21856636.
^ de Villemereuil P, Wells JA, Edwards RD, Blomberg SP (июнь 2012 г.). «Байесовские модели для сравнительного анализа, интегрирующие филогенетическую неопределенность». BMC Evolutionary Biology . 12 (1): 102. Bibcode :2012BMCEE..12..102V. doi : 10.1186/1471-2148-12-102 . PMC 3582467 . PMID 22741602.
^ Ронквист Ф. (сентябрь 2004 г.). «Байесовский вывод об эволюции признаков». Тенденции в экологии и эволюции . 19 (9): 475–81. doi :10.1016/j.tree.2004.07.002. PMID 16701310.
^ Schäffer S, Koblmüller S, Pfingstl T, Sturmbauer C, Krisper G (август 2010 г.). «Реконструкция предкового состояния выявляет множественную независимую эволюцию диагностических морфологических признаков у «высших орибатид» (Acari), что противоречит текущим схемам классификации». BMC Evolutionary Biology . 10 (1): 246. Bibcode :2010BMCEE..10..246S. doi : 10.1186/1471-2148-10-246 . PMC 2930640 . PMID 20701742.
^ Филипович Н., Реннер СС (июль 2012 г.). «Брунфельсия (Пасленовые): род, поровну разделенный между Южной Америкой и радиацией на Кубе и других Антильских островах». Молекулярная филогенетика и эволюция . 64 (1): 1–11. Бибкод : 2012MolPE..64....1F. doi :10.1016/j.ympev.2012.02.026. ПМИД 22425729.
^ Bacon CD, Baker WJ, Simmons MP (май 2012). «Миоценовое рассеивание приводит к островной радиации в пальмовом трибе Trachycarpeae (Arecaceae)». Systematic Biology . 61 (3): 426–42. doi : 10.1093/sysbio/syr123 . PMID 22223444.
^ Särkinen T, Bohs L, Olmstead RG, Knapp S (сентябрь 2013 г.). "Филогенетические рамки для эволюционного изучения пасленовых (Solanaceae): датированное 1000-вершинное дерево". BMC Evolutionary Biology . 13 (1): 214. Bibcode :2013BMCEE..13..214S. doi : 10.1186/1471-2148-13-214 . PMC 3850475 . PMID 24283922.
^ Silvestro D, Schnitzler J, Liow LH, Antonelli A, Salamin N (май 2014 г.). «Байесовская оценка видообразования и вымирания по неполным данным о местонахождении ископаемых». Systematic Biology . 63 (3): 349–67. doi :10.1093/sysbio/syu006. PMC 4361715 . PMID 24510972.
^ Lemey P, Rambaut A, Drummond AJ, Suchard MA (сентябрь 2009 г.). «Байесовская филогеография находит свои корни». PLOS Computational Biology . 5 (9): e1000520. Bibcode : 2009PLSCB...5E0520L. doi : 10.1371/journal.pcbi.1000520 . PMC 2740835. PMID 19779555 .
^ Cybis G, Sinsheimer J, Bedford T, Mather A, Lemey P, Suchard MA (2015). «Оценка фенотипической корреляции с помощью многомерной филогенетической модели латентной ответственности». Annals of Applied Statistics . 9 (2): 969–991. doi : 10.1214/15-AOAS821. ISSN 1932-6157. PMC 4820077. PMID 27053974 .
^ Tolkoff M, Alfaro M, Baele G, Lemey P, Suchard MA (2018). «Анализ филогенетического фактора». Systematic Biology . 67 (3): 384–399. doi :10.1093/sysbio/syx066. ISSN 1063-5157. PMC 5920329. PMID 28950376 .