stringtranslate.com

Байесовский вывод в филогении

Байесовский вывод филогении объединяет информацию в априорной вероятности и в правдоподобии данных для создания так называемой апостериорной вероятности деревьев, которая является вероятностью того, что дерево является правильным с учетом данных, априорной вероятности и модели правдоподобия. Байесовский вывод был введен в молекулярную филогенетику в 1990-х годах тремя независимыми группами: Брюсом Ранналой и Цзихэном Яном в Беркли [1] [2] Бобом Мау в Мэдисоне [3] и Шуйин Ли в Университете Айовы [4] , последние двое в то время были аспирантами. Этот подход стал очень популярным с момента выпуска программного обеспечения MrBayes в 2001 году [5] и в настоящее время является одним из самых популярных методов в молекулярной филогенетике.

Байесовский вывод о филогенетических предпосылках и основах

Теорема Байеса
Метафора, иллюстрирующая шаги метода MCMC

Байесовский вывод относится к вероятностному методу, разработанному преподобным Томасом Байесом на основе теоремы Байеса . Опубликованная посмертно в 1763 году, она была первым выражением обратной вероятности и основой байесовского вывода. Независимо, не зная о работе Байеса, Пьер-Симон Лаплас разработал теорему Байеса в 1774 году. [6]

Байесовский вывод или метод обратной вероятности был стандартным подходом в статистическом мышлении до начала 1900-х годов, пока RA Fisher не разработал то, что сейчас известно как классический/частотный/фишеровский вывод. Вычислительные трудности и философские возражения препятствовали широкому принятию байесовского подхода до 1990-х годов, когда алгоритмы Монте-Карло с цепями Маркова (MCMC) произвели революцию в байесовских вычислениях.

Байесовский подход к филогенетической реконструкции объединяет априорную вероятность дерева P(A) с вероятностью данных (B) для получения апостериорного распределения вероятностей на деревьях P(A|B). [7] Апостериорная вероятность дерева будет вероятностью того, что дерево является правильным, учитывая априорную вероятность, данные и правильность модели правдоподобия.

Методы MCMC можно описать в три этапа: во-первых, используя стохастический механизм, предлагается новое состояние для цепи Маркова . Во-вторых, вычисляется вероятность того, что это новое состояние будет правильным. В-третьих, предлагается новая случайная величина (0,1). Если это новое значение меньше вероятности принятия, то новое состояние принимается, и состояние цепи обновляется. Этот процесс выполняется тысячи или миллионы раз. Количество посещений одного дерева в ходе цепочки является приближением его апостериорной вероятности. Некоторые из наиболее распространенных алгоритмов, используемых в методах MCMC, включают алгоритмы Метрополиса–Гастингса, Метрополис-связующий MCMC (MC³) и алгоритм LOCAL Ларже и Саймона.

Алгоритм Метрополиса–Гастингса

Одним из наиболее распространенных методов MCMC является алгоритм Метрополиса–Гастингса , [8] модифицированная версия оригинального алгоритма Метрополиса. [9] Это широко используемый метод для случайной выборки из сложных и многомерных вероятностей распределения. Алгоритм Метрополиса описывается следующими шагами: [10] [11]

  1. Начальное дерево T i выбирается случайным образом.
  2. Из коллекции деревьев выбирается соседнее дерево T j .
  3. Отношение R вероятностей (или функций плотности вероятности) T j и T i вычисляется следующим образом: R = f(T j )/f(T i )
  4. Если R ≥ 1, то T j принимается в качестве текущего дерева.
  5. Если R < 1, то T j принимается в качестве текущего дерева с вероятностью R, в противном случае сохраняется T i .
  6. На этом этапе процесс повторяется с шага 2 N раз.

Алгоритм продолжает работать до тех пор, пока не достигнет равновесного распределения. Он также предполагает, что вероятность предложения нового дерева T j , когда мы находимся в старом состоянии дерева T i , равна вероятности предложения T i , когда мы находимся в T j . Если это не так, применяются поправки Гастингса. Цель алгоритма Метрополиса-Гастингса — создать набор состояний с определенным распределением, пока марковский процесс не достигнет стационарного распределения. Алгоритм состоит из двух компонентов:

  1. Потенциальный переход из одного состояния в другое (i → j) с использованием функции вероятности перехода q i,j
  2. Движение цепи в состояние j с вероятностью α i,j и сохранение в i с вероятностью 1 – α i,j . [2]

MCMC, связанный с метрополией

Алгоритм MCMC, связанный с Метрополисом (MC³) [12], был предложен для решения практической проблемы перемещения цепи Маркова через пики, когда целевое распределение имеет несколько локальных пиков, разделенных низкими долинами, которые, как известно, существуют в пространстве дерева. Это имеет место во время эвристического поиска по дереву по критериям максимальной экономии (MP), максимального правдоподобия (ML) и минимальной эволюции (ME), и то же самое можно ожидать для стохастического поиска по дереву с использованием MCMC. Эта проблема приведет к тому, что выборки не будут правильно приближаться к апостериорной плотности. (MC³) улучшает смешивание цепей Маркова при наличии нескольких локальных пиков в апостериорной плотности. Он запускает несколько (m) цепей параллельно, каждая для n итераций и с различными стационарными распределениями , , где первое, является целевой плотностью, в то время как , выбираются для улучшения смешивания. Например, можно выбрать инкрементный нагрев в форме:

так что первая цепь является холодной цепью с правильной целевой плотностью, в то время как цепи являются нагретыми цепями. Обратите внимание, что повышение плотности до степени с имеет эффект выравнивания распределения, аналогичного нагреванию металла. В таком распределении легче перемещаться между пиками (разделенными долинами), чем в исходном распределении. После каждой итерации предлагается обмен состояниями между двумя случайно выбранными цепями через шаг типа Метрополиса. Пусть будет текущим состоянием в цепи , . Обмен между состояниями цепей и принимается с вероятностью:

В конце прогона используются выходные данные только холодной цепи, в то время как выходные данные горячих цепей отбрасываются. Эвристически горячие цепи будут довольно легко посещать локальные пики, а обмен состояниями между цепями позволит холодной цепи иногда перескакивать через долины, что приведет к лучшему смешиванию. Однако, если нестабильна, предлагаемые обмены будут редко приниматься. Это причина использования нескольких цепей, которые отличаются только инкрементно.

Очевидным недостатком алгоритма является то, что цепочки запускаются, и только одна цепочка используется для вывода. По этой причине идеально подходит для реализации на параллельных машинах, поскольку каждая цепочка в целом потребует одинакового количества вычислений на итерацию.

ЛОКАЛЬНЫЙ алгоритм Ларже и Саймона

Алгоритмы LOCAL [13] предлагают вычислительное преимущество по сравнению с предыдущими методами и демонстрируют, что байесовский подход способен оценивать неопределенность с практической точки зрения в более крупных деревьях. Алгоритм LOCAL является усовершенствованием алгоритма GLOBAL, представленного в работе Mau, Newton и Larget (1999) [14] , в котором все длины ветвей изменяются в каждом цикле. Алгоритмы LOCAL изменяют дерево, выбирая внутреннюю ветвь дерева случайным образом. Узлы на концах этой ветви соединены с двумя другими ветвями. Один из каждой пары выбирается случайным образом. Представьте себе, что вы берете эти три выбранных ребра и натягиваете их как бельевую веревку слева направо, где направление (влево/вправо) также выбирается случайным образом. Две конечные точки первой выбранной ветви будут иметь поддерево, висящее как кусок одежды, натянутый на веревку. Алгоритм действует путем умножения трех выбранных ветвей на общую случайную величину, сродни растяжению или сжатию бельевой веревки. Наконец, самое левое из двух висящих поддеревьев отсоединяется и снова прикрепляется к бельевой веревке в месте, выбранном равномерно и случайно. Это будет дерево-кандидат.

Предположим, что мы начали с выбора внутренней ветви длиной , которая отделяет таксоны и от остальных. Предположим также, что мы (случайным образом) выбрали ветви длиной и с каждой стороны, и что мы сориентировали эти ветви. Пусть , будет текущей длиной бельевой веревки. Мы выбираем новую длину , где — равномерная случайная величина на . Тогда для алгоритма LOCAL вероятность принятия может быть вычислена как:

Оценка конвергенции

Чтобы оценить длину ветви 2-таксонного дерева в JC, в котором сайты неизменны и изменчивы, предположим экспоненциальное априорное распределение со скоростью . Плотность равна . Вероятности возможных шаблонов сайтов следующие:

для неизменных участков, и

Таким образом, ненормализованное апостериорное распределение имеет вид:

или, альтернативно,

Обновить длину ветви, выбрав новое значение равномерно случайным образом из окна полуширины, центрированного на текущем значении:

где равномерно распределено между и . Вероятность принятия равна:

Пример: , . Мы сравним результаты для двух значений , и . В каждом случае мы начнем с начальной длины и обновим длину по временам.

Максимальная экономия и максимальное правдоподобие

Филогенетические связи тигра, значения бутстрепа показаны в ветвях.
Пример притяжения длинных ветвей . Более длинные ветви (A и C) кажутся более тесно связанными. 

Существует множество подходов к реконструкции филогенетических деревьев, каждый из которых имеет свои преимущества и недостатки, и нет однозначного ответа на вопрос «какой метод лучше?». Максимальная экономия (MP) и максимальное правдоподобие (ML) являются традиционными методами, широко используемыми для оценки филогений, и оба используют информацию о символах напрямую, как и байесовские методы.

Максимальная экономичность восстанавливает одно или несколько оптимальных деревьев на основе матрицы дискретных признаков для определенной группы таксонов и не требует модели эволюционных изменений. MP дает наиболее простое объяснение для заданного набора данных, реконструируя филогенетическое дерево, которое включает как можно меньше изменений в последовательностях. Поддержка ветвей дерева представлена ​​процентом бутстрепа . По той же причине, по которой он широко использовался, своей простотой, MP также подвергся критике и был отодвинут на задний план методами машинного обучения и байесовскими методами. MP представляет несколько проблем и ограничений. Как показал Фельзенштейн (1978), MP может быть статистически непоследовательным, [15] что означает, что по мере накопления все большего количества данных (например, длины последовательности) результаты могут сходиться на неправильном дереве и приводить к притяжению длинных ветвей , филогенетическому явлению, когда таксоны с длинными ветвями (многочисленные изменения состояний признаков) имеют тенденцию казаться более тесно связанными в филогении, чем они есть на самом деле. Для морфологических данных недавние исследования моделирования показывают, что экономия может быть менее точной, чем деревья, построенные с использованием байесовских подходов, [16] возможно, из-за чрезмерной точности, [17] хотя это и оспаривается. [18] Исследования с использованием новых методов моделирования продемонстрировали, что различия между методами вывода являются результатом стратегии поиска и используемого метода консенсуса, а не используемой оптимизации. [19]

Как и в случае максимальной экономии, максимальное правдоподобие будет оценивать альтернативные деревья. Однако он учитывает вероятность того, что каждое дерево объясняет заданные данные на основе модели эволюции. В этом случае выбирается дерево с наибольшей вероятностью объяснения данных среди других. [20] Другими словами, он сравнивает, как разные деревья предсказывают наблюдаемые данные. Введение модели эволюции в анализы ML дает преимущество перед MP, поскольку учитываются вероятность нуклеотидных замен и скорости этих замен, что объясняет филогенетические связи таксонов более реалистичным образом. Важным соображением этого метода является длина ветви, которую экономия игнорирует, при этом изменения с большей вероятностью происходят вдоль длинных ветвей, чем вдоль коротких. Этот подход может устранить притяжение длинных ветвей и объяснить большую согласованность ML по сравнению с MP. Хотя многие считают его лучшим подходом к выводу филогений с теоретической точки зрения, ML требует больших вычислительных затрат, и практически невозможно исследовать все деревья, поскольку их слишком много. Байесовский вывод также включает в себя модель эволюции, и его основные преимущества перед MP и МО заключаются в том, что он более эффективен с вычислительной точки зрения, чем традиционные методы, он количественно оценивает и устраняет источник неопределенности, а также способен включать в себя сложные модели эволюции.

Подводные камни и противоречия

Программное обеспечение MrBayes

MrBayes — это бесплатный программный инструмент, который выполняет байесовский вывод филогении. Первоначально он был написан Джоном П. Хюльзенбеком и Фредериком Ронквистом в 2001 году . [28] По мере роста популярности байесовских методов MrBayes стал одним из программных продуктов, которые выбирают многие специалисты по молекулярной филогенетике. Он предлагается для операционных систем Macintosh, Windows и UNIX и имеет интерфейс командной строки. Программа использует стандартный алгоритм MCMC, а также связанный с Metropolis вариант MCMC. MrBayes считывает выровненные матрицы последовательностей (ДНК или аминокислот) в стандартном формате NEXUS . [29]

MrBayes использует MCMC для аппроксимации апостериорных вероятностей деревьев. [9] Пользователь может изменять предположения модели замены, априорные данные и детали анализа MC³. Он также позволяет пользователю удалять и добавлять таксоны и символы в анализ. Программа включает, среди нескольких нуклеотидных моделей, самую стандартную модель замены ДНК, 4x4, также называемую JC69, которая предполагает, что изменения между нуклеотидами происходят с равной вероятностью. [30] Он также реализует ряд 20x20 моделей замены аминокислот и кодонных моделей замены ДНК. Он предлагает различные методы для ослабления предположения о равных скоростях замен по всем нуклеотидным сайтам. [31] MrBayes также может выводить предковые состояния, приспосабливаясь к неопределенности филогенетического дерева и параметров модели.

MrBayes 3 [32] был полностью реорганизованной и реструктурированной версией оригинального MrBayes. Главной новинкой была способность программного обеспечения учитывать неоднородность наборов данных. Эта новая структура позволяет пользователю смешивать модели и использовать преимущества эффективности байесовского анализа MCMC при работе с различными типами данных (например, белковыми, нуклеотидными и морфологическими). ​​По умолчанию он использует Metropolis-Coupling MCMC.

MrBayes 3.2 был выпущен в 2012 году [33] Новая версия позволяет пользователям запускать несколько анализов параллельно. Она также обеспечивает более быстрые вычисления правдоподобия и позволяет делегировать эти вычисления графическим процессорам (GPU). Версия 3.2 предоставляет более широкие возможности вывода, совместимые с FigTree и другими просмотрщиками деревьев.

Список программного обеспечения для филогенетики

В этой таблице приведены некоторые из наиболее распространенных программ филогенетического анализа, используемых для вывода филогений в рамках байесовского подхода. Некоторые из них не используют исключительно байесовские методы.

Приложения

Байесовский вывод широко использовался молекулярными филогенетиками для широкого круга приложений. Некоторые из них включают:

Хронограмма получена из анализа молекулярных часов с использованием BEAST. Круговая диаграмма в каждом узле показывает возможные предковые распределения, выведенные из байесовского бинарного анализа MCMC (BBM)

Ссылки

  1. ^ Раннала, Брюс; Ян, Цзихэн (сентябрь 1996 г.). «Распределение вероятностей молекулярных эволюционных деревьев: новый метод филогенетического вывода». Журнал молекулярной эволюции . 43 (3): 304–311. Bibcode : 1996JMolE..43..304R. doi : 10.1007/BF02338839. PMID  8703097. S2CID  8269826.
  2. ^ ab Yang, Z.; Rannala, B. (1 июля 1997 г.). «Байесовский филогенетический вывод с использованием последовательностей ДНК: метод Монте-Карло с использованием цепей Маркова». Молекулярная биология и эволюция . 14 (7): 717–724. doi : 10.1093/oxfordjournals.molbev.a025811 . PMID  9214744.
  3. ^ Мау, Боб; Ньютон, Майкл А.; Ларже, Брет (март 1999 г.). «Байесовский филогенетический вывод с помощью методов Монте-Карло на основе цепей Маркова». Биометрия . 55 (1): 1–12. doi : 10.1111/j.0006-341x.1999.00001.x . JSTOR  2533889. PMID  11318142. S2CID  932887.
  4. ^ Ли, Шуйин; Перл, Деннис К.; Досс, Хани (июнь 2000 г.). «Построение филогенетического дерева с использованием метода Монте-Карло с цепями Маркова». Журнал Американской статистической ассоциации . 95 (450): 493–508. doi :10.1080/01621459.2000.10474227. JSTOR  2669394. S2CID  122459537.
  5. ^ Хюльзенбек, Дж. П.; Ронквист, Ф. (1 августа 2001 г.). «MRBAYES: байесовский вывод филогенетических деревьев». Биоинформатика . 17 (8): 754–755. doi : 10.1093/bioinformatics/17.8.754 . PMID  11524383.
  6. ^ Лаплас П. (1774). «Memoire sur la Probabilite des Causes par les Evenements». Королевская академия наук . 6 : 621–656. НАИД  10010866843.Перевод на английский язык: Stigler SM (1986). «Мемуары о вероятности причин событий». Статистическая наука . 1 (3): 359–378. doi : 10.1214/ss/1177013620 .
  7. ^ Насименто, Фабрисия Ф.; Рейс, Марио дос; Ян, Цзыхэн (октябрь 2017 г.). «Руководство биолога по байесовскому филогенетическому анализу». Экология и эволюция природы . 1 (10): 1446–1454. Бибкод : 2017NatEE...1.1446N. дои : 10.1038/s41559-017-0280-x. ПМК 5624502 ​​. ПМИД  28983516. 
  8. ^ Hastings WK (апрель 1970 г.). «Методы выборки Монте-Карло с использованием цепей Маркова и их приложения». Biometrika . 57 (1): 97–109. Bibcode : 1970Bimka..57...97H. doi : 10.1093/biomet/57.1.97.
  9. ^ ab Metropolis N, Rosenbluth AW, Rosenbluth MN, Teller AH, Teller E (июнь 1953 г.). «Вычисления уравнений состояния на быстрых вычислительных машинах». Журнал химической физики . 21 (6): 1087–92. Bibcode : 1953JChPh..21.1087M. doi : 10.1063/1.1699114. OSTI  4390578. S2CID  1046577.
  10. ^ Фельзенштейн Дж (2004). Выводы о филогениях . Сандерленд, Массачусетс: Sinauer Associates.
  11. ^ Yang Z (2014). Молекулярная эволюция: статистический подход . Оксфорд, Англия: Oxford University Press.
  12. ^ Geyer CJ (1991). "Марковская цепь Монте-Карло максимальное правдоподобие". В Keramidas EM, Kaufman SM (ред.). Computing Science and Statistics: Proceedings of the 23rd Symposium on the Interface . Fairfax Station: Interface Foundation. стр. 156–163. OCLC  26603816.
  13. ^ Ларджет Б., Саймон Д. Л. (июнь 1999 г.). «Марковские цепные алгоритмы Монте-Карло для байесовского анализа филогенетических деревьев». Молекулярная биология и эволюция . 16 (6): 750–9. doi : 10.1093/oxfordjournals.molbev.a026160 .
  14. ^ Mau B, Newton MA, Larget B (март 1999). «Байесовский филогенетический вывод с помощью методов Монте-Карло на основе цепей Маркова». Биометрия . 55 (1): 1–12. doi : 10.1111/j.0006-341x.1999.00001.x . PMID  11318142. S2CID  932887.
  15. ^ Felsenstein J (декабрь 1978 г.). «Случаи, в которых методы экономии или совместимости будут определенно вводящими в заблуждение». Systematic Zoology . 27 (4): 401–10. doi :10.1093/sysbio/27.4.401.
  16. ^ Касторани MC, Рид DC, Раймонди PT, Альберто F, Белл TW, Кавано KC и др. (январь 2017 г.). «Колебания плодовитости популяции обусловливают изменчивость демографической связанности и динамику метапопуляции». Труды. Биологические науки . 284 (1847): 20162086. doi :10.1098/rspb.2016.2086. PMC 5310032. PMID  28123088 . 
  17. ^ O'Reilly JE, Puttick MN, Parry L, Tanner AR, Tarver JE, Fleming J, Pisani D, Donoghue PC (апрель 2016 г.). «Байесовские методы превосходят экономичность, но за счет точности в оценке филогении по дискретным морфологическим данным». Biology Letters . 12 (4): 20160081. doi :10.1098/rsbl.2016.0081. PMC 4881353 . PMID  27095266. 
  18. ^ Goloboff PA, Torres A, Arias JS (2018). «Взвешенная экономия превосходит другие методы филогенетического вывода в моделях, подходящих для морфологии». Cladistics . 34 (4): 407–437. doi : 10.1111/cla.12205 . hdl : 11336/57822 . ISSN  0748-3007. PMID  34649370.
  19. ^ Keating JN, Sansom RS, Sutton MD, Knight CG, Garwood RJ (февраль 2020 г.). «Морфологическая филогенетика, оцененная с использованием новых эволюционных симуляций». Systematic Biology . 69 (5): 897–912. doi : 10.1093/sysbio/syaa012 . PMC 7440746. PMID  32073641 . 
  20. ^ Swofford DL, Olsen GJ, Waddell PJ, Hillis DM (1996). «Филогенетический вывод». В Hillis DM, Moritz C, Mable BK (ред.). Молекулярная систематика, 2-е издание . Sunderland, MA: Sinauer. стр. 407–514. ISBN 9780878932825.
  21. ^ ab Suzuki Y, Glazko GV, Nei M (декабрь 2002 г.). «Излишняя достоверность молекулярных филогений, полученных с помощью байесовской филогенетики». Труды Национальной академии наук Соединенных Штатов Америки . 99 (25): 16138–43. Bibcode :2002PNAS...9916138S. doi : 10.1073/pnas.212646199 . PMC 138578 . PMID  12451182. 
  22. ^ Альфаро М. Э., Золлер С., Лутцони Ф. (февраль 2003 г.). «Байес или бутстрап? Исследование моделирования, сравнивающее эффективность выборки Монте-Карло байесовской цепи Маркова и бутстрапа при оценке филогенетической достоверности». Молекулярная биология и эволюция . 20 (2): 255–66. doi : 10.1093/molbev/msg028 . PMID  12598693.
  23. ^ Douady CJ, Delsuc F, Boucher Y, Doolittle WF, Douzery EJ (февраль 2003 г.). «Сравнение байесовских и максимально правдоподобных бутстрап-мер филогенетической надежности». Молекулярная биология и эволюция . 20 (2): 248–54. doi : 10.1093/molbev/msg042 . PMID  12598692.
  24. ^ Гарсия-Сандовал Р. (январь 2014 г.). «Почему некоторые клады имеют низкие частоты бутстрепа и высокие байесовские апостериорные вероятности». Israel Journal of Ecology & Evolution . 60 (1): 41–4. doi :10.1080/15659801.2014.937900.
  25. ^ Yang, Z. (18 апреля 2007 г.). «Парадокс справедливого баланса, парадокс звездного дерева и байесовская филогенетика». Молекулярная биология и эволюция . 24 (8): 1639–1655. doi : 10.1093/molbev/msm081 . PMID  17488737.
  26. ^ Ян, Цзихэн; Чжу, Тяньци (20 февраля 2018 г.). «Байесовский выбор неверно определенных моделей является излишне самонадеянным и может привести к ложным апостериорным вероятностям для филогенетических деревьев». Труды Национальной академии наук . 115 (8): 1854–1859. Bibcode : 2018PNAS..115.1854Y. doi : 10.1073/pnas.1712673115 . PMC 5828583. PMID  29432193 . 
  27. ^ Эриксон П., Свенблад Б., Бриттон Т., Оксельман Б. (октябрь 2003 г.). «Надежность байесовских апостериорных вероятностей и частот бутстрапа в филогенетике». Systematic Biology . 52 (5): 665–73. doi : 10.1080/10635150390235485 . PMID  14530133.
  28. ^ Huelsenbeck JP, Ronquist F (август 2001 г.). «MRBAYES: байесовский вывод филогенетических деревьев». Биоинформатика . 17 (8). Оксфорд, Англия: 754–5. doi : 10.1093/bioinformatics/17.8.754 . PMID  11524383.
  29. ^ Maddison DR, Swofford DL, Maddison WP (декабрь 1997 г.). «NEXUS: расширяемый формат файла для систематической информации». Systematic Biology . 46 (4): 590–621. doi : 10.1093/sysbio/46.4.590 . PMID  11975335.
  30. ^ Jukes TH, Cantor CR (1969). Эволюция белковых молекул . Нью-Йорк: Academic Press. С. 21–132.
  31. ^ Yang Z (ноябрь 1993 г.). «Оценка максимального правдоподобия филогении из последовательностей ДНК, когда скорости замены различаются по сайтам». Молекулярная биология и эволюция . 10 (6): 1396–401. doi : 10.1093/oxfordjournals.molbev.a040082 . PMID  8277861.
  32. ^ Ronquist F, Huelsenbeck JP (август 2003 г.). «MrBayes 3: Байесовский филогенетический вывод в смешанных моделях». Биоинформатика . 19 (12). Оксфорд, Англия: 1572–4. doi : 10.1093/bioinformatics/btg180 . PMID  12912839.
  33. ^ Ronquist F, Teslenko M, van der Mark P, Ayres DL, Darling A, Höhna S, Larget B, Liu L, Suchard MA, Huelsenbeck JP (май 2012 г.). «MrBayes 3.2: эффективный байесовский филогенетический вывод и выбор модели в большом модельном пространстве». Systematic Biology . 61 (3): 539–42. doi :10.1093/sysbio/sys029. PMC 3329765 . PMID  22357727. 
  34. ^ Drummond AJ, Suchard MA, Xie D, Rambaut A (август 2012 г.). «Байесовская филогенетика с BEAUti и BEAST 1.7». Молекулярная биология и эволюция . 29 (8): 1969–73. doi :10.1093/molbev/mss075. PMC 3408070. PMID  22367748 . 
  35. ^ Bouckaert R, Heled J, Kühnert D, Vaughan T, Wu CH, Xie D, Suchard MA, Rambaut A, Drummond AJ (апрель 2014 г.). "BEAST 2: программная платформа для байесовского эволюционного анализа". PLOS Computational Biology . 10 (4): e1003537. Bibcode : 2014PLSCB..10E3537B. doi : 10.1371/journal.pcbi.1003537 . PMC 3985171. PMID  24722319 . 
  36. ^ Lartillot N, Philippe H (июнь 2004 г.). «Модель байесовской смеси для гетерогенностей между сайтами в процессе замены аминокислот». Молекулярная биология и эволюция . 21 (6): 1095–109. doi : 10.1093/molbev/msh112 . PMID  15014145.
  37. ^ Suchard MA, Redelings BD (август 2006 г.). «BAli-Phy: одновременный байесовский вывод выравнивания и филогении». Биоинформатика . 22 (16): 2047–8. doi : 10.1093/bioinformatics/btl175 . PMID  16679334.
  38. ^ Ané C , Larget B, Baum DA, Smith SD, Rokas A (февраль 2007 г.). «Байесовская оценка согласованности среди генных деревьев». Молекулярная биология и эволюция . 24 (2): 412–26. doi : 10.1093/molbev/msl170 . PMID  17095535.
  39. ^ Wilson IJ, Weale ME, Balding DJ (июнь 2003 г.). «Выводы из данных ДНК: истории популяций, эволюционные процессы и вероятности судебного соответствия». Журнал Королевского статистического общества, серия A (Статистика в обществе) . 166 (2): 155–88. doi : 10.1111/1467-985X.00264 .
  40. ^ Pagel M, Meade A (июнь 2006 г.). «Байесовский анализ коррелированной эволюции дискретных признаков методом Монте-Карло с обратимым скачком цепи Маркова». The American Naturalist . 167 (6): 808–25. doi :10.1086/503444. PMID  16685633. S2CID  205984494.
  41. ^ Лорд Э., Леклерк М., Бок А., Диалло АБ., Макаренков В. (2012). «Armadillo 1.1: оригинальная платформа рабочего процесса для проектирования и проведения филогенетического анализа и моделирования». PLOS ONE . 7 (1): e29903. Bibcode : 2012PLoSO...729903L. doi : 10.1371/journal.pone.0029903 . PMC 3256230. PMID  22253821 . 
  42. ^ Milne I, Lindner D, Bayer M, Husmeier D, McGuire G, Marshall DF, Wright F (январь 2009 г.). "TOPALi v2: богатый графический интерфейс для эволюционного анализа множественных выравниваний на кластерах HPC и многоядерных настольных компьютерах". Bioinformatics . 25 (1): 126–7. doi :10.1093/bioinformatics/btn575. PMC 2638937 . PMID  18984599. 
  43. ^ Алонсо Р., Кроуфорд А.Дж., Бермингем Э. (март 2012 г.). «Молекулярная филогения эндемичной радиации кубинских жаб (Bufonidae: Peltophryne) на основе митохондриальных и ядерных генов». Журнал биогеографии . 39 (3): 434–51. Bibcode : 2012JBiog..39..434A. doi : 10.1111/j.1365-2699.2011.02594.x. S2CID  4152245.
  44. ^ Антонелли А, Санмартин I (октябрь 2011 г.). «Массовое вымирание, постепенное похолодание или быстрая радиация? Реконструкция пространственно-временной эволюции древнего рода покрытосеменных Hedyosmum (Chloranthaceae) с использованием эмпирических и имитационных подходов». Systematic Biology . 60 (5): 596–615. doi : 10.1093/sysbio/syr062 . hdl : 10261/34829 . PMID  21856636.
  45. ^ de Villemereuil P, Wells JA, Edwards RD, Blomberg SP (июнь 2012 г.). «Байесовские модели для сравнительного анализа, интегрирующие филогенетическую неопределенность». BMC Evolutionary Biology . 12 (1): 102. Bibcode :2012BMCEE..12..102V. doi : 10.1186/1471-2148-12-102 . PMC 3582467 . PMID  22741602. 
  46. ^ Ронквист Ф. (сентябрь 2004 г.). «Байесовский вывод об эволюции признаков». Тенденции в экологии и эволюции . 19 (9): 475–81. doi :10.1016/j.tree.2004.07.002. PMID  16701310.
  47. ^ Schäffer S, Koblmüller S, Pfingstl T, Sturmbauer C, Krisper G (август 2010 г.). «Реконструкция предкового состояния выявляет множественную независимую эволюцию диагностических морфологических признаков у «высших орибатид» (Acari), что противоречит текущим схемам классификации». BMC Evolutionary Biology . 10 (1): 246. Bibcode :2010BMCEE..10..246S. doi : 10.1186/1471-2148-10-246 . PMC 2930640 . PMID  20701742. 
  48. ^ Филипович Н., Реннер СС (июль 2012 г.). «Брунфельсия (Пасленовые): род, поровну разделенный между Южной Америкой и радиацией на Кубе и других Антильских островах». Молекулярная филогенетика и эволюция . 64 (1): 1–11. Бибкод : 2012MolPE..64....1F. doi :10.1016/j.ympev.2012.02.026. ПМИД  22425729.
  49. ^ Bacon CD, Baker WJ, Simmons MP (май 2012). «Миоценовое рассеивание приводит к островной радиации в пальмовом трибе Trachycarpeae (Arecaceae)». Systematic Biology . 61 (3): 426–42. doi : 10.1093/sysbio/syr123 . PMID  22223444.
  50. ^ Särkinen T, Bohs L, Olmstead RG, Knapp S (сентябрь 2013 г.). "Филогенетические рамки для эволюционного изучения пасленовых (Solanaceae): датированное 1000-вершинное дерево". BMC Evolutionary Biology . 13 (1): 214. Bibcode :2013BMCEE..13..214S. doi : 10.1186/1471-2148-13-214 . PMC 3850475 . PMID  24283922. 
  51. ^ Silvestro D, Schnitzler J, Liow LH, Antonelli A, Salamin N (май 2014 г.). «Байесовская оценка видообразования и вымирания по неполным данным о местонахождении ископаемых». Systematic Biology . 63 (3): 349–67. doi :10.1093/sysbio/syu006. PMC 4361715 . PMID  24510972. 
  52. ^ Lemey P, Rambaut A, Drummond AJ, Suchard MA (сентябрь 2009 г.). «Байесовская филогеография находит свои корни». PLOS Computational Biology . 5 (9): e1000520. Bibcode : 2009PLSCB...5E0520L. doi : 10.1371/journal.pcbi.1000520 . PMC 2740835. PMID  19779555 . 
  53. ^ Cybis G, Sinsheimer J, Bedford T, Mather A, Lemey P, Suchard MA (2015). «Оценка фенотипической корреляции с помощью многомерной филогенетической модели латентной ответственности». Annals of Applied Statistics . 9 (2): 969–991. doi : 10.1214/15-AOAS821. ISSN  1932-6157. PMC 4820077. PMID 27053974  . 
  54. ^ Tolkoff M, Alfaro M, Baele G, Lemey P, Suchard MA (2018). «Анализ филогенетического фактора». Systematic Biology . 67 (3): 384–399. doi :10.1093/sysbio/syx066. ISSN  1063-5157. PMC 5920329. PMID 28950376  . 

Внешние ссылки