Филогенетическое дерево, объединяющее несколько поддеревьев
Супердерево — это единое филогенетическое дерево , собранное из комбинации меньших филогенетических деревьев, которые могли быть собраны с использованием различных наборов данных (например, морфологических и молекулярных) или другого выбора таксонов. [1] Алгоритмы супердерева могут выделять области, в которых дополнительные данные будут наиболее полезными для разрешения любых неоднозначностей. [2] Входные деревья супердерева должны вести себя как образцы из более крупного дерева. [3]
Методы строительства
Построение супердерева масштабируется экспоненциально с числом включенных таксонов; поэтому для дерева любого разумного размера невозможно изучить каждое возможное супердерево и оценить его успешность в объединении входной информации. Таким образом, эвристические методы являются существенными, хотя эти методы могут быть ненадежными; извлеченный результат часто смещен или зависит от нерелевантных характеристик входных данных. [1]
Наиболее известным методом построения супердерева является матричное представление с экономичностью (MRP), в котором входные исходные деревья представлены матрицами с нулями, единицами и ? (т. е. каждое ребро в каждом исходном дереве определяет разбиение листового набора на две непересекающиеся части, и листья с одной стороны получают 0, листья с другой стороны получают 1, а отсутствующие листья получают ?), а матрицы объединяются и затем анализируются с использованием эвристики для максимальной экономичности. [4]
Другой подход к построению супердерева включает версию MRP с максимальным правдоподобием, называемую «MRL» (матричное представление с правдоподобием), которая анализирует ту же матрицу MRP, но использует эвристику для максимального правдоподобия вместо максимальной экономичности для построения супердерева.
Расстояние Робинсона-Фоулдса является самым популярным из многих способов измерения того, насколько похоже супердерево на входные деревья. Это метрика для числа клад из входных деревьев, которые сохраняются в супердереве. Методы оптимизации Робинсона-Фоулдса ищут супердерево, которое минимизирует общие (суммарные) различия Робинсона-Фоулдса между (бинарным) супердеревом и каждым входным деревом. [1] В этом случае супердерево можно рассматривать как медиану входного дерева в соответствии с расстоянием Робинсона-Фоулдса. Были разработаны альтернативные подходы для вывода медианного супердерева на основе различных метрик, например, полагаясь на триплетную или квартетную декомпозицию деревьев. [5]
Недавним нововведением стало построение супердеревьев максимального правдоподобия и использование оценок правдоподобия «входного дерева» для проведения тестов двух супердеревьев. [6]
Дополнительные методы включают подход Min Cut Supertree, [7] Most Similar Supertree Analysis (MSSA), Distance Fit (DFIT) и Quartet Fit (QFIT), реализованные в программном обеспечении CLANN. [8] [9]
Приложение
Супердеревья применялись для создания филогений многих групп, в частности, покрытосеменных , [10] эукариот [11] и млекопитающих. [12] Они также применялись к более масштабным проблемам, таким как происхождение разнообразия, уязвимость к вымиранию [13] и эволюционные модели экологической структуры. [14]
Дальнейшее чтение
- Bininda-Emonds, OR P (2004). Филогенетические супердеревья: объединение информации для выявления древа жизни. Springer. ISBN 978-1-4020-2328-6.
- Бининда-Эмондс, ОРП; Джитлман, Дж. Л.; Стил, МА (2002). «(Супер)Дерево жизни: процедуры, проблемы и перспективы». Annual Review of Ecology and Systematics . 33 : 265–289. doi :10.1146/annurev.ecolsys.33.010802.150511. JSTOR 3069263.
Ссылки
- ^ abc Бансал, М.; Берли, Дж.; Эйленстайн, О.; Фернандес-Бака, Д. (2010). «Супердеревья Робинсона-Фоулда». Алгоритмы для молекулярной биологии . 5 : 18. doi : 10.1186/1748-7188-5-18 . PMC 2846952. PMID 20181274 .
- ^ "Супердерево: Введение". genome.cs.iastate.edu.
- ^ Гордон, А. (1986). «Консенсусные супердеревья: синтез корневых деревьев, содержащих перекрывающиеся наборы помеченных листьев». Журнал классификации . 3 (2): 335–348. doi :10.1007/BF01894195. S2CID 122146129.
- ^ Марк А. Раган (1992). «Филогенетический вывод на основе матричного представления деревьев». Молекулярная филогенетика и эволюция . 1 (1): 53–58. doi :10.1016/1055-7903(92)90035-F. ISSN 1055-7903. PMID 1342924.
- ^ Ранвез, Винсент; Крискуоло, Алексис; Дузери, Эммануэль Дж. П. (15.06.2010). «Супертриплеты: подход к филогеномике на основе супердерева на основе триплетов». Биоинформатика . 26 (12): i115–i123. doi :10.1093/bioinformatics/btq196. ISSN 1367-4811. PMC 2881381. PMID 20529895 .
- ^ Аканни, Васиу А.; Криви, Кристофер Дж.; Уилкинсон, Марк; Пизани, Давиде (2014-06-12). "LUSt: инструмент для приближенной реконструкции супердерева максимального правдоподобия". BMC Bioinformatics . 15 (1): 183. doi : 10.1186/1471-2105-15-183 . ISSN 1471-2105. PMC 4073192 . PMID 24925766.
- ^ Semple, C. (2000). "Метод супердерева для корневых деревьев". Discrete Applied Mathematics . 105 (1–3): 147–158. CiteSeerX 10.1.1.24.6784 . doi : 10.1016/S0166-218X(00)00202-X .
- ^ Creevey, CJ; McInerney, JO (2005-02-01). «Clann: исследование филогенетической информации посредством анализа супердеревьев». Биоинформатика . 21 (3): 390–392. doi : 10.1093/bioinformatics/bti020 . ISSN 1367-4803. PMID 15374874.
- ^ Creevey, CJ; McInerney, JO (2009-01-01). "Деревья из деревьев: построение филогенетических супердеревьев с использованием Clann" (PDF) . В Посада, Дэвид (ред.). Биоинформатика для анализа последовательностей ДНК . Методы в молекулярной биологии. Том 537. Humana Press. стр. 139–161. doi :10.1007/978-1-59745-251-9_7. ISBN 978-1-58829-910-9. PMID 19378143.
- ^ Дэвис, Т.; Барраклоу, Т.; Чейз, М.; Солтис , П .; Солтис, Д .; Саволайнен, В. (2004). «Отвратительная тайна Дарвина: Взгляд из супердерева покрытосеменных». Труды Национальной академии наук Соединенных Штатов Америки . 101 (7): 1904–1909. Bibcode : 2004PNAS..101.1904D. doi : 10.1073/pnas.0308127100 . PMC 357025. PMID 14766971 .
- ^ Пизани, Д.; Коттон, Дж.; МакИнерни, Дж. (2007). «Супердеревья распутывают химерическое происхождение эукариотических геномов». Молекулярная биология и эволюция . 24 (8): 1752–1760. doi : 10.1093/molbev/msm095 . PMID 17504772.
- ^ Бининда-Эмондс, О.; Кардилло, М.; Джонс, К.; Макфи, Р.; Бек, Р.; Гренье, Р.; Прайс, С.; Вос, Р.; Гиттлман, Дж.; Пёрвис, А. (2007). «Задержанный подъем современных млекопитающих». Nature . 446 (7135): 507–512. Bibcode :2007Natur.446..507B. doi :10.1038/nature05634. PMID 17392779. S2CID 4314965.
- ^ Дэвис, Т.; Фриц, С.; Греньер, Р.; Орм, К.; Билби, Дж.; Бининда-Эмондс, О.; Кардилло, М.; Джонс, К.; Гиттлман, Дж.; Мейс, ГМ; Пёрвис, А. (2008). «Филогенетические деревья и будущее биоразнообразия млекопитающих». Труды Национальной академии наук Соединенных Штатов Америки . 105 Suppl 1 (Supplement_1): 11556–11563. Bibcode : 2008PNAS..10511556D. doi : 10.1073/pnas.0801917105 . PMC 2556418. PMID 18695230 .
- ^ Вебб, CO; Акерли, DD; МакПик, MA; Донохью, MJ (2002). «Филогения и экология сообществ». Annual Review of Ecology and Systematics . 33 : 475–505. doi :10.1146/annurev.ecolsys.33.010802.150448. S2CID 535590.