Классификация по сходству ДНК
Операционная таксономическая единица ( OTU ) — это операциональное определение, используемое для классификации групп близкородственных особей. Термин был первоначально введен в 1963 году Робертом Р. Сокалом и Питером HA Снитом в контексте числовой таксономии , где «операционная таксономическая единица» — это просто группа организмов, изучаемых в настоящее время. [1] Числовая таксономия — это метод в биологической систематике, который включает использование числовых методов для классификации таксономических единиц на основе состояний их характеристик. [2] В этом смысле OTU — это прагматическое определение для группировки особей по сходству, эквивалентное, но не обязательно соответствующее классической таксономии Линнея или современной эволюционной таксономии .
OTU используются в исследованиях по секвенированию ДНК микробных сообществ для определения различий на уровне видов среди организмов и представляют собой наиболее часто используемую единицу для измерения микробного разнообразия. [3] Однако в настоящее время термин «OTU» обычно используется в другом контексте и относится к кластерам (некультивируемых или неизвестных) организмов, сгруппированных по сходству последовательности ДНК определенного таксономического маркерного гена (первоначально придуманного как mOTU; молекулярный OTU). [4] Другими словами, OTU являются прагматическими заместителями « видов » (микробных или метазойных ) на разных таксономических уровнях в отсутствие традиционных систем биологической классификации , которые доступны для макроскопических организмов. В течение нескольких лет OTU были наиболее часто используемыми единицами разнообразия, особенно при анализе наборов данных последовательностей генов маркеров малых субъединиц 16S (для прокариот) или 18S рРНК (для эукариот [5] ).
Последовательности могут быть сгруппированы в соответствии с их сходством друг с другом, а операционные таксономические единицы определяются на основе порога сходства (обычно 97% сходства; однако также распространено 100% сходство, также известное как отдельные варианты [6] ), установленного исследователем. Остается спорным, насколько хорошо этот широко используемый метод воспроизводит истинную филогению или экологию микробных видов. Хотя OTU могут быть рассчитаны по-разному при использовании разных алгоритмов или пороговых значений, исследование Шмидта и др. (2014) показало, что микробные OTU в целом экологически согласованы в разных средах обитания и нескольких подходах к кластеризации OTU. [7] Количество определенных OTU может быть завышено из-за ошибок в секвенировании ДНК. [8]
Подходы к кластеризации OTU
Существует три основных подхода к кластеризации OTU: [9]
- De novo , для которого кластеризация основана на сходстве между прочтениями секвенирования.
- Закрытая ссылка, для которой кластеризация выполняется по референтной базе данных последовательностей.
- Открытая ссылка, где кластеризация сначала выполняется по эталонной базе данных последовательностей, а затем все оставшиеся последовательности, которые не удалось сопоставить с эталоном, кластеризуются заново .
Алгоритмы кластеризации OTU
Смотрите также
Ссылки
- ^ Сокал и Снит: Принципы числовой таксономии , Сан-Франциско: WH Freeman, 1957
- ^ «Contributors», Википедия и академические библиотеки , Michigan Publishing, 15 сентября 2021 г., doi : 10.3998/mpub.11778416.contributors.en, ISBN 978-1-60785-672-6, получено 17 января 2024 г.[ ненадежный источник? ]
- ^ Эскалас, Артур; Хейл, Лорен; Вурдекерс, Джеймс У.; Ян, Юньфэн; Файрстоун, Мэри К.; Альварес-Коэн, Лиза; Чжоу, Цзичжун (октябрь 2019 г.). «Микробное функциональное разнообразие: от концепций к приложениям». Экология и эволюция . 9 (20): 12000–12016. Bibcode : 2019EcoEv...912000E. doi : 10.1002/ece3.5670. ISSN 2045-7758. PMC 6822047. PMID 31695904 .
- ^ Blaxter, M.; Mann, J.; Chapman, T.; Thomas, F.; Whitton, C.; Floyd, R.; Abebe, E. (октябрь 2005 г.). «Определение операционных таксономических единиц с использованием данных ДНК-штрихкода». Philos Trans R Soc Lond B Biol Sci . 360 (1462): 1935–43. doi :10.1098/rstb.2005.1725. PMC 1609233. PMID 16214751 .
- ^ Sommer, Stephanie A.; Woudenberg, Lauren Van; Lenz, Petra H.; Cepeda, Georgina; Goetze, Erica (2017). «Вертикальные градиенты видового богатства и состава сообщества в сумеречной зоне в северотихоокеанском субтропическом круговороте». Молекулярная экология . 26 (21): 6136–6156. Bibcode : 2017MolEc..26.6136S. doi : 10.1111/mec.14286 . hdl : 11336/53966 . ISSN 1365-294X. PMID 28792641.
- ^ Портер, Тересита М.; Хаджибабаи, Мехрдад (2018). «Масштабирование: руководство по высокопроизводительным геномным подходам для анализа биоразнообразия». Молекулярная экология . 27 (2): 313–338. Bibcode : 2018MolEc..27..313P. doi : 10.1111/mec.14478 . ISSN 1365-294X. PMID 29292539.
- ^ Шмидт, Томас СБ; Родригес, Жуан Ф. Матиас; фон Меринг, Кристиан (24 апреля 2014 г.). «Экологическая согласованность операционных таксономических единиц на основе рРНК SSU в глобальном масштабе». PLOS Comput Biol . 10 (4): e1003594. Bibcode : 2014PLSCB..10E3594S. doi : 10.1371/journal.pcbi.1003594 . ISSN 1553-7358. PMC 3998914. PMID 24763141 .
- ^ Кунин, В.; Энгельбректсон, А.; Охман, Х.; Хугенхольц, П. (январь 2010 г.). «Морщины в редкой биосфере: ошибки пиросеквенирования могут привести к искусственному завышению оценок разнообразия». Environ Microbiol . 12 (1): 118–23. Bibcode : 2010EnvMi..12..118K. doi : 10.1111/j.1462-2920.2009.02051.x. PMID 19725865.
- ^ Копылова E, Навас-Молина JA, Мерсье C, Сюй ZZ, Маэ F, Хе Y и др. (23 февраля 2016 г.). Сегата Н. (ред.). «Методы кластеризации последовательностей с открытым исходным кодом улучшают современное состояние». mSystems . 1 (1): e00003–15. doi :10.1128/mSystems.00003-15. PMC 5069751 . PMID 27822515.
- ^ Эдгар, Роберт С. (1 октября 2010 г.). «Поиск и кластеризация на порядок быстрее, чем BLAST». Биоинформатика . 26 (19): 2460–2461. doi : 10.1093/bioinformatics/btq461 . ISSN 1367-4803. PMID 20709691.
- ^ ab Fu, Limin; Niu, Beifang; Zhu, Zhengwei; Wu, Sitao; Li, Weizhong (1 декабря 2012 г.). "CD-HIT: ускорение кластеризации данных секвенирования следующего поколения". Bioinformatics . 28 (23): 3150–3152. doi :10.1093/bioinformatics/bts565. PMC 3516142 . PMID 23060610.
- ^ Хао, X.; Цзян, Р.; Чен, Т. (2011). «Кластеризация 16S рРНК для прогнозирования OTU: метод неконтролируемой байесовской кластеризации». Биоинформатика . 27 (5): 611–618. doi :10.1093/bioinformatics/btq725. PMC 3042185. PMID 21233169 .
Дальнейшее чтение
- Chen, W.; Zhang, CK; Cheng, Y.; Zhang, S.; Zhao, H. (2013). "Сравнение методов кластеризации последовательностей 16S рРНК в OTU". PLOS ONE . 8 (8): e70837. Bibcode :2013PLoSO...870837C. doi : 10.1371/journal.pone.0070837 . PMC 3742672 . PMID 23967117.