Классификация по сходству ДНК
Операционная таксономическая единица ( OTU ) — это рабочее определение, используемое для классификации групп близкородственных особей. Этот термин был первоначально введен в 1963 году Робертом Р. Сокалом и Питером Х.А. Снитом в контексте числовой таксономии , где «оперативная таксономическая единица» — это просто группа организмов, изучаемых в настоящее время. [1] Численная таксономия — это метод биологической систематики, который включает использование числовых методов для классификации таксономических единиц на основе состояния их характеристик. [2] В этом смысле OTU — это прагматическое определение группировки особей по сходству, эквивалентное, но не обязательно соответствующее классической таксономии Линнея или современной эволюционной таксономии .
OTU используются в исследованиях по секвенированию ДНК микробных сообществ для определения различий между организмами на видовом уровне и представляют собой наиболее часто используемую единицу измерения микробного разнообразия. [3] Однако в настоящее время термин «OTU» обычно используется в другом контексте и относится к кластерам (некультивируемых или неизвестных) организмов, сгруппированных по сходству последовательностей ДНК определенного таксономического маркерного гена (первоначально называемого mOTU; молекулярный OTU). ). [4] Другими словами, OTU являются прагматическими представителями « видов » (микробных или многоклеточных ) на разных таксономических уровнях, в отсутствие традиционных систем биологической классификации , доступных для макроскопических организмов. В течение нескольких лет OTU были наиболее часто используемыми единицами разнообразия, особенно при анализе наборов данных последовательностей маркерных генов малых субъединиц 16S (для прокариот) или 18S рРНК (для эукариот [5] ).
Последовательности можно группировать по сходству друг с другом, а оперативные таксономические единицы определяются на основе порога сходства (обычно 97% сходства; однако встречается и 100% сходство, также известное как единичные варианты [6] ), установленного исследователем. . Остается спорным, насколько хорошо этот широко используемый метод воспроизводит истинную филогению или экологию видов микробов. Хотя OTU можно рассчитывать по-разному при использовании разных алгоритмов или порогов, исследования Schmidt et al. (2014) продемонстрировали, что микробные OTU в целом были экологически согласованы во всех средах обитания и в нескольких подходах к кластеризации OTU. [7] Количество определенных OTU может быть завышено из-за ошибок в секвенировании ДНК. [8]
Подходы к кластеризации OTU
Существует три основных подхода к кластеризации OTU: [9]
- De novo , для которого кластеризация основана на сходстве между чтениями секвенирования.
- Закрытая ссылка, для которой кластеризация выполняется по эталонной базе данных последовательностей.
- Открытая ссылка, при которой кластеризация сначала выполняется на основе эталонной базы данных последовательностей, а затем любые оставшиеся последовательности, которые не могут быть сопоставлены со ссылкой, кластеризуются заново .
Алгоритмы кластеризации OTU
Смотрите также
Рекомендации
- ^ Сокал и Снит: Принципы числовой таксономии , Сан-Франциско: WH Freeman, 1957.
- ^ «Соавторы», Википедия и академические библиотеки , Michigan Publishing, 15 сентября 2021 г. , получено 17 января 2024 г.
- ^ Эскалас, Артур; Хейл, Лорен; Вордекерс, Джеймс В.; Ян, Юньфэн; Файерстоун, Мэри К.; Альварес-Коэн, Лиза; Чжоу, Цзичжун (октябрь 2019 г.). «Микробное функциональное разнообразие: от концепций к приложениям». Экология и эволюция . 9 (20): 12000–12016. дои : 10.1002/ece3.5670. ISSN 2045-7758. ПМК 6822047 . ПМИД 31695904.
- ^ Блакстер, М.; Манн, Дж.; Чепмен, Т.; Томас, Ф.; Уиттон, К.; Флойд, Р.; Абебе, Э. (октябрь 2005 г.). «Определение операционных таксономических единиц с использованием данных штрих-кода ДНК». Philos Trans R Soc Lond B Biol Sci . 360 (1462): 1935–43. дои : 10.1098/rstb.2005.1725. ПМК 1609233 . ПМИД 16214751.
- ^ Соммер, Стефани А.; Вауденберг, Лорен Ван; Ленц, Петра Х.; Сепеда, Джорджина; Гетце, Эрика (2017). «Вертикальные градиенты видового богатства и состава сообществ в сумеречной зоне субтропического круговорота северной части Тихого океана». Молекулярная экология . 26 (21): 6136–6156. дои : 10.1111/mec.14286 . hdl : 11336/53966 . ISSN 1365-294X. ПМИД 28792641.
- ^ Портер, Тересита М.; Хаджибабаи, Мехрдад (2018). «Расширение масштабов: руководство по высокопроизводительным геномным подходам к анализу биоразнообразия». Молекулярная экология . 27 (2): 313–338. дои : 10.1111/mec.14478 . ISSN 1365-294X. ПМИД 29292539.
- ^ Шмидт, Томас С.Б.; Родригеш, Жоау Ф. Матиас; фон Меринг, Кристиан (24 апреля 2014 г.). «Экологическая согласованность операционных таксономических единиц СГУ на основе рРНК в глобальном масштабе». ПЛОС Компьютерная Биол . 10 (4): e1003594. Бибкод : 2014PLSCB..10E3594S. дои : 10.1371/journal.pcbi.1003594 . ISSN 1553-7358. ПМЦ 3998914 . ПМИД 24763141.
- ^ Кунин, В.; Энгельбректсон, А.; Охман, Х.; Гугенгольц, П. (январь 2010 г.). «Морщины в редкой биосфере: ошибки пиросеквенирования могут привести к искусственному завышению оценок разнообразия». Энвайрон Микробиол . 12 (1): 118–23. дои : 10.1111/j.1462-2920.2009.02051.x. ПМИД 19725865.
- ^ Копылова Е., Навас-Молина Дж.А., Мерсье С., Сюй З.З., Маэ Ф., Хе Ю. и др. (23 февраля 2016 г.). Сегата Н (ред.). «Методы кластеризации последовательностей с открытым исходным кодом улучшают современное состояние». mSystems . 1 (1): e00003–15. doi : 10.1128/mSystems.00003-15. ПМК 5069751 . ПМИД 27822515.
- ↑ Эдгар, Роберт С. (1 октября 2010 г.). «Поиск и кластеризация на порядки быстрее, чем BLAST». Биоинформатика . 26 (19): 2460–2461. doi : 10.1093/биоинформатика/btq461 . ISSN 1367-4803. ПМИД 20709691.
- ^ Фу, Лимин; Ню, Бэйфан; Чжу, Чжэнвэй; Ву, Ситао; Ли, Вэйчжун (1 декабря 2012 г.). «CD-HIT: ускорено для кластеризации данных секвенирования следующего поколения». Биоинформатика . 28 (23): 3150–3152. doi : 10.1093/биоинформатика/bts565. ISSN 1367-4803. ПМК 3516142 . ПМИД 23060610.
- ^ Фу, Лимин; Ню, Бэйфан; Чжу, Чжэнвэй; Ву, Ситао; Ли, Вэйчжун (1 декабря 2012 г.). «CD-HIT: ускорено для кластеризации данных секвенирования следующего поколения». Биоинформатика . 28 (23): 3150–3152. doi : 10.1093/биоинформатика/bts565. ISSN 1367-4803. ПМК 3516142 . ПМИД 23060610.
- ^ Хао, X.; Цзян, Р.; Чен, Т. (2011). «Кластеризация 16S рРНК для предсказания OTU: метод неконтролируемой байесовской кластеризации». Биоинформатика . 27 (5): 611–618. doi : 10.1093/биоинформатика/btq725. ПМК 3042185 . ПМИД 21233169.
дальнейшее чтение
- Чен, В.; Чжан, СК; Ченг, Ю.; Чжан, С.; Чжао, Х. (2013). «Сравнение методов кластеризации последовательностей 16S рРНК в OTU». ПЛОС ОДИН . 8 (8): e70837. Бибкод : 2013PLoSO...870837C. дои : 10.1371/journal.pone.0070837 . ПМЦ 3742672 . ПМИД 23967117.