ДНК-штрихкодирование — это метод идентификации видов с использованием короткого участка ДНК из определенного гена или генов. Предпосылка ДНК-штрихкодирования заключается в том, что путем сравнения с референтной библиотекой таких участков ДНК (также называемых « последовательностями ») индивидуальная последовательность может быть использована для уникальной идентификации организма к виду, так же как сканер в супермаркете использует знакомые черные полосы штрихкода UPC для идентификации товара на своем складе по своей референтной базе данных. [1] Эти «штрихкоды» иногда используются в попытке идентифицировать неизвестные виды или части организма, просто для каталогизации как можно большего количества таксонов или для сравнения с традиционной таксономией в попытке определить границы видов. [2]
Для идентификации различных групп организмов с помощью штрихкодирования используются различные области генов. Наиболее часто используемая область штрихкода для животных и некоторых простейших — это часть гена цитохром с оксидазы I (COI или COX1 ), обнаруженная в митохондриальной ДНК . Другие гены, подходящие для штрихкодирования ДНК, — это внутренний транскрибируемый спейсер (ITS) рРНК, часто используемый для грибов, и RuBisCO, используемый для растений. [3] [4] [5] Микроорганизмы обнаруживаются с использованием различных областей генов. Например, ген 16S рРНК широко используется для идентификации прокариот, тогда как ген 18S рРНК в основном используется для обнаружения микробных эукариот . Эти области генов выбраны, потому что они имеют меньше внутривидовых (внутри вида) вариаций, чем межвидовых (между видами) вариаций, которые известны как «пробел штрихкодирования». [6]
Некоторые приложения ДНК-штрихкодирования включают: идентификацию листьев растений, даже если цветы или фрукты недоступны; идентификацию пыльцы, собранной на телах опыляющих животных; идентификацию личинок насекомых, которые могут иметь меньше диагностических признаков, чем взрослые особи; или исследование рациона животного на основе содержимого его желудка, слюны или фекалий. [7] Когда штрихкодирование используется для идентификации организмов из образца, содержащего ДНК более чем одного организма, используется термин ДНК-метабаркодирование , [8] [9] например, ДНК-метабаркодирование сообществ диатомовых водорослей в реках и ручьях, которое используется для оценки качества воды. [10]
Методы ДНК-штрихкодирования были разработаны на основе ранних работ по секвенированию ДНК микробных сообществ с использованием гена 5S рРНК . [11] В 2003 году в статье Пола Д. Н. Хеберта и его коллег из Университета Гвельфа , Онтарио, Канада, были предложены конкретные методы и терминология современного ДНК-штрихкодирования в качестве стандартизированного метода идентификации видов, а также потенциального распределения неизвестных последовательностей по более высоким таксонам , таким как отряды и типы . [12] Хеберт и его коллеги продемонстрировали полезность гена цитохром с оксидазы I (COI), впервые использованного Фолмером и его коллегами в 1994 году, используя опубликованные ими ДНК-праймеры в качестве инструмента для филогенетического анализа на уровне видов [12] в качестве подходящего дискриминационного инструмента между метазойными беспозвоночными. [13] «Область Фолмера» гена COI обычно используется для различения таксонов на основе его моделей изменчивости на уровне ДНК. Относительная простота извлечения последовательности и изменчивость в сочетании с сохранением между видами являются некоторыми из преимуществ COI. Называя профили «штрихкодами», Хеберт и др. предполагали разработку базы данных COI, которая могла бы служить основой для «глобальной системы биоидентификации».
Штрихкодирование может быть выполнено из ткани целевого образца, из смеси организмов (объемный образец) или из ДНК, присутствующей в образцах окружающей среды (например, вода или почва). Методы отбора проб, сохранения или анализа различаются для разных типов образцов.
Образцы тканей
Для штрихкодирования образца ткани из целевого образца, вероятно, будет достаточно небольшого кусочка кожи, чешуи, ноги или антенны (в зависимости от размера образца). Чтобы избежать загрязнения, необходимо стерилизовать используемые инструменты между образцами. Рекомендуется собирать два образца из одного образца, один для архивирования и один для процесса штрихкодирования. Сохранение образца имеет решающее значение для решения проблемы деградации ДНК.
Массовые образцы
Массовый образец — это тип образца окружающей среды, содержащий несколько организмов из изучаемой таксономической группы . Разница между массовыми образцами (в используемом здесь смысле) и другими образцами окружающей среды заключается в том, что массовый образец обычно обеспечивает большое количество ДНК хорошего качества. Примерами массовых образцов являются образцы водных макробеспозвоночных, собранные с помощью сачка, или образцы насекомых, собранные с помощью ловушки Малеза. Фильтрованные или фракционированные по размеру образцы воды, содержащие целые организмы, такие как одноклеточные эукариоты, также иногда определяются как массовые образцы. Такие образцы могут быть собраны теми же методами, которые используются для получения традиционных образцов для идентификации на основе морфологии.
Образцы ДНК
Метод ДНК окружающей среды (eDNA) представляет собой неинвазивный подход к обнаружению и идентификации видов из клеточного мусора или внеклеточной ДНК, присутствующей в образцах окружающей среды (например, вода или почва) с помощью штрихкодирования или метабаркодирования. Подход основан на том факте, что каждый живой организм оставляет ДНК в окружающей среде, и эта ДНК окружающей среды может быть обнаружена даже для организмов, которые находятся в очень низкой численности. Таким образом, для полевого отбора проб наиболее важной частью является использование материалов и инструментов без ДНК на каждом месте отбора проб или в каждом образце, чтобы избежать загрязнения, если ДНК целевого организма(ов), вероятно, будет присутствовать в малых количествах. С другой стороны, образец eDNA всегда включает ДНК цельноклеточных живых микроорганизмов, которые часто присутствуют в больших количествах. Поэтому образцы микроорганизмов, взятые в естественной среде, также называются образцами eDNA, но загрязнение менее проблематично в этом контексте из-за большого количества целевых организмов. Метод eDNA применяется к большинству типов образцов, таких как вода, осадок, почва, фекалии животных, содержимое желудка или кровь, например, пиявок. [14]
Для ДНК-штрихкодирования требуется, чтобы ДНК из образца была извлечена. Существует несколько различных методов извлечения ДНК , и такие факторы, как стоимость, время, тип образца и выход, влияют на выбор оптимального метода.
Когда ДНК из образцов организмов или eDNA амплифицируется с помощью полимеразной цепной реакции (ПЦР), на реакцию могут негативно влиять молекулы-ингибиторы, содержащиеся в образце. [15] Удаление этих ингибиторов имеет решающее значение для обеспечения доступности высококачественной ДНК для последующего анализа.
Амплификация извлеченной ДНК является необходимым этапом в ДНК-штрихкодировании. Обычно для получения ДНК-штрихкода секвенируется только небольшой фрагмент всего материала ДНК (обычно 400–800 пар оснований ) [16] . Амплификация материала eDNA обычно фокусируется на меньших размерах фрагментов (<200 пар оснований), поскольку eDNA с большей вероятностью будет фрагментирована, чем материал ДНК из других источников. Однако некоторые исследования утверждают, что нет никакой связи между размером ампликона и скоростью обнаружения eDNA. [17] [18]
После амплификации области маркера штрихкода ДНК следующим шагом является секвенирование области маркера с использованием методов секвенирования ДНК . [19] Доступно множество различных платформ секвенирования, и техническая разработка быстро продвигается.
Маркеры, используемые для ДНК-штрихкодирования, называются штрихкодами. Для успешной характеристики видов на основе ДНК-штрихкодов решающее значение имеет выбор информативных участков ДНК. Хороший ДНК-штрихкод должен иметь низкую внутривидовую и высокую межвидовую изменчивость [12] и обладать консервативными фланкирующими участками для разработки универсальных ПЦР- праймеров для широкого таксономического применения. Цель состоит в том, чтобы разработать праймеры, которые будут обнаруживать и различать большинство или все виды в изучаемой группе организмов (высокое таксономическое разрешение). Длина последовательности штрихкода должна быть достаточно короткой для использования с текущим источником выборки, методами извлечения ДНК , амплификации и секвенирования . [20]
В идеале, одна последовательность гена должна использоваться для всех таксономических групп, от вирусов до растений и животных . Однако пока не найдено ни одного такого генного региона, поэтому для разных групп организмов используются разные штрихкоды, [ необходима ссылка ] или в зависимости от вопроса исследования.
Для животных наиболее широко используемый штрихкод — это митохондриальный локус цитохрома С оксидазы I ( COI ). [21] Также используются другие митохондриальные гены, такие как Cytb , 12S или 16S . Митохондриальные гены предпочтительнее ядерных генов из-за отсутствия интронов , гаплоидного типа наследования и ограниченной рекомбинации . [21] [22] Более того, каждая клетка имеет различные митохондрии (до нескольких тысяч), и каждая из них содержит несколько кольцевых молекул ДНК. Поэтому митохондрии могут стать обильным источником ДНК, даже если образец ткани ограничен. [ необходима ссылка ]
Однако в растениях митохондриальные гены не подходят для ДНК-штрихкодирования, поскольку они демонстрируют низкую частоту мутаций . [23] Несколько генов-кандидатов были обнаружены в геноме хлоропластов , наиболее перспективным из которых является ген матуразы К ( matK ) сам по себе или в сочетании с другими генами. Мультилокусные маркеры , такие как рибосомальные внутренние транскрибируемые спейсеры (ITS DNA) вместе с matK , rbcL , trnH или другими генами, также использовались для идентификации видов. [ требуется цитата ] Наилучшее различение видов растений было достигнуто при использовании двух или более хлоропластных штрихкодов. [24]
Для бактерий малая субъединица гена рибосомальной РНК ( 16S ) может использоваться для различных таксонов, поскольку она высококонсервативна. [25] Некоторые исследования предполагают, что COI [26] , шаперонин типа II ( cpn60 ) [27] или β-субъединица РНК-полимеразы ( rpoB ) [28] также могут служить в качестве бактериальных ДНК-штрихкодов.
Штрихкодирование грибов является более сложной задачей, и может потребоваться более одной комбинации праймеров. [29] Маркер COI хорошо работает в определенных группах грибов, [30] но не так хорошо в других. [31] Поэтому используются дополнительные маркеры, такие как ITS рДНК и большая субъединица ядерной рибосомальной РНК (28S LSU рРНК). [32]
В группе простейших были предложены различные штрихкоды, такие как регионы D1–D2 или D2–D3 28S рРНК , субрегион V4 гена 18S рРНК , ITS рДНК и COI . Кроме того, некоторые специфические штрихкоды могут быть использованы для фотосинтетических простейших, например, большая субъединица гена рибулозо-1,5-бисфосфаткарбоксилазы-оксигеназы ( rbcL ) и ген хлоропластной 23S рРНК . [ необходима цитата ]
Справочные библиотеки используются для таксономической идентификации, также называемой аннотацией, последовательностей, полученных с помощью штрихкодирования или меташтрихкодирования. Эти базы данных содержат штрихкоды ДНК, присвоенные ранее идентифицированным таксонам. Большинство справочных библиотек не охватывают все виды в пределах группы организмов, и постоянно создаются новые записи. В случае макро- и многих микроорганизмов (таких как водоросли) эти справочные библиотеки требуют подробной документации (место и дата взятия пробы, лицо, собравшее ее, изображение и т. д.) и авторитетной таксономической идентификации контрольного образца, а также представления последовательностей в определенном формате. Однако такие стандарты выполняются только для небольшого числа видов. Этот процесс также требует хранения контрольных образцов в музейных коллекциях, гербариях и других сотрудничающих учреждениях. Как таксономически полный охват, так и качество содержания важны для точности идентификации. [33] В микробном мире нет информации о ДНК для большинства названий видов, и многие последовательности ДНК не могут быть отнесены ни к одному биному Линнея . [34] Существует несколько баз данных ссылок в зависимости от группы организмов и используемого генетического маркера. Существуют более мелкие национальные базы данных (например, FinBOL) и крупные консорциумы, такие как International Barcode of Life Project (iBOL). [35]
СМЕЛЫЙ
Запущенная в 2007 году система данных Barcode of Life (BOLD) [36] является одной из крупнейших баз данных, содержащей около 780 000 BIN (индексных номеров штрихкодов) в 2022 году. Это свободно доступный репозиторий для записей образцов и последовательностей для исследований штрихкодов, а также рабочая среда, помогающая управлять, контролировать качество и анализировать данные штрихкодов. База данных в основном содержит записи BIN для животных на основе генетического маркера COI. Для идентификации растений BOLD принимает последовательности из matK и rbcL .
ОБЪЕДИНЯЙТЕСЬ
База данных UNITE [37] была запущена в 2003 году и является референтной базой данных для молекулярной идентификации видов грибов (а с 2018 года и всех эукариот) с областью генетического маркера ядерного рибосомального внутреннего транскрибируемого спейсера (ITS). Эта база данных основана на концепции гипотез видов: вы выбираете %, с которым хотите работать, и последовательности сортируются в сравнении с последовательностями, полученными из контрольных образцов, идентифицированных экспертами.
Diat.barcode [ постоянная мертвая ссылка ]
База данных Diat.barcode [38] была впервые опубликована под названием R-syst::diatom [39] в 2016 году, начиная с данных из двух источников: коллекции культур Тонона (TCC) в гидробиологической станции Французского национального института сельскохозяйственных исследований (INRA) и из базы данных нуклеотидов NCBI (Национальный центр биотехнологической информации). Diat.barcode предоставляет данные для двух генетических маркеров, rbc L (рибулозо-1,5-бисфосфаткарбоксилаза/оксигеназа) и 18S (18S рибосомальная РНК). База данных также включает дополнительную информацию о признаках видов, такую как морфологические характеристики (биообъем, размеры и т. д.), жизненные формы (подвижность, тип колонии и т. д.) или экологические особенности (чувствительность к загрязнению и т. д.).
Для получения хорошо структурированных, чистых и интерпретируемых данных необработанные данные секвенирования должны быть обработаны с использованием биоинформатического анализа. Файл FASTQ с данными секвенирования содержит два типа информации: последовательности, обнаруженные в образце ( файл FASTA ), и файл качества с оценками качества ( оценки PHRED ), связанными с каждым нуклеотидом каждой последовательности ДНК. Оценки PHRED указывают вероятность, с которой связанный нуклеотид был правильно оценен.
В целом, оценка PHRED уменьшается к концу каждой последовательности ДНК. Таким образом, некоторые биоинформатические конвейеры просто обрезают конец последовательностей на определенном пороге.
Некоторые технологии секвенирования, такие как MiSeq, используют парное секвенирование, во время которого секвенирование выполняется с обоих направлений, что обеспечивает лучшее качество. Затем перекрывающиеся последовательности выравниваются в контиги и объединяются. Обычно несколько образцов объединяются в один запуск, и каждый образец характеризуется коротким фрагментом ДНК, тегом. На этапе демультиплексирования последовательности сортируются с использованием этих тегов для повторной сборки отдельных образцов. Перед дальнейшим анализом теги и другие адаптеры удаляются из фрагмента ДНК штрихкодирующей последовательности. Во время обрезки удаляются последовательности плохого качества (низкие баллы PHRED) или последовательности, которые намного короче или длиннее целевого штрихкода ДНК. Следующий этап дерепликации — это процесс, в котором все отфильтрованные по качеству последовательности сворачиваются в набор уникальных прочтений (отдельные единицы последовательности ISU) с информацией об их распространенности в образцах. После этого обнаруживаются и удаляются химеры (т. е. составные последовательности, образованные из частей смешанного происхождения). Наконец, последовательности кластеризуются в OTU (операционные таксономические единицы), используя одну из многих стратегий кластеризации. Наиболее часто используемое биоинформатическое программное обеспечение включает Mothur, [40] Uparse, [41] Qiime, [42] Galaxy, [43] Obitools, [44] JAMP, [45] Barque, [46] и DADA2. [47]
Сравнение распространенности прочтений, т. е. последовательностей, между различными образцами по-прежнему является проблемой, поскольку как общее количество прочтений в образце, так и относительное количество прочтений для вида могут различаться между образцами, методами или другими переменными. Для сравнения можно затем уменьшить количество прочтений каждого образца до минимального количества прочтений сравниваемых образцов — процесс, называемый разрежением. Другой способ — использовать относительное количество прочтений. [48]
Таксономическое назначение OTU видам достигается путем сопоставления последовательностей с референтными библиотеками. Инструмент поиска базового локального выравнивания (BLAST) обычно используется для определения областей сходства между последовательностями путем сравнения прочтений последовательностей из образца с последовательностями в референтных базах данных. [49] Если референтная база данных содержит последовательности соответствующих видов, то последовательности образцов могут быть идентифицированы до уровня вида. Если последовательность не может быть сопоставлена с существующей записью референтной библиотеки, можно использовать ДНК-штрихкодирование для создания новой записи.
В некоторых случаях из-за неполноты справочных баз данных идентификация может быть достигнута только на более высоких таксономических уровнях, таких как отнесение к семейству или классу. В некоторых группах организмов, таких как бактерии, таксономическое отнесение к уровню вида часто невозможно. В таких случаях образец может быть отнесен к определенной операционной таксономической единице (OTU) .
В некоторых случаях образцы с идентичными (COI) ДНК-штрихкодами явно принадлежат к разным видам, например, видам рыб рода Chromis . [50]
Применение ДНК-штрихкодирования включает идентификацию новых видов , оценку безопасности продуктов питания, идентификацию и оценку криптических видов, обнаружение чужеродных видов, идентификацию исчезающих и находящихся под угрозой исчезновения видов , [51] установление связи между стадиями яиц и личинок и взрослыми видами, обеспечение прав интеллектуальной собственности на биоресурсы, разработку глобальных планов управления для стратегий сохранения, выяснение пищевых ниш [52] и судебную экспертизу. [53] Маркеры ДНК-штрихкода могут применяться для решения основных вопросов в систематике, экологии , эволюционной биологии и сохранении , включая сборку сообществ, сети взаимодействия видов , таксономические открытия и оценку приоритетных областей для защиты окружающей среды .
Конкретные короткие последовательности ДНК или маркеры из стандартизированного региона генома могут предоставить ДНК-штрихкод для идентификации видов. [54] Молекулярные методы особенно полезны, когда традиционные методы неприменимы. ДНК-штрихкодирование имеет большое применение в идентификации личинок, для которых обычно доступно мало диагностических признаков, и в ассоциации различных стадий жизни (например, личиночная и взрослая) у многих животных. [55] Идентификация видов, перечисленных в приложениях Конвенции о международной торговле видами, находящимися под угрозой исчезновения ( СИТЕС ), с использованием методов штрихкодирования используется для мониторинга незаконной торговли. [56]
Чужеродные виды могут быть обнаружены с помощью штрихкодирования. [57] [58] Штрихкодирование может быть пригодно для обнаружения видов, например, в пограничном контроле, где быстрая и точная морфологическая идентификация часто невозможна из-за сходства между различными видами, отсутствия достаточных диагностических характеристик [57] и/или отсутствия таксономической экспертизы. Штрихкодирование и меташтрихкодирование также могут использоваться для скрининга экосистем на наличие инвазивных видов и для различения инвазивных видов и местных, морфологически похожих, видов. [59] Показана высокая эффективность идентификации ДНК по сравнению с традиционным мониторингом биологических инвазий. [60]
ДНК-штрихкодирование позволяет идентифицировать и распознавать криптические виды . [61] Результаты анализа ДНК-штрихкодирования, однако, зависят от выбора аналитических методов, поэтому процесс разграничения криптических видов с использованием ДНК-штрихкодов может быть столь же субъективным, как и любая другая форма таксономии . Хеберт и др. (2004) пришли к выводу, что бабочка Astraptes fulgerator на северо-западе Коста-Рики на самом деле состоит из 10 различных видов. [62] Эти результаты, однако, впоследствии были оспорены Брауэром (2006), который указал на многочисленные серьезные недостатки в анализе и пришел к выводу, что исходные данные могли поддерживать не более чем возможность трех-семи криптических таксонов, а не десяти криптических видов. [63] Смит и др. (2007) использовали ДНК-штрихкоды цитохрома с оксидазы I для идентификации видов 20 морфовидов паразитоидных мух Belvosia ( Diptera : Tachinidae ), выведенных из гусениц ( Lepidoptera ) в Area de Conservación Guanacaste (ACG) на северо-западе Коста-Рики. Эти авторы обнаружили, что штрихкодирование увеличивает количество видов до 32, показывая, что каждый из трех видов паразитоидов , ранее считавшихся универсалами, на самом деле представляет собой массивы высокоспецифичных для хозяина криптических видов. [64] Для 15 морфовидов полихет в глубоководном антарктическом бентосе, изученных с помощью ДНК-штрихкодирования, криптическое разнообразие было обнаружено в 50% случаев. Кроме того, были обнаружены 10 ранее не обнаруженных морфовидов, что увеличило общее видовое богатство в образце на 233%. [65]
ДНК-штрихкодирование и меташтрихкодирование могут быть полезны в исследованиях по анализу рациона питания [66] и обычно используются, если образцы добычи не могут быть идентифицированы на основе морфологических признаков. [67] [68] Существует ряд подходов к выборке при анализе рациона питания: ДНК-меташтрихкодирование может проводиться на содержимом желудка, [69] фекалиях, [68] [70] слюне [71] или анализе всего тела. [51] [72] В образцах фекалий или хорошо переваренном содержимом желудка часто невозможно отличить ткани от одного вида, и поэтому вместо этого можно применять меташтрихкодирование. [68] [73] Фекалии или слюна представляют собой неинвазивные подходы к выборке, в то время как анализ всего тела часто означает, что особь должна быть сначала убита. Для более мелких организмов секвенирование содержимого желудка затем часто выполняется путем секвенирования всего животного.
ДНК-штрихкодирование представляет собой важный инструмент для оценки качества пищевых продуктов. Целью является обеспечение прослеживаемости пищевых продуктов, минимизация пиратства пищевых продуктов и оценка местного и типичного агропищевого производства. Другая цель заключается в защите общественного здоровья; например, меташтрихкодирование дает возможность идентифицировать груперов, вызывающих отравление рыбой Ciguatera , по остаткам еды [74] или отделить ядовитые грибы от съедобных (Ref).
ДНК-штрихкодирование можно использовать для оценки наличия видов, находящихся под угрозой исчезновения, в целях их сохранения (Ref) или наличия видов-индикаторов, отражающих определенные экологические условия (Ref), например, избыток питательных веществ или низкий уровень кислорода.
ДНК-штрихкодирование часто используется для идентификации видов в судебных делах. Неизвестные образцы животных или растений на месте преступления могут быть найдены, собраны и идентифицированы в надежде связать их с подозреваемым и получить обвинительный приговор. [75] Браконьерство , убийство исчезающих видов и жестокое обращение с животными являются примерами преступлений, где используется ДНК-штрихкодирование, поскольку ДНК животных часто обнаруживается. [53] [76] С другой стороны, ДНК растений обычно используется в качестве улики для связи подозреваемого с местом преступления. [77]
Традиционные методы биооценки хорошо зарекомендовали себя на международном уровне и хорошо служат биомониторингу, например, для водной биооценки в рамках Директив ЕС WFD и MSFD . Однако ДНК-штрихкодирование может улучшить традиционные методы по следующим причинам: ДНК-штрихкодирование (i) может повысить таксономическое разрешение и гармонизировать идентификацию таксонов, которые трудно идентифицировать или для которых не хватает экспертов, (ii) может более точно/конкретно связать факторы окружающей среды с конкретными таксонами, (iii) может повысить сопоставимость между регионами, (iv) позволяет включать ранние стадии жизни и фрагментированные образцы, (v) позволяет разграничивать криптические /редкие виды, (vi) позволяет разрабатывать новые индексы, например, редкие/криптические виды, которые могут быть чувствительны/устойчивы к стрессорам , (vii) увеличивает количество образцов, которые могут быть обработаны, и сокращает время обработки, что приводит к расширению знаний об экологии видов, (viii) является неинвазивным способом мониторинга при использовании методов eDNA . [78]
ДНК-штрихкодирование быстрее традиционных морфологических методов на всем пути от обучения до таксономического назначения. Требуется меньше времени, чтобы получить экспертные знания в методах ДНК, чем стать экспертом в таксономии. Кроме того, рабочий процесс ДНК-штрихкодирования (т. е. от образца до результата) обычно быстрее традиционного морфологического рабочего процесса и позволяет обрабатывать больше образцов.
ДНК-штрихкодирование позволяет разделять таксоны от более высоких (например, семейство) до более низких (например, вид) таксономических уровней, которые в противном случае слишком сложно идентифицировать с помощью традиционных морфологических методов, таких как, например, идентификация с помощью микроскопии. Например, Chironomidae (некусающиеся мошки) широко распространены как в наземных, так и в пресноводных экосистемах. Их богатство и обилие делают их важными для экологических процессов и сетей, и они являются одной из многих групп беспозвоночных, используемых в биомониторинге. Образцы беспозвоночных могут содержать до 100 видов хирономид, которые часто составляют до 50% образца. Несмотря на это, их обычно не идентифицируют ниже уровня семейства из-за таксономической экспертизы и требуемого времени. [79] Это может привести к тому, что разные виды хирономид с разными экологическими предпочтениями будут сгруппированы вместе, что приведет к неточной оценке качества воды.
ДНК-штрихкодирование дает возможность определять таксоны и напрямую связывать эффекты стрессоров с конкретными таксонами, такими как отдельные виды хирономид. Например, Бирманн и др. (2018) провели ДНК-штрихкодирование хирономид, чтобы исследовать их реакцию на множественные стрессоры: уменьшение потока, увеличение мелкодисперсных осадков и повышенную соленость. [80] После штрихкодирования было обнаружено, что выборка хирономид состояла из 183 операционных таксономических единиц (OTU), т. е. штрихкодов (последовательностей), которые часто эквивалентны морфологическим видам. Эти 183 OTU демонстрировали 15 типов ответов, а не ранее сообщавшиеся [81] два типа ответов, зарегистрированных, когда все хирономиды были сгруппированы вместе в одном и том же исследовании множественных стрессоров. Похожая тенденция была обнаружена в исследовании Мачера и др. (2016), которые обнаружили криптическое разнообразие внутри новозеландского вида поденок Deleatidium sp . В ходе этого исследования были обнаружены различные модели реагирования 12 молекулярных различных OTU на стрессоры, которые могут изменить общее мнение о том, что эта поденка чувствительна к загрязнению. [82]
Несмотря на преимущества, предлагаемые ДНК-штрихкодированием, также было высказано предположение, что ДНК-штрихкодирование лучше всего использовать в качестве дополнения к традиционным морфологическим методам. [78] Эта рекомендация основана на многочисленных предполагаемых проблемах.
Не совсем просто связать ДНК-штрихкоды с экологическими предпочтениями рассматриваемого штрихкодированного таксона, как это необходимо, если штрихкодирование будет использоваться для биомониторинга. Например, обнаружение целевой ДНК в водных системах зависит от концентрации молекул ДНК на участке, на которую, в свою очередь, могут влиять многие факторы. Наличие молекул ДНК также зависит от дисперсии на участке, например, направления или силы течений. На самом деле неизвестно, как ДНК перемещается в ручьях и озерах, что затрудняет отбор проб. Другим фактором может быть поведение целевого вида, например, у рыб могут быть сезонные изменения движений, раки или мидии будут выделять ДНК в больших количествах только в определенные периоды своей жизни (линька, нерест). Для ДНК в почве еще меньше известно о распределении, количестве или качестве.
Основным ограничением метода штрихкодирования является то, что он полагается на библиотеки ссылок на штрихкоды для таксономической идентификации последовательностей. Таксономическая идентификация точна только при наличии надежной ссылки. Однако большинство баз данных все еще неполны, особенно для более мелких организмов, например, грибов, фитопланктона, нематод и т. д. Кроме того, текущие базы данных содержат неверные идентификации, орфографические ошибки и другие ошибки. Существуют огромные усилия по курированию и дополнению баз данных для всех необходимых организмов, включая крупные проекты штрихкодирования (например, проект iBOL для справочной базы данных Barcode of Life Data Systems (BOLD)). [83] [84] Однако завершение и курирование сложны и требуют много времени. Без подтвержденных образцов не может быть уверенности в том, является ли последовательность, используемая в качестве ссылки, правильной.
Базы данных последовательностей ДНК, такие как GenBank, содержат много последовательностей, которые не привязаны к подтвержденным образцам (например, гербарные образцы, культивированные клеточные линии или иногда изображения). Это проблематично с точки зрения таксономических вопросов, таких как необходимость разделения или объединения нескольких видов или обоснованность прошлых идентификаций. Повторное использование последовательностей, не привязанных к подтвержденным образцам, изначально неверно идентифицированного организма может привести к неверным выводам и его следует избегать. [85] Поэтому наилучшей практикой для штрихкодирования ДНК является секвенирование подтвержденных образцов. [86] [87] Однако для многих таксонов может быть сложно получить референтные образцы, например, для образцов, которые трудно поймать, имеющиеся образцы плохо сохранились или отсутствует адекватная таксономическая экспертиза. [85]
Важно отметить, что ДНК-штрихкоды также могут использоваться для создания временной таксономии, и в этом случае OTU могут использоваться в качестве замены традиционным латинским биномам, что значительно снижает зависимость от полностью заполненных справочных баз данных. [88]
ДНК-штрихкодирование также несет методологическую предвзятость, от выборки до анализа данных биоинформатики . Помимо риска загрязнения образца ДНК ингибиторами ПЦР, смещение праймера является одним из основных источников ошибок в ДНК-штрихкодировании. [89] [90] Выделение эффективного ДНК-маркера и разработка праймеров являются сложным процессом, и были предприняты значительные усилия для разработки праймеров для ДНК-штрихкодирования в различных таксономических группах. [91] Однако праймеры часто будут связываться преимущественно с некоторыми последовательностями, что приводит к дифференциальной эффективности и специфичности праймера и оценке нерепрезентативных сообществ и инфляции богатства. [92] Таким образом, состав последовательностей сообществ образца в основном изменяется на этапе ПЦР. Кроме того, часто требуется репликация ПЦР, но это приводит к экспоненциальному увеличению риска загрязнения. В нескольких исследованиях подчеркивалась возможность использования образцов, обогащенных митохондриями [93] [94] или подходов без ПЦР, чтобы избежать этих предубеждений, но по состоянию на 2018 год [обновлять]метод метабаркодирования ДНК по-прежнему основывается на секвенировании ампликонов. [91] В ходе секвенирования и биоинформатической обработки последовательностей появляются и другие предубеждения, такие как создание химер.
Даже несмотря на то, что ДНК-штрихкодирование все более широко используется и применяется, нет единого мнения относительно методов сохранения или извлечения ДНК, выбора набора маркеров и праймеров ДНК или протоколов ПЦР. Параметры биоинформатических конвейеров (например, кластеризация OTU, алгоритмы таксономического назначения или пороговые значения и т. д.) являются источником многочисленных споров среди пользователей ДНК-штрихкодирования. [91] Технологии секвенирования также быстро развиваются вместе с инструментами для анализа огромных объемов полученных данных ДНК, и стандартизация методов срочно необходима для обеспечения сотрудничества и обмена данными в большем пространственном и временном масштабе. Эта стандартизация методов штрихкодирования в европейском масштабе является частью целей Европейского действия COST DNAqua-net [95] и также рассматривается CEN (Европейским комитетом по стандартизации). [96]
Еще одним недостатком ДНК-штрихкодирования является его ограниченная эффективность для точного различения ниже уровня вида (например, для различения разновидностей), для обнаружения гибридов, а также то, что на него могут влиять темпы эволюции [ необходима ссылка ] .
Важно знать, что списки таксонов, полученные с помощью обычной (морфологической) идентификации, не сопоставимы и, возможно, никогда не будут сопоставимы напрямую со списками таксонов, полученными с помощью идентификации на основе штрихкодов, по нескольким причинам. Наиболее важной причиной, вероятно, является неполнота и неточность молекулярных справочных баз данных, что препятствует правильному таксономическому назначению последовательностей eDNA. Таксоны, отсутствующие в справочных базах данных, не будут найдены eDNA, а последовательности, связанные с неправильным названием, приведут к неправильной идентификации. [78] Другими известными причинами являются разный масштаб и размер выборки между традиционным и молекулярным образцом, возможный анализ мертвых организмов, который может происходить по-разному для обоих методов в зависимости от группы организмов, и конкретный выбор идентификации в любом методе, т. е. разная таксономическая экспертиза или возможность идентифицировать определенные группы организмов, соответственно, смещение праймера, приводящее также к потенциально предвзятому анализу таксонов. [78]
ДНК-штрихкодирование может привести к переоценке или недооценке видового богатства и разнообразия. Некоторые исследования предполагают, что артефакты (идентификация видов, не присутствующих в сообществе) являются основной причиной завышенного биоразнообразия. [97] [98] Наиболее проблемной проблемой являются таксоны, представленные малым количеством прочтений секвенирования. Эти прочтения обычно удаляются в процессе фильтрации данных, поскольку различные исследования предполагают, что большинство этих низкочастотных прочтений могут быть артефактами. [99] Однако среди этих малораспространенных прочтений могут существовать действительно редкие таксоны. [100] Редкие последовательности могут отражать уникальные родословные в сообществах, что делает их информативными и ценными последовательностями. Таким образом, существует острая необходимость в более надежных алгоритмах биоинформатики, которые позволяют различать информативные прочтения и артефакты. Полные справочные библиотеки также позволят лучше тестировать алгоритмы биоинформатики, позволяя лучше фильтровать артефакты (т. е. удалять последовательности, не имеющие аналога среди существующих видов), и, следовательно, можно будет получить более точное назначение видов. [101] Криптографическое разнообразие также может привести к раздутому биоразнообразию, поскольку один морфологический вид может фактически разделиться на множество отдельных молекулярных последовательностей. [78] Это будет иметь большое значение для создания справочных данных ДНК, которые имеют решающее значение для мониторинга биоразнообразия на основе ДНК окружающей среды .
Мегабаркодирование — это термин, используемый для описания высокопроизводительного ДНК-штрихкодирования образцов, при котором одновременно могут быть штрихкодированы тысячи образцов для идентификации и обнаружения видов. [102] [103] [104] [105] [106]
Это стало возможным благодаря использованию платформ секвенирования третьего поколения , включая PacBio (Sequel I/II) от Pacific Biosciences и MinION, PromethION от Oxford Nanopore Technology . По сравнению с секвенированием по Сэнгеру , мегабаркодирование быстрее и дешевле, что позволяет производить крупномасштабную генерацию ДНК-штрихкодов для тысяч видов. [107]
Мегабаркодирование может помочь заполнить пробел в справочных данных о таксонах . ДНК-штрихкодирование для насекомых и ускорить открытие видов, [108] [109] понять закономерности разнообразия видов, [110] [111] [112] оценить видовое богатство, [113] создать быстрые инвентаризации видового биоразнообразия, [114] отслеживать базовые сдвиги, [115] и сопоставлять стадии жизненного цикла. [116]
Метабаркодирование определяется как штрихкодирование ДНК или eDNA (экологической ДНК), которое позволяет одновременно идентифицировать множество таксонов в одном и том же образце (экологической), однако часто в пределах одной и той же группы организмов. Главное различие между подходами заключается в том, что метабаркодирование, в отличие от штрихкодирования, не фокусируется на одном конкретном организме, а вместо этого нацелено на определение видового состава в образце.
Процедура метабаркодирования, как и общее штрихкодирование, охватывает этапы извлечения ДНК , ПЦР-амплификации , секвенирования и анализа данных . Штрихкод состоит из короткой вариабельной области гена (например, см. различные маркеры/штрихкоды ), которая полезна для таксономического назначения, фланкированной высококонсервативными областями генов, которые можно использовать для проектирования праймеров . [117] Различные гены используются в зависимости от того, является ли целью штрихкодирование одного вида или метабаркодирование нескольких видов. В последнем случае используется более универсальный ген. Метабаркодирование не использует ДНК/РНК одного вида в качестве отправной точки, а ДНК/РНК из нескольких различных организмов, полученных из одного образца окружающей среды или объема.
Метабаркодирование может дополнять меры по сохранению биоразнообразия, а в некоторых случаях даже заменять их, особенно по мере развития технологий и постепенного удешевления, оптимизации и распространения процедур. [118] [119]
Области применения меташтрихкодирования ДНК включают мониторинг биоразнообразия в наземной и водной среде, палеонтологию и древние экосистемы, взаимодействие растений и опылителей , анализ рациона питания и безопасность пищевых продуктов.
Общие преимущества и недостатки штрихкодирования, рассмотренные выше, справедливы также и для метабаркодирования. Одним из особых недостатков исследований метабаркодирования является то, что пока нет консенсуса относительно оптимального экспериментального дизайна и критериев биоинформатики, которые следует применять в метабаркодировании eDNA. [120] Однако в настоящее время предпринимаются совместные попытки, например, сеть EU COST DNAqua-Net, двигаться вперед путем обмена опытом и знаниями для установления стандартов наилучшей практики для биомониторинга. [78]
В 2014 году исследователи из ETH Zurich предложили использовать искусственные ДНК-штрихкоды субмикрометрового размера в качестве «невидимой нефтяной метки». Штрихкоды состоят из синтетических последовательностей ДНК внутри магнитно-извлекаемых частиц кремния. Их можно добавлять в пищевое масло в очень небольшом количестве (до 1 ppb) в качестве метки и в любое время извлекать для проверки подлинности методом ПЦР/секвенирования. Этот метод можно использовать для проверки оливкового масла на фальсификацию. [121]
Подтемы:
Похожие темы:
Также смотрите боковую панель навигации в верхней части статьи.
{{cite book}}
: CS1 maint: отсутствует местоположение издателя ( ссылка )