Метагеномика — это изучение генетического материала, полученного непосредственно из образцов окружающей среды или клинических образцов методом секвенирования . Широкая область может также называться геномикой окружающей среды , экогеномикой , геномикой сообществ или микробиомикой .
В то время как традиционная микробиология , секвенирование генома микробов и геномика опираются на культивируемые клонированные культуры , раннее экологическое секвенирование генов клонировало определенные гены (часто ген 16S рРНК ) для получения профиля разнообразия в естественном образце. Такая работа показала, что подавляющее большинство микробного биоразнообразия было упущено методами, основанными на культивировании. [2]
Благодаря своей способности выявлять ранее скрытое разнообразие микроскопической жизни, метагеномика предлагает мощный способ понимания микробного мира, который может произвести революцию в понимании биологии. [3] Поскольку стоимость секвенирования ДНК продолжает падать, метагеномика теперь позволяет исследовать микробную экологию в гораздо большем масштабе и с большей детализацией, чем раньше. В недавних исследованиях используется либо « дробовик », либо направленное ПЦР- секвенирование для получения в значительной степени беспристрастных образцов всех генов от всех членов отобранных сообществ. [4]
Термин «метагеномика» впервые был использован Джо Хандельсманом , Робертом М. Гудманом , Мишель Р. Рондон, Джоном Кларди и Шоном Ф. Брэди и впервые появился в публикации в 1998 году. [5] Термин метагеном ссылался на идею о том, что набор генов, секвенированных из окружающей среды, может быть проанализирован способом, аналогичным изучению одного генома . В 2005 году Кевин Чен и Лиор Пахтер (исследователи из Калифорнийского университета в Беркли ) определили метагеномику как «применение современных методов геномики без необходимости изоляции и лабораторного выращивания отдельных видов». [6]
Традиционное секвенирование начинается с культивирования идентичных клеток в качестве источника ДНК . Однако ранние метагеномные исследования показали, что, вероятно, существуют большие группы микроорганизмов во многих средах, которые невозможно культивировать и, следовательно, невозможно секвенировать. Эти ранние исследования были сосредоточены на последовательностях рибосомальной РНК 16S (рРНК), которые относительно короткие, часто сохраняются в пределах вида и, как правило, различаются между видами. Было обнаружено много последовательностей рибосомальной РНК 16S , которые не принадлежат ни одному известному культивируемому виду , что указывает на существование многочисленных неизолированных организмов. Эти исследования генов рибосомальной РНК, взятых непосредственно из окружающей среды, показали, что методы, основанные на культивировании, обнаруживают менее 1% видов бактерий и архей в образце. [2] Большая часть интереса к метагеномике исходит из этих открытий, которые показали, что подавляющее большинство микроорганизмов ранее оставалось незамеченным.
В 1980-х годах ранние молекулярные работы в этой области были проведены Норманом Р. Пейсом и его коллегами, которые использовали ПЦР для изучения разнообразия последовательностей рибосомной РНК. [7] Полученные в результате этих прорывных исследований знания привели к тому, что Пейс предложил идею клонирования ДНК непосредственно из образцов окружающей среды еще в 1985 году. [8] Это привело к первому отчету об изоляции и клонировании объемной ДНК из образца окружающей среды, опубликованному Пейсом и его коллегами в 1991 году [9], когда Пейс работал на кафедре биологии в Университете Индианы . Значительные усилия гарантировали, что это не были ложноположительные результаты ПЦР , и подтвердили существование сложного сообщества неисследованных видов. Хотя эта методология была ограничена изучением высококонсервативных, не кодирующих белок генов , она подтвердила ранние наблюдения, основанные на микробной морфологии, о том, что разнообразие было гораздо более сложным, чем было известно с помощью методов культивирования. Вскоре после этого в 1995 году Хили сообщил о метагеномной изоляции функциональных генов из «зообиблиотек», созданных на основе сложной культуры экологических организмов, выращенных в лаборатории на сушеных травах . [10] После ухода из лаборатории Пейса Эдвард ДеЛонг продолжил работу в этой области и опубликовал работу, которая в значительной степени заложила основу для экологических филогений, основанных на сигнатурных последовательностях 16S, начиная с создания его группой библиотек из морских образцов. [11]
В 2002 году Майя Брейтбарт , Форест Ровер и коллеги использовали экологическое дробовик-секвенирование (см. ниже), чтобы показать, что 200 литров морской воды содержат более 5000 различных вирусов. [12] Последующие исследования показали, что в человеческом стуле содержится более тысячи видов вирусов и, возможно, миллион различных вирусов на килограмм морских отложений , включая множество бактериофагов . По сути, все вирусы в этих исследованиях были новыми видами. В 2004 году Джин Тайсон, Джилл Бэнфилд и коллеги из Калифорнийского университета в Беркли и Объединенного института генома секвенировали ДНК, извлеченную из дренажной системы кислых шахт . [13] Эти усилия привели к получению полных или почти полных геномов для нескольких бактерий и архей , которые ранее сопротивлялись попыткам их культивирования. [14]
Начиная с 2003 года Крейг Вентер , руководитель финансируемой из частных источников параллельной программы «Геном человека» , возглавил Глобальную экспедицию по отбору проб океана (GOS), которая совершила кругосветное плавание и собрала метагеномные образцы на протяжении всего путешествия. Все эти образцы были секвенированы с помощью дробовика, в надежде на то, что будут идентифицированы новые геномы (и, следовательно, новые организмы). Пилотный проект, проведенный в Саргассовом море , обнаружил ДНК почти 2000 различных видов , включая 148 видов бактерий, никогда ранее не встречавшихся. [15] Вентер тщательно исследовал западное побережье Соединенных Штатов и завершил двухлетнюю экспедицию в 2006 году по исследованию Балтийского , Средиземного и Черного морей. Анализ метагеномных данных, собранных во время этого путешествия, выявил две группы организмов, одна из которых состояла из таксонов, адаптированных к условиям окружающей среды «пир или голод», а вторая состояла из относительно меньшего количества, но более обильных и широко распространенных таксонов, в основном состоящих из планктона . [16]
В 2005 году Стефан С. Шустер из Университета штата Пенсильвания и его коллеги опубликовали первые последовательности образца окружающей среды, полученные с помощью высокопроизводительного секвенирования , в данном случае массивного параллельного пиросеквенирования, разработанного 454 Life Sciences . [17] Еще одна ранняя статья в этой области появилась в 2006 году Робертом Эдвардсом, Форестом Роуэром и его коллегами из Университета штата Сан-Диего . [18]
Восстановление последовательностей ДНК длиной более нескольких тысяч пар оснований из образцов окружающей среды было очень сложным, пока недавние достижения в области молекулярно-биологических методов не позволили создать библиотеки в бактериальных искусственных хромосомах (BAC), которые предоставили лучшие векторы для молекулярного клонирования . [20]
Достижения в области биоинформатики , усовершенствования амплификации ДНК и распространение вычислительной мощности значительно помогли анализу последовательностей ДНК, извлеченных из образцов окружающей среды, что позволило адаптировать дробовое секвенирование к метагеномным образцам (также известное как дробовое секвенирование всего метагенома или секвенирование WMGS). Подход, используемый для секвенирования многих культивируемых микроорганизмов и генома человека , случайным образом разрезает ДНК, секвенирует множество коротких последовательностей и реконструирует их в консенсусную последовательность . Дробовое секвенирование выявляет гены, присутствующие в образцах окружающей среды. Исторически для облегчения этого секвенирования использовались библиотеки клонов. Однако с достижениями в технологиях высокопроизводительного секвенирования этап клонирования больше не является необходимым, и более высокие выходы данных секвенирования могут быть получены без этого трудоемкого этапа. Метагеномика дробового секвенирования предоставляет информацию как о том, какие организмы присутствуют, так и о том, какие метаболические процессы возможны в сообществе. [21] Поскольку сбор ДНК из окружающей среды в значительной степени не контролируется, наиболее распространенные организмы в образце окружающей среды наиболее высоко представлены в результирующих данных последовательности. Для достижения высокого покрытия, необходимого для полного разрешения геномов недостаточно представленных членов сообщества, необходимы большие выборки, часто недопустимо большие. С другой стороны, случайный характер секвенирования дробовика гарантирует, что многие из этих организмов, которые в противном случае остались бы незамеченными при использовании традиционных методов культивирования, будут представлены по крайней мере некоторыми небольшими сегментами последовательности. [13]
Преимуществом высокопроизводительного секвенирования является то, что этот метод не требует клонирования ДНК перед секвенированием, что устраняет одно из основных смещений и узких мест в отборе проб из окружающей среды. Первые метагеномные исследования, проведенные с использованием высокопроизводительного секвенирования, использовали массивное параллельное пиросеквенирование 454. [17] Три другие технологии, обычно применяемые для отбора проб из окружающей среды, — это Ion Torrent Personal Genome Machine , Illumina MiSeq или HiSeq и система Applied Biosystems SOLiD . [22] Эти методы секвенирования ДНК генерируют более короткие фрагменты, чем секвенирование по Сэнгеру ; Ion Torrent PGM System и пиросеквенирование 454 обычно производят прочтения размером ~400 п.н., Illumina MiSeq производит прочтения размером 400–700 п.н. (в зависимости от того, используются ли опции парных концов), а SOLiD производит прочтения размером 25–75 п.н. [23] Исторически эти длины прочтений были значительно короче типичной длины прочтения секвенирования по Сэнгеру ~750 п.н., однако технология Illumina быстро приближается к этому эталону. Однако это ограничение компенсируется гораздо большим числом прочтений последовательностей. В 2009 году пиросеквенированные метагеномы генерируют 200–500 мегабаз, а платформы Illumina генерируют около 20–50 гигабаз, но эти результаты увеличились на порядки в последние годы. [24]
Новый подход объединяет дробовое секвенирование и захват конформации хромосомы (Hi-C), который измеряет близость любых двух последовательностей ДНК в одной клетке, чтобы направлять сборку микробного генома. [25] Технологии секвенирования длинных прочтений, включая PacBio RSII и PacBio Sequel от Pacific Biosciences , а также Nanopore MinION, GridION, PromethION от Oxford Nanopore Technologies , являются еще одним выбором для получения длинных прочтений дробового секвенирования, которые должны облегчить процесс сборки. [26]
Данные, полученные в ходе экспериментов по метагеномике, являются одновременно огромными и изначально шумными, содержащими фрагментированные данные, представляющие до 10 000 видов. [1] Секвенирование метагенома рубца коровы сгенерировало 279 гигабаз , или 279 миллиардов пар оснований данных о последовательностях нуклеотидов, [28] в то время как каталог генов микробиома кишечника человека идентифицировал 3,3 миллиона генов, собранных из 567,7 гигабаз данных о последовательностях. [29] Сбор, курирование и извлечение полезной биологической информации из наборов данных такого размера представляют собой значительные вычислительные проблемы для исследователей. [21] [30] [31] [32]
Первый шаг анализа метагеномных данных требует выполнения определенных шагов предварительной фильтрации, включая удаление избыточных, низкокачественных последовательностей и последовательностей вероятного эукариотического происхождения (особенно в метагеномах человеческого происхождения). [33] [34] Доступные методы удаления загрязняющих последовательностей эукариотической геномной ДНК включают Eu-Detect и DeConseq. [35] [36]
Данные о последовательностях ДНК из геномных и метагеномных проектов по сути одинаковы, но данные о геномных последовательностях обеспечивают более высокий охват , в то время как метагеномные данные обычно в высшей степени не избыточны. [31] Более того, возросшее использование технологий секвенирования второго поколения с короткими длинами прочтений означает, что большая часть будущих метагеномных данных будет подвержена ошибкам. В совокупности эти факторы делают сборку прочтений метагеномных последовательностей в геномы сложной и ненадежной. Ошибочные сборки вызваны наличием повторяющихся последовательностей ДНК , которые делают сборку особенно сложной из-за разницы в относительном обилии видов, присутствующих в образце. [37] Ошибочные сборки могут также включать объединение последовательностей из более чем одного вида в химерные контиги . [37]
Существует несколько программ сборки, большинство из которых могут использовать информацию из парных конечных тегов для повышения точности сборок. Некоторые программы, такие как Phrap или Celera Assembler, были разработаны для использования при сборке отдельных геномов , но, тем не менее, дают хорошие результаты при сборке наборов метагеномных данных. [1] Другие программы, такие как Velvet assembler , были оптимизированы для более коротких прочтений, полученных при секвенировании второго поколения с использованием графов де Брейна . [38] [39] Использование референтных геномов позволяет исследователям улучшить сборку наиболее распространенных видов микроорганизмов, но этот подход ограничен небольшим подмножеством микробных филумов, для которых доступны секвенированные геномы. [37] После создания сборки дополнительной проблемой является «метагеномная деконволюция», или определение того, какие последовательности происходят от каких видов в образце. [40]
Конвейеры метагеномного анализа используют два подхода к аннотации кодирующих областей в собранных контигах. [37] Первый подход заключается в идентификации генов на основе гомологии с генами, которые уже общедоступны в базах данных последовательностей , обычно с помощью поиска BLAST . Этот тип подхода реализован в программе MEGAN 4. [41] Второй, ab initio , использует внутренние особенности последовательности для прогнозирования кодирующих областей на основе обучающих наборов генов из родственных организмов. Этот подход используется такими программами, как GeneMark [42] и GLIMMER . Главное преимущество прогнозирования ab initio заключается в том, что оно позволяет обнаруживать кодирующие области, в которых отсутствуют гомологи в базах данных последовательностей; однако оно наиболее точно, когда для сравнения доступны большие области смежной геномной ДНК. [1]
Аннотации генов предоставляют информацию о «что», в то время как измерения видового разнообразия предоставляют информацию о «кто». [43] Для того чтобы связать состав сообщества и функцию в метагеномах, последовательности должны быть объединены в биннинг. Биннинг — это процесс связывания определенной последовательности с организмом. [37] При объединении на основе сходства такие методы, как BLAST, используются для быстрого поиска филогенетических маркеров или иным образом похожих последовательностей в существующих общедоступных базах данных. Этот подход реализован в MEGAN . [44] Другой инструмент, PhymmBL, использует интерполированные марковские модели для назначения прочтений. [1] MetaPhlAn и AMPHORA — это методы, основанные на уникальных кладоспецифичных маркерах для оценки относительной численности организмов с улучшенными вычислительными характеристиками. [45] Другие инструменты, такие как mOTU [46] [47] и MetaPhyler [48] , используют универсальные маркерные гены для профилирования прокариотических видов. С помощью профилировщика mOTUs можно профилировать виды без референтного генома, улучшая оценку разнообразия микробного сообщества. [47] Современные методы, такие как SLIMM, используют ландшафт покрытия прочтений отдельных референтных геномов для минимизации ложноположительных результатов и получения надежных относительных значений распространенности. [49] При биннинге на основе состава методы используют внутренние характеристики последовательности, такие как частоты олигонуклеотидов или смещение использования кодонов . [1] После биннинга последовательностей можно проводить сравнительный анализ разнообразия и богатства.
Огромное количество экспоненциально растущих данных о последовательностях является сложной задачей, которая усложняется сложностью метаданных, связанных с метагеномными проектами. Метаданные включают подробную информацию о трехмерной (включая глубину или высоту) географии и экологических особенностях образца, физические данные о месте взятия образца и методологии отбора проб. [31] Эта информация необходима как для обеспечения воспроизводимости , так и для обеспечения нисходящего анализа. Из-за своей важности метаданные и совместный обзор и курирование данных требуют стандартизированных форматов данных, размещенных в специализированных базах данных, таких как Genomes OnLine Database (GOLD). [50]
Было разработано несколько инструментов для интеграции метаданных и данных о последовательностях, что позволяет проводить сравнительный анализ различных наборов данных с использованием ряда экологических индексов. В 2007 году Фолкер Мейер и Роберт Эдвардс и команда из Аргоннской национальной лаборатории и Чикагского университета выпустили Metagenomics Rapid Annotation using Subsystem Technology server ( MG-RAST ) — ресурс сообщества для анализа наборов метагеномных данных. [51] По состоянию на июнь 2012 года было проанализировано более 14,8 терабаз (14x10 12 оснований) ДНК, и более 10 000 общедоступных наборов данных свободно доступны для сравнения в MG-RAST. Более 8 000 пользователей в настоящее время отправили в MG-RAST в общей сложности 50 000 метагеномов. Система интегрированных микробных геномов/метагеномов (IMG/M) также предоставляет набор инструментов для функционального анализа микробных сообществ на основе последовательности их метагенома, основанной на референтных геномах изолятов, включенных в систему интегрированных микробных геномов (IMG) и проект Геномной энциклопедии бактерий и архей (GEBA). [52]
Одним из первых автономных инструментов для анализа высокопроизводительных метагеномных данных дробовика был MEGAN (MEta Genome ANalyzer). [41] [44] Первая версия программы была использована в 2005 году для анализа метагеномного контекста последовательностей ДНК, полученных из кости мамонта. [17] Основываясь на сравнении BLAST с референтной базой данных, этот инструмент выполняет как таксономическое, так и функциональное биннинг, помещая считывания в узлы таксономии NCBI с помощью простого алгоритма наименьшего общего предка (LCA) или в узлы классификаций SEED или KEGG соответственно. [53]
С появлением быстрых и недорогих инструментов секвенирования рост баз данных последовательностей ДНК теперь стал экспоненциальным (например, база данных NCBI GenBank [54] ). Для того чтобы идти в ногу с высокопроизводительным секвенированием, необходимы более быстрые и эффективные инструменты, поскольку основанные на BLAST подходы, такие как MG-RAST или MEGAN, работают медленно для аннотирования больших выборок (например, несколько часов для обработки набора данных/образца небольшого/среднего размера [55] ). Таким образом, недавно появились сверхбыстрые классификаторы, благодаря более доступным мощным серверам. Эти инструменты могут выполнять таксономическую аннотацию с чрезвычайно высокой скоростью, например, CLARK [56] (по словам авторов CLARK, он может точно классифицировать «32 миллиона метагеномных коротких прочтений в минуту»). При такой скорости очень большой набор данных/выборка из миллиарда коротких прочтений может быть обработан примерно за 30 минут.
С ростом доступности образцов, содержащих древнюю ДНК, и из-за неопределенности, связанной с природой этих образцов (древние повреждения ДНК), [57] был создан быстрый инструмент, способный производить консервативные оценки сходства. По словам авторов FALCON, он может использовать смягченные пороги и редактировать расстояния, не влияя на производительность памяти и скорости.
Сравнительный анализ метагеномов может дать дополнительное представление о функции сложных микробных сообществ и их роли в здоровье хозяина. [58] Парные или множественные сравнения метагеномов могут быть сделаны на уровне состава последовательности (сравнение содержания GC или размера генома), таксономического разнообразия или функционального дополнения. Сравнения структуры популяции и филогенетического разнообразия могут быть сделаны на основе 16S рРНК и других филогенетических маркерных генов или — в случае сообществ с низким разнообразием — путем реконструкции генома из набора метагеномных данных. [59] Функциональные сравнения метагеномов могут быть сделаны путем сравнения последовательностей со справочными базами данных, такими как COG или KEGG , и табулирования распространенности по категориям и оценки любых различий для статистической значимости. [53] Этот подход, ориентированный на гены, подчеркивает функциональное дополнение сообщества в целом, а не таксономических групп, и показывает, что функциональные дополнения аналогичны в схожих условиях окружающей среды. [59] Следовательно, метаданные об экологическом контексте метагеномного образца особенно важны в сравнительном анализе, поскольку они предоставляют исследователям возможность изучать влияние среды обитания на структуру и функционирование сообщества. [1]
Кроме того, несколько исследований также использовали шаблоны использования олигонуклеотидов для выявления различий между различными микробными сообществами. Примерами таких методологий являются подход относительного содержания динуклеотидов Виллнера и др. [60] и подход HabiSign Гоша и др. [61]. Последнее исследование также показало, что различия в шаблонах использования тетрануклеотидов могут использоваться для идентификации генов (или метагеномных прочтений), происходящих из определенных местообитаний. Кроме того, некоторые методы, такие как TriageTools [62] или Compareads [63], обнаруживают похожие прочтения между двумя наборами прочтений. Мера сходства, которую они применяют к прочтениям, основана на количестве идентичных слов длины k, общих для пар прочтений.
Ключевой целью сравнительной метагеномики является идентификация микробной группы (групп), которая отвечает за придание определенной среды. Однако из-за проблем в технологиях секвенирования необходимо учитывать артефакты, как в metagenomeSeq. [30] Другие охарактеризовали межмикробные взаимодействия между резидентными микробными группами. Приложение для сравнительного метагеномного анализа на основе графического интерфейса пользователя под названием Community-Analyzer было разработано Кунталом и соавторами [64] , которое реализует алгоритм компоновки графа на основе корреляции, который не только облегчает быструю визуализацию различий в анализируемых микробных сообществах (с точки зрения их таксономического состава), но и дает представление о присущих им межмикробных взаимодействиях, происходящих в них. Примечательно, что этот алгоритм компоновки также позволяет группировать метагеномы на основе вероятных моделей межмикробного взаимодействия, а не просто сравнивать значения распространенности различных таксономических групп. Кроме того, инструмент реализует несколько интерактивных функций на основе графического пользовательского интерфейса, которые позволяют пользователям выполнять стандартные сравнительные анализы микробиомов.
Во многих бактериальных сообществах, естественных или искусственно созданных (например, биореакторах ), существует значительное разделение труда в метаболизме ( синтрофия ), в ходе которого отходы некоторых организмов являются метаболитами для других. [65] В одной из таких систем, метаногенном биореакторе, функциональная стабильность требует присутствия нескольких синтрофных видов ( Syntrophobacterales и Synergistia ), работающих вместе, чтобы превратить сырые ресурсы в полностью метаболизированные отходы ( метан ). [66] Используя сравнительные генные исследования и эксперименты по экспрессии с микрочипами или протеомикой, исследователи могут собрать воедино метаболическую сеть, выходящую за рамки границ видов. Такие исследования требуют подробных знаний о том, какие версии каких белков кодируются какими видами и даже какими штаммами каких видов. Поэтому геномная информация сообщества является еще одним фундаментальным инструментом (вместе с метаболомикой и протеомикой) в стремлении определить, как метаболиты переносятся и трансформируются сообществом. [67]
Метагеномика позволяет исследователям получить доступ к функциональному и метаболическому разнообразию микробных сообществ, но она не может показать, какие из этих процессов активны. [59] Извлечение и анализ метагеномной мРНК ( метатранскриптома ) дает информацию о регуляции и профилях экспрессии сложных сообществ. Из-за технических трудностей ( например, короткого периода полураспада мРНК) при сборе экологической РНК на сегодняшний день было проведено относительно мало метатранскриптомных исследований микробных сообществ in situ . [59] Хотя изначально исследования метатранскриптомики ограничивались технологией микрочипов , они использовали технологии транскриптомики для измерения экспрессии всего генома и количественной оценки микробного сообщества, [59] впервые примененные при анализе окисления аммиака в почвах. [68]
Метагеномное секвенирование особенно полезно при изучении вирусных сообществ. Поскольку вирусы не имеют общего универсального филогенетического маркера (как 16S РНК для бактерий и архей и 18S РНК для эукариот), единственный способ получить доступ к генетическому разнообразию вирусного сообщества из образца окружающей среды — это метагеномика. Таким образом, вирусные метагеномы (также называемые виромами) должны предоставлять все больше и больше информации о вирусном разнообразии и эволюции. [69] [70] [71] [72] [73] Например, метагеномный конвейер под названием Giant Virus Finder показал первые доказательства существования гигантских вирусов в соляной пустыне [74] и в сухих долинах Антарктиды. [75]
Метагеномика имеет потенциал для продвижения знаний в самых разных областях. Она также может быть применена для решения практических задач в медицине , инженерии , сельском хозяйстве , устойчивом развитии и экологии . [31] [76]
Почвы , в которых растут растения, населены микробными сообществами, причем один грамм почвы содержит около 10 9 -10 10 микробных клеток, которые содержат около одной гигабазы информации о последовательностях. [77] [78] Микробные сообщества, населяющие почвы, являются одними из самых сложных, известных науке, и остаются плохо изученными, несмотря на их экономическое значение. [79] Микробные консорциумы выполняют широкий спектр экосистемных услуг , необходимых для роста растений, включая фиксацию атмосферного азота , круговорот питательных веществ , подавление болезней и секвестрацию железа и других металлов . [80] Функциональные стратегии метагеномики используются для изучения взаимодействий между растениями и микробами посредством независимого от выращивания изучения этих микробных сообществ. [81] [82] Позволяя глубже понять роль ранее необрабатываемых или редких членов сообщества в круговороте питательных веществ и стимулировании роста растений, метагеномные подходы могут способствовать улучшению обнаружения заболеваний сельскохозяйственных культур и скота , а также адаптации усовершенствованных методов ведения сельского хозяйства , которые улучшают здоровье сельскохозяйственных культур за счет использования взаимосвязи между микробами и растениями. [31]
Биотопливо — это топливо, получаемое в результате преобразования биомассы , например, при преобразовании целлюлозы, содержащейся в стеблях кукурузы , просе и другой биомассе, в целлюлозный этанол . [31] Этот процесс зависит от микробных консорциумов (ассоциаций), которые преобразуют целлюлозу в сахара , а затем ферментируют сахара в этанол . Микробы также производят различные источники биоэнергии, включая метан и водород . [31]
Эффективная промышленная деконструкция биомассы требует новых ферментов с более высокой производительностью и более низкой стоимостью. [28] Метагеномные подходы к анализу сложных микробных сообществ позволяют проводить целевой скрининг ферментов с промышленным применением в производстве биотоплива, таких как гликозидгидролазы . [83] Кроме того, для их контроля необходимы знания о том, как функционируют эти микробные сообщества, и метагеномика является ключевым инструментом в их понимании. Метагеномные подходы позволяют проводить сравнительный анализ между конвергентными микробными системами, такими как биогазовые ферментеры [84] или насекомыми -травоядными, такими как грибной сад муравьев -листорезов . [85]
Микробные сообщества производят широкий спектр биологически активных химических веществ, которые используются в конкуренции и коммуникации. [80] Многие из используемых сегодня лекарств изначально были обнаружены в микробах; недавний прогресс в добыче богатых генетических ресурсов некультивируемых микробов привел к открытию новых генов, ферментов и натуральных продуктов. [59] [86] Применение метагеномики позволило разработать товарные и тонкие химикаты , агрохимикаты и фармацевтические препараты , где преимущество ферментативного хирального синтеза все больше признается. [87]
В биоразведке метагеномных данных используются два типа анализа : скрининг на основе функций для выраженного признака и скрининг на основе последовательностей для интересующих последовательностей ДНК. [88] Анализ на основе функций направлен на выявление клонов, выражающих желаемый признак или полезную активность, с последующей биохимической характеристикой и анализом последовательностей. Этот подход ограничен доступностью подходящего скрининга и требованием, чтобы желаемый признак был выражен в клетке-хозяине. Более того, низкая скорость обнаружения (менее одного на 1000 проверенных клонов) и его трудоемкость еще больше ограничивают этот подход. [89] Напротив, анализ на основе последовательностей использует консервативные последовательности ДНК для разработки праймеров ПЦР для скрининга клонов на интересующую последовательность. [88] По сравнению с подходами, основанными на клонировании, использование подхода, основанного только на последовательностях, еще больше сокращает объем требуемой лабораторной работы. Применение массивного параллельного секвенирования также значительно увеличивает объем генерируемых данных о последовательностях, что требует высокопроизводительных конвейеров биоинформатического анализа. [89] Подход к скринингу, основанный на последовательностях, ограничен широтой и точностью функций генов, представленных в общедоступных базах данных последовательностей. На практике эксперименты используют комбинацию как функциональных, так и основанных на последовательностях подходов, основанных на интересующей функции, сложности образца, подлежащего скринингу, и других факторах. [89] [90] Примером успешного использования метагеномики в качестве биотехнологии для открытия лекарств является антибиотик малацидин . [91]
Метагеномика может предоставить ценную информацию о функциональной экологии экологических сообществ. [92] Метагеномный анализ бактериальных консорциумов, обнаруженных в испражнениях австралийских морских львов, предполагает, что богатые питательными веществами фекалии морских львов могут быть важным источником питательных веществ для прибрежных экосистем. Это связано с тем, что бактерии, которые выбрасываются одновременно с испражнениями, умеют расщеплять питательные вещества в фекалиях в биодоступную форму, которая может быть включена в пищевую цепочку. [93]
Секвенирование ДНК может также использоваться в более широком смысле для идентификации видов, присутствующих в водоеме, [94] отфильтрованном из воздуха мусоре, образцах грязи или фекалиях животных, [95] и даже для обнаружения элементов рациона из кровяной пищи. [96] Это может установить диапазон инвазивных видов и видов, находящихся под угрозой исчезновения , а также отслеживать сезонные популяции.
Метагеномика может улучшить стратегии мониторинга воздействия загрязняющих веществ на экосистемы и очистки загрязненных сред. Более глубокое понимание того, как микробные сообщества справляются с загрязняющими веществами, улучшает оценку потенциала загрязненных участков для восстановления после загрязнения и увеличивает шансы на успех испытаний биоаугментации или биостимуляции . [97]
Микробные сообщества играют ключевую роль в сохранении здоровья человека , но их состав и механизм, с помощью которого они это делают, остаются загадочными. [98] Метагеномное секвенирование используется для характеристики микробных сообществ из 15–18 участков тела по меньшей мере 250 человек. Это часть инициативы «Человеческий микробиом» , основные цели которой — определить, существует ли основной человеческий микробиом , понять изменения в человеческом микробиоме, которые могут быть связаны со здоровьем человека, и разработать новые технологические и биоинформатические инструменты для поддержки этих целей. [99]
Другое медицинское исследование в рамках проекта MetaHit (Метагеномика кишечного тракта человека) включало 124 человека из Дании и Испании, состоящих из здоровых, страдающих избыточным весом и раздраженным кишечником пациентов. [100] Исследование попыталось классифицировать глубину и филогенетическое разнообразие желудочно-кишечных бактерий. Используя данные последовательности Illumina GA и SOAPdenovo, инструмент на основе графа де Брейна, специально разработанный для сборки коротких прочтений, они смогли сгенерировать 6,58 миллионов контигов размером более 500 п.н. для общей длины контига 10,3 Гб и длины N50 2,2 кб.
Исследование показало, что два бактериальных подразделения, Bacteroidetes и Firmicutes, составляют более 90% известных филогенетических категорий, которые доминируют среди дистальных кишечных бактерий. Используя относительные частоты генов, обнаруженные в кишечнике, эти исследователи идентифицировали 1244 метагеномных кластера, которые критически важны для здоровья кишечного тракта. В этих кластерах диапазонов есть два типа функций: функции домашнего хозяйства и специфические для кишечника. Кластеры генов домашнего хозяйства требуются всем бактериям и часто играют главную роль в основных метаболических путях, включая центральный углеродный метаболизм и синтез аминокислот. Специфические для кишечника функции включают адгезию к белкам хозяина и сбор сахаров из гликолипидов глобозерии. Было показано, что у пациентов с синдромом раздраженного кишечника на 25% меньше генов и меньше бактериальное разнообразие, чем у людей, не страдающих синдромом раздраженного кишечника, что указывает на то, что изменения в разнообразии биома кишечника пациентов могут быть связаны с этим состоянием. [100]
Хотя эти исследования подчеркивают некоторые потенциально ценные медицинские применения, только 31–48,8% прочтений удалось сопоставить со 194 общедоступными геномами бактерий кишечника человека и 7,6–21,2% с бактериальными геномами, доступными в GenBank, что указывает на то, что для обнаружения новых бактериальных геномов необходимо провести еще гораздо больше исследований. [101]
В проекте «Микробиом человека » (HMP) микробные сообщества кишечника были проанализированы с помощью высокопроизводительного секвенирования ДНК. HMP показал, что, в отличие от отдельных видов микроорганизмов, многие метаболические процессы присутствовали во всех местообитаниях организма с различной частотой. Микробные сообщества 649 метагеномов, взятых из семи основных участков тела у 102 человек, были изучены в рамках проекта «Микробиом человека» . Метагеномный анализ выявил различия в нишевом специфическом изобилии среди 168 функциональных модулей и 196 метаболических путей в микробиоме. К ним относились деградация гликозаминогликанов в кишечнике, а также транспорт фосфата и аминокислот, связанный с фенотипом хозяина (pH влагалища) в заднем своде. HMP выявил полезность метагеномики в диагностике и доказательной медицине . Таким образом, метагеномика является мощным инструментом для решения многих насущных проблем в области персонализированной медицины . [102]
У животных метагеномику можно использовать для профилирования их кишечных микробиомов и обнаружения бактерий, устойчивых к антибиотикам. [103] Это может иметь значение для мониторинга распространения заболеваний от диких животных к сельскохозяйственным животным и людям.
Дифференциация инфекционных и неинфекционных заболеваний, а также выявление основной этиологии инфекции может быть сложной задачей. Например, более половины случаев энцефалита остаются недиагностированными, несмотря на обширное тестирование с использованием современных клинических лабораторных методов. Клиническое метагеномное секвенирование обещает быть чувствительным и быстрым методом диагностики инфекции путем сравнения генетического материала, обнаруженного в образце пациента, с базами данных всех известных микроскопических человеческих патогенов и тысячами других бактериальных, вирусных, грибковых и паразитарных организмов, а также с базами данных последовательностей генов устойчивости к противомикробным препаратам с соответствующими клиническими фенотипами. [104]
Метагеномика стала бесценным инструментом, помогающим охарактеризовать разнообразие и экологию патогенов, переносимых гематофагическими (кровососущими) насекомыми, такими как комары и клещи. [105] [106] [107] Метагеномика [ когда? ] регулярно используется должностными лицами и организациями общественного здравоохранения [ где? ] для наблюдения за арбовирусами . [108] [109]