Вирусная метагеномика использует метагеномные технологии для обнаружения вирусного геномного материала из различных образцов окружающей среды и клинических образцов. [1] [2] Вирусы являются наиболее распространенной биологической сущностью и чрезвычайно разнообразны; однако, только небольшая часть вирусов была секвенирована, и только еще меньшая часть была выделена и культивирована. [1] [3] Секвенирование вирусов может быть сложной задачей, поскольку вирусы не имеют универсально сохраняющегося гена-маркера, поэтому подходы, основанные на генах, ограничены. [3] [4] Метагеномика может использоваться для изучения и анализа некультивируемых вирусов и является важным инструментом для понимания вирусного разнообразия и распространенности, а также для открытия новых вирусов. [1] [5] [6] Например, методы метагеномики использовались для описания вирусов, связанных с раковыми опухолями и в наземных экосистемах. [7]
Традиционные методы обнаружения, характеристики и присвоения вирусной таксономии вирусам основывались на выделении вирусной частицы или ее нуклеиновой кислоты из образцов. [8] Морфологию вируса можно было визуализировать с помощью электронной микроскопии, но только если вирус можно было выделить в достаточно высоком титре для обнаружения. Вирус можно было культивировать в эукариотических клеточных линиях или бактериях, но только если был известен соответствующий тип клетки-хозяина, а нуклеиновая кислота вируса могла быть обнаружена с помощью ПЦР, но только если был известен консенсусный праймер. [8]
Метагеномика не требует предварительных знаний вирусного генома, поскольку не требует универсального гена-маркера, праймера или конструкции зонда. [9] Поскольку этот метод использует инструменты прогнозирования для обнаружения вирусного содержимого образца, его можно использовать для идентификации новых видов вирусов или отличающихся членов известных видов.
Самые ранние метагеномные исследования вирусов были проведены на образцах океана в 2002 году. Последовательности, которые были сопоставлены с контрольными последовательностями, в основном представляли собой двухцепочечные ДНК бактериофагов и двухцепочечные вирусы водорослей. [10]
В 2016 году Международный комитет по таксономии вирусов (ICTV) официально признал, что вирусные геномы, собранные из метагеномных данных, можно классифицировать, используя те же процедуры, что и вирусы, выделенные с помощью классических подходов вирусологии. [11]
В исследовании метагеномики 2002 года ученые обнаружили, что 65% последовательностей ДНК и РНК вирусов не имели соответствий в справочных базах данных. [10] Это явление несовпадения вирусных последовательностей в справочных базах данных последовательностей распространено в исследованиях вирусной метагеномики и называется «вирусной темной материей». [3] [8] Оно в основном вызвано отсутствием полных последовательностей вирусного генома различных образцов в справочных базах данных и быстрой скоростью вирусной эволюции. [3] [8]
В дополнение к этим проблемам, существует семь классов вирусов, основанных на системе классификации Балтимора, которая группирует вирусы на основе их геномной структуры и способа транскрипции: есть вирусы с двухцепочечной ДНК, вирусы с одноцепочечной ДНК, вирусы с двухцепочечной РНК и вирусы с одноцепочечной РНК. [12] Одноцепочечная РНК может быть положительной или отрицательной. Эти различные типы нуклеиновых кислот требуют различных подходов к секвенированию, и не существует универсального генного маркера, который был бы консервативен для всех типов вирусов. [3] [4] Подходы, основанные на генах, могут быть нацелены только на определенные группы вирусов (например, вирусы с РНК, которые разделяют консервативную последовательность РНК-полимеразы). [3] [4]
В справочных базах данных все еще сохраняется предвзятость в сторону ДНК-вирусов. Распространенные причины этого предвзятого отношения заключаются в том, что РНК-вирусы мутируют быстрее, чем ДНК-вирусы, ДНК легче обрабатывать из образцов, тогда как РНК нестабильна, и для анализа метагеномики РНК (обратная транскрипция) требуется больше шагов. [4] [8]
Последовательности могут быть загрязнены последовательностями организма-хозяина, что особенно проблематично, если организм-хозяин вируса неизвестен. [4] Также может иметь место загрязнение в результате извлечения нуклеиновых кислот и ПЦР. [4]
Метагеномный анализ использует секвенирование всего генома методом дробовика для характеристики микробного разнообразия в клинических и экологических образцах. Общая ДНК и/или РНК извлекаются из образцов и готовятся в библиотеке ДНК или РНК для секвенирования. [9] Эти методы использовались для секвенирования всего генома вируса Эпштейна-Барр (EBV) и HCV , однако загрязнение нуклеиновых кислот хозяина может повлиять на чувствительность к целевому вирусному геному, при этом доля прочтений, связанных с целевой последовательностью, часто бывает низкой. [13] [14]
Система IMG/VR и IMG/VR v.2.0 являются крупнейшими интерактивными общедоступными базами данных вирусов с более чем 760 000 метагеномных вирусных последовательностей и изолятами вирусов и служат отправной точкой для анализа последовательностей вирусных фрагментов, полученных из метагеномных образцов. [15] [16]
В то время как нецелевая метагеномика и метатранскриптомика не нуждаются в генетическом маркере, секвенирование ампликона нуждается в нем. Оно использует ген, который высококонсервативен в качестве генетического маркера, но из-за разнообразных типов нуклеиновых кислот используемый маркер должен быть для определенных групп вирусов. [3] [4] Это делается с помощью ПЦР-амплификации праймеров, которые комплементарны известной, высококонсервативной нуклеотидной последовательности. [9] Затем за ПЦР следуют методы секвенирования всего генома , и он использовался для отслеживания эпидемий вируса Эбола [17] , вируса Зика [18] и COVID-19 [19] . Секвенирование ампликона с помощью ПЦР более успешно для секвенирования всего генома образцов с низкими концентрациями. Однако при более крупных вирусных геномах и гетерогенности РНК-вирусов может потребоваться несколько перекрывающихся праймеров для покрытия амплификации всех генотипов. Для секвенирования ампликонов методом ПЦР требуются знания вирусного генома до секвенирования, соответствующие праймеры, и оно сильно зависит от титров вируса, однако секвенирование ампликонов методом ПЦР является более дешевым методом оценки, чем метагеномное секвенирование при изучении известных вирусов с относительно небольшими геномами. [9]
Обогащение мишени — это независимый от культуры метод, который секвенирует вирусные геномы непосредственно из образца с использованием небольших зондов РНК или ДНК, комплементарных референсной последовательности патогенов. Зонды, которые могут быть связаны с твердой фазой, захватывают и вытягивают комплементарные последовательности ДНК в образце. [9] Наличие перекрывающихся зондов повышает толерантность к несовпадениям праймеров, но их разработка требует больших затрат и времени, поэтому быстрый ответ ограничен. Захват ДНК сопровождается коротким циклом ПЦР и дробовым секвенированием. Успех этого метода зависит от доступных референсных последовательностей для создания зондов и не подходит для характеристики новых вирусов. [9] Этот метод использовался для характеристики больших и малых вирусов, таких как HCV , [14] HSV-1 , [20] и HCMV . [21]
Методы вирусной метагеномики могут создавать ошибочные химерные последовательности. [22] [23] Они могут включать артефакты in vitro от амплификации и артефакты in silico от сборки. [23] Химеры могут образовываться между неродственными вирусами, а также между вирусными и эукариотическими последовательностями. [23] Вероятность ошибок частично снижается за счет большей глубины секвенирования, но химеры все еще могут образовываться в областях с высоким покрытием, если прочтения сильно фрагментированы. [22]
Вирусы растений представляют глобальную угрозу для производства сельскохозяйственных культур, но посредством метагеномного секвенирования и создания вирусной базы данных модифицированные вирусы растений могут быть использованы для помощи в иммунитете растений, а также для изменения внешнего вида. [24] Данные, полученные о геномах вирусов растений с помощью метагеномного секвенирования, могут быть использованы для создания клонированных вирусов для инокуляции растений с целью изучения вирусных компонентов и биологической характеристики вирусных агентов с повышенной воспроизводимостью. Сконструированные мутантные штаммы вирусов использовались для изменения окраски и размера различных декоративных растений и улучшения здоровья сельскохозяйственных культур. [25]
Вирусная метагеномика способствует классификации вирусов без необходимости в методологиях, основанных на культуре, и предоставила обширные знания о вирусном разнообразии в любой системе. Метагеномика может использоваться для изучения воздействия вирусов на данную экосистему и того, как они влияют на микробиом, а также для мониторинга вирусов в экосистеме на предмет возможного распространения на популяции людей. [1] В экосистемах вирусы могут изучаться для определения того, как они конкурируют друг с другом, а также вирусного воздействия на функции хозяина. Вирусная метагеномика использовалась для изучения некультивируемых вирусных сообществ в морских и почвенных экосистемах. [7] [26]
Вирусная метагеномика легко используется для обнаружения новых вирусов, с основным акцентом на зоонозных или патогенных для человека. Вирусные базы данных, полученные с помощью метагеномики, предоставляют методы быстрого реагирования для определения вирусных инфекций, а также определения вариантов, устойчивых к лекарствам, в клинических образцах. [9] Вклад вирусной метагеномики в вирусную классификацию помог усилиям по наблюдению за пандемиями, а также сделал наблюдение за инфекционными заболеваниями и тестирование более доступными. [27] Поскольку большинство пандемий у людей имеют зоонозное происхождение, метагеномное наблюдение может обеспечить более быструю идентификацию новых вирусов и их резервуаров. [28]
Одной из таких программ наблюдения является Глобальный проект Virome (GVP) — международная совместная исследовательская инициатива, базирующаяся в Институте One Health Калифорнийского университета в Дэвисе . [29] [30] Целью GVP является усиление надзора за инфекционными заболеваниями во всем мире путем использования недорогих методов секвенирования в странах с высоким риском для предотвращения вспышек заболеваний и предотвращения будущих вспышек вирусов. [27] [31]
Вирусная метагеномика использовалась для тестирования на вирусные виды рака и трудно диагностируемые случаи в клинической диагностике. [31] Этот метод чаще всего используется, когда обычные и передовые молекулярные тесты не могут найти возбудителя заболевания. Метагеномное секвенирование также может использоваться для обнаружения патогенных вирусов в клинических образцах и предоставления данных в реальном времени о наличии патогенов в популяции. [28]
Методы, используемые для клинической вирусной метагеномики, не стандартизированы, но Европейским обществом клинической вирусологии были опубликованы руководящие принципы. [32] [33] Для клинической вирусной метагеномики используется смесь различных платформ секвенирования, наиболее распространенными из которых являются инструменты от Illumina и Oxford Nanopore Technologies . Существует также несколько различных протоколов, как для работы в мокрой лаборатории, так и для биоинформатического анализа, которые используются. [34]