Массивное параллельное секвенирование

Массивное параллельное секвенирование или массово-параллельное секвенирование — это любой из нескольких высокопроизводительных подходов к секвенированию ДНК, использующих концепцию массово-параллельной обработки; его также называют секвенированием следующего поколения ( NGS ) или секвенированием второго поколения . Некоторые из этих технологий появились в период с 1993 по 1998 год ^[1]^[2]^[3]^[4]^[5] и коммерчески доступны с 2005 года. Эти технологии используют миниатюрные и параллельные платформы для секвенирования от 1 до 43 миллиардов коротких чтений ( от 50 до 400 оснований каждое) за один сеанс работы с прибором.

Многие платформы NGS различаются инженерными конфигурациями и химическим составом секвенирования. Они разделяют техническую парадигму массового параллельного секвенирования с помощью пространственно разделенных, клонально амплифицированных матриц ДНК или отдельных молекул ДНК в проточной ячейке . Этот дизайн сильно отличается от метода секвенирования по Сэнгеру , также известного как капиллярное секвенирование или секвенирование первого поколения, которое основано на электрофоретическом разделении продуктов обрыва цепи, полученных в ходе отдельных реакций секвенирования. ^[6] Эта методология позволяет проводить секвенирование в более крупных масштабах. ^[7]

Платформы НГС

Секвенирование ДНК с использованием коммерчески доступных платформ NGS обычно проводится в следующие этапы. Во-первых, библиотеки секвенирования ДНК создаются путем клональной амплификации с помощью ПЦР in vitro . Во-вторых, ДНК секвенируется путем синтеза , так что последовательность ДНК определяется добавлением нуклеотидов к комплементарной цепи, а не химическим путем обрыва цепи. В-третьих, пространственно разделенные амплифицированные матрицы ДНК секвенируются одновременно и в массовом параллельном режиме без необходимости физического разделения. Эти шаги выполняются на большинстве платформ NGS, но каждая использует свою стратегию. ^[8]

Распараллеливание NGS реакций секвенирования позволяет генерировать от сотен мегабаз до гигабаз считываний нуклеотидных последовательностей за один проход прибора. Это позволило резко увеличить количество доступных данных о последовательностях и фундаментально изменить подходы к секвенированию генома в биомедицинских науках. ^[9] Новые технологии и инструменты NGS также способствовали значительному снижению стоимости секвенирования, приближающейся к отметке в 1000 долларов США за секвенирование генома . ^[10]^[11]

По состоянию на 2014 год платформы массово-параллельного секвенирования коммерчески доступны, и их характеристики обобщены в таблице. Поскольку темпы развития технологий NGS быстро развиваются, технические характеристики и цены меняются.

Отмечаются время выполнения и выходная мощность в гигабазе (ГБ) за один цикл для одноконечного секвенирования. Время выполнения и выходные данные примерно удваиваются при выполнении парного секвенирования. ‡Средняя длина чтения для платформ Roche 454 и Helicos Biosciences. ^[23]

Способы подготовки шаблона для NGS

При приготовлении матриц для реакций NGS используются два метода: амплифицированные матрицы, происходящие из отдельных молекул ДНК, и матрицы из одной молекулы ДНК. Для систем визуализации, которые не могут обнаружить отдельные события флуоресценции, требуется амплификация матриц ДНК. Тремя наиболее распространенными методами амплификации являются эмульсионная ПЦР (эмПЦР), метод катящегося круга и твердофазная амплификация. Окончательное распределение шаблонов может быть случайным в пространстве или по сетке.

Эмульсионная ПЦР

В методах эмульсионной ПЦР библиотека ДНК сначала создается путем случайной фрагментации геномной ДНК. Одноцепочечные фрагменты ДНК (матрицы) прикрепляются к поверхности шариков с помощью адаптеров или линкеров, а один шарик прикрепляется к одному фрагменту ДНК из библиотеки ДНК. Поверхность шариков содержит олигонуклеотидные зонды с последовательностями, комплементарными адаптерам, связывающим фрагменты ДНК. Затем гранулы разделяются на капли водно-масляной эмульсии. В водной водно-масляной эмульсии каждая капля, захватывающая одну гранулу, представляет собой микрореактор ПЦР , производящий амплифицированные копии одной матрицы ДНК. ^[24]^[25]^[26]

Наношарики с катящимися кругами с сеткой

За амплификацией популяции одиночных молекул ДНК путем амплификации по катящемуся кругу в растворе следует захват на сетке пятен, размер которых меньше размера ДНК, подлежащей иммобилизации. ^[27]^[28]^[29]^[30]

Генерация колоний ДНК (мостовая амплификация)

Прямые и обратные праймеры ковалентно прикрепляются к предметному стеклу в проточной кювете с высокой плотностью. Соотношение праймеров и матрицы на носителе определяет поверхностную плотность амплифицированных кластеров. Проточная ячейка подвергается воздействию реагентов для полимеразного удлинения, и прайминг происходит, когда свободный/дистальный конец лигированного фрагмента «соединяется» с комплементарным олигонуклеотидом на поверхности. Повторяющаяся денатурация и удлинение приводят к локализованной амплификации фрагментов ДНК в миллионах отдельных мест на поверхности проточной ячейки. Твердофазная амплификация дает 100–200 миллионов пространственно разделенных матричных кластеров, предоставляя свободные концы, с которыми затем гибридизуется универсальный праймер для секвенирования, чтобы инициировать реакцию секвенирования. ^[24]^[25] Эта технология была подана на патент в 1997 году в Женевском институте биомедицинских исследований (GBRI) компании Glaxo-Welcome Паскалем Майером , Эриком Кавашимой и Лораном Фаринелли, ^[4]^[5] и была публично представлена для впервые в 1998 году. ^[31] В 1994 году Крис Адамс и Стив Крон подали патент на аналогичный, но неклональный метод поверхностной амплификации, названный «мостиковой амплификацией» ^[3], адаптированный для клональной амплификации в 1997 году Черчем и Митрой. ^[27]^[28]

Одномолекулярные шаблоны

Протоколы, требующие амплификации ДНК, часто сложны в реализации и могут привести к ошибкам секвенирования. Приготовление шаблонов одиночных молекул более простое и не требует ПЦР, что может привести к ошибкам в амплифицированных шаблонах. Целевые последовательности, богатые AT и GC, часто демонстрируют систематическую ошибку амплификации, что приводит к их недостаточной представленности в выравниваниях и сборках генома. Шаблоны из одной молекулы обычно иммобилизуют на твердых носителях, используя один из по меньшей мере трех различных подходов. В первом подходе пространственно распределенные отдельные молекулы праймера ковалентно присоединяются к твердой подложке. Матрицу, которую готовят путем случайного фрагментирования исходного материала на небольшие размеры (например, ~200–250 п.о.) и добавления общих адаптеров к концам фрагмента, затем гибридизуют с иммобилизованным праймером. Во втором подходе пространственно распределенные одномолекулярные шаблоны ковалентно прикрепляются к твердой основе путем праймирования и удлинения одноцепочечных одномолекулярных шаблонов из иммобилизованных праймеров. Затем с матрицей гибридизуют общий праймер. В любом подходе ДНК-полимераза может связываться с иммобилизованной праймированной конфигурацией матрицы, чтобы инициировать реакцию NGS. Оба вышеуказанных подхода используются Helicos BioSciences. В третьем подходе пространственно распределенные одиночные молекулы полимеразы прикрепляются к твердой подложке, с которой связана примированная молекула-матрица. Этот подход используется Pacific Biosciences. С помощью этого метода можно использовать более крупные молекулы ДНК (до десятков тысяч пар оснований), и, в отличие от первых двух подходов, третий подход может использоваться с методами реального времени, что приводит к потенциально большей длине считывания.

Подходы к секвенированию

Секвенирование путем синтеза

Целью последовательного секвенирования путем синтеза (SBS) является определение последовательности образца ДНК путем обнаружения включения нуклеотида ДНК - полимеразой . Сконструированная полимераза используется для синтеза копии одной цепи ДНК и контролируется включение каждого нуклеотида. Принцип секвенирования путем синтеза был впервые описан в 1993 году ^{^[1],} а некоторые усовершенствования были опубликованы несколько лет спустя. ^[32] Ключевые части очень схожи для всех вариантов реализации SBS и включают (1) амплификацию ДНК для усиления последующего сигнала и прикрепления ДНК, подлежащей секвенированию, к твердой подложке, (2) генерацию одноцепочечной ДНК на твердая подложка, (3) включение нуклеотидов с использованием сконструированной полимеразы и (4) обнаружение включения нуклеотида. Затем повторяются шаги 3-4 и последовательность собирается из сигналов, полученных на шаге 4. Этот принцип секвенирования-синтеза использовался практически для всех массовых инструментов параллельного секвенирования, включая 454 , PacBio , IonTorrent , Illumina и MGI .

Пиросеквенирование

Принцип пиросеквенирования был впервые описан в 1993 году ^{^[1]} путем объединения твердой подложки с сконструированной ДНК-полимеразой, лишенной 3-5-экзонуклеазной активности (корректура), и обнаружения люминесценции в реальном времени с использованием люциферазы светлячка . Были представлены все ключевые концепции секвенирования путем синтеза, включая (1) амплификацию ДНК для усиления последующего сигнала и прикрепление ДНК, подлежащей секвенированию (матрице), к твердой подложке, (2) генерацию одноцепочечной ДНК на твердой подложке. (3) включение нуклеотидов с использованием сконструированной полимеразы и (4) обнаружение включенного нуклеотида с помощью светового обнаружения в режиме реального времени. В последующей статье ^[2] концепция получила дальнейшее развитие, и в 1998 году была опубликована статья ^[32] , в которой авторы показали, что невключенные нуклеотиды могут быть удалены с помощью четвертого фермента ( апиразы ), что позволяет секвенировать путем синтеза. проводиться без необходимости отмывания невключившихся нуклеотидов.

Секвенирование с помощью обратимой химии терминаторов

В этом подходе используются обратимые связанные с терминатором dNTP в циклическом методе, который включает включение нуклеотидов, флуоресцентную визуализацию и расщепление. Терминатор с флуоресцентной меткой визуализируется по мере добавления каждого dNTP, а затем расщепляется, чтобы обеспечить включение следующего основания. Эти нуклеотиды химически заблокированы, поэтому каждое включение является уникальным событием. За каждым этапом включения оснований следует этап визуализации, затем заблокированная группа химически удаляется, чтобы подготовить каждую цепь к следующему включению ДНК-полимеразой. Эта серия шагов продолжается определенное количество циклов, определяемое пользовательскими настройками прибора. 3'-блокирующие группы изначально задумывались как ферментативные ^[33] или химические реверсивные ^[14]^[15] Химический метод лег в основу машин Solexa и Illumina. Секвенирование с помощью обратимой химии терминаторов может представлять собой четырехцветный цикл, например, используемый Illumina/Solexa, или одноцветный цикл, например, используемый Helicos BioSciences. Helicos BioSciences использовала «виртуальные терминаторы», которые представляют собой разблокированные терминаторы со вторым аналогом нуклеозида, который действует как ингибитор. Эти терминаторы имеют соответствующие модификации для терминации или ингибирования групп, так что синтез ДНК прекращается после добавления одного основания. ^[25]^[34]^[35]

Секвенирование путем лигирования, опосредованное ферментами лигазами

В этом подходе реакция удлинения последовательности осуществляется не полимеразами, а скорее ДНК- лигазой и либо зондами, кодируемыми одним основанием, либо зондами, кодируемыми двумя основаниями. В своей простейшей форме флуоресцентно-меченный зонд гибридизуется с комплементарной последовательностью, соседней с загрунтованной матрицей. Затем добавляется ДНК-лигаза, чтобы присоединить меченный красителем зонд к праймеру. Нелигированные зонды смывают, после чего проводят флуоресцентную визуализацию для определения идентичности лигированного зонда. Цикл можно повторить либо с помощью расщепляемых зондов для удаления флуоресцентного красителя и регенерации группы 5'-PO4 для последующих циклов лигирования (цепное лигирование ^[16]^[36] ), либо путем удаления и гибридизации нового праймера с матрицей (несцепное лигирование). перевязка ^[18]^[19] ).

Фосфосвязанные флуоресцентные нуклеотиды или секвенирование в реальном времени

Pacific Biosciences в настоящее время является лидером в этом методе. Метод секвенирования в реальном времени включает визуализацию непрерывного включения меченных красителем нуклеотидов во время синтеза ДНК: отдельные молекулы ДНК-полимеразы прикрепляются к нижней поверхности отдельных волноводных детекторов нулевой моды (детекторы Zmw), которые могут получать информацию о последовательности, в то время как фосфосвязанные нуклеотиды включаются в растущую цепь праймера. Компания Pacific Biosciences использует уникальную ДНК-полимеразу, которая лучше объединяет фосфосвязанные нуклеотиды и позволяет повторно секвенировать замкнутые кольцевые матрицы. В то время как точность однократного чтения составляет 87%, согласованная точность была продемонстрирована на уровне 99,999% при длинах чтения в нескольких килобазах. ^[37]^[38] В 2015 году компания Pacific Biosciences выпустила новый инструмент для секвенирования под названием Sequel System, который увеличивает производительность примерно в 6,5 раз. ^[39]^[40]