Массовое параллельное секвенирование или массивно параллельное секвенирование — это один из нескольких высокопроизводительных подходов к секвенированию ДНК, использующих концепцию массивно параллельной обработки; его также называют секвенированием следующего поколения ( NGS ) или секвенированием второго поколения . Некоторые из этих технологий появились между 1993 и 1998 годами [1] [2] [3] [4] [5] и стали коммерчески доступны с 2005 года. Эти технологии используют миниатюризированные и распараллеленные платформы для секвенирования от 1 миллиона до 43 миллиардов коротких прочтений (от 50 до 400 оснований каждое) за один запуск прибора.
Многие платформы NGS различаются по инженерным конфигурациям и химии секвенирования. Они разделяют техническую парадигму массового параллельного секвенирования с помощью пространственно разделенных, клонально амплифицированных ДНК- шаблонов или отдельных молекул ДНК в проточной ячейке . Эта конструкция сильно отличается от конструкции секвенирования по Сэнгеру — также известного как капиллярное секвенирование или секвенирование первого поколения — которое основано на электрофоретическом разделении продуктов обрыва цепи, полученных в индивидуальных реакциях секвенирования. [6] Эта методология позволяет выполнять секвенирование в большем масштабе. [7]
Секвенирование ДНК с коммерчески доступными платформами NGS обычно проводится с помощью следующих шагов. Во-первых, библиотеки секвенирования ДНК генерируются путем клональной амплификации с помощью ПЦР in vitro . Во-вторых, ДНК секвенируется путем синтеза , так что последовательность ДНК определяется путем добавления нуклеотидов к комплементарной цепи, а не посредством химии обрыва цепи. В-третьих, пространственно разделенные, амплифицированные шаблоны ДНК секвенируются одновременно в массово-параллельном режиме без необходимости в шаге физического разделения. Эти шаги выполняются в большинстве платформ NGS, но каждая использует другую стратегию. [8]
Параллелизация NGS реакций секвенирования генерирует сотни мегабаз и гигабаз нуклеотидных последовательностей считываний за один запуск прибора. Это позволило резко увеличить доступные данные о последовательностях и принципиально изменить подходы к секвенированию генома в биомедицинских науках. [9] Новые появляющиеся технологии и инструменты NGS еще больше способствовали значительному снижению стоимости секвенирования, приближаясь к отметке в 1000 долларов за секвенирование генома . [10] [11]
По состоянию на 2014 год платформы массового параллельного секвенирования стали коммерчески доступными, и их характеристики обобщены в таблице. Поскольку темпы развития технологий NGS стремительно развиваются, технические характеристики и цены меняются.
Отмечены время выполнения и выход гигабазы (Гб) за запуск для секвенирования с одним концом. Время выполнения и выход примерно удваиваются при выполнении секвенирования с парным концом. ‡Средняя длина прочтений для платформ Roche 454 и Helicos Biosciences. [23]
При подготовке шаблонов для реакций NGS используются два метода: амплифицированные шаблоны, происходящие из отдельных молекул ДНК, и шаблоны отдельных молекул ДНК. Для систем визуализации, которые не могут обнаружить отдельные события флуоресценции, требуется амплификация шаблонов ДНК. Три наиболее распространенных метода амплификации — это эмульсионная ПЦР (emPCR), катящийся круг и твердофазная амплификация. Конечное распределение шаблонов может быть пространственно случайным или на сетке.
В методах эмульсионной ПЦР библиотека ДНК сначала генерируется путем случайной фрагментации геномной ДНК. Одноцепочечные фрагменты ДНК (шаблоны) прикрепляются к поверхности гранул с помощью адаптеров или линкеров, и одна гранула прикрепляется к одному фрагменту ДНК из библиотеки ДНК. Поверхность гранул содержит олигонуклеотидные зонды с последовательностями, которые комплементарны адаптерам, связывающим фрагменты ДНК. Затем гранулы разделяются на капли водно-масляной эмульсии. В водной водно-масляной эмульсии каждая из капель, захватывающих одну гранулу, является микрореактором ПЦР , который производит амплифицированные копии одной матрицы ДНК. [24] [25] [26]
За амплификацией популяции отдельных молекул ДНК методом катящегося кольца в растворе следует захват на сетке пятен, размер которых меньше размера иммобилизуемых ДНК. [27] [28] [29] [30] Технологии секвенирования второго поколения, такие как DNBSEQ от MGI Tech или AVITI от Element Biosciences, используют этот подход для подготовки образца в проточной ячейке, который затем визуализируется цикл за циклом.
Прямые и обратные праймеры ковалентно прикрепляются с высокой плотностью к слайду в проточной ячейке. Соотношение праймеров к шаблону на подложке определяет поверхностную плотность амплифицированных кластеров. Проточная ячейка подвергается воздействию реагентов для полимеразного расширения, и праймирование происходит, когда свободный/дистальный конец лигированного фрагмента «соединяется» с комплементарным олиго на поверхности. Повторная денатурация и расширение приводят к локализованной амплификации фрагментов ДНК в миллионах отдельных мест по всей поверхности проточной ячейки. Твердофазная амплификация производит 100–200 миллионов пространственно разделенных кластеров шаблонов, предоставляя свободные концы, с которыми затем гибридизуется универсальный праймер секвенирования для инициирования реакции секвенирования. [24] [25] Эта технология была запатентована в 1997 году в Женевском институте биомедицинских исследований Glaxo-Welcome (GBRI) Паскалем Майером , Эриком Кавашимой и Лораном Фаринелли, [4] [5] и была впервые публично представлена в 1998 году. [31] В 1994 году Крис Адамс и Стив Крон подали патент на аналогичный, но неклональный метод поверхностной амплификации, названный «мостовой амплификацией» [3], адаптированный для клональной амплификации в 1997 году Чёрчем и Митрой. [27] [28]
Протоколы, требующие амплификации ДНК, часто сложны в реализации и могут приводить к ошибкам секвенирования. Подготовка шаблонов из одной молекулы более проста и не требует ПЦР, которая может приводить к ошибкам в амплифицированных шаблонах. Целевые последовательности, богатые AT и GC, часто демонстрируют смещение амплификации, что приводит к их недопредставленности в выравниваниях и сборках генома. Шаблоны из одной молекулы обычно иммобилизуются на твердых носителях с использованием одного из по крайней мере трех различных подходов. В первом подходе пространственно распределенные отдельные молекулы праймера ковалентно прикрепляются к твердому носителю. Шаблон, который готовится путем случайного фрагментирования исходного материала на небольшие размеры (например, ~200–250 п.н.) и добавления общих адаптеров к концам фрагментов, затем гибридизуется с иммобилизованным праймером. Во втором подходе пространственно распределенные шаблоны из одной молекулы ковалентно прикрепляются к твердому носителю путем праймирования и удлинения одноцепочечных шаблонов из одной молекулы из иммобилизованных праймеров. Затем общий праймер гибридизуется с шаблоном. В любом подходе ДНК-полимераза может связываться с иммобилизованной конфигурацией праймированного шаблона для инициирования реакции NGS. Оба вышеуказанных подхода используются Helicos BioSciences. В третьем подходе пространственно распределенные отдельные молекулы полимеразы прикрепляются к твердой подложке, с которой связана праймированная молекула шаблона. Этот подход используется Pacific Biosciences. С помощью этой техники можно использовать более крупные молекулы ДНК (до десятков тысяч пар оснований), и, в отличие от первых двух подходов, третий подход можно использовать с методами реального времени, что приводит к потенциально более длинным длинам считывания.
Целью последовательного секвенирования синтезом (SBS) является определение последовательности образца ДНК путем обнаружения включения нуклеотида ДНК -полимеразой . Сконструированная полимераза используется для синтеза копии одной цепи ДНК, и включение каждого нуклеотида отслеживается. Принцип секвенирования синтезом был впервые описан в 1993 году [1] с улучшениями, опубликованными несколько лет спустя. [32] Ключевые части очень похожи для всех вариантов SBS и включают в себя (1) амплификацию ДНК для усиления последующего сигнала и присоединения ДНК, подлежащей секвенированию, к твердой подложке, (2) генерацию одноцепочечной ДНК на твердой подложке, (3) включение нуклеотидов с использованием сконструированной полимеразы и (4) обнаружение включения нуклеотида. Затем шаги 3–4 повторяются, и последовательность собирается из сигналов, полученных на шаге 4. Этот принцип секвенирования путем синтеза использовался практически во всех приборах массового параллельного секвенирования, включая 454 , PacBio , IonTorrent , Illumina и MGI .
Принцип пиросеквенирования был впервые описан в 1993 году [1] путем объединения твердой подложки с модифицированной ДНК-полимеразой, лишенной 3´-5´экзонуклеазной активности (корректура) и люминесцентного обнаружения в реальном времени с использованием люциферазы светлячков . Были введены все ключевые концепции секвенирования путем синтеза, включая (1) амплификацию ДНК для усиления последующего сигнала и присоединения ДНК, подлежащей секвенированию (шаблона), к твердой подложке, (2) генерацию одноцепочечной ДНК на твердой подложке, (3) включение нуклеотидов с использованием модифицированной полимеразы и (4) обнаружение включенного нуклеотида путем светового обнаружения в реальном времени. В последующей статье [2] концепция получила дальнейшее развитие, и в 1998 году была опубликована статья [32] , в которой авторы показали, что невключенные нуклеотиды можно удалить с помощью четвертого фермента ( апиразы ), что позволяет проводить секвенирование путем синтеза без необходимости вымывания невключенных нуклеотидов.
Этот подход использует обратимые терминатор-связанные dNTP в циклическом методе, который включает в себя включение нуклеотидов, флуоресцентную визуализацию и расщепление. Флуоресцентно меченый терминатор визуализируется по мере добавления каждого dNTP, а затем расщепляется, чтобы обеспечить включение следующего основания. Эти нуклеотиды химически блокируются таким образом, что каждое включение является уникальным событием. Шаг визуализации следует за каждым шагом включения основания, затем заблокированная группа химически удаляется, чтобы подготовить каждую цепь к следующему включению ДНК-полимеразой. Эта серия шагов продолжается в течение определенного количества циклов, как определено пользовательскими настройками прибора. 3'-блокирующие группы изначально были задуманы как ферментативное [33] или химическое обращение [14] [15] Химический метод стал основой для машин Solexa и Illumina. Секвенирование с помощью обратимой терминаторной химии может быть четырехцветным циклом, как, например, используемый Illumina/Solexa, или одноцветным циклом, как, например, используемый Helicos BioSciences. Helicos BioSciences использовала «виртуальные терминаторы», которые являются незаблокированными терминаторами со вторым аналогом нуклеозида, который действует как ингибитор. Эти терминаторы имеют соответствующие модификации для терминирующих или ингибирующих групп, так что синтез ДНК прекращается после добавления одного основания. [25] [34] [35]
В этом подходе реакция расширения последовательности выполняется не полимеразами, а ДНК- лигазой и зондами, кодированными одним основанием, или зондами, кодированными двумя основаниями. В своей простейшей форме флуоресцентно меченый зонд гибридизуется с его комплементарной последовательностью, смежной с праймированной матрицей. Затем добавляется ДНК-лигаза для присоединения меченого красителем зонда к праймеру. Нелигированные зонды смываются, после чего проводится флуоресцентная визуализация для определения идентичности лигированного зонда. Цикл можно повторить либо с помощью расщепляемых зондов для удаления флуоресцентного красителя и регенерации группы 5′-PO4 для последующих циклов лигирования (цепочечное лигирование [16] [36] ), либо путем удаления и гибридизации нового праймера с матрицей (нецепочечное лигирование [18] [19] ).
Pacific Biosciences в настоящее время лидирует в этом методе. Метод секвенирования в реальном времени включает в себя визуализацию непрерывного включения меченых красителем нуклеотидов во время синтеза ДНК: отдельные молекулы ДНК-полимеразы прикрепляются к нижней поверхности отдельных детекторов волновода нулевого режима (детекторы Zmw), которые могут получать информацию о последовательности, в то время как фосфосвязанные нуклеотиды включаются в растущую праймерную цепь. Pacific Biosciences использует уникальную ДНК-полимеразу, которая лучше включает фосфосвязанные нуклеотиды и позволяет повторно секвенировать закрытые кольцевые шаблоны. В то время как точность одиночного считывания составляет 87%, точность консенсуса была продемонстрирована на уровне 99,999% с длиной считывания в несколько килобаз. [37] [38] В 2015 году Pacific Biosciences выпустила новый инструмент для секвенирования под названием Sequel System, который увеличивает производительность примерно в 6,5 раз. [39] [40]
{{cite web}}
: |last=
имеет общее название ( помощь )Массовое параллельное секвенирование колоний ДНК ams98 презентация