Секвенирование в реальном времени с одной молекулой ( SMRT ) — это метод параллельного секвенирования ДНК с одной молекулой . Секвенирование в реальном времени с одной молекулой использует волновод нулевой моды (ZMW). [1] Один фермент ДНК-полимеразы прикреплен к нижней части ZMW с одной молекулой ДНК в качестве шаблона. ZMW — это структура, которая создает освещенный объем наблюдения, который достаточно мал, чтобы наблюдать только один нуклеотид ДНК, включенный ДНК-полимеразой . Каждое из четырех оснований ДНК присоединено к одному из четырех различных флуоресцентных красителей. Когда нуклеотид включен ДНК-полимеразой, флуоресцентная метка отщепляется и диффундирует из области наблюдения ZMW, где ее флуоресценция больше не наблюдается. Детектор обнаруживает флуоресцентный сигнал включения нуклеотида, и вызов основания производится в соответствии с соответствующей флуоресценцией красителя. [2]
Секвенирование ДНК выполняется на чипе, содержащем множество ZMW. Внутри каждого ZMW одна активная ДНК-полимераза с одной молекулой одноцепочечной ДНК-матрицы иммобилизована на дне, через которое может проникать свет и создавать камеру визуализации, которая позволяет контролировать активность ДНК-полимеразы на уровне одной молекулы. Сигнал от фосфосвязанного нуклеотида, включенного ДНК-полимеразой, обнаруживается по мере синтеза ДНК, что приводит к секвенированию ДНК в реальном времени.
Для подготовки библиотеки фрагменты ДНК придают кольцевую форму с помощью лигирования шпильковых адаптеров. [3]
Для каждого из нуклеотидных оснований существует соответствующая молекула флуоресцентного красителя, которая позволяет детектору идентифицировать основание, включаемое ДНК-полимеразой при выполнении ею синтеза ДНК . Молекула флуоресцентного красителя присоединяется к фосфатной цепи нуклеотида. Когда нуклеотид встраивается ДНК-полимеразой, флуоресцентный краситель расщепляется вместе с фосфатной цепью как часть естественного процесса синтеза ДНК, в ходе которого создается фосфодиэфирная связь для удлинения цепи ДНК. Затем расщепленная молекула флуоресцентного красителя диффундирует из объема обнаружения, так что флуоресцентный сигнал больше не обнаруживается. [4]
Волновод с нулевой модой (ZMW) представляет собой нанофотонную ограничивающую структуру, которая состоит из круглого отверстия в алюминиевой оболочке, нанесенной на прозрачную кремниевую подложку. [5]
Отверстия ZMW имеют диаметр ~70 нм и глубину ~100 нм. Из-за поведения света, когда он проходит через маленькое отверстие, оптическое поле экспоненциально затухает внутри камеры. [6] [7]
Объем наблюдения в освещенном ZMW составляет ~20 зептолитров (20 X 10−21 литров ). В этом объеме активность ДНК-полимеразы, включающей один нуклеотид, может быть легко обнаружена. [4] [8]
Эффективность секвенирования можно измерить по длине считывания, точности и общей пропускной способности на эксперимент. Системы секвенирования PacBio, использующие ZMW, имеют преимущество в виде большой длины считывания, хотя частота ошибок составляет порядка 5-15%, а пропускная способность образца ниже, чем у платформ секвенирования Illumina . [9]
19 сентября 2018 года Pacific Biosciences [PacBio] выпустила Sequel 6.0 chemistry, синхронизировав версию chemistry с версией программного обеспечения. Производительность сравнивается для библиотек с большими вставками с ДНК с высокой молекулярной массой по сравнению с библиотеками с более короткими вставками длиной менее ~15 000 оснований. Для более крупных шаблонов средняя длина прочтения составляет до 30 000 оснований. Для библиотек с более короткими вставками средняя длина прочтения составляет до 100 000 оснований при многократном чтении одной и той же молекулы по кругу. Последние библиотеки с более короткими вставками затем выдают до 50 миллиардов оснований из одной ячейки SMRT. [10]
Компания Pacific Biosciences (PacBio) вывела на рынок секвенирование SMRT в 2011 году [11] после выпуска бета-версии своего инструмента RS в конце 2010 года [12].
На момент коммерциализации длина прочтения имела нормальное распределение со средним значением около 1100 оснований. Новый химический набор, выпущенный в начале 2012 года, увеличил длину прочтения секвенатора; один из первых клиентов химии назвал среднюю длину прочтения от 2500 до 2900 оснований. [13]
Химический набор XL, выпущенный в конце 2012 года, увеличил среднюю длину считывания до более чем 4300 оснований. [14] [15]
21 августа 2013 года PacBio выпустила новый набор для связывания ДНК-полимеразы P4. Этот фермент P4 имеет среднюю длину прочтения более 4300 оснований в паре с химией секвенирования C2 и более 5000 оснований в паре с химией XL. [16] Точность фермента аналогична C2, достигая QV50 между 30X и 40X покрытием. Полученные атрибуты P4 обеспечили более качественные сборки с использованием меньшего количества ячеек SMRT и с улучшенным вызовом вариантов. [16] В сочетании с выбором размера входной ДНК (с использованием электрофорезного прибора, такого как BluePippin) дает среднюю длину прочтения более 7 килобаз. [17]
3 октября 2013 года PacBio выпустила новую комбинацию реагентов для PacBio RS II, ДНК-полимеразу P5 с химией C3 (P5-C3). Вместе они увеличивают длину прочтений секвенирования в среднем до приблизительно 8500 оснований, причем самые длинные прочтения превышают 30000 оснований. [18] Пропускная способность на ячейку SMRT составляет около 500 миллионов оснований, что подтверждается результатами секвенирования клеточной линии CHM1. [19]
15 октября 2014 года PacBio объявила о выпуске новой химии P6-C4 для системы RS II, которая представляет собой 6-е поколение полимеразы компании и химию 4-го поколения — еще больше увеличивая среднюю длину считывания до 10 000–15 000 оснований, причем самые длинные считывания превышают 40 000 оснований. Пропускная способность с новой химией оценивалась от 500 миллионов до 1 миллиарда оснований на ячейку SMRT в зависимости от секвенируемого образца. [20] [21] Это была последняя версия химии, выпущенная для инструмента RS.
Пропускная способность на эксперимент для этой технологии зависит как от длины считывания секвенированных молекул ДНК, так и от общего мультиплекса ячейки SMRT. Прототип ячейки SMRT содержал около 3000 отверстий ZMW, что позволяло проводить параллельное секвенирование ДНК. При коммерциализации каждая ячейка SMRT была снабжена 150 000 отверстий ZMW, которые считывались в двух наборах по 75 000. [22] В апреле 2013 года компания выпустила новую версию секвенатора под названием «PacBio RS II», которая использует все 150 000 отверстий ZMW одновременно, что удваивает пропускную способность на эксперимент. [23] [24] Самый высокий режим пропускной способности в ноябре 2013 года использовал связывание P5, химию C3, выбор размера BluePippin и PacBio RS II, официально выдавший 350 миллионов оснований на ячейку SMRT, хотя набор данных человека de novo был выпущен с химией в среднем 500 миллионов оснований на ячейку SMRT. Пропускная способность варьируется в зависимости от типа секвенируемого образца. [25] С введением химии P6-C4 типичная пропускная способность на ячейку SMRT увеличилась с 500 миллионов оснований до 1 миллиарда оснований.
В сентябре 2015 года компания объявила о запуске нового инструмента для секвенирования Sequel System, который увеличил производительность до 1 миллиона отверстий ZMW. [26] [27]
При использовании прибора Sequel начальные длины считываний были сопоставимы с RS, затем более поздние версии химических реагентов увеличили длину считываний.
23 января 2017 года была выпущена химия V2. Она увеличила среднюю длину прочтения до 10 000–18 000 оснований. [28]
8 марта 2018 года была выпущена химия 2.1. Она увеличила среднюю длину прочтения до 20 000 оснований и половину всех прочтений длиной свыше 30 000 оснований. Выход на ячейку SMRT увеличился до 10 или 20 миллиардов оснований, как для библиотек с большими вставками, так и для библиотек с более короткими вставками (например, ампликон ) соответственно. [29]
19 сентября 2018 года компания анонсировала химию Sequel 6.0 со средней длиной прочтения, увеличенной до 100 000 оснований для библиотек с более короткими вставками и до 30 000 для библиотек с более длинными вставками. Выход SMRT Cell увеличился до 50 миллиардов оснований для библиотек с более короткими вставками. [10]
В апреле 2019 года компания выпустила новую ячейку SMRT с восемью миллионами ZMW, [30] увеличив ожидаемую пропускную способность на ячейку SMRT в восемь раз. [31] Клиенты с ранним доступом в марте 2019 года сообщили о пропускной способности более 58 ячеек, запущенных клиентами, в размере 250 ГБ сырого выхода на ячейку с шаблонами длиной около 15 кб и 67,4 ГБ выхода на ячейку с шаблонами в молекулах с более высоким весом. [32] Производительность системы теперь сообщается либо в непрерывных длинных чтениях с высокой молекулярной массой, либо в предварительно скорректированных чтениях HiFi (также известных как кольцевая консенсусная последовательность (CCS)). Для прочтений с высокой молекулярной массой примерно половина всех чтений имеет длину более 50 кб.
HiFi-исполнение включает исправленные базы с качеством выше оценки Phred Q20, используя повторные проходы ампликона для коррекции. Они принимают ампликоны длиной до 20 кб.
Секвенирование отдельных молекул в реальном времени может применяться для широкого спектра геномных исследований.
Для секвенирования генома de novo длины прочтений от секвенирования в реальном времени одной молекулы сопоставимы или превышают таковые от метода секвенирования Сэнгера, основанного на терминации дидезоксинуклеотидной цепи. Более длинная длина прочтений позволяет проводить секвенирование генома de novo и упрощает сборку генома. [2] [33] [34] Ученые также используют секвенирование в реальном времени одной молекулы в гибридных сборках для геномов de novo, чтобы объединить данные о последовательностях коротких прочтений с данными о последовательностях длинных прочтений. [35] [36] В 2012 году было выпущено несколько рецензируемых публикаций, демонстрирующих автоматизированную доработку бактериальных геномов, [37] [38] включая одну статью, которая обновила Celera Assembler с помощью конвейера для доработки генома с использованием длинных прочтений секвенирования SMRT. [39] В 2013 году ученые подсчитали, что длиннопрочтное секвенирование может быть использовано для полной сборки и завершения большинства бактериальных и архейных геномов. [40]
Одну и ту же молекулу ДНК можно повторно секвенировать независимо, создав кольцевой шаблон ДНК и используя фермент, вытесняющий цепь, который отделяет вновь синтезированную цепь ДНК от шаблона. [41] В августе 2012 года ученые из Института Брода опубликовали оценку секвенирования SMRT для распознавания однонуклеотидных полиморфизмов. [42]
Динамика полимеразы может указывать на то, метилировано ли основание . [43] Ученые продемонстрировали использование секвенирования отдельных молекул в реальном времени для обнаружения метилирования и других модификаций оснований. [44] [45] [46] В 2012 году группа ученых использовала секвенирование SMRT для создания полных метиломов шести бактерий. [47] В ноябре 2012 года ученые опубликовали отчет о метилировании по всему геному штамма E. coli, вызвавшего вспышку заболевания. [48]
Длинные считывания позволяют секвенировать полные изоформы генов, включая 5' и 3' концы. Этот тип секвенирования полезен для захвата изоформ и вариантов сплайсинга. [49] [50]
Секвенирование SMRT имеет несколько применений в репродуктивной генетике при исследовании семей с подозрением на родительский гонадный мозаицизм. Длинные считывания позволяют проводить фазирование гаплотипа у пациентов для исследования родителя происхождения мутаций. Глубокое секвенирование позволяет определять частоты аллелей в сперматозоидах, что имеет значение для оценки риска рецидива для будущего пораженного потомства. [51] [52]
{{cite web}}
: CS1 maint: архивная копия как заголовок ( ссылка )