Секвенатор ДНК — это научный инструмент , используемый для автоматизации процесса секвенирования ДНК . При наличии образца ДНК секвенатор ДНК используется для определения порядка четырех оснований: G ( гуанин ), C ( цитозин ), A ( аденин ) и T ( тимин ). Затем это сообщается в виде текстовой строки , называемой считыванием. Некоторые секвенаторы ДНК можно также считать оптическими приборами, поскольку они анализируют световые сигналы, исходящие от флуорохромов, прикрепленных к нуклеотидам .
Первый автоматизированный секвенатор ДНК, изобретенный Ллойдом М. Смитом , был представлен Applied Biosystems в 1987 году. [1] Он использовал метод секвенирования Сэнгера , технологию, которая легла в основу «первого поколения» секвенаторов ДНК [2] [3] и позволила завершить проект по геному человека в 2001 году. [4] Это первое поколение секвенаторов ДНК по сути является автоматизированными системами электрофореза , которые обнаруживают миграцию меченых фрагментов ДНК. Поэтому эти секвенаторы также могут использоваться при генотипировании генетических маркеров, где необходимо определить только длину фрагмента(ов) ДНК (например, микросателлиты , AFLP ).
Проект «Геном человека» стимулировал разработку более дешевых, высокопроизводительных и более точных платформ, известных как секвенаторы нового поколения (NGS), для секвенирования генома человека . К ним относятся платформы секвенирования ДНК 454, SOLiD и Illumina . Секвенирующие машины нового поколения существенно увеличили скорость секвенирования ДНК по сравнению с предыдущими методами Сэнгера. Образцы ДНК могут быть подготовлены автоматически всего за 90 минут, [5] в то время как геном человека может быть секвенирован с 15-кратным покрытием в течение нескольких дней. [6]
Более современные ДНК-секвенаторы третьего поколения, такие как PacBio SMRT и Oxford Nanopore, предлагают возможность секвенирования длинных молекул по сравнению с технологиями короткого считывания, такими как Illumina SBS или DNBSEQ от MGI Tech.
Из-за ограничений в технологии секвенирования ДНК, считывания многих из этих технологий короткие по сравнению с длиной генома, поэтому считывания должны быть собраны в более длинные контиги . [7] Данные также могут содержать ошибки, вызванные ограничениями в технике секвенирования ДНК или ошибками во время амплификации ПЦР . Производители секвенаторов ДНК используют ряд различных методов для определения присутствующих оснований ДНК. Конкретные протоколы, применяемые на разных платформах секвенирования, оказывают влияние на конечные данные, которые генерируются. Поэтому сравнение качества данных и стоимости по разным технологиям может быть сложной задачей. Каждый производитель предоставляет свои собственные способы информирования об ошибках и оценках секвенирования. Однако ошибки и оценки между разными платформами не всегда можно сравнивать напрямую. Поскольку эти системы полагаются на разные подходы к секвенированию ДНК, выбор лучшего секвенатора ДНК и метода, как правило, будет зависеть от целей эксперимента и доступного бюджета. [2]
Первые методы секвенирования ДНК были разработаны Гилбертом (1973) [8] и Сэнгером (1975). [9] Гилберт представил метод секвенирования, основанный на химической модификации ДНК с последующим расщеплением по определенным основаниям, тогда как метод Сэнгера основан на терминации дидезоксинуклеотидной цепи. Метод Сэнгера стал популярным из-за его повышенной эффективности и низкой радиоактивности. Первым автоматизированным секвенатором ДНК был AB370A, представленный в 1986 году компанией Applied Biosystems . AB370A мог секвенировать 96 образцов одновременно, 500 килооснований в день, и достигать длины прочтения до 600 оснований. Это было начало «первого поколения» секвенаторов ДНК, [2] [3] которые реализовали секвенирование по Сэнгеру, флуоресцентные дидезоксинуклеотиды и полиакриламидный гель, зажатый между стеклянными пластинами - пластинчатые гели. Следующим крупным достижением стал выпуск в 1995 году AB310, который использовал линейный полимер в капилляре вместо пластинчатого геля для разделения цепей ДНК методом электрофореза. Эти методы легли в основу завершения проекта генома человека в 2001 году. [4] Проект генома человека стимулировал разработку более дешевых, высокопроизводительных и более точных платформ, известных как секвенаторы следующего поколения (NGS). В 2005 году 454 Life Sciences выпустила секвенатор 454, за которым в 2006 году последовали Solexa Genome Analyzer и SOLiD (Supported Oligo Ligation Detection) от Agencourt. Applied Biosystems приобрела Agencourt в 2006 году, а в 2007 году Roche купила 454 Life Sciences, в то время как Illumina купила Solexa. Ion Torrent вышла на рынок в 2010 году и была приобретена Life Technologies (теперь Thermo Fisher Scientific ). А BGI начала производить секвенаторы в Китае после приобретения Complete Genomics под своим крылом MGI . Это по-прежнему самые распространенные системы NGS из-за их конкурентоспособной стоимости, точности и производительности.
Совсем недавно было представлено третье поколение секвенаторов ДНК. Методы секвенирования, применяемые этими секвенаторами, не требуют амплификации ДНК (полимеразной цепной реакции – ПЦР), что ускоряет подготовку образцов перед секвенированием и снижает количество ошибок. Кроме того, данные секвенирования собираются из реакций, вызванных добавлением нуклеотидов в комплементарную цепь в реальном времени. Две компании представили разные подходы в своих секвенаторах третьего поколения. Секвенаторы Pacific Biosciences используют метод, называемый Single-molecule real-time (SMRT), где данные секвенирования производятся с помощью света (захваченного камерой), испускаемого при добавлении нуклеотида в комплементарную цепь ферментами, содержащими флуоресцентные красители. Oxford Nanopore Technologies – еще одна компания, разрабатывающая секвенаторы третьего поколения с использованием электронных систем на основе технологий обнаружения нанопор.
Секвенаторы ДНК были разработаны, изготовлены и проданы, среди прочего, следующими компаниями.
Секвенатор ДНК 454 стал первым секвенатором нового поколения, который стал коммерчески успешным. [10] Он был разработан компанией 454 Life Sciences и куплен компанией Roche в 2007 году. 454 использует обнаружение пирофосфата, высвобождаемого в результате реакции ДНК-полимеразы при добавлении нуклеотида к штамму-шаблону.
В настоящее время Roche производит две системы на основе своей технологии пиросеквенирования: GS FLX+ и GS Junior System. [11] Система GS FLX+ обещает длину прочтения около 1000 пар оснований, в то время как система GS Junior обещает 400 прочтений пар оснований. [12] [13] Предшественник GS FLX+, система 454 GS FLX Titanium была выпущена в 2008 году, достигая вывода 0,7G данных за запуск с точностью 99,9% после качественного фильтра и длиной прочтения до 700 п.н. В 2009 году Roche выпустила GS Junior, настольную версию секвенатора 454 с длиной прочтения до 400 п.н. и упрощенной подготовкой библиотеки и обработкой данных.
Одним из преимуществ систем 454 является их скорость работы. Рабочую силу можно сократить за счет автоматизации подготовки библиотеки и полуавтоматизации эмульсионной ПЦР. Недостатком системы 454 является то, что она подвержена ошибкам при оценке количества оснований в длинной строке идентичных нуклеотидов. Это называется ошибкой гомополимера и происходит, когда в ряду находится 6 или более идентичных оснований. [14] Другим недостатком является то, что цена реагентов относительно выше по сравнению с другими секвенаторами следующего поколения.
В 2013 году компания Roche объявила, что прекратит разработку технологии 454 и полностью выведет из эксплуатации машины 454 в 2016 году, когда ее технология станет неконкурентоспособной. [15] [16]
Компания Roche выпускает ряд программных инструментов, оптимизированных для анализа данных секвенирования 454. [17] Например,
Illumina производит ряд секвенирующих машин следующего поколения, используя технологию, приобретенную у Manteia Predictive Medicine и разработанную Solexa. [19] Illumina производит ряд секвенирующих машин следующего поколения, используя эту технологию, включая HiSeq, Genome Analyzer IIx, MiSeq и HiScanSQ, которые также могут обрабатывать микрочипы . [20]
Технология, ведущая к этим ДНК-секвенаторам, была впервые выпущена Solexa в 2006 году как Genome Analyzer. [10] Illumina приобрела Solexa в 2007 году. Genome Analyzer использует метод секвенирования синтезом. Первая модель производила 1G за запуск. В течение 2009 года производительность была увеличена с 20G за запуск в августе до 50G за запуск в декабре. В 2010 году Illumina выпустила HiSeq 2000 с производительностью 200, а затем 600G за запуск, что заняло бы 8 дней. На момент своего выпуска HiSeq 2000 представлял собой одну из самых дешевых платформ секвенирования по цене 0,02 доллара за миллион оснований, согласно расчетам Пекинского института геномики .
В 2011 году Illumina выпустила настольный секвенатор под названием MiSeq. На момент выпуска MiSeq мог генерировать 1,5G за запуск с парными конечными 150bp чтениями. Запуск секвенирования может быть выполнен за 10 часов при использовании автоматизированной подготовки образцов ДНК. [10]
Illumina HiSeq использует два программных инструмента для расчета количества и положения кластеров ДНК для оценки качества секвенирования: систему управления HiSeq и анализатор в реальном времени. Эти методы помогают оценить, мешают ли соседние кластеры друг другу. [10]
Life Technologies (теперь Thermo Fisher Scientific ) производит ДНК-секвенаторы под брендами Applied Biosystems и Ion Torrent . Applied Biosystems производит платформу секвенирования следующего поколения SOLiD [21] и ДНК-секвенаторы на основе Сэнгера, такие как 3500 Genetic Analyzer. [22] Под брендом Ion Torrent Applied Biosystems выпускает четыре секвенатора следующего поколения: Ion PGM System, Ion Proton System, Ion S5 и Ion S5xl. [23] Также считается, что компания разрабатывает свой новый капиллярный ДНК-секвенатор под названием SeqStudio, который будет выпущен в начале 2018 года. [24]
SOLiD systems была приобретена Applied Biosystems в 2006 году. SOLiD применяет секвенирование путем лигирования и двойного кодирования оснований . Первая система SOLiD была запущена в 2007 году, генерируя длину считывания 35bp и 3G данных за один запуск. После пяти обновлений система секвенирования 5500xl была выпущена в 2010 году, значительно увеличив длину считывания до 85bp, повысив точность до 99,99% и производя 30G за 7-дневный запуск. [10]
Ограниченная длина считывания SOLiD осталась существенным недостатком [25] и в некоторой степени ограничила его применение в экспериментах, где длина считывания менее важна, таких как повторное секвенирование и анализ транскриптома, а в последнее время и эксперименты по ChIP-Seq и метилированию. [10] Время подготовки образцов ДНК для систем SOLiD стало намного быстрее благодаря автоматизации подготовки библиотек секвенирования, такой как система Tecan. [10]
Данные цветового пространства, полученные платформой SOLiD, могут быть декодированы в ДНК-базы для дальнейшего анализа, однако программное обеспечение, которое учитывает исходную информацию цветового пространства, может дать более точные результаты. Life Technologies выпустила BioScope [26], пакет анализа данных для повторного секвенирования, ChiP-Seq и анализа транскриптома. Он использует алгоритм MaxMapper для картирования считываний цветового пространства.
Компания Beckman Coulter (теперь Danaher ) ранее производила ДНК-секвенаторы на основе терминации цепи и капиллярного электрофореза под названием модели CEQ, включая CEQ 8000. [27] В настоящее время компания производит систему генетического анализа GeXP, которая использует секвенирование с использованием красителя-терминатора . [28] Этот метод использует термоциклер во многом так же, как ПЦР, для денатурации, отжига и удлинения фрагментов ДНК, амплифицируя секвенированные фрагменты. [29] [30]
Pacific Biosciences производит системы секвенирования PacBio RS и Sequel, используя метод секвенирования в реальном времени одной молекулы , или SMRT. [31] Эта система может производить длины считывания в несколько тысяч пар оснований. Более высокие ошибки необработанного считывания исправляются либо с помощью кругового консенсуса — когда одна и та же цепь считывается снова и снова — либо с помощью оптимизированных стратегий сборки . [32] Ученые сообщили о точности 99,9999% с этими стратегиями. [33] Система Sequel была запущена в 2015 году с увеличенной емкостью и более низкой ценой. [34] [35]
Секвенатор MinION от Oxford Nanopore Technologies основан на эволюционирующей технологии секвенирования нанопор для анализа нуклеиновых кислот. [37] Устройство имеет длину четыре дюйма и питается от порта USB . MinION декодирует ДНК напрямую, когда молекула протягивается со скоростью 450 оснований в секунду через нанопору, подвешенную в мембране. [38] Изменения электрического тока указывают на то, какое основание присутствует. Первоначально точность устройства составляла от 60 до 85 процентов по сравнению с 99,9 процента в обычных машинах. [39] Даже неточные результаты могут оказаться полезными, поскольку оно обеспечивает большую длину считывания. [40] В начале 2021 года исследователи из Университета Британской Колумбии использовали специальные молекулярные метки и смогли снизить частоту ошибок устройства с 5 до 15 процентов до менее 0,005 процента даже при секвенировании множества длинных участков ДНК за раз. [41] На основе MinION есть еще две итерации продукта; Первый — это GridION, который является немного большим секвенатором, который обрабатывает до пяти проточных ячеек MinION одновременно. А второй — это PromethION, который использует до 100 000 пор параллельно, что больше подходит для секвенирования большого объема. [42]
MGI производит высокопроизводительные секвенаторы для научных исследований и клинических приложений, такие как DNBSEQ-G50, DNBSEQ-G400 и DNBSEQ-T7, в рамках запатентованной технологии DNBSEQ. [43] Она основана на технологиях секвенирования ДНК с помощью наношариков и синтеза комбинаторных зондовых якорей, в которых наношарики ДНК (DNB) загружаются на чип с узорчатым массивом через жидкостную систему, а затем в адаптерную область DNB добавляется праймер секвенирования для гибридизации . DNBSEQ-T7 может генерировать короткие считывания в очень больших масштабах — до 60 человеческих геномов в день. [44] DNBSEQ-T7 использовался для генерации считываний парных концов длиной 150 п.н., секвенируя 30X, для секвенирования генома SARS-CoV-2 или COVID-19 с целью выявления предрасположенности к генетическим вариантам при тяжелом заболевании COVID-19. [45] Используя новую методику, исследователи из China National GeneBank секвенировали библиотеки без ПЦР на массивах DNBSEQ без ПЦР от MGI, чтобы впервые получить истинное секвенирование всего генома без ПЦР . [46] MGISEQ-2000 использовался при секвенировании РНК отдельных клеток для изучения основного патогенеза и выздоровления у пациентов с COVID-19, как опубликовано в Nature Medicine . [47]
Текущие предложения в области технологий секвенирования ДНК демонстрируют доминирующего игрока: Illumina (декабрь 2019 г.), за которой следуют PacBio , MGI и Oxford Nanopore .