stringtranslate.com

Секвенирование красителя Illumina

Секвенирование красителем Illumina — это метод, используемый для определения ряда пар оснований в ДНК , также известный как секвенирование ДНК . Концепция обратимой терминированной химии была изобретена Бруно Канардом и Саймоном Сарфати в Институте Пастера в Париже. [1] [2] Он был разработан Шанкаром Баласубраманяном и Дэвидом Кленерманом из Кембриджского университета, [3] которые впоследствии основали Solexa, компанию, позже приобретенную Illumina . Этот метод секвенирования основан на обратимых красителях-терминаторах, которые позволяют идентифицировать отдельные нуклеотиды, когда они промываются по цепям ДНК. Его также можно использовать для полногеномного секвенирования и секвенирования областей, анализа транскриптома , метагеномики , обнаружения малых РНК , профилирования метилирования и полногеномного анализа взаимодействия белка и нуклеиновой кислоты . [4] [5]

ДНК прикрепляется к проточной ячейке через комплементарные последовательности. Нить изгибается и прикрепляется ко второму олигонуклеотиду, образуя мост. Полимераза синтезирует обратную цепь. Две пряди отпускают и выпрямляют. Каждый образует новый мост (усиление моста). В результате образуется кластер клонов прямой и обратной цепи ДНК.

Обзор

Это работает в три основных этапа: амплификация, упорядочивание и анализ. Процесс начинается с очищенной ДНК. ДНК фрагментируется, и добавляются адаптеры, содержащие сегменты, которые действуют как контрольные точки во время амплификации, секвенирования и анализа. Модифицированную ДНК загружают в проточную ячейку, где будут происходить амплификация и секвенирование. Проточная ячейка содержит нанолунки, которые распределяют фрагменты и помогают избежать переполнения. [6] Каждая нанолунка содержит олигонуклеотиды, которые обеспечивают точку крепления адаптеров. Как только фрагменты прикрепятся, начинается фаза, называемая генерацией кластера. На этом этапе создается около тысячи копий каждого фрагмента ДНК с помощью ПЦР с мостиковой амплификацией . Далее на чип наносятся праймеры и модифицированные нуклеотиды. Эти нуклеотиды обладают обратимым блокатором флуоресценции, поэтому ДНК-полимераза может добавлять к фрагменту ДНК только один нуклеотид за раз. [6] После каждого раунда синтеза камера фотографирует чип. Компьютер определяет, какое основание было добавлено, по длине волны флуоресцентной метки и записывает это для каждого пятна на чипе. После каждого раунда невключившиеся молекулы смываются. Затем используется этап химического деблокирования для удаления 3'-блокирующей группы флуоресцентного конца. Процесс продолжается до тех пор, пока не будет секвенирована полная молекула ДНК. [5] С помощью этой технологии тысячи мест по всему геному секвенируются одновременно посредством массового параллельного секвенирования .

Процедура

Геномная библиотека

После очистки ДНК необходимо создать библиотеку ДНК, геномную библиотеку. Существует два способа создания геномной библиотеки: обработка ультразвуком и тагментация. При тагментации транспозазы случайным образом разрезают ДНК на фрагменты размером от 50 до 500 п.н. и одновременно добавляют адаптеры. [6] Генетическая библиотека также может быть создана с помощью обработки ультразвуком для фрагментации геномной ДНК. Обработка ультразвуком фрагментирует ДНК до одинаковых размеров с помощью ультразвуковых звуковых волн. Правый и левый адаптеры должны быть прикреплены ДНК-полимеразой Т7 и ДНК-лигазой Т4 после обработки ультразвуком. Пряди, к которым не удалось перевязать адаптеры, смывают. [7]

Двухцепочечная ДНК расщепляется транспосомами. Обрезанные концы восстанавливаются, и к каждой цепи ДНК добавляются адаптеры, индексы, сайты связывания праймера и терминальные сайты. Изображение частично основано на видео секвенирования Ilumina [7]

Адаптеры

Адаптеры содержат три разных сегмента: последовательность, комплементарную твердой подложке (олигонуклеотиды на проточной ячейке), последовательность штрих-кода (индексы) и сайт связывания для праймера секвенирования. [6] Индексы обычно имеют длину шесть пар оснований и используются во время анализа последовательности ДНК для идентификации образцов. Индексы позволяют одновременно обрабатывать до 96 различных выборок, это также называется мультиплексированием. Во время анализа компьютер сгруппирует все чтения с одним и тем же индексом. [8] [9] Illumina использует подход «последовательность путем синтеза». [9] Этот процесс происходит внутри стеклянной проточной кюветы с акриламидным покрытием. [10] Проточная ячейка имеет олигонуклеотиды (короткие нуклеотидные последовательности), покрывающие нижнюю часть ячейки и служащие прочной опорой, удерживающей нити ДНК на месте во время секвенирования. Когда фрагментированная ДНК промывается проточной кюветой, соответствующий адаптер прикрепляется к комплементарной твердой подложке.

Миллионы олигонуклеотидов выстилают нижнюю часть каждой дорожки проточной кюветы.

Мостовое усиление

После подключения можно начать создание кластера. Цель состоит в том, чтобы создать сотни идентичных нитей ДНК. Некоторые будут передней прядью; в остальном наоборот. Поэтому используются правый и левый адаптеры. Кластеры генерируются посредством мостового усиления. ДНК-полимераза движется вдоль цепи ДНК, создавая комплементарную ей цепь. Исходную прядь смывают, оставляя только обратную прядь. На вершине обратной пряди находится переходная последовательность. Нить ДНК изгибается и прикрепляется к олигонуклеотиду, комплементарному верхней адаптерной последовательности. Полимеразы прикрепляются к обратной цепи, и образуется ее комплементарная цепь (идентичная исходной). Теперь двухцепочечная ДНК денатурирована, так что каждая цепь может отдельно прикрепляться к олигонуклеотидной последовательности, закрепленной на проточной ячейке. Одна будет обратной прядью; другой, вперед. Этот процесс называется мостовой амплификацией, и он происходит одновременно для тысяч кластеров по всей проточной кювете. [11]

Клональная амплификация

Снова и снова нити ДНК изгибаются и прикрепляются к твердой основе. ДНК-полимераза синтезирует новую цепь для создания двухцепочечного сегмента, который будет денатурирован так, что все цепи ДНК в одной области происходят из одного источника (клональная амплификация). Клональная амплификация важна для целей контроля качества. Если обнаруживается, что цепь имеет нечетную последовательность, ученые могут проверить обратную цепь, чтобы убедиться, что она имеет дополнение той же странности. Прямые и обратные нити действуют как ограничители для защиты от артефактов. Поскольку при секвенировании Illumina используется ДНК-полимераза, наблюдались ошибки замены оснований, [12] особенно на 3'-конце. [13] Парное чтение концов в сочетании с генерацией кластера может подтвердить наличие ошибки. Обратные и прямые цепочки должны дополнять друг друга, все обратные чтения должны соответствовать друг другу, а все прямые чтения должны соответствовать друг другу. Если чтение недостаточно похоже на свои аналоги (с которыми оно должно быть клоном), возможно, произошла ошибка. В некоторых лабораторных анализах использовался минимальный порог сходства в 97%. [13]

Последовательность путем синтеза

В конце клональной амплификации все обратные цепи смываются с проточной ячейки, оставляя только прямые цепи. Праймер прикрепляется к участку связывания адаптерного праймера прямых цепей, а полимераза добавляет флуоресцентно меченный dNTP к цепи ДНК. За один раунд можно добавить только одно основание, поскольку флуорофор действует как блокирующая группа; однако группа блокировки является обратимой. [6] Благодаря использованию четырехцветной химии каждая из четырех основ имеет уникальное излучение, и после каждого раунда машина записывает, какая основа была добавлена. После регистрации цвета флуорофор смывают, а другой дНТФ промывают проточную кювету, и процесс повторяется.

Начиная с запуска NextSeq, а затем и MiniSeq, компания Illumina представила новый химический метод двухцветного секвенирования. Нуклеотиды различаются либо по одному из двух цветов (красный или зеленый), либо по отсутствию цвета («черный»), либо по сочетанию обоих цветов (оранжевый как смесь красного и зеленого).

Меченые нуклеотиды добавляются к цепи ДНК по порядку. Каждый из четырех нуклеотидов имеет идентифицирующую метку, которую можно возбудить, излучая характерную длину волны. Компьютер записывает все выбросы, и на основе этих данных делаются базовые расчеты.

После прочтения цепи ДНК только что добавленная цепь смывается. Затем праймер с индексом 1 прикрепляется, полимеризует последовательность индекса 1 и смывается. Нить снова образует мост, и 3'-конец цепи ДНК прикрепляется к олигонуклеотиду на проточной ячейке. Праймер с индексом 2 прикрепляется, полимеризует последовательность и смывается.

Полимераза секвенирует комплементарную цепь поверх дугообразной цепи. Они разделяются, и 3'-конец каждой нити блокируется. Прямая цепь смывается, и процесс секвенирования путем синтеза повторяется для обратной цепи.

Анализ данных

Секвенирование происходит одновременно для миллионов кластеров, и каждый кластер содержит около 1000 идентичных копий вставки ДНК. [12] Данные о последовательности анализируются путем поиска фрагментов с перекрывающимися областями, называемыми контигами , и их выравнивания. Если эталонная последовательность известна, контиги затем сравниваются с ней для идентификации варианта.

Этот поэтапный процесс позволяет ученым увидеть полную последовательность, даже если нефрагментированная последовательность никогда не запускалась; однако, поскольку длина считывания Illumina не очень велика [13] (секвенирование HiSeq может давать длину считывания около 90 п.н. [8] ), может возникнуть проблема с разрешением коротких тандемных повторяющихся областей. [8] [12] Кроме того, если последовательность создана заново и ссылка не существует, повторяющиеся области могут вызвать большие трудности при сборке последовательности. [12] Дополнительные трудности включают замены оснований (особенно на 3'-конце ридов [13] ) неверными полимеразами, химерными последовательностями и смещением ПЦР, все из которых могут способствовать созданию неправильной последовательности. [13]

Сравнение с другими методами секвенирования

Этот метод предлагает несколько преимуществ по сравнению с традиционными методами секвенирования, такими как секвенирование по Сэнгеру . Секвенирование по Сэнгеру требует двух реакций: одной для прямого праймера, а другой для обратного праймера. В отличие от Illumina, при секвенировании по Сэнгеру для определения последовательности фрагмента ДНК используются флуоресцентно меченные дидезоксинуклеозидтрифосфаты (ddNTP). В ddNTP отсутствует 3'-ОН-группа, и они навсегда прекращают синтез ДНК. [6] В каждую реакционную пробирку добавляются dNTP и ddNTP, а также ДНК-полимераза и праймеры. Соотношение ddNTP к dNTP имеет значение, поскольку ДНК-матрица должна быть полностью синтезирована, а переизбыток ddNTP приведет к созданию множества фрагментов одинакового размера и положения матрицы ДНК. Когда ДНК-полимераза добавляет ddNTP, фрагмент терминируется и синтезируется новый фрагмент. Каждый синтезированный фрагмент на один нуклеотид длиннее предыдущего. После полного синтеза матрицы ДНК фрагменты разделяют с помощью капиллярного электрофореза. В нижней части капиллярной трубки лазер возбуждает флуоресцентно меченные ddNTP, а камера фиксирует излучаемый цвет.

Благодаря автоматизированному характеру секвенирования красителей Illumina можно секвенировать несколько цепей одновременно и быстро получать фактические данные секвенирования. При секвенировании по Сэнгеру одновременно можно секвенировать только одну цепь, и это происходит относительно медленно. Illumina использует только ДНК-полимеразу, а не множество дорогостоящих ферментов , необходимых для других методов секвенирования (например, пиросеквенирования ). [14]

Рекомендации

  1. ^ CA 2158975, Канард, Бруно и Сарфати, Саймон, «Новые производные, используемые для секвенирования нуклеиновых кислот», опубликовано 13 октября 1994 г., передано Институту Пастера. 
  2. ^ Canard B, Сарфати RS (октябрь 1994 г.). «Флуоресцентные субстраты ДНК-полимеразы с обратимыми 3'-метками». Джин . 148 (1): 1–6. дои : 10.1016/0378-1119(94)90226-7. ПМИД  7523248.
  3. ^ «История секвенирования Illumina». Архивировано из оригинала 12 октября 2014 года.
  4. ^ «Illumina - Решения для секвенирования и массивов для генетических исследований» . www.illumina.com .
  5. ^ аб Мейер М, Кирхер М (июнь 2010 г.). «Подготовка библиотеки секвенирования Illumina для захвата и секвенирования мультиплексированных мишеней». Протоколы Колд-Спринг-Харбора . 2010 (6): pdb.prot5448. doi : 10.1101/pdb.prot5448. ПМИД  20516186.
  6. ↑ abcdef Кларк, Дэвид П. (2 ноября 2018 г.). Молекулярная биология. Паздерник, Нанетт Джин, МакГи, Мишель Р. (Третье изд.). Лондон. ISBN 978-0-12-813289-0. ОСЛК  1062496183.{{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
  7. ^ ab «Технология секвенирования Illumina». YouTube . Проверено 24 сентября 2015 г.
  8. ^ abc Фэн Ю.Дж., Лю Ц.Ф., Чен М.Ю., Лян Д., Чжан П. (январь 2016 г.). «Параллельное секвенирование ампликонов с метками относительно длинных продуктов ПЦР с использованием платформы Illumina HiSeq и сборки транскриптома». Ресурсы молекулярной экологии . 16 (1): 91–102. дои : 10.1111/1755-0998.12429. PMID  25959587. S2CID  36882760.
  9. ^ ab Illumina, Inc. «Мультиплексное секвенирование с помощью системы анализатора генома Illumina» (PDF) . Проверено 25 сентября 2015 г.
  10. ^ Куэйл М.А., Смит М., Коупленд П., Отто Т.Д., Харрис С.Р., Коннор Т.Р. и др. (июль 2012 г.). «Рассказ о трех платформах секвенирования следующего поколения: сравнение секвенаторов Ion Torrent, Pacific Biosciences и Illumina MiSeq». БМК Геномика . 13 :341. дои : 10.1186/1471-2164-13-341 . ПМЦ 3431227 . ПМИД  22827831. 
  11. ^ Кларк, Дэвид П.; Паздерник, Нанетт Дж.; МакГи, Мишель Р. (2019). Молекулярная биология . Академическая ячейка. стр. 253–255. ISBN 9780128132883.
  12. ^ abcd Морозова О, Марра М.А. (ноябрь 2008 г.). «Применение технологий секвенирования нового поколения в функциональной геномике». Геномика . 92 (5): 255–64. дои : 10.1016/j.ygeno.2008.07.001. ПМИД  18703132.
  13. ^ abcde Чон Ю.С., Пак СК, Лим Дж., Чун Дж., Ким Б.С. (январь 2015 г.). «Улучшенный конвейер для уменьшения ошибочной идентификации по последовательностям 16S рРНК с использованием платформы Illumina MiSeq». Журнал микробиологии . 53 (1): 60–9. doi : 10.1007/s12275-015-4601-y. PMID  25557481. S2CID  17210846.
  14. ^ Ронаги, Мостафа; Улен, Матиас; Нюрен, Пол (17 июля 1998 г.). «Метод секвенирования на основе пирофосфата реального времени». Наука . 281 (5375): 363–365. дои : 10.1126/science.281.5375.363. ISSN  0036-8075. ПМИД  9705713.