Секвенирование красителя Illumina

Секвенирование красителем Illumina — это метод, используемый для определения ряда пар оснований в ДНК , также известный как секвенирование ДНК . Концепция обратимой терминированной химии была изобретена Бруно Канардом и Саймоном Сарфати в Институте Пастера в Париже. ^[1]^[2] Он был разработан Шанкаром Баласубраманяном и Дэвидом Кленерманом из Кембриджского университета, ^[3] которые впоследствии основали Solexa, компанию, позже приобретенную Illumina . Этот метод секвенирования основан на обратимых красителях-терминаторах, которые позволяют идентифицировать отдельные нуклеотиды, когда они промываются по цепям ДНК. Его также можно использовать для полногеномного секвенирования и секвенирования областей, анализа транскриптома , метагеномики , обнаружения малых РНК , профилирования метилирования и полногеномного анализа взаимодействия белка и нуклеиновой кислоты . ^[4]^[5]

Обзор

Это работает в три основных этапа: амплификация, упорядочивание и анализ. Процесс начинается с очищенной ДНК. ДНК фрагментируется, и добавляются адаптеры, содержащие сегменты, которые действуют как контрольные точки во время амплификации, секвенирования и анализа. Модифицированную ДНК загружают в проточную ячейку, где будут происходить амплификация и секвенирование. Проточная ячейка содержит нанолунки, которые распределяют фрагменты и помогают избежать переполнения. ^[6] Каждая нанолунка содержит олигонуклеотиды, которые обеспечивают точку крепления адаптеров. Как только фрагменты прикрепятся, начинается фаза, называемая генерацией кластера. На этом этапе создается около тысячи копий каждого фрагмента ДНК с помощью ПЦР с мостиковой амплификацией . Далее на чип наносятся праймеры и модифицированные нуклеотиды. Эти нуклеотиды обладают обратимым блокатором флуоресценции, поэтому ДНК-полимераза может добавлять к фрагменту ДНК только один нуклеотид за раз. ^[6] После каждого раунда синтеза камера фотографирует чип. Компьютер определяет, какое основание было добавлено, по длине волны флуоресцентной метки и записывает это для каждого пятна на чипе. После каждого раунда невключившиеся молекулы смываются. Затем используется этап химического деблокирования для удаления 3'-блокирующей группы флуоресцентного конца. Процесс продолжается до тех пор, пока не будет секвенирована полная молекула ДНК. ^[5] С помощью этой технологии тысячи мест по всему геному секвенируются одновременно посредством массового параллельного секвенирования .

Процедура

Геномная библиотека

После очистки ДНК необходимо создать библиотеку ДНК, геномную библиотеку. Существует два способа создания геномной библиотеки: обработка ультразвуком и тагментация. При тагментации транспозазы случайным образом разрезают ДНК на фрагменты размером от 50 до 500 п.н. и одновременно добавляют адаптеры. ^[6] Генетическая библиотека также может быть создана с помощью обработки ультразвуком для фрагментации геномной ДНК. Обработка ультразвуком фрагментирует ДНК до одинаковых размеров с помощью ультразвуковых звуковых волн. Правый и левый адаптеры должны быть прикреплены ДНК-полимеразой Т7 и ДНК-лигазой Т4 после обработки ультразвуком. Пряди, к которым не удалось перевязать адаптеры, смывают. ^[7]

Адаптеры

Адаптеры содержат три разных сегмента: последовательность, комплементарную твердой подложке (олигонуклеотиды на проточной ячейке), последовательность штрих-кода (индексы) и сайт связывания для праймера секвенирования. ^[6] Индексы обычно имеют длину шесть пар оснований и используются во время анализа последовательности ДНК для идентификации образцов. Индексы позволяют одновременно обрабатывать до 96 различных выборок, это также называется мультиплексированием. Во время анализа компьютер сгруппирует все чтения с одним и тем же индексом. ^[8]^[9] Illumina использует подход «последовательность путем синтеза». ^[9] Этот процесс происходит внутри стеклянной проточной кюветы с акриламидным покрытием. ^[10] Проточная ячейка имеет олигонуклеотиды (короткие нуклеотидные последовательности), покрывающие нижнюю часть ячейки и служащие прочной опорой, удерживающей нити ДНК на месте во время секвенирования. Когда фрагментированная ДНК промывается проточной кюветой, соответствующий адаптер прикрепляется к комплементарной твердой подложке.

Мостовое усиление

После подключения можно начать создание кластера. Цель состоит в том, чтобы создать сотни идентичных нитей ДНК. Некоторые будут передней прядью; в остальном наоборот. Поэтому используются правый и левый адаптеры. Кластеры генерируются посредством мостового усиления. ДНК-полимераза движется вдоль цепи ДНК, создавая комплементарную ей цепь. Исходную прядь смывают, оставляя только обратную прядь. На вершине обратной пряди находится переходная последовательность. Нить ДНК изгибается и прикрепляется к олигонуклеотиду, комплементарному верхней адаптерной последовательности. Полимеразы прикрепляются к обратной цепи, и образуется ее комплементарная цепь (идентичная исходной). Теперь двухцепочечная ДНК денатурирована, так что каждая цепь может отдельно прикрепляться к олигонуклеотидной последовательности, закрепленной на проточной ячейке. Одна будет обратной прядью; другой, вперед. Этот процесс называется мостовой амплификацией, и он происходит одновременно для тысяч кластеров по всей проточной кювете. ^[11]

Клональная амплификация

Снова и снова нити ДНК изгибаются и прикрепляются к твердой основе. ДНК-полимераза синтезирует новую цепь для создания двухцепочечного сегмента, который будет денатурирован так, что все цепи ДНК в одной области происходят из одного источника (клональная амплификация). Клональная амплификация важна для целей контроля качества. Если обнаруживается, что цепь имеет нечетную последовательность, ученые могут проверить обратную цепь, чтобы убедиться, что она имеет дополнение той же странности. Прямые и обратные нити действуют как ограничители для защиты от артефактов. Поскольку при секвенировании Illumina используется ДНК-полимераза, наблюдались ошибки замены оснований, ^[12] особенно на 3'-конце. ^[13] Парное чтение концов в сочетании с генерацией кластера может подтвердить наличие ошибки. Обратные и прямые цепочки должны дополнять друг друга, все обратные чтения должны соответствовать друг другу, а все прямые чтения должны соответствовать друг другу. Если чтение недостаточно похоже на свои аналоги (с которыми оно должно быть клоном), возможно, произошла ошибка. В некоторых лабораторных анализах использовался минимальный порог сходства в 97%. ^[13]

Последовательность путем синтеза

В конце клональной амплификации все обратные цепи смываются с проточной ячейки, оставляя только прямые цепи. Праймер прикрепляется к участку связывания адаптерного праймера прямых цепей, а полимераза добавляет флуоресцентно меченный dNTP к цепи ДНК. За один раунд можно добавить только одно основание, поскольку флуорофор действует как блокирующая группа; однако группа блокировки является обратимой. ^[6] Благодаря использованию четырехцветной химии каждая из четырех основ имеет уникальное излучение, и после каждого раунда машина записывает, какая основа была добавлена. После регистрации цвета флуорофор смывают, а другой дНТФ промывают проточную кювету, и процесс повторяется.

Начиная с запуска NextSeq, а затем и MiniSeq, компания Illumina представила новый химический метод двухцветного секвенирования. Нуклеотиды различаются либо по одному из двух цветов (красный или зеленый), либо по отсутствию цвета («черный»), либо по сочетанию обоих цветов (оранжевый как смесь красного и зеленого).

После прочтения цепи ДНК только что добавленная цепь смывается. Затем праймер с индексом 1 прикрепляется, полимеризует последовательность индекса 1 и смывается. Нить снова образует мост, и 3'-конец цепи ДНК прикрепляется к олигонуклеотиду на проточной ячейке. Праймер с индексом 2 прикрепляется, полимеризует последовательность и смывается.

Полимераза секвенирует комплементарную цепь поверх дугообразной цепи. Они разделяются, и 3'-конец каждой нити блокируется. Прямая цепь смывается, и процесс секвенирования путем синтеза повторяется для обратной цепи.

Анализ данных

Секвенирование происходит одновременно для миллионов кластеров, и каждый кластер содержит около 1000 идентичных копий вставки ДНК. ^[12] Данные о последовательности анализируются путем поиска фрагментов с перекрывающимися областями, называемыми контигами , и их выравнивания. Если эталонная последовательность известна, контиги затем сравниваются с ней для идентификации варианта.

Этот поэтапный процесс позволяет ученым увидеть полную последовательность, даже если нефрагментированная последовательность никогда не запускалась; однако, поскольку длина считывания Illumina не очень велика ^[13] (секвенирование HiSeq может давать длину считывания около 90 п.н. ^[8] ), может возникнуть проблема с разрешением коротких тандемных повторяющихся областей. ^[8]^[12] Кроме того, если последовательность создана заново и ссылка не существует, повторяющиеся области могут вызвать большие трудности при сборке последовательности. ^[12] Дополнительные трудности включают замены оснований (особенно на 3'-конце ридов ^[13] ) неверными полимеразами, химерными последовательностями и смещением ПЦР, все из которых могут способствовать созданию неправильной последовательности. ^[13]

Сравнение с другими методами секвенирования

Этот метод предлагает несколько преимуществ по сравнению с традиционными методами секвенирования, такими как секвенирование по Сэнгеру . Секвенирование по Сэнгеру требует двух реакций: одной для прямого праймера, а другой для обратного праймера. В отличие от Illumina, при секвенировании по Сэнгеру для определения последовательности фрагмента ДНК используются флуоресцентно меченные дидезоксинуклеозидтрифосфаты (ddNTP). В ddNTP отсутствует 3'-ОН-группа, и они навсегда прекращают синтез ДНК. ^[6] В каждую реакционную пробирку добавляются dNTP и ddNTP, а также ДНК-полимераза и праймеры. Соотношение ddNTP к dNTP имеет значение, поскольку ДНК-матрица должна быть полностью синтезирована, а переизбыток ddNTP приведет к созданию множества фрагментов одинакового размера и положения матрицы ДНК. Когда ДНК-полимераза добавляет ddNTP, фрагмент терминируется и синтезируется новый фрагмент. Каждый синтезированный фрагмент на один нуклеотид длиннее предыдущего. После полного синтеза матрицы ДНК фрагменты разделяют с помощью капиллярного электрофореза. В нижней части капиллярной трубки лазер возбуждает флуоресцентно меченные ddNTP, а камера фиксирует излучаемый цвет.

Благодаря автоматизированному характеру секвенирования красителей Illumina можно секвенировать несколько цепей одновременно и быстро получать фактические данные секвенирования. При секвенировании по Сэнгеру одновременно можно секвенировать только одну цепь, и это происходит относительно медленно. Illumina использует только ДНК-полимеразу, а не множество дорогостоящих ферментов , необходимых для других методов секвенирования (например, пиросеквенирования ). ^[14]