В генетике и биохимии секвенирование означает определение первичной структуры (иногда неправильно называемой первичной последовательностью) неразветвленного биополимера . Результатом секвенирования является символическое линейное изображение, известное как последовательность , которое кратко суммирует большую часть структуры на атомном уровне секвенированной молекулы.
Секвенирование ДНК — это процесс определения порядка нуклеотидов в заданном фрагменте ДНК . До сих пор большинство секвенирований ДНК выполнялось с использованием метода терминации цепи, разработанного Фредериком Сэнгером . Этот метод использует специфическое для последовательности завершение реакции синтеза ДНК с использованием модифицированных нуклеотидных субстратов. Однако новые технологии секвенирования, такие как пиросеквенирование, завоевывают все большую долю рынка секвенирования. В настоящее время больше данных о геноме производится с помощью пиросеквенирования, чем секвенирования ДНК по Сэнгеру. Пиросеквенирование позволило проводить быстрое секвенирование генома. Бактериальные геномы можно секвенировать за один запуск с многократным покрытием с помощью этого метода. Этот метод также недавно использовался для секвенирования генома Джеймса Уотсона . [1]
Последовательность ДНК кодирует необходимую информацию для выживания и размножения живых существ. Поэтому определение последовательности полезно в фундаментальных исследованиях того, почему и как живут организмы, а также в прикладных предметах. Из-за ключевого значения ДНК для живых существ знание последовательностей ДНК полезно практически в любой области биологических исследований. Например, в медицине его можно использовать для выявления, диагностики и потенциальной разработки методов лечения генетических заболеваний. Аналогичным образом, исследования патогенов могут привести к методам лечения инфекционных заболеваний. Биотехнология — это бурно развивающаяся дисциплина, имеющая потенциал для многих полезных продуктов и услуг.
Кривая Карлсона — термин, введенный журналом The Economist [2] для описания биотехнологического эквивалента закона Мура и названный в честь автора Роба Карлсона. [3] Карлсон точно предсказал, что время удвоения технологий секвенирования ДНК (измеренное по стоимости и производительности) будет по крайней мере таким же быстрым, как и закон Мура. [4] Кривые Карлсона иллюстрируют быстрое (в некоторых случаях гиперэкспоненциальное) снижение стоимости и увеличение производительности различных технологий, включая секвенирование ДНК, синтез ДНК и ряд физических и вычислительных инструментов, используемых для экспрессии белков и определения структур белков.
При секвенировании с терминатором цепи (секвенировании по Сэнгеру) удлинение инициируется в определенном месте на шаблоне ДНК с помощью короткого олигонуклеотидного «праймера», комплементарного шаблону в этом регионе. Олигонуклеотидный праймер удлиняется с помощью ДНК-полимеразы , фермента, который реплицирует ДНК. В состав праймера и ДНК-полимеразы входят четыре основания дезоксинуклеотида (строительные блоки ДНК) вместе с низкой концентрацией нуклеотида, завершающего цепь (чаще всего дидезоксинуклеотида ) . Дезоксинуклеотиды не имеют группы ОН как в 2'-, так и в 3'-положении молекулы рибозы, поэтому после вставки в молекулу ДНК они предотвращают ее дальнейшее удлинение. В этом секвенаторе используются четыре различных сосуда, каждый из которых содержит только четыре дидезоксирибонуклеотида; включение нуклеотидов, завершающих цепь, ДНК-полимеразой в случайном положении приводит к получению ряда связанных фрагментов ДНК разных размеров, которые заканчиваются заданным дидезоксирибонуклеотидом. Затем фрагменты разделяют по размеру методом электрофореза в пластине полиакриламидного геля или, что сейчас чаще используется, в узкой стеклянной трубке (капилляре), заполненной вязким полимером.
Альтернативой маркировке праймера является маркировка терминаторов, что обычно называется «секвенированием терминаторов с красителем». Главное преимущество этого подхода заключается в том, что полный набор секвенирования может быть выполнен за одну реакцию, а не за четыре, необходимые при подходе с маркированными праймерами. Это достигается путем маркировки каждого из терминаторов цепи дидезоксинуклеотида отдельным флуоресцентным красителем, который флуоресцирует на другой длине волны . Этот метод проще и быстрее, чем подход с праймером с красителем, но может давать более неравномерные пики данных (разные высоты) из-за зависящей от шаблона разницы во включении больших терминаторов цепи красителя. Эта проблема была значительно уменьшена с введением новых ферментов и красителей, которые минимизируют изменчивость включения. Этот метод теперь используется для подавляющего большинства реакций секвенирования, поскольку он и проще, и дешевле. Основная причина этого заключается в том, что праймеры не должны быть отдельно маркированы (что может быть существенным расходом для одноразового индивидуального праймера), хотя это не так важно для часто используемых «универсальных» праймеров. Это быстро меняется из-за растущей экономической эффективности систем второго и третьего поколения от Illumina, 454, ABI, Helicos и Dover.
Метод пиросеквенирования основан на обнаружении высвобождения пирофосфата при включении нуклеотида. Перед выполнением пиросеквенирования цепь ДНК для секвенирования должна быть амплифицирована с помощью ПЦР. Затем выбирается порядок, в котором нуклеотиды должны быть добавлены в секвенатор (т. е. GATC). Когда добавляется определенный нуклеотид, если ДНК-полимераза включает его в растущую цепь, пирофосфат высвобождается и преобразуется в АТФ с помощью АТФ-сульфурилазы. АТФ обеспечивает окисление люциферазы через люциферазу; эта реакция генерирует световой сигнал, регистрируемый как пик пирограммы. Таким образом, включение нуклеотида коррелирует с сигналом. Световой сигнал пропорционален количеству нуклеотидов, включенных во время синтеза цепи ДНК (т. е. два включенных нуклеотида соответствуют двум пикам пирограммы). Когда добавленные нуклеотиды не включены в молекулу ДНК, сигнал не регистрируется; фермент апираза удаляет любой невключенный нуклеотид, оставшийся в реакции. Этот метод не требует ни флуоресцентно-меченых нуклеотидов, ни гель-электрофореза. Пиросеквенирование, разработанное Полом Нюреном и Мостафой Ронаги ДНК, было коммерциализировано Biotage (для низкопроизводительного секвенирования) и 454 Life Sciences (для высокопроизводительного секвенирования). Последняя платформа секвенирует примерно 100 мегабаз [теперь до 400 мегабаз] за семичасовой цикл с помощью одной машины. В методе на основе массива (коммерциализированном 454 Life Sciences) одноцепочечная ДНК отжигается до гранул и амплифицируется с помощью EmPCR . Затем эти ДНК-связанные гранулы помещаются в лунки на оптоволоконном чипе вместе с ферментами , которые производят свет в присутствии АТФ . Когда свободные нуклеотиды промываются над этим чипом, свет вырабатывается, поскольку АТФ генерируется, когда нуклеотиды соединяются со своими комплементарными парами оснований . Добавление одного (или более) нуклеотида(ов) приводит к реакции, которая генерирует световой сигнал, который регистрируется ПЗС-камерой в приборе. Сила сигнала пропорциональна количеству нуклеотидов, например, гомополимерных отрезков, включенных в один поток нуклеотидов. [1]
В то время как методы выше описывают различные методы секвенирования, отдельные связанные термины используются, когда секвенируется большая часть генома. Было разработано несколько платформ для выполнения экзомного секвенирования (подмножества всей ДНК во всех хромосомах, которые кодируют гены) или полного геномного секвенирования (секвенирования всей ядерной ДНК человека).
РНК менее стабильна в клетке, а также более подвержена экспериментальной атаке нуклеазы. Поскольку РНК генерируется путем транскрипции из ДНК, информация уже присутствует в ДНК клетки. Однако иногда желательно секвенировать молекулы РНК . В то время как секвенирование ДНК дает генетический профиль организма, секвенирование РНК отражает только последовательности, которые активно экспрессируются в клетках. Для секвенирования РНК обычным методом является сначала обратная транскрипция РНК, извлеченной из образца, для получения фрагментов кДНК. Затем ее можно секвенировать, как описано выше. Основная часть РНК, экспрессируемой в клетках, представляет собой рибосомальные РНК или малые РНК , пагубные для клеточной трансляции, но часто не являющиеся предметом исследования. Однако эту фракцию можно удалить in vitro , чтобы обогатить для матричной РНК, также включенной, которая обычно представляет интерес. Полученные из экзонов, эти мРНК должны быть позже транслированы в белки, которые поддерживают определенные клеточные функции. Таким образом, профиль экспрессии указывает на клеточную активность, что особенно желательно при изучении заболеваний, клеточного поведения, реакций на реагенты или стимулы. Молекулы эукариотической РНК не обязательно коллинеарны с их шаблоном ДНК, поскольку интроны вырезаются. Это создает определенную сложность для сопоставления считанных последовательностей обратно в геном и, таким образом, определения их происхождения. Для получения дополнительной информации о возможностях секвенирования следующего поколения, применяемого к целым транскриптомам, см.: RNA-Seq и MicroRNA Sequencing .
Методы проведения секвенирования белков включают в себя:
Если известен ген, кодирующий белок, в настоящее время гораздо проще секвенировать ДНК и вывести последовательность белка. Определение части аминокислотной последовательности белка (часто одного конца) одним из вышеперечисленных методов может быть достаточным для идентификации клона, несущего этот ген.
Хотя полисахариды также являются биополимерами, не так часто говорят о «секвенировании» полисахарида по нескольким причинам. Хотя многие полисахариды линейны, многие имеют ответвления. Можно использовать много различных единиц (отдельных моносахаридов ) и связывать их по-разному. Однако главная теоретическая причина заключается в том, что в то время как другие полимеры, перечисленные здесь, в первую очередь генерируются «зависимым от шаблона» образом одним процессивным ферментом, каждое отдельное соединение в полисахариде может быть образовано другим ферментом . Во многих случаях сборка не является однозначно определенной; в зависимости от того, какой фермент действует, может быть включена одна из нескольких различных единиц. Это может привести к образованию семейства похожих молекул. Это особенно верно для растительных полисахаридов. Методы определения структуры олигосахаридов и полисахаридов включают ЯМР- спектроскопию и анализ метилирования. [5]