Бисульфитное [1] секвенирование (также известное как бисульфитное секвенирование ) представляет собой использование бисульфитной обработки ДНК перед рутинным секвенированием для определения характера метилирования . Метилирование ДНК было первой обнаруженной эпигенетической меткой и остается наиболее изученной. У животных оно преимущественно включает добавление метильной группы к позиции углерода-5 остатков цитозина динуклеотида CpG и участвует в подавлении транскрипционной активности .
Обработка ДНК бисульфитом преобразует остатки цитозина в урацил , но оставляет остатки 5-метилцитозина нетронутыми. Поэтому ДНК, обработанная бисульфитом, сохраняет только метилированные цитозины. Таким образом, обработка бисульфитом вносит специфические изменения в последовательность ДНК , которые зависят от статуса метилирования отдельных остатков цитозина, давая информацию о разрешении по одному нуклеотиду о статусе метилирования сегмента ДНК. Различные анализы могут быть выполнены на измененной последовательности для получения этой информации. Таким образом, цель этого анализа сводится к дифференциации между полиморфизмами по одному нуклеотиду (цитозины и тимидин ), возникающими в результате конверсии бисульфита (рисунок 1).
Бисульфитное секвенирование применяет рутинные методы секвенирования на обработанной бисульфитом геномной ДНК для определения статуса метилирования в динуклеотидах CpG. Другие несеквенирующие стратегии также используются для исследования метилирования в определенных локусах или на уровне всего генома . Все стратегии предполагают, что индуцированное бисульфитом преобразование неметилированных цитозинов в урацил завершено, и это служит основой всех последующих методов. В идеале используемый метод должен определять статус метилирования отдельно для каждого аллеля . Альтернативные бисульфитному секвенированию методы включают комбинированный бисульфитный рестрикционный анализ и иммунопреципитацию метилированной ДНК (MeDIP).
Методологии анализа ДНК, обработанной бисульфитом, постоянно развиваются. Чтобы подвести итог этим быстро развивающимся методологиям, были написаны многочисленные обзорные статьи. [2] [3] [4] [5]
Методологии можно в целом разделить на стратегии, основанные на метилспецифической ПЦР (MSP) (рисунок 4), и стратегии, использующие полимеразную цепную реакцию (ПЦР), проводимую в условиях, неспецифических для метилирования (рисунок 3). Методы, основанные на микрочипах, также используют ПЦР, основанную на условиях, неспецифических для метилирования.
Первый описанный метод анализа метилирования с использованием обработанной бисульфитом ДНК использовал ПЦР и стандартное дидезоксинуклеотидное секвенирование ДНК для прямого определения нуклеотидов, устойчивых к бисульфитной конверсии. [6] Праймеры разработаны так, чтобы быть специфичными как для цепи, так и для бисульфита (т. е. праймеры, содержащие не-CpG цитозины, так что они не комплементарны необработанной бисульфитом ДНК), фланкируя (но не вовлекая) интересующий сайт метилирования. Поэтому он будет амплифицировать как метилированные, так и неметилированные последовательности, в отличие от специфичной для метилирования ПЦР. Все сайты неметилированных цитозинов отображаются как тимины в результирующей амплифицированной последовательности смысловой цепи и как аденины в амплифицированной антисмысловой цепи. Включая адаптеры высокопроизводительного секвенирования в праймеры ПЦР, продукты ПЦР можно секвенировать с помощью массивного параллельного секвенирования. Альтернативно, и трудоемко, продукт ПЦР может быть клонирован и секвенирован. Методы вложенной ПЦР могут быть использованы для улучшения продукта для секвенирования .
Все последующие методы анализа метилирования ДНК с использованием обработанной бисульфитом ДНК основаны на этом отчете Фроммера и др. (рисунок 2). [6] Хотя большинство других методов не являются истинными методами секвенирования, термин «бисульфитное секвенирование» часто используется для описания методов анализа метилирования ДНК с бисульфитной конверсией в целом.
Пиросеквенирование также использовалось для анализа обработанной бисульфитом ДНК без использования ПЦР, специфичной для метилирования. [7] [8] После ПЦР-амплификации интересующей области пиросеквенирование используется для определения преобразованной бисульфитом последовательности определенных участков CpG в этой области. Соотношение C-к-T в отдельных участках можно определить количественно на основе количества включений C и T во время расширения последовательности. Основным ограничением этого метода является стоимость технологии. Однако пиросеквенирование хорошо позволяет расширить методы скрининга с высокой пропускной способностью .
Вариант этого метода, описанный Вонгом и др. , использует аллель-специфичные праймеры, которые включают однонуклеотидные полиморфизмы в последовательность секвенирующего праймера, что позволяет проводить отдельный анализ материнских и отцовских аллелей . [9] Этот метод особенно полезен для анализа геномного импринтинга .
Этот метод основан на методе анализа полиморфизма одноцепочечной конформации (SSCA), разработанном для анализа полиморфизма однонуклеотидов (SNP). [10] SSCA различает одноцепочечные фрагменты ДНК одинакового размера, но с разной последовательностью на основе дифференциальной миграции в неденатурирующем электрофорезе . В MS-SSCA это используется для различения обработанных бисульфитом, амплифицированных ПЦР областей, содержащих интересующие сайты CpG. Хотя SSCA не обладает чувствительностью, когда присутствует только одно нуклеотидное различие, обработка бисульфитом часто производит ряд преобразований C в T в большинстве интересующих регионов, и результирующая чувствительность приближается к 100%. MS-SSCA также обеспечивает полуколичественный анализ степени метилирования ДНК на основе соотношения интенсивностей полос. Однако этот метод предназначен для оценки всех сайтов CpG в целом в интересующей области, а не отдельных сайтов метилирования.
Еще одним методом дифференциации преобразованной и не преобразованной обработанной бисульфитом ДНК является использование анализа плавления высокого разрешения (HRM), количественной методики на основе ПЦР , изначально разработанной для различения SNP. [11] Ампликоны ПЦР анализируются напрямую путем изменения температуры и последующего высвобождения интеркалирующего флуоресцентного красителя во время плавления. Степень метилирования, представленная содержанием C-to-T в ампликоне , определяет скорость плавления и последующего высвобождения красителя. Этот метод позволяет проводить прямое количественное определение в однопробирочном анализе, но оценивает метилирование в амплифицированной области в целом, а не в конкретных участках CpG .
MS-SnuPE использует метод удлинения праймера, изначально разработанный для анализа однонуклеотидных полиморфизмов . [12] ДНК преобразуется в бисульфит, и бисульфит-специфичные праймеры отжигаются с последовательностью до пары оснований непосредственно перед интересующим CpG. Праймеру позволяют удлинить одну пару оснований до C (или T) с использованием ДНК-полимеразы, завершающей дидезоксинуклеотиды , и соотношение C к T определяется количественно.
Для определения этого соотношения C:T можно использовать ряд методов. В начале MS-SnuPE полагался на радиоактивные ddNTP в качестве репортера удлинения праймера. Также можно использовать методы на основе флуоресценции или пиросеквенирования . [13] Однако для различения двух полиморфных продуктов удлинения праймера можно использовать анализ масс-спектрометрии с лазерной десорбцией и ионизацией с матрицей/времяпролетом ( MALDI-TOF ) , по сути, на основе анализа GOOD, разработанного для генотипирования SNP . Высокоэффективная жидкостная хроматография с обращенной фазой и ионными парами (IP-RP- HPLC ) также использовалась для различения продуктов удлинения праймера. [14]
Недавно описанный Эрихом и соавторами метод дополнительно использует преимущества бисульфитных конверсий, добавляя шаг расщепления, специфичный для основания, для улучшения информации, полученной из изменений нуклеотидов. [15] Сначала используя in vitro транскрипцию интересующей области в РНК (добавляя сайт промотора РНК-полимеразы к праймеру ПЦР при начальной амплификации), РНКазу А можно использовать для расщепления транскрипта РНК в сайтах, специфичных для основания. Поскольку РНКаза А расщепляет РНК специфически на цитозиновых и урациловых рибонуклеотидах , специфичность к основанию достигается путем добавления включения устойчивого к расщеплению dTTP , когда желательно расщепление, специфичное для цитозина (C-специфическое), и включения dCTP, когда желательно расщепление, специфичное для урацила (U-специфическое). Затем расщепленные фрагменты можно проанализировать с помощью MALDI-TOF . Обработка бисульфитом приводит либо к введению/удалению участков расщепления путем преобразования C в U, либо к сдвигу массы фрагмента путем преобразования G в A в амплифицированной обратной цепи. C-специфическое расщепление будет специфически резать все метилированные участки CpG . Анализируя размеры полученных фрагментов, можно определить конкретную схему метилирования ДНК участков CpG в пределах региона, а не определять степень метилирования региона в целом. Этот метод продемонстрировал эффективность для высокопроизводительного скрининга , что позволяет проводить исследование многочисленных участков CpG в нескольких тканях экономически эффективным способом.
Этот альтернативный метод анализа метилирования также использует обработанную бисульфитом ДНК, но избегает необходимости секвенирования интересующей области. [16] Вместо этого пары праймеров разрабатываются так, чтобы быть «специфичными к метилированию», включая последовательности, дополняющие только неконвертированные 5-метилцитозины , или, наоборот, «специфичными к неметилированию», дополняя тимины, преобразованные из неметилированных цитозинов. Метилирование определяется способностью специфического праймера достигать амплификации. Этот метод особенно полезен для исследования CpG-островков с возможно высокой плотностью метилирования, поскольку увеличенное количество пар CpG в праймере увеличивает специфичность анализа. Размещение пары CpG на 3'-конце праймера также повышает чувствительность. Первоначальный отчет с использованием MSP описывал достаточную чувствительность для обнаружения метилирования 0,1% аллелей . В целом MSP и связанные с ним протоколы считаются наиболее чувствительными при оценке статуса метилирования в определенном локусе .
Метод MethyLight основан на MSP, но обеспечивает количественный анализ с использованием количественной ПЦР . [17] Используются метилированные специфические праймеры, а также метилированный специфический флуоресцентный репортерный зонд, который отжигается с амплифицированной областью. В альтернативном варианте праймеры или зонд могут быть разработаны без специфичности метилирования, если необходимо различение пар CpG в задействованных последовательностях. Количественное определение выполняется относительно метилированной референтной ДНК. Модификация этого протокола для повышения специфичности ПЦР для успешно преобразованной бисульфитом ДНК (ConLight-MSP) использует дополнительный зонд для не преобразованной бисульфитом ДНК для количественной оценки этой неспецифической амплификации. [18]
Дальнейшая методология с использованием MSP-амплифицированной ДНК анализирует продукты с использованием анализа кривой плавления (Mc-MSP). [19] Этот метод амплифицирует бисульфит-преобразованную ДНК как с метилированными, так и с неметилированными специфическими праймерами и определяет количественное соотношение двух продуктов путем сравнения дифференциальных пиков, полученных при анализе кривой плавления. Был введен метод анализа плавления с высоким разрешением, который использует как количественную ПЦР, так и анализ плавления, в частности, для чувствительного обнаружения метилирования низкого уровня [20]
Методы на основе микрочипов являются логическим продолжением технологий, доступных для анализа обработанной бисульфитом ДНК, что позволяет проводить анализ метилирования по всему геному. [21] Олигонуклеотидные микрочипы разработаны с использованием пар олигонуклеотидных гибридизационных зондов, нацеленных на интересующие сайты CpG . Один из них комплементарен неизмененной метилированной последовательности, а другой комплементарен неметилированной последовательности, преобразованной из C в U. Зонды также являются бисульфит-специфичными для предотвращения связывания с ДНК, не полностью преобразованной бисульфитом. Анализ метилирования Illumina является одним из таких анализов, который применяет технологию бисульфитного секвенирования на уровне микрочипа для получения данных о метилировании по всему геному.
Бисульфитное секвенирование широко используется в геномах млекопитающих, однако возникли осложнения с открытием новой модификации ДНК млекопитающих 5-гидроксиметилцитозина . [22] [23] 5-гидроксиметилцитозин преобразуется в цитозин-5-метилсульфонат при обработке бисульфитом, который затем читается как C при секвенировании. [24] Таким образом, бисульфитное секвенирование не может различать 5-метилцитозин и 5-гидроксиметилцитозин. Это означает, что выход бисульфитного секвенирования больше не может быть определен как исключительно метилирование ДНК, поскольку он представляет собой совокупность 5-метилцитозина и 5-гидроксиметилцитозина. Разработка окислительного бисульфитного секвенирования с помощью Tet Чуаном Хе из Чикагского университета теперь позволяет различать две модификации с разрешением по одному основанию. [25]
Бисульфитное секвенирование основано на преобразовании каждого отдельного неметилированного остатка цитозина в урацил. Если преобразование неполное, последующий анализ неправильно интерпретирует непреобразованные неметилированные цитозины как метилированные цитозины, что приводит к ложноположительным результатам метилирования. Только цитозины в одноцепочечной ДНК восприимчивы к атаке бисульфита, поэтому денатурация ДНК, подвергающейся анализу, имеет решающее значение. [2] Важно убедиться, что параметры реакции, такие как температура и концентрация соли, подходят для поддержания ДНК в одноцепочечной конформации и позволяют осуществить полное преобразование. Сообщалось, что встраивание ДНК в агарозный гель улучшает скорость преобразования, сохраняя цепи ДНК физически разделенными. [26] Неполные скорости конверсии можно оценить и скорректировать после секвенирования, включив внутренний контроль в библиотеку секвенирования, например, ДНК фага лямбда (которая, как известно, неметилирована), или сопоставив результаты бисульфитного секвенирования с известной неметилированной областью в организме, например, с геномом хлоропласта. [27]
Основной проблемой бисульфитного секвенирования является деградация ДНК, которая происходит одновременно с конверсией. Условия, необходимые для полной конверсии, такие как длительное время инкубации, повышенная температура и высокая концентрация бисульфита, могут привести к деградации около 90% инкубированной ДНК. [28] Учитывая, что начальное количество ДНК часто ограничено, такая обширная деградация может быть проблематичной. Деградация происходит в виде депуринизации, приводящей к случайным разрывам нитей. [29] Следовательно, чем длиннее желаемый ампликон ПЦР , тем более ограниченным, вероятно, будет число неповрежденных молекул-шаблонов. Это может привести к неудаче амплификации ПЦР или потере количественно точной информации об уровнях метилирования в результате ограниченного отбора образцов молекул-шаблонов. Таким образом, важно оценить количество деградации ДНК в результате используемых условий реакции и рассмотреть, как это повлияет на желаемый ампликон . Также можно использовать методы для минимизации деградации ДНК, такие как циклическое изменение температуры инкубации. [29]
В 2020 году компания New England Biolabs разработала NEBNext Enzymatic Methyl-seq — альтернативный ферментативный подход для минимизации повреждений ДНК. [30]
Потенциально значимой проблемой после обработки бисульфитом является неполное десульфирование остатков пиримидина из-за недостаточного подщелачивания раствора. Это может ингибировать некоторые ДНК-полимеразы , затрудняя последующую ПЦР. Однако этой ситуации можно избежать, контролируя pH раствора, чтобы убедиться, что десульфирование будет полным. [2]
Последняя проблема заключается в том, что обработка бисульфитом значительно снижает уровень сложности образца, что может быть проблематичным, если необходимо проводить несколько реакций ПЦР (2006). [5] Разработка праймера становится более сложной, а ненадлежащая кросс-гибридизация происходит чаще.
Достижения в области бисульфитного секвенирования привели к возможности их применения в масштабах всего генома , где ранее глобальная мера метилирования ДНК была осуществима только с использованием других методов, таких как геномное сканирование с использованием рестрикционных маркеров . Картирование человеческого эпигенома рассматривается многими учеными как логическое продолжение завершения проекта «Геном человека» . [31] [32] Эта эпигеномная информация будет важна для понимания того, как реализуется и регулируется функция генетической последовательности. Поскольку эпигеном менее стабилен, чем геном, считается, что он важен во взаимодействиях генов и окружающей среды . [33]
Однако эпигеномное картирование по своей сути сложнее, чем секвенирование генома , поскольку эпигеном гораздо более изменчив, чем геном . Эпигеном человека меняется с возрастом, отличается между тканями, изменяется под воздействием факторов окружающей среды и демонстрирует отклонения при заболеваниях. Однако такое богатое эпигеномное картирование, представляющее различные возрасты, типы тканей и состояния болезней, дало бы ценную информацию о нормальной функции эпигенетических меток, а также о механизмах, приводящих к старению и заболеваниям.
Прямые выгоды от эпигеномного картирования включают вероятные достижения в технологии клонирования . Считается, что неудачи в создании клонированных животных с нормальной жизнеспособностью и продолжительностью жизни являются результатом неподходящих моделей эпигенетических меток. Кроме того, аберрантные модели метилирования хорошо охарактеризованы во многих видах рака . Глобальное гипометилирование приводит к снижению геномной стабильности, в то время как локальное гиперметилирование промоторов генов-супрессоров опухолей часто объясняет потерю их функции . Конкретные модели метилирования указывают на конкретные типы рака, имеют прогностическое значение и могут помочь в определении наилучшего курса лечения. [32]
Масштабные усилия по картированию эпигенома ведутся по всему миру и организованы в рамках проекта Human Epigenome Project . [33] Это основано на многоуровневой стратегии, в которой бисульфитное секвенирование используется для получения профилей метилирования высокого разрешения для ограниченного числа референтных эпигеномов, в то время как менее тщательный анализ выполняется на более широком спектре образцов. Этот подход призван максимизировать понимание, полученное из заданного количества ресурсов, поскольку картирование генома высокого разрешения остается дорогостоящим мероприятием.
Было показано, что анализ набора генов (например, с использованием таких инструментов, как DAVID и GoSeq) является сильно предвзятым при применении к данным метилирования с высокой пропускной способностью (например, бисульфитное секвенирование по всему геному); было высказано предположение, что это можно исправить с помощью перестановок меток образцов или с помощью статистической модели для контроля различий в количестве зондов CpG / сайтов CpG, нацеленных на каждый ген. [34]
5-метилцитозин и 5-гидроксиметилцитозин оба читаются как C в бисульфитном секвенировании. [24] Окислительное бисульфитное секвенирование — это метод различения 5-метилцитозина и 5-гидроксиметилцитозина с разрешением по одному основанию. Метод использует специфическое (с помощью Tet) химическое окисление 5-гидроксиметилцитозина до 5-формилцитозина, который впоследствии преобразуется в урацил во время обработки бисульфитом. [35] Единственное основание, которое затем считывается как C, — это 5-метилцитозин, что дает карту истинного статуса метилирования в образце ДНК. Уровни 5-гидроксиметилцитозина также можно количественно определить, измерив разницу между бисульфитным и окислительным бисульфитным секвенированием.