Бисульфитное секвенирование всего генома — это технология секвенирования следующего поколения, используемая для определения статуса метилирования ДНК отдельных цитозинов путем обработки ДНК бисульфитом натрия перед высокопроизводительным секвенированием ДНК . Статус метилирования ДНК в различных генах может раскрыть информацию о регуляции генов и транскрипционной активности. [1] Эта методика была разработана в 2009 году вместе с бисульфитным секвенированием с пониженным представительством после того, как бисульфитное секвенирование стало золотым стандартом для анализа метилирования ДНК. [2] [3]
Бисульфитное секвенирование всего генома измеряет уровни метилирования отдельных цитозинов по всему геному и напрямую оценивает соотношение метилированных молекул, а не уровни обогащения. В настоящее время эта методика распознала и протестировала приблизительно 95% всех цитозинов в известных геномах. [4] С улучшением методов подготовки библиотек и технологией секвенирования следующего поколения за последнее десятилетие бисульфитное секвенирование всего генома стало все более распространенным и информативным методом анализа метилирования ДНК в эпигеномных исследованиях. [5]
До разработки бисульфитного секвенирования всего генома анализ метилирования генома в значительной степени опирался на ранние неспецифические и дифференциальные методы, такие как бумажная хроматография , высокоэффективная жидкостная хроматография и тонкослойная хроматография для анализа профилей метилирования. [6] Эти методы были ограничены невозможностью амплифицировать метилированную ДНК с помощью полимеразной цепной реакции in vitro из-за потери статуса метилирования. [6] В результате большая часть этих ранних методов опиралась на обнаружение и анализ естественно проявленных метилированных цитозинов in vivo, а не химически метилированных цитозинов.
В 1970 году произошел прорыв, когда было обнаружено, что обработка ДНК бисульфитом натрия дезаминирует остатки цитозина в урацил. [6] В следующем десятилетии это открытие привело к открытию того, что неметилированный цитозин реагирует на обработку бисульфитом натрия гораздо быстрее, чем 5-метилцитозин . Эта разница в скоростях реакции создала возможность идентификации химических изменений в ДНК как легко обнаруживаемого генетического маркера. [6] Бисульфитное секвенирование всего генома было получено как комбинация этой бисульфитной обработки и технологии секвенирования следующего поколения, такой как секвенирование методом дробовика .
Методика секвенирования всего генома была впервые применена для картирования метилирования ДНК с разрешением в один нуклеотид к Arabidopsis thaliana в 2008 году, и вскоре после этого в 2009 году была создана первая карта метилирования ДНК с разрешением в один нуклеотид всего человеческого генома с использованием бисульфитного секвенирования всего генома. [7] [5] С момента ее разработки было разработано множество различных протоколов бисульфитного секвенирования всего генома, направленных на повышение эффективности и действенности его одноосновного картирования. Поскольку затраты на секвенирование следующего поколения снизились, бисульфитное секвенирование всего генома стало более широко использоваться в клинических и экспериментальных исследованиях. [3] В настоящее время создано несколько общедоступных наборов геномных данных, и эта методика распознала и протестировала приблизительно 95% всех цитозинов в известных геномах. [4]
Следующие шаги получены из одного потенциального рабочего процесса обычного бисульфитного секвенирования всего генома: извлечение целевой ДНК, бисульфитная конверсия, амплификация библиотеки и биоинформатический анализ. [8] Однако различные системы секвенирования и инструменты анализа часто адаптируют технические параметры и порядок следующих этапов процесса для оптимизации охвата анализа и эффективности. [3]
Протоколы подготовки библиотеки включают фрагментацию ДНК, репарацию концов, dA-хвост и лигирование адаптеров перед обработкой бисульфитом и амплификацией библиотеки. Стандартная фрагментация с использованием высокопроизводительной технологии, такой как Illumina Genome Analyser и Solexa, требует распыления для получения фрагментов размером от 0 до 1200 пар оснований. [9] После фрагментации ферменты репарации концов и комплементарные адаптеры затем применяются к ДНК в полимеразной цепной реакции подготовки концов и реакции лигирования адаптеров соответственно. Выбор размера происходит до обработки ДНК бисульфитом натрия.
Традиционные методы подготовки эукариотической ДНК во время секвенирования используют широкий спектр входных объемов ДНК, варьирующихся от всего лишь 10 нг для новых альтернатив библиотек NGS, таких как подход с тегированием, до целых 500–1000 нг ДНК в качестве входного образца. [10]
Образец ДНК, лигированный адаптером, обрабатывается бисульфитом натрия, химическим соединением, которое преобразует неметилированные цитозины в урацил , при низком pH и высоких температурах. [11] [12] Химическая реакция изображена на рисунке 1, где сульфирование происходит в положении углерода-6 цитозина с образованием промежуточного сульфоната цитозина. [13] Затем этот промежуточный продукт подвергается необратимому гидролитическому дезаминированию с образованием сульфоната урацила. В щелочных условиях сульфонат урацила десульфируется с образованием урацила. [13]
Это позволяет обнаружить метилирование, различая метилированные цитозины (5-метилцитозин), которые устойчивы к обработке бисульфитом, от урацила. Во время амплификации с помощью полимеразной цепной реакции урацилы преобразуются в тимины . [3] Метилированные цитозины затем распознаются как цитозины. Затем их местоположение определяется путем сравнения обработанной бисульфитом и исходной последовательности ДНК.
После обработки бисульфитом требуется очистка образца для удаления нежелательных продуктов, включая соли бисульфита. [13]
Для амплификации библиотеки эпигенома обработанная бисульфитом ДНК запускается для генерации ДНК с определенной последовательностью маркировки. Затем 3'-конец этой последовательности снова маркируется, создавая фрагменты ДНК с маркерами на обоих концах. Эти фрагменты амплифицируются в конечной реакции полимеразной цепной реакции, после чего библиотека подготавливается для секвенирования путем синтеза. [8] Это показано на рисунке 2, на котором высокопроизводительная система секвенирования, разработанная биотехнологической компанией Illumina, выполняет комплексные анализы на основе секвенирования путем синтеза пар оснований. [8]
После амплификации библиотеки можно провести ряд анализов расширенной библиотеки для определения различных характеристик метилирования или картирования профиля метилирования по всему геному. [8]
Одно из таких исследований выравнивает новые считывания с референтным геномом, чтобы напрямую сравнить местоположения метилированных цитозинов и несовпадений CT. Для этого требуется программное обеспечение, такое как SOAP, для параллельного сравнения геномов. [8] Другим потенциальным анализом секвенирования является метилированный цитозиновый вызов, который вычисляет соотношения метилированных цитозинов путем сопоставления вероятностей на основе качества считывания. Это помогает определить местоположения метилированных цитозинов по всему геному. [8] Наконец, глобальные тенденции метилома можно проанализировать, вычислив соотношения распределения CG, CHGG и CHH в метилированных цитозинах по всему геному. [8] Эти соотношения могут отражать особенности карт метилирования всего генома определенных видов.
Благодаря своей способности скрининга статуса метилирования с разрешением в один нуклеотид по всему данному геному, бисульфитное секвенирование всего генома становится все более многообещающим в оказании помощи фундаментальным исследованиям эпигеномики, новым гипотезам о метилировании ДНК и исследованиям будущих крупномасштабных эпидемиологических исследований. [3] [5] Этот подход к изучению всего генома также способен к чувствительному обнаружению метилирования цитозина в определенных последовательностях по всему геному, что увеличивает его потенциал для идентификации определенных участков метилирования ДНК и их связи с определенными экспрессиями генов. [6]
Метод бисульфитного секвенирования всего генома способен к чувствительному обнаружению метилирования цитозина в определенных последовательностях по всему геному, что увеличивает его потенциал для идентификации определенных участков метилирования ДНК и их связи с определенными экспрессиями генов. [6] Использование бисульфитного секвенирования всего генома для создания первого метилома человеческой ДНК в 2009 году также помогло идентифицировать значительную долю не-CG метилирования. [6] В результате продолжают производиться множественные одноосновные метиломы человеческого генома с целью определения роли внутригенного метилирования ДНК в экспрессии и регуляции генов. Будущие исследования направлены на использование бисульфитного секвенирования всего генома для изучения роли метилирования ДНК в разнообразных клеточных процессах, таких как клеточная дифференциация , эмбриогенез , X-инактивация, геномный импринтинг и опухолеобразование . [4] Карты отдельных нуклеотидов уже были секвенированы для двух линий человеческих клеток, человеческих эмбриональных стволовых клеток H1 и фетальных легочных фибробластов IMR90, с целью изучения закономерностей не-CG метилирования в человеческих клетках. [4]
Бисульфитное секвенирование всего генома также применялось к исследованиям биологии развития, в которых было обнаружено, что не-CG метилирование преобладает в плюрипотентных стволовых клетках и ооцитах. Этот метод помог исследователям обнаружить, что не-CG метилирование накапливалось во время роста ооцитов и охватывало более половины всего метилирования в ооцитах зародышевых пузырьков мышей. [14] Аналогично, в растениях бисульфитное секвенирование всего генома использовалось для изучения метилирования CG, CHH и CHG [ необходимо уточнение ] . Затем было обнаружено, что зародышевая линия растений сохранила метилирование CG и CHG, в то время как млекопитающие потеряли метилирование CHH в микроспорах и сперматозоидах. [14]
Неограниченные ресурсы, предоставляемые подходом целого генома, стимулировали множество новых гипотез о том, как бисульфитное секвенирование всего генома может быть использовано в других различных областях, включая диагностику заболеваний и судебную экспертизу. Исследования показали, что бисульфитное секвенирование всего генома может обнаруживать аномальное метилирование или, более конкретно, гиперметилированные гены-супрессоры, которые часто наблюдаются при раке, включая лейкемию. [14] Кроме того, бисульфитное секвенирование всего генома применялось к образцам пятен крови в судебно-медицинских расследованиях для получения высококачественных анализов метилирования ДНК на высушенных пятнах. [14]
Широкое использование бисульфитного секвенирования всего генома было в первую очередь ограничено его чрезмерной стоимостью, сложными выходными данными и минимальным требуемым покрытием. Из-за большого количества и последующей стоимости ввода ДНК многие исследования с использованием анализов бисульфитного секвенирования всего генома проводятся с небольшим количеством или без биологических повторов. [15] Для образцов человека Проект эпигеномики дорожной карты Национального института здравоохранения США (NIH) рекомендует секвенирование с покрытием не менее 30 раз для достижения точных результатов и приблизительно 80 миллионов выровненных высококачественных прочтений. [16] Следовательно, крупномасштабные исследования для профилирования метилирования всего генома остаются менее экономически эффективными, часто требуя многократного повторного секвенирования всего генома несколько раз для каждого эксперимента. [17] В настоящее время проводятся исследования для снижения обычных минимальных требований к покрытию при сохранении точности картирования.
Наконец, метод также ограничен сложностью данных и отсутствием достаточно продвинутых аналитических инструментов для последующих вычислительных требований. [2] Текущие требования биоинформатики к точной интерпретации данных опережают существующие технологии, что затрудняет доступность результатов секвенирования для широкой публики.
Кроме того, существуют биологические ограничения, касающиеся различных этапов стандартного протокола, особенно в методе подготовки библиотеки. Одной из самых больших проблем является потенциальная предвзятость в составе оснований последовательностей и перепредставленность метилированных данных ДНК после биоинформатических анализов. [9] Предвзятость может возникнуть из-за множественных непреднамеренных эффектов бисульфитной конверсии, включая деградацию ДНК. Эта деградация может привести к неравномерному покрытию последовательностей из-за неправильного представления геномных последовательностей и переоценки значений 5-метилцитозина. [3] Кроме того, процесс бисульфитной конверсии отличает только неметилированный цитозин от 5-метилцитозина. В результате специфичность между 5-метилцитозином и 5-гидроксиметилцитозином ограничена. [3] Другой потенциальный источник предвзятости возникает из-за амплификации библиотеки с помощью полимеразной цепной реакции, которая влияет на последовательности с сильно перекошенным составом оснований из-за высоких показателей ошибок полимеразной последовательности в ДНК с высоким содержанием AT, преобразованной бисульфитом. [3]