В биологии эпигеном организма представляет собой совокупность химических изменений в его ДНК и гистоновых белках, которая влияет на то, когда, где и как экспрессируется ДНК ; эти изменения могут передаваться потомству организма через трансгенерационное эпигенетическое наследование . Изменения в эпигеноме могут приводить к изменениям в структуре хроматина и изменениям в функции генома . [ 1] Человеческий эпигеном , включая метилирование ДНК и модификацию гистонов , поддерживается посредством деления клеток (как митоза , так и мейоза ). [2] Эпигеном необходим для нормального развития и клеточной дифференциации , позволяя клеткам с одинаковым генетическим кодом выполнять различные функции. Человеческий эпигеном динамичен и может находиться под влиянием факторов окружающей среды, таких как диета , стресс и токсины .
Эпигеном участвует в регуляции экспрессии генов, развитии, дифференциации тканей и подавлении мобильных элементов . В отличие от базового генома, который остается в значительной степени статичным в пределах индивидуума, эпигеном может динамически изменяться под воздействием условий окружающей среды.
К основным типам эпигенетических изменений относятся: [3]
Добавление метильной группы к молекуле ДНК, обычно на цитозиновых основаниях. Эта модификация обычно приводит к подавлению гена , предотвращая связывание факторов транскрипции и других белков, необходимых для экспрессии гена. [3]
ДНК функционально взаимодействует с различными эпигенетическими метками, такими как метилирование цитозина, также известного как 5-метилцитозин (5mC). Эта эпигенетическая метка широко распространена и играет важную роль в регуляции экспрессии генов, в подавлении транспозируемых элементов и повторных последовательностей . [4]
Индивидуумы различаются по своему эпигенетическому профилю, например, дисперсия в метилировании CpG среди индивидуумов составляет около 42%. Напротив, эпигенетический профиль (включая профиль метилирования) каждого индивидуума постоянен в течение года, отражая постоянство нашего фенотипа и метаболических признаков. В частности, профиль метилирования довольно стабилен в течение 12-месячного периода и, по-видимому, меняется больше в течение десятилетий. [5]
CoRSIVs — это коррелированные регионы системной межиндивидуальной изменчивости в метилировании ДНК. Они охватывают всего 0,1% генома человека, поэтому встречаются очень редко; они могут быть интеркоррелированы на больших геномных расстояниях (>50 т.п.н.). CoRSIVs также связаны с генами , вовлеченными во множество человеческих расстройств , включая опухоли, психические расстройства и сердечно-сосудистые заболевания. Было замечено, что сайты CpG, связанные с заболеваниями, на 37% обогащены CoRSIVs по сравнению с контрольными регионами и на 53% обогащены CoRSIVs по сравнению с tDMRs (тканеспецифические дифференциально метилированные регионы). [6]
Большинство CoRSIVs имеют длину всего 200–300 п.н. и включают 5–10 динуклеотидов CpG, самый большой охватывает несколько кб и включает сотни CpG. Эти регионы, как правило, встречаются кластерами, и две геномные области высокой плотности CoRSIV наблюдаются в главном локусе гистосовместимости ( MHC ) на хромосоме 6 и в перицентромерной области на длинном плече хромосомы 20. [6]
CoRSIV обогащены в межгенных и покоящихся областях (например, субтеломерных областях) и содержат много транспонируемых элементов, но мало CpG-островков (CGI) и сайтов связывания факторов транскрипции. CoRSIV недостаточно представлены вблизи генов, в гетерохроматиновых областях, активных промоторах и энхансерах . Они также обычно не присутствуют в высококонсервативных геномных областях. [6]
CoRSIV могут иметь полезное применение: измерения метилирования CoRSIV в одной ткани могут предоставить некоторую информацию об эпигенетической регуляции в других тканях, действительно, мы можем предсказать экспрессию связанных генов, поскольку системные эпигенетические варианты, как правило, одинаковы во всех тканях и типах клеток. [7]
Количественная оценка наследственной основы эпигеномной изменчивости популяции также важна для разграничения ее цис- и трансрегуляторной архитектуры. В частности, большинство исследований утверждают, что межиндивидуальные различия в метилировании ДНК в основном определяются полиморфизмами цис-регуляторной последовательности , вероятно, включающими мутации в TFBS (сайты связывания факторов транскрипции) с последующими последствиями для локальной среды хроматина. Редкость транс-действующих полиморфизмов у людей предполагает, что такие эффекты крайне пагубны. Действительно, ожидается, что транс-действующие факторы будут вызваны мутациями в генах контроля хроматина или других высоко плейотропных регуляторах. Если транс-действующие варианты действительно существуют в человеческих популяциях, они, вероятно, сегрегируют как редкие аллели или происходят из соматических мутаций и проявляются клиническими фенотипами, как это имеет место при многих видах рака. [4]
Метилирование ДНК (в частности, в регионах CpG) может влиять на экспрессию генов: гиперметилированные регионы, как правило, экспрессируются по-разному. Фактически, люди со схожим профилем метилирования, как правило, имеют одинаковый транскриптом . Более того, одно из ключевых наблюдений, полученных в ходе изучения метилирования у человека, заключается в том, что большинство функционально значимых изменений в метилировании CpG происходят в регуляторных элементах, таких как энхансеры.
В любом случае, дифференциальная экспрессия касается лишь небольшого числа метилированных генов: только пятая часть генов с метилированием CpG показывает переменную экспрессию в зависимости от их состояния метилирования. Важно отметить, что метилирование — не единственный фактор, влияющий на регуляцию генов . [5]
Эксперименты с иммуноокрашиванием показали , что в человеческих эмбрионах до имплантации происходит глобальный процесс деметилирования ДНК . После оплодотворения уровень метилирования ДНК резко снижается в ранних пронуклеусах . Это является следствием активного деметилирования ДНК на этой стадии. Но глобальное деметилирование не является необратимым процессом, фактически метилирование de novo происходит от ранней до средней пронуклеусной стадии и от 4-клеточной до 8-клеточной стадии. [8]
Процент метилирования ДНК различен в ооцитах и сперматозоидах : зрелый ооцит имеет промежуточный уровень метилирования ДНК (72%), а сперматозоид имеет высокий уровень метилирования ДНК (86%). Деметилирование в отцовском геноме происходит быстро после оплодотворения, тогда как материнский геном довольно устойчив к процессу деметилирования на этой стадии. Материнские различные метилированные области (DMR) более устойчивы к волне предимплантационного деметилирования. [8]
Метилирование CpG аналогично на стадии зародышевых пузырьков (GV), промежуточной стадии метафазы I (MI) и зрелой стадии метафазы II (MII). Метилирование не-CpG продолжает накапливаться на этих стадиях. [8]
Доступность хроматина в зародышевой линии оценивалась различными подходами, такими как sc ATAC-seq и sciATAC-seq, scCOOL-seq, scNOMe-seq и sc DNase-seq . Были идентифицированы специфичные для стадии проксимальные и дистальные регионы с доступными регионами хроматина. Обнаружено, что глобальная доступность хроматина постепенно уменьшается от зиготы до 8-клеточной стадии, а затем увеличивается. Анализ родительских аллелей показывает, что отцовский геном становится более открытым, чем материнский геном, от поздней стадии зиготы до 4-клеточной стадии, что может отражать деконденсацию отцовского генома с заменой протаминов гистонами . [ 8]
Дисбаланс метилирования ДНК между гомологичными хромосомами показывает поведение, зависящее от последовательности. Разница в состоянии метилирования соседних цитозинов на одной и той же хромосоме возникает из-за разницы в последовательности ДНК между хромосомами. Бисульфитное секвенирование всего генома (WGBS) используется для изучения зависимого от последовательности аллель-специфического метилирования (SD-ASM) на уровне разрешения одной хромосомы и всестороннего покрытия всего генома. Результаты WGBS, протестированные на 49 метиломах, выявили дисбаланс метилирования CpG, превышающий 30% различий в 5% локусов. [9]
На участках регуляторных локусов генов, связанных с факторами транскрипции, наблюдалось случайное переключение между метилированным и неметилированным состояниями ДНК. Это также называется стохастическим переключением и связано с селективной буферизацией регуляторного контура генов от мутаций и генетических заболеваний. Только редкие генетические варианты демонстрируют стохастический тип регуляции генов.
Исследование, проведенное Онучичем и соавторами, было направлено на построение карт аллельных дисбалансов в метилировании ДНК, транскрипции генов, а также модификаций гистонов. 36 типов клеток и тканей от 13 доноров-участников были использованы для изучения 71 эпигенома. Результаты WGBS, протестированные на 49 метиломах, выявили дисбаланс метилирования CpG, превышающий 30% различий в 5% локусов. Стохастическое переключение произошло в тысячах гетерозиготных регуляторных локусов, которые были связаны с факторами транскрипции. Промежуточное состояние метилирования относится к относительным частотам между метилированными и неметилированными эпиаллелями. Изменения частоты эпиаллелей коррелируют со сродством аллелей к факторам транскрипции.
Анализ исследования показывает, что человеческий эпигеном в среднем охватывает около 200 неблагоприятных вариантов SD-ASM. Чувствительность генов с тканеспецифичными паттернами экспрессии дает возможность для эволюционных инноваций в регуляции генов. [9]
Стратегия реконструкции гаплотипа используется для отслеживания химических модификаций хроматина (с использованием ChIP-seq) в различных тканях человека. Эпигеномные карты, разрешенные гаплотипом, могут отслеживать аллельные смещения в конфигурации хроматина. Наблюдается существенная вариация среди различных тканей и индивидуумов. Это позволяет глубже понять цис-регуляторные отношения между генами и контрольными последовательностями. [10]
Посттрансляционные модификации гистоновых белков, включающие метилирование, ацетилирование , фосфорилирование , убиквитинирование и сумоилирование . Эти модификации могут либо активировать, либо подавлять экспрессию генов, изменяя структуру хроматина и доступность ДНК для транскрипционного аппарата.
Эпигенетические профили тканей человека выявляют следующие отчетливые модификации гистонов в различных функциональных областях: [10]
Ацетилирование гистонов нейтрализует положительный заряд на гистонах. Это ослабляет электростатическое притяжение к отрицательно заряженной ДНК и вызывает раскручивание ДНК от гистонов, делая ДНК более доступной для транскрипционного аппарата и, следовательно, приводя к транскрипционной активации. [11]
Может приводить к активации или подавлению экспрессии генов в зависимости от конкретных метилированных аминокислот.
Подавление генов некодирующей РНК (ncRNA) включает различные типы некодирующих РНК, такие как микроРНК (miRNA), длинные некодирующие РНК (lncRNA) и малые интерферирующие РНК (siRNA). Эти молекулы РНК могут модулировать экспрессию генов различными механизмами, включая деградацию мРНК, ингибирование трансляции и ремоделирование хроматина. [3]
За последние несколько лет было разработано несколько методов для изучения структурных и, следовательно, функциональных модификаций хроматина. Первым проектом, который использовал эпигеномное профилирование для идентификации регуляторных элементов в геноме человека, был ENCODE (Encyclopedia of DNA Elements), который был сосредоточен на профилировании модификаций гистонов в клеточных линиях. Несколько лет спустя ENCODE был включен в Международный консорциум по эпигеному человека (IHEC), целью которого является координация международных исследований эпигенома. [12]
Структурные изменения, на изучение которых направлены эти проекты, можно разделить на пять основных групп:
Топологические ассоциированные домены являются степенью структурной организации генома клетки . Они образованы областями хроматина размером от 100 килобаз до мегабаз, которые в высокой степени взаимодействуют друг с другом. Домены связаны другими геномными областями, которые в зависимости от их размера называются либо «топологическими граничными областями», либо «неорганизованным хроматином». Эти граничные области отделяют топологические домены от гетерохроматина и предотвращают амплификацию последнего. Топологические домены рассеяны у млекопитающих, хотя похожие геномные разделы были выявлены также у Drosophila . [13]
Топологические домены у людей, как и у других млекопитающих, имеют много функций относительно экспрессии генов и процесса контроля транскрипции . Внутри этих доменов хроматин оказывается хорошо запутанным, тогда как в пограничных областях взаимодействия хроматина присутствуют гораздо меньше. [14] Эти пограничные области, в частности, показывают некоторую особенность, которая определяет функции всех топологических доменов.
Во-первых, они содержат инсуляторные области и барьерные элементы, которые действуют как ингибиторы дальнейшей транскрипции фермента РНК-полимеразы . [15] Такие элементы характеризуются массивным присутствием инсуляторных связывающих белков CTCF .
Во-вторых, пограничные области блокируют распространение гетерохроматина, тем самым предотвращая потерю полезной генетической информации. Эта информация вытекает из наблюдения, что гетерохроматиновая метка H3K9me3 последовательности четко прерывает пограничные последовательности. [16]
В-третьих, сайты начала транскрипции (TSS), гены домашнего хозяйства и гены тРНК особенно распространены в пограничных областях, что указывает на то, что эти области обладают высокой транскрипционной активностью благодаря своим структурным характеристикам, отличным от других топологических областей. [17] [18]
Наконец, в пограничных областях топологических доменов и их окружении наблюдается обогащение ретротранспозонов Alu /B1 и B2 SINE . В последние годы эти последовательности были отнесены к изменению сайта связывания CTCF, таким образом, мешая экспрессии некоторых геномных областей. [19]
Дальнейшие доказательства роли в генетической модуляции и регуляции транскрипции относятся к значительной сохранности пограничного паттерна в ходе эволюции млекопитающих с динамическим диапазоном небольших различий внутри различных типов клеток, что предполагает, что эти топологические домены принимают участие в специфичных для типа клеток регуляторных событиях. [14]
Проект 4D Nucleome направлен на реализацию 3D-карт геномов млекопитающих с целью разработки предиктивных моделей для корреляции эпигеномных модификаций с генетическими вариациями. В частности, цель состоит в том, чтобы связать генетические и эпигеномные модификации с энхансерами и промоторами, с которыми они взаимодействуют в трехмерном пространстве, тем самым обнаруживая интерактомы и пути набора генов в качестве новых кандидатов для функционального анализа и терапевтического нацеливания.
Hi-C [20] — экспериментальный метод, используемый для картирования связей между фрагментами ДНК в трехмерном пространстве в масштабе всего генома. Этот метод сочетает химическое сшивание хроматина с расщеплением рестриктазами и секвенированием ДНК следующего поколения. [21]
Исследования такого рода в настоящее время ограничены отсутствием или недоступностью исходных данных. [12]
Эпигенетика в настоящее время является активной темой в исследованиях рака . Человеческие опухоли подвергаются значительному нарушению метилирования ДНК и моделей модификации гистонов . Аберрантный эпигенетический ландшафт раковой клетки характеризуется глобальным геномным гипометилированием, гиперметилированием промотора CpG-островка генов- супрессоров опухолей , измененным гистоновым кодом для критических генов и глобальной потерей моноацетилированного и триметилированного гистона H4.
Идея о том, что повреждение ДНК стимулирует старение, нарушая транскрипцию и репликацию ДНК, получила широкую поддержку с момента ее первоначальной разработки в 1980-х годах. [22] В последние десятилетия накопились доказательства, подтверждающие дополнительную идею о том, что повреждение и восстановление ДНК вызывают широко распространенные изменения эпигенома, которые также способствуют старению (например, [23] [24] ). Такие изменения эпигенома включают возрастные изменения в моделях метилирования ДНК и модификации гистонов. [23]
В качестве прелюдии к потенциальному проекту «Эпигеном человека » пилотный проект «Эпигеном человека» направлен на выявление и каталогизацию позиций вариабельной метилации (MVP) в геноме человека . [25] Достижения в технологии секвенирования теперь позволяют анализировать эпигеномные состояния по всему геному с помощью нескольких молекулярных методологий. [26] Были созданы или предложены микро- и наномасштабные устройства для исследования эпигенома. [27]
Международные усилия по анализу референтных эпигеномов начались в 2010 году в форме Международного консорциума по эпигеному человека (IHEC). [28] [29] [30] [31] Члены IHEC стремятся создать не менее 1000 референтных (базовых) эпигеномов человека из различных типов нормальных и связанных с заболеваниями клеток человека . [32] [33] [34]
Одной из целей проекта NIH Roadmap Epigenomics Project, заархивированного 08.04.2021 в Wayback Machine, является создание референтных эпигеномов человека из нормальных здоровых людей из большого разнообразия клеточных линий, первичных клеток и первичных тканей. Данные, полученные в ходе проекта, которые можно просматривать и загружать из Human Epigenome Atlas, делятся на пять типов, которые анализируют различные аспекты эпигенома и результаты эпигеномных состояний (такие как экспрессия генов):
Референтные эпигеномы здоровых людей позволят достичь второй цели проекта «Дорожная карта эпигеномики», которая заключается в изучении эпигеномных различий, возникающих при таких болезненных состояниях, как болезнь Альцгеймера .