В генетике энхансер — это короткий (50–1500 п.н. ) участок ДНК , который может быть связан белками ( активаторами ) для увеличения вероятности транскрипции определенного гена . [1] [2] Эти белки обычно называют факторами транскрипции . Энхансеры действуют цис - положением . Они могут располагаться на расстоянии до 1 Мб.н. (1 000 000 п.н.) от гена, выше или ниже стартового участка. [2] [3] В геноме человека существуют сотни тысяч энхансеров. [2] Они встречаются как у прокариот, так и у эукариот. [4] Активные энхансеры обычно транскрибируются как энхансерная или регуляторная некодирующая РНК, уровни экспрессии которой коррелируют с уровнями мРНК целевых генов. [5]
Первое открытие эукариотического энхансера было сделано в гене тяжелой цепи иммуноглобулина в 1983 году. [6] [7] [8] Этот энхансер, расположенный в большом интроне , дал объяснение транскрипционной активации перестроенных промоторов гена Vh, в то время как неперестроенные промоторы Vh оставались неактивными. [9] В последнее время было показано, что энхансеры участвуют в определенных медицинских состояниях, например, миелосупрессии . [10] С 2022 года ученые использовали искусственный интеллект для разработки синтетических энхансеров и применяли их в животных системах, сначала в клеточной линии, [11] а год спустя также in vivo. [12] [13]
В эукариотических клетках структура хроматинового комплекса ДНК свернута таким образом, что функционально имитирует сверхспиральное состояние, характерное для прокариотической ДНК, поэтому, хотя энхансерная ДНК может быть далека от гена в линейном направлении, она пространственно близка к промотору и гену. Это позволяет ей взаимодействовать с общими факторами транскрипции и РНК-полимеразой II . [14] Тот же механизм справедлив для сайленсеров в эукариотическом геноме. Сайленсеры являются антагонистами энхансеров, которые при связывании с собственными факторами транскрипции, называемыми репрессорами , подавляют транскрипцию гена. Сайленсеры и энхансеры могут находиться в непосредственной близости друг от друга или даже в одном регионе, различаясь только по фактору транскрипции, с которым связывается регион.
Энхансер может быть расположен выше или ниже гена, который он регулирует. Более того, энхансеру не обязательно располагаться вблизи сайта инициации транскрипции , чтобы влиять на транскрипцию, поскольку некоторые из них были обнаружены расположенными на несколько сотен тысяч пар оснований выше или ниже сайта старта. [15] Энхансеры не действуют на саму область промотора, а связываются с активаторными белками , как впервые было показано в экспериментах по конкуренции in vivo. [16] [17] Впоследствии молекулярные исследования показали прямое взаимодействие с факторами транскрипции и кофакторами, включая медиаторный комплекс , который рекрутирует полимеразу II и общие факторы транскрипции, которые затем начинают транскрипцию генов. [18] [19] Энхансеры также могут быть обнаружены внутри интронов. Ориентация энхансера может быть даже изменена на противоположную, не влияя на его функцию; кроме того, энхансер может быть вырезан и вставлен в другое место хромосомы и все еще влиять на транскрипцию гена. [8] Это одна из причин, по которой полиморфизмы интронов могут иметь последствия, хотя они и не транслируются . [ необходима ссылка ] Усилители также могут быть обнаружены в экзонной области неродственного гена [20] [21] [22] и они могут воздействовать на гены на другой хромосоме . [23]
Усилители связаны с p300-CBP , и их местоположение можно предсказать с помощью ChIP-seq против этого семейства коактиваторов. [24] [25] [26] [27]
Экспрессия генов у млекопитающих регулируется многими цис-регуляторными элементами , включая основные промоторы и промоторно-проксимальные элементы , которые расположены вблизи мест начала транскрипции генов. Основные промоторы достаточны для управления инициацией транскрипции, но, как правило, имеют низкую базальную активность. [28] Другие важные цис-регуляторные модули локализованы в областях ДНК, которые удалены от мест начала транскрипции. К ним относятся энхансеры, сайленсеры , инсуляторы и элементы привязки. [29] Среди этого созвездия элементов энхансеры и связанные с ними факторы транскрипции играют ведущую роль в регуляции экспрессии генов. [30] Энхансер, локализованный в области ДНК, удаленной от промотора гена, может оказывать очень большое влияние на экспрессию генов, при этом некоторые гены подвергаются 100-кратному увеличению экспрессии из-за активированного энхансера. [31]
Энхансеры — это области генома, которые являются основными элементами регуляции генов. Энхансеры контролируют программы экспрессии генов, специфичные для типа клеток, чаще всего, прокладывая петли на больших расстояниях, чтобы физически приблизиться к промоторам своих целевых генов. [32] Хотя существуют сотни тысяч областей ДНК энхансеров, [2] для определенного типа ткани только определенные энхансеры приближаются к промоторам, которые они регулируют. В исследовании нейронов коры головного мозга было обнаружено 24 937 петель, приближающих энхансеры к своим целевым промоторам. [31] Множественные энхансеры, каждый из которых часто находится на расстоянии десятков или сотен тысяч нуклеотидов от своих целевых генов, прокладывают петли к своим целевым промоторам генов и могут координировать друг с другом, чтобы контролировать экспрессию своего общего целевого гена. [32]
Схематическая иллюстрация в этом разделе показывает энхансер, образующий петлю, чтобы приблизиться к промотору целевого гена. Петля стабилизируется димером соединительного белка (например, димером CTCF или YY1 ), при этом один член димера прикреплен к своему связывающему мотиву на энхансере, а другой член прикреплен к своему связывающему мотиву на промоторе (представлен красными зигзагами на иллюстрации). [33] Несколько факторов транскрипции, специфичных для клеточных функций (в человеческой клетке насчитывается около 1600 факторов транскрипции [34] ), обычно связываются со специфическими мотивами на энхансере [35] , и небольшая комбинация этих связанных с энхансером факторов транскрипции, когда они приближаются к промотору с помощью петли ДНК, регулируют уровень транскрипции целевого гена. Медиатор (комплекс, обычно состоящий из около 26 белков во взаимодействующей структуре) передает регуляторные сигналы от факторов транскрипции, связанных с ДНК-энхансером, непосредственно ферменту РНК-полимеразе II (pol II), связанному с промотором. [36]
Активные энхансеры обычно транскрибируются с обеих цепей ДНК с помощью РНК-полимераз, действующих в двух разных направлениях, в результате чего образуются две энхансерные РНК (eRNA), как показано на рисунке. [37] Как и мРНК , эти eRNA обычно защищены своим 5′-колпачком . [38] Неактивный энхансер может быть связан с неактивным фактором транскрипции. Фосфорилирование фактора транскрипции может активировать его, и этот активированный фактор транскрипции может затем активировать энхансер, с которым он связан (см. маленькую красную звездочку, представляющую фосфорилирование фактора транскрипции, связанного с энхансером на иллюстрации). [39] Активированный энхансер начинает транскрипцию своей РНК перед активацией транскрипции информационной РНК со своего целевого гена. [40]
По состоянию на 2005 год [обновлять]существуют две различные теории относительно обработки информации, которая происходит на усилителях: [41]
HACNS1 (также известный как CENTG2 и расположенный в Human Accelerated Region 2) — это генный усилитель, «который мог способствовать эволюции уникально противопоставленного большого пальца человека , а также, возможно, модификациям в лодыжке или стопе , которые позволяют людям ходить на двух ногах». Имеющиеся на сегодняшний день данные показывают, что из 110 000 последовательностей генных усилителей, идентифицированных в геноме человека , HACNS1 претерпел наибольшие изменения в ходе эволюции людей после разделения с предками шимпанзе . [ требуется цитата ]
Был описан энхансер около гена GADD45g, который может регулировать рост мозга у шимпанзе и других млекопитающих, но не у людей. [42] Регулятор GADD45G у мышей и шимпанзе активен в областях мозга, где расположены клетки, образующие кору, вентральную часть переднего мозга и таламус, и может подавлять дальнейший нейрогенез. Потеря энхансера GADD45G у людей может способствовать увеличению определенных популяций нейронов и расширению переднего мозга у людей. [ необходима цитата ]
Развитие, дифференциация и рост клеток и тканей требуют точно регулируемых моделей экспрессии генов . Усилители работают как цис-регуляторные элементы, опосредуя как пространственный, так и временной контроль развития, включая транскрипцию в определенных клетках и/или подавляя ее в других клетках. Таким образом, конкретная комбинация факторов транскрипции и других ДНК-связывающих белков в развивающейся ткани контролирует, какие гены будут экспрессироваться в этой ткани. Усилители позволяют использовать один и тот же ген в различных процессах в пространстве и времени. [ необходима цитата ] [43]
Традиционно энхансеры идентифицировались методами ловушки энхансера с использованием гена-репортера или с помощью сравнительного анализа последовательностей и вычислительной геномики. В генетически поддающихся обработке моделях, таких как плодовая мушка Drosophila melanogaster , например, репортерная конструкция, такая как ген lacZ , может быть случайным образом интегрирована в геном с использованием транспозона P-элемента . Если репортерный ген интегрируется рядом с энхансером, его экспрессия будет отражать паттерн экспрессии, управляемый этим энхансером. Таким образом, окрашивание мух на экспрессию или активность LacZ и клонирование последовательности, окружающей сайт интеграции, позволяет идентифицировать последовательность энхансера. [44]
Однако развитие геномных и эпигеномных технологий кардинально изменило перспективы открытия цис-регуляторных модулей (CRM). Методы секвенирования следующего поколения (NGS) теперь позволяют проводить высокопроизводительные функциональные анализы открытия CRM, а значительно растущие объемы доступных данных, включая крупномасштабные библиотеки мотивов сайтов связывания факторов транскрипции (TFBS) , коллекции аннотированных, проверенных CRM и обширные эпигенетические данные по многим типам клеток, делают точное вычислительное открытие CRM достижимой целью. Пример подхода на основе NGS, называемого DNase-seq, позволил идентифицировать обедненные нуклеосомами или открытые области хроматина, которые могут содержать CRM. Совсем недавно были разработаны такие методы, как ATAC-seq, которые требуют меньше исходного материала. Обедненные нуклеосомами области можно идентифицировать in vivo посредством экспрессии метилазы Dam , что позволяет лучше контролировать идентификацию специфичных для типа клеток энхансеров. [45] Вычислительные методы включают сравнительную геномику , кластеризацию известных или предсказанных сайтов связывания ТФ и контролируемые подходы машинного обучения, обученные на известных CRM. Все эти методы доказали свою эффективность для обнаружения CRM, но у каждого есть свои соображения и ограничения, и каждый подвержен большему или меньшему количеству ложноположительных идентификаций. [46] В подходе сравнительной геномики сохранение последовательностей некодирующих областей может быть показателем энхансеров. Последовательности из нескольких видов выравниваются, и консервативные области идентифицируются вычислительным путем. [47] Затем идентифицированные последовательности могут быть присоединены к гену-репортеру, такому как зеленый флуоресцентный белок или lacZ, для определения in vivo паттерна экспрессии гена, производимого энхансером при инъекции в эмбрион. Экспрессию мРНК репортера можно визуализировать с помощью гибридизации in situ , которая обеспечивает более прямое измерение активности энхансера, поскольку она не подвергается сложностям трансляции и сворачивания белка . Хотя многие данные указывают на сохранение последовательности для критических энхансеров развития, другие работы показали, что функция энхансеров может быть сохранена с небольшим или нулевым сохранением первичной последовательности. Например, энхансеры RET у людей имеют очень мало сохранения последовательности по сравнению с энхансерами у данио-рерио, однако последовательности обоих видов создают почти идентичные паттерны экспрессии репортерных генов у данио-рерио. [47] Аналогичным образом, у сильно различающихся насекомых (разделенных примерно 350 миллионами лет) было обнаружено, что схожие паттерны экспрессии нескольких ключевых генов регулируются посредством сходно составленных CRM, хотя эти CRM не показывают какой-либо заметной консервации последовательностей, обнаруживаемой стандартными методами выравнивания последовательностей, такими как BLAST . [48]
Энхансеры, определяющие раннюю сегментацию в эмбрионах Drosophila melanogaster, являются одними из наиболее хорошо охарактеризованных энхансеров развития. В раннем эмбрионе мухи факторы транскрипции гена gap отвечают за активацию и подавление ряда генов сегментации, таких как гены правила пар . Гены gap экспрессируются блоками вдоль передне-задней оси мухи вместе с другими факторами транскрипции материнского эффекта , тем самым создавая зоны, в которых экспрессируются различные комбинации факторов транскрипции. Гены правила пар отделены друг от друга неэкспрессирующими клетками. Более того, полосы экспрессии для различных генов правила пар смещены на несколько диаметров клеток друг от друга. Таким образом, уникальные комбинации экспрессии гена правила пар создают пространственные домены вдоль передне-задней оси для настройки каждого из 14 отдельных сегментов. Энхансер размером 480 п.н., отвечающий за управление острой полосой два гена правила пар even-skipped ( eve ), хорошо охарактеризован. Энхансер содержит 12 различных участков связывания для материнских и генных факторов транскрипции gap. Активирующие и репрессирующие участки перекрываются в последовательности. Eve экспрессируется только в узкой полосе клеток, которые содержат высокие концентрации активаторов и низкие концентрации репрессоров для этой последовательности энхансера. Другие области энхансера управляют экспрессией eve в 6 других полосах эмбриона. [49]
Установление осей тела является критическим шагом в развитии животных. Во время эмбрионального развития мыши Nodal , лиганд суперсемейства трансформирующего фактора роста бета , является ключевым геном, участвующим в формировании как передне-задней оси, так и лево-правой оси раннего эмбриона. Ген Nodal содержит два энхансера: проксимальный эпибластный энхансер (PEE) и асимметричный энхансер (ASE). PEE находится выше гена Nodal и управляет экспрессией Nodal в части первичной полоски , которая будет дифференцироваться в узел (также называемый примитивным узлом ). [50] PEE включает экспрессию Nodal в ответ на комбинацию сигнализации Wnt и второго, неизвестного сигнала; таким образом, член семейства факторов транскрипции LEF/TCF, вероятно, связывается с сайтом связывания TCF в клетках в узле. Диффузия Nodal от узла образует градиент, который затем формирует расширяющуюся передне-заднюю ось эмбриона. [51] ASE — это интронный энхансер, связанный с фактором транскрипции домена вилки Fox1. На ранних этапах развития экспрессия Nodal, управляемая Fox1, формирует висцеральную энтодерму. На поздних этапах развития связывание Fox1 с ASE запускает экспрессию Nodal на левой стороне латеральной пластинки мезодермы , тем самым устанавливая лево-правую асимметрию, необходимую для асимметричного развития органов в мезодерме. [52]
Установление трех зародышевых слоев во время гаструляции является еще одним критическим шагом в развитии животных. Каждый из трех зародышевых слоев имеет уникальные паттерны экспрессии генов, которые способствуют их дифференциации и развитию. Эндодерма определяется на ранних стадиях развития экспрессией Gata4 , а Gata4 продолжает направлять морфогенез кишечника позже. Экспрессия Gata4 контролируется на раннем этапе эмбриона интронным энхансером, который связывает другой фактор транскрипции домена forkhead, FoxA2. Первоначально энхансер управляет широкой экспрессией генов по всему эмбриону, но экспрессия быстро ограничивается энтодермой, что предполагает, что в ее ограничении могут быть задействованы другие репрессоры. На поздних стадиях развития тот же энхансер ограничивает экспрессию тканями, которые станут желудком и поджелудочной железой. Дополнительный энхансер отвечает за поддержание экспрессии Gata4 в энтодерме на промежуточных стадиях развития кишечника. [53]
Некоторые гены, участвующие в критических процессах развития, содержат несколько усилителей перекрывающейся функции. Вторичные усилители, или «теневые усилители», могут быть обнаружены на расстоянии многих килобаз от первичного усилителя («первичный» обычно относится к первому обнаруженному усилителю, который часто находится ближе к гену, который он регулирует). Сам по себе каждый усилитель управляет почти идентичными моделями экспрессии генов. Действительно ли два усилителя избыточны? Недавние исследования показали, что несколько усилителей позволяют плодовым мушкам выживать в условиях окружающей среды, таких как повышение температуры. При выращивании при повышенной температуре один усилитель иногда не может управлять полной моделью экспрессии, тогда как присутствие обоих усилителей обеспечивает нормальную экспрессию генов. [54]
Одной из тем исследований в области эволюционной биологии развития («эво-дево») является изучение роли энхансеров и других цис-регуляторных элементов в создании морфологических изменений посредством различий в развитии между видами. [ необходима ссылка ]
Недавние исследования исследовали роль энхансеров в морфологических изменениях у трехиглой колюшки . Колюшки существуют как в морской, так и в пресноводной среде, но колюшки во многих пресноводных популяциях полностью утратили свои брюшные плавники (придатки, гомологичные задней конечности четвероногих).
Pitx1 — это гомеобоксный ген, участвующий в развитии задней конечности у позвоночных. Предварительный генетический анализ показал, что изменения в экспрессии этого гена были ответственны за редукцию таза у колюшек. Рыбы, экспрессирующие только пресноводный аллель Pitx1 , не имеют тазовых шипов, тогда как рыбы, экспрессирующие морской аллель, сохраняют тазовые шипы. Более тщательная характеристика показала, что последовательность энхансера из 500 пар оснований отвечает за включение экспрессии Pitx1 в зачатке заднего плавника. Этот энхансер расположен вблизи хромосомного хрупкого участка — последовательности ДНК, которая, скорее всего, будет повреждена и, следовательно, с большей вероятностью мутирует в результате неточного восстановления ДНК . Этот хрупкий участок вызвал повторные независимые потери энхансера, ответственного за управление экспрессией Pitx1 в тазовых шипах в изолированной пресноводной популяции, и без этого энхансера пресноводные рыбы не могут развить тазовые шипы. [55]
Паттерны пигментации представляют собой одно из самых поразительных и легко оцениваемых различий между различными видами животных. Пигментация крыла Drosophila оказалась особенно податливой системой для изучения развития сложных фенотипов пигментации. Крыло Drosophila guttifera имеет 12 темных пигментных пятен и 4 более светлых серых межжилковых пятна. Пигментные пятна возникают в результате экспрессии гена yellow , продукт которого производит черный меланин . Недавние исследования показали, что два энхансера в гене yellow производят экспрессию гена именно по этой схеме — энхансер пятен жилок управляет экспрессией гена-репортера в 12 пятнах, а энхансер оттенка между жилками управляет экспрессией гена-репортера в 4 отдельных пятнах. Эти два энхансера реагируют на сигнальный путь Wnt , который активируется экспрессией wingless во всех пигментированных местах. Таким образом, в ходе эволюции фенотипа сложной пигментации ген желтого пигмента развил усилители, реагирующие на сигнал бескрылости, и экспрессия бескрылости развилась в новых местах, что привело к появлению новых узоров крыльев. [56]
Каждая клетка обычно содержит несколько сотен особого класса усилителей, которые простираются на многие килобазы длинных последовательностей ДНК, называемых « супер-усилителями ». [57] Эти усилители содержат большое количество сайтов связывания для специфичных для последовательности, индуцируемых факторов транскрипции и регулируют экспрессию генов, участвующих в дифференциации клеток. [58] Во время воспаления фактор транскрипции NF-κB облегчает ремоделирование хроматина таким образом, что избирательно перераспределяет кофакторы из высокозанятых усилителей, тем самым подавляя гены, участвующие в поддержании клеточной идентификации, экспрессию которых они усиливают; в то же время это управляемое F-κB ремоделирование и перераспределение активирует другие усилители, которые направляют изменения в клеточной функции через воспаление. [59] [60] В результате воспаление перепрограммирует клетки, изменяя их взаимодействие с остальной тканью и с иммунной системой. [61] [62] При раке белки, контролирующие активность NF-κB, нарушаются, что позволяет злокачественным клеткам снизить свою зависимость от взаимодействия с местной тканью и затрудняет их надзор со стороны иммунной системы . [63] [64]
Синтетические регуляторные элементы, такие как энхансеры, обещают стать мощным инструментом для направления генных продуктов в определенные типы клеток с целью лечения заболеваний путем активации полезных генов или остановки аномальных состояний клеток.
С 2022 года искусственный интеллект и стратегии трансферного обучения привели к лучшему пониманию особенностей регуляторных последовательностей ДНК, прогнозированию и разработке синтетических усилителей. [65] [66]
Основываясь на работе в области клеточной культуры, [65] синтетические усилители были успешно применены к целым живым организмам в 2023 году. Используя глубокие нейронные сети , ученые смоделировали эволюцию последовательностей ДНК, чтобы проанализировать возникновение признаков, лежащих в основе функции усилителя. Это позволило разработать и произвести ряд функционирующих синтетических усилителей для различных типов клеток мозга плодовой мушки. [13] Второй подход обучил модели искусственного интеллекта на данных о доступности ДНК отдельных клеток и перенес изученные модели на прогнозирование усилителей для выбранных тканей в эмбрионе плодовой мушки. Эти модели прогнозирования усилителей использовались для разработки синтетических усилителей для нервной системы, мозга, мышц, эпидермиса и кишечника. [12]