Регуляторная последовательность — это сегмент молекулы нуклеиновой кислоты , способный увеличивать или уменьшать экспрессию определенных генов в организме. Регуляция экспрессии генов является неотъемлемой чертой всех живых организмов и вирусов.
В ДНК регуляция экспрессии генов обычно происходит на уровне биосинтеза РНК ( транскрипции ). Это достигается посредством специфического для последовательности связывания белков ( факторов транскрипции ), которые активируют или ингибируют транскрипцию. Факторы транскрипции могут действовать как активаторы , репрессоры или и то, и другое. Репрессоры часто действуют, предотвращая образование продуктивного комплекса РНК-полимеразой с областью инициации транскрипции ( промотором ), в то время как активаторы способствуют образованию продуктивного комплекса. Кроме того, было показано, что мотивы ДНК предсказывают эпигеномные модификации, что позволяет предположить, что факторы транскрипции играют роль в регуляции эпигенома . [ 2]
В РНК регуляция может происходить на уровне биосинтеза белка ( трансляции ), расщепления РНК, сплайсинга РНК или терминации транскрипции. Регуляторные последовательности часто связаны с молекулами информационной РНК (мРНК), где они используются для контроля биогенеза или трансляции мРНК. Различные биологические молекулы могут связываться с РНК для осуществления этой регуляции, включая белки (например, репрессоры трансляции и факторы сплайсинга), другие молекулы РНК (например, микроРНК ) и малые молекулы , в случае рибопереключателей .
Регуляторная последовательность ДНК не регулирует, если она не активирована. Различные регуляторные последовательности активируются и затем осуществляют свою регуляцию посредством различных механизмов.
Экспрессия генов у млекопитающих может быть повышена, когда сигналы передаются на промоторы, связанные с генами. Цис -регуляторные последовательности ДНК , которые расположены в областях ДНК, удаленных от промоторов генов, могут иметь очень большое влияние на экспрессию генов, при этом некоторые гены подвергаются 100-кратному увеличению экспрессии из-за такой цис -регуляторной последовательности. [3] Эти цис -регуляторные последовательности включают энхансеры , сайленсеры , инсуляторы и элементы привязки. [4] Среди этого созвездия последовательностей энхансеры и связанные с ними белки факторов транскрипции играют ведущую роль в регуляции экспрессии генов. [5]
Энхансеры — это последовательности генома, которые являются основными элементами регуляции генов. Энхансеры контролируют программы экспрессии генов, специфичные для типа клеток, чаще всего, прокладывая петли на больших расстояниях, чтобы физически приблизиться к промоторам своих целевых генов. [6] При исследовании нейронов коры головного мозга было обнаружено 24 937 петель, которые приводят энхансеры к промоторам. [3] Множественные энхансеры, каждый из которых часто находится на расстоянии десятков или сотен тысяч нуклеотидов от своих целевых генов, прокладывают петли к своим промоторам целевых генов и координируют друг с другом, чтобы контролировать экспрессию своего общего целевого гена. [6]
Схематическая иллюстрация в этом разделе показывает энхансер, закручивающийся вокруг, чтобы войти в тесную физическую близость с промотором целевого гена. Петля стабилизируется димером соединительного белка (например, димером CTCF или YY1 ), при этом один член димера прикреплен к своему связывающему мотиву на энхансере, а другой член прикреплен к своему связывающему мотиву на промоторе (представлен красными зигзагами на иллюстрации). [7] Несколько белков факторов транскрипции, специфичных для клеточных функций (в 2018 году Ламберт и др. указали, что в человеческой клетке существует около 1600 факторов транскрипции [8] ), как правило, связываются со специфическими мотивами на энхансере [9], и небольшая комбинация этих связанных с энхансером факторов транскрипции, когда они приближаются к промотору с помощью петли ДНК, регулируют уровень транскрипции целевого гена. Медиатор (коактиватор) (комплекс, обычно состоящий из около 26 белков во взаимодействующей структуре) передает регуляторные сигналы от факторов транскрипции, связанных с ДНК-энхансером, непосредственно ферменту РНК-полимеразе II (РНКП II), связанному с промотором. [10]
Активные энхансеры обычно транскрибируются с обеих цепей ДНК с помощью РНК-полимераз, действующих в двух разных направлениях, производя две эРНК, как показано на рисунке. [11] Неактивный энхансер может быть связан с неактивным фактором транскрипции. Фосфорилирование фактора транскрипции может активировать его, а активированный фактор транскрипции может затем активировать энхансер, с которым он связан (см. маленькую красную звездочку, представляющую фосфорилирование фактора транскрипции, связанного с энхансером на рисунке). [12] Активированный энхансер начинает транскрипцию своей РНК перед активацией промотора для инициирования транскрипции информационной РНК с его целевого гена. [13]
5-Метилцитозин (5-mC) — это метилированная форма цитозина основания ДНК (см. рисунок). 5-mC — это эпигенетический маркер, обнаруженный преимущественно на цитозинах в динуклеотидах CpG, которые состоят из цитозина, за которым следует гуанин в направлении от 5' до 3' вдоль цепи ДНК ( сайты CpG ). В геноме человека встречается около 28 миллионов динуклеотидов CpG. [14] В большинстве тканей млекопитающих в среднем от 70% до 80% цитозинов CpG метилированы (образуя 5-метил-CpG или 5-mCpG). [15] Метилированные цитозины в последовательностях CpG часто встречаются группами, называемыми островками CpG . Около 59% последовательностей промотора имеют островок CpG, тогда как только около 6% последовательностей энхансера имеют островок CpG. [16] Островки CpG представляют собой регуляторные последовательности, поскольку, если островки CpG метилированы в промоторе гена, это может снизить или полностью отключить экспрессию гена. [17]
Метилирование ДНК регулирует экспрессию генов посредством взаимодействия с белками домена связывания метила (MBD), такими как MeCP2, MBD1 и MBD2. Эти белки MBD наиболее прочно связываются с высокометилированными островками CpG . [18] Эти белки MBD имеют как домен связывания метил-CpG, так и домен репрессии транскрипции. [18] Они связываются с метилированной ДНК и направляют или направляют белковые комплексы с ремоделированием хроматина и/или модифицирующей гистон активностью к метилированным островкам CpG. Белки MBD обычно подавляют локальный хроматин такими способами, как катализируя введение репрессивных гистоновых меток или создавая общую репрессивную хроматиновую среду посредством ремоделирования нуклеосом и реорганизации хроматина. [18]
Факторы транскрипции — это белки, которые связываются с определенными последовательностями ДНК для регулирования экспрессии данного гена. Связывающая последовательность для фактора транскрипции в ДНК обычно имеет длину около 10 или 11 нуклеотидов. В геноме человека закодировано около 1400 различных факторов транскрипции, и они составляют около 6% всех генов, кодирующих человеческие белки. [19] Около 94% сайтов связывания факторов транскрипции, которые связаны с генами, реагирующими на сигнал, находятся в энхансерах, тогда как только около 6% таких сайтов находятся в промоторах. [9]
EGR1 — это фактор транскрипции, важный для регуляции метилирования CpG-островков. Сайт связывания фактора транскрипции EGR1 часто располагается в последовательностях энхансера или промотора. [20] В геноме млекопитающих имеется около 12 000 сайтов связывания EGR1, и около половины сайтов связывания EGR1 расположены в промоторах, а половина — в энхансерах. [20] Связывание EGR1 с его сайтом связывания целевой ДНК нечувствительно к метилированию цитозина в ДНК. [20]
Хотя в нестимулированных клетках можно обнаружить лишь небольшое количество белка EGR1, трансляция EGR1 в белок через час после стимуляции заметно повышается. [21] Экспрессия EGR1 в различных типах клеток может стимулироваться факторами роста, нейротрансмиттерами, гормонами, стрессом и травмой. [21] В мозге, когда нейроны активируются, белки EGR1 активируются, и они связываются с (рекрутируют) уже существующими ферментами TET1, которые высоко экспрессируются в нейронах. Ферменты TET могут катализировать деметилирование 5-метилцитозина. Когда факторы транскрипции EGR1 переносят ферменты TET1 к сайтам связывания EGR1 в промоторах, ферменты TET могут деметилировать метилированные островки CpG на этих промоторах. После деметилирования эти промоторы могут инициировать транскрипцию своих целевых генов. Сотни генов в нейронах дифференциально экспрессируются после активации нейронов посредством привлечения EGR1 TET1 к метилированным регуляторным последовательностям в их промоторах. [20]
Около 600 регуляторных последовательностей в промоторах и около 800 регуляторных последовательностей в энхансерах, по-видимому, зависят от двухцепочечных разрывов, инициированных топоизомеразой 2β (TOP2B) для активации. [22] [23] Индукция конкретных двухцепочечных разрывов специфична по отношению к индуцирующему сигналу. Когда нейроны активируются in vitro , в их геномах происходит всего 22 двухцепочечных разрыва, индуцированных TOP2B. [24] Однако, когда контекстуальное условное рефлексообразование страха осуществляется у мыши, это условное рефлексообразование вызывает сотни ген-ассоциированных DSB в медиальной префронтальной коре и гиппокампе, которые важны для обучения и памяти. [25]
Такие двухцепочечные разрывы, вызванные TOP2B, сопровождаются по крайней мере четырьмя ферментами пути репарации ДНК с негомологичным соединением концов (NHEJ) (DNA-PKcs, KU70, KU80 и DNA LIGASE IV) (см. рисунок). Эти ферменты восстанавливают двухцепочечные разрывы в течение примерно от 15 минут до 2 часов. [24] [26] Таким образом, двухцепочечные разрывы в промоторе связаны с TOP2B и по крайней мере этими четырьмя ферментами репарации. Эти белки присутствуют одновременно на одной нуклеосоме промотора (в последовательности ДНК, обернутой вокруг одной нуклеосомы, около 147 нуклеотидов), расположенной вблизи сайта начала транскрипции их целевого гена. [26]
Двухцепочечный разрыв, введенный TOP2B, по-видимому, освобождает часть промотора в месте начала транскрипции, связанном с РНК-полимеразой, для физического перемещения к связанному с ним энхансеру. Это позволяет энхансеру с его связанными факторами транскрипции и медиаторными белками напрямую взаимодействовать с РНК-полимеразой, которая была остановлена в месте начала транскрипции, чтобы начать транскрипцию. [24] [10]
Аналогично, ферменты топоизомеразы I (TOP1), по-видимому, расположены во многих энхансерах, и эти энхансеры активируются, когда TOP1 вносит одноцепочечный разрыв. [27] TOP1 вызывает одноцепочечные разрывы в определенных регуляторных последовательностях ДНК энхансера, когда получает сигнал от специфического фактора транскрипции, связывающего энхансер. [27] Разрывы топоизомеразы I связаны с другими факторами репарации ДНК, чем те, которые окружают разрывы TOP2B. В случае TOP1 разрывы связаны непосредственно с ферментами репарации ДНК MRE11 , RAD50 и ATR . [27]
Геномы можно систематически анализировать для выявления регуляторных областей. [28] Консервативные некодирующие последовательности часто содержат регуляторные области, и поэтому они часто являются предметом этих анализов.
Регуляторные последовательности гена инсулина : [29]