Регуляторная последовательность — это сегмент молекулы нуклеиновой кислоты , который способен увеличивать или уменьшать экспрессию определенных генов в организме. Регуляция экспрессии генов является важной особенностью всех живых организмов и вирусов.
В ДНК регуляция экспрессии генов обычно происходит на уровне биосинтеза РНК ( транскрипции ). Это достигается за счет специфического связывания белков ( факторов транскрипции ), которые активируют или ингибируют транскрипцию. Факторы транскрипции могут действовать как активаторы , репрессоры или и то, и другое. Репрессоры часто действуют, предотвращая образование продуктивного комплекса РНК-полимеразой с областью инициации транскрипции ( промотором ), тогда как активаторы способствуют образованию продуктивного комплекса. Более того, было показано, что мотивы ДНК предсказывают эпигеномные модификации, что позволяет предположить, что факторы транскрипции играют роль в регуляции эпигенома . [2]
В РНК регуляция может происходить на уровне биосинтеза белка ( трансляции ), расщепления РНК, сплайсинга РНК или терминации транскрипции. Регуляторные последовательности часто связаны с молекулами информационной РНК (мРНК), где они используются для контроля биогенеза или трансляции мРНК. Для осуществления этой регуляции с РНК могут связываться различные биологические молекулы, включая белки (например, репрессоры трансляции и факторы сплайсинга), другие молекулы РНК (например, микроРНК ) и небольшие молекулы в случае рибопереключателей .
Регуляторная последовательность ДНК не регулирует, пока она не активирована. Различные регуляторные последовательности активируются и затем осуществляют свою регуляцию с помощью разных механизмов.
Экспрессию генов у млекопитающих можно активировать, когда сигналы передаются промоторам, связанным с генами. Цис -регуляторные последовательности ДНК , расположенные в областях ДНК, удаленных от промоторов генов, могут оказывать очень сильное влияние на экспрессию генов, при этом экспрессия некоторых генов увеличивается до 100 раз из-за такой цис -регуляторной последовательности. [3] Эти цис -регуляторные последовательности включают энхансеры , сайленсеры , изоляторы и привязывающие элементы. [4] Среди этого созвездия последовательностей энхансеры и связанные с ними белки транскрипционных факторов играют ведущую роль в регуляции экспрессии генов. [5]
Энхансеры — это последовательности генома, являющиеся основными генно-регуляторными элементами. Энхансеры контролируют программы экспрессии генов, специфичные для конкретного типа клеток, чаще всего преодолевая большие расстояния, чтобы оказаться в физической близости с промоторами своих генов-мишеней. [6] При исследовании нейронов коры головного мозга было обнаружено 24 937 петель, приводящих энхансеры к промоторам. [3] Множественные энхансеры, каждый из которых часто находится на десятках или сотнях тысяч нуклеотидов, удаленных от генов-мишеней, соединяются с промоторами гена-мишени и координируются друг с другом, чтобы контролировать экспрессию общего гена-мишени. [6]
Схематическая иллюстрация в этом разделе показывает, как энхансер движется по кругу, чтобы вступить в тесную физическую близость к промотору целевого гена. Петля стабилизируется димером соединительного белка (например, димером CTCF или YY1 ), причем один член димера прикреплен к своему связывающему мотиву на энхансере, а другой член прикреплен к своему связывающему мотиву на промоторе (представленному красные зигзаги на иллюстрации). [7] Несколько белков транскрипционных факторов, специфичных для клеточных функций (в 2018 году Ламберт и др. указали, что в клетке человека имеется около 1600 транскрипционных факторов [8] ), как правило, связываются со специфическими мотивами на энхансере [9] и небольшой комбинацией этих энхансеров. -связанные факторы транскрипции, когда они приближаются к промотору с помощью петли ДНК, регулируют уровень транскрипции гена-мишени. Медиатор (коактиватор) (комплекс, обычно состоящий примерно из 26 белков во взаимодействующей структуре) передает регуляторные сигналы от энхансерных ДНК-связанных факторов транскрипции непосредственно ферменту РНК-полимеразы II (РНКП II), связанному с промотором. [10]
Энхансеры, когда они активны, обычно транскрибируются с обеих цепей ДНК с помощью РНК-полимераз, действующих в двух разных направлениях, образуя две эРНК, как показано на рисунке. [11] Неактивный энхансер может быть связан с неактивным фактором транскрипции. Фосфорилирование фактора транскрипции может активировать его, и этот активированный фактор транскрипции может затем активировать энхансер, с которым он связан (см. маленькую красную звездочку, обозначающую фосфорилирование фактора транскрипции, связанного с энхансером, на иллюстрации). [12] Активированный энхансер начинает транскрипцию своей РНК перед активацией промотора, чтобы инициировать транскрипцию информационной РНК из его целевого гена. [13]
5-Метилцитозин (5-mC) представляет собой метилированную форму цитозина основания ДНК ( см. рисунок). 5-mC — это эпигенетический маркер, обнаруживаемый преимущественно в цитозинах в составе динуклеотидов CpG, которые состоят из цитозина, за которым следует считывание гуанина в направлении от 5’ к 3’ вдоль цепи ДНК ( сайты CpG ). В геноме человека встречается около 28 миллионов CpG-динуклеотидов. [14] В большинстве тканей млекопитающих в среднем от 70% до 80% цитозинов CpG метилированы (образуя 5-метил-CpG или 5-mCpG). [15] Метилированные цитозины в последовательностях CpG часто встречаются группами, называемыми CpG-островками . Около 59% последовательностей промоторов имеют островок CpG, тогда как только около 6% последовательностей энхансеров имеют островок CpG. [16] Островки CpG представляют собой регуляторные последовательности, поскольку, если островки CpG метилированы в промоторе гена, это может уменьшить или заглушить экспрессию гена. [17]
Метилирование ДНК регулирует экспрессию генов посредством взаимодействия с белками метилсвязывающего домена (MBD), такими как MeCP2, MBD1 и MBD2. Эти белки MBD наиболее прочно связываются с высоко метилированными CpG-островками . [18] Эти белки MBD имеют как метил-CpG-связывающий домен, так и домен репрессии транскрипции. [18] Они связываются с метилированной ДНК и направляют белковые комплексы с ремоделированием хроматина и/или модификацией гистонов на метилированные CpG-островки. Белки MBD обычно репрессируют локальный хроматин с помощью таких средств, как катализ внедрения репрессивных меток гистонов или создание общей репрессивной среды хроматина посредством ремоделирования нуклеосом и реорганизации хроматина. [18]
Факторы транскрипции — это белки, которые связываются со специфическими последовательностями ДНК, чтобы регулировать экспрессию данного гена. Последовательность связывания фактора транскрипции в ДНК обычно имеет длину около 10 или 11 нуклеотидов. В геноме человека закодировано около 1400 различных факторов транскрипции, и они составляют около 6% всех генов, кодирующих белки человека. [19] Около 94% сайтов связывания транскрипционных факторов, которые связаны с сигнально-чувствительными генами, встречаются в энхансерах, тогда как только около 6% таких сайтов встречаются в промоторах. [9]
EGR1 является фактором транскрипции, важным для регуляции метилирования CpG-островков. Сайт связывания транскрипционного фактора EGR1 часто расположен в последовательностях энхансера или промотора. [20] В геноме млекопитающих имеется около 12 000 сайтов связывания EGR1, и около половины сайтов связывания EGR1 расположены в промоторах, а половина — в энхансерах. [20] Связывание EGR1 с целевым участком связывания ДНК нечувствительно к метилированию цитозина в ДНК. [20]
Хотя в нестимулированных клетках обнаруживаются лишь небольшие количества белка EGR1, трансляция EGR1 в белок через час после стимуляции заметно увеличивается. [21] Экспрессия EGR1 в различных типах клеток может стимулироваться факторами роста, нейротрансмиттерами, гормонами, стрессом и травмой. [21] В головном мозге, когда нейроны активируются, белки EGR1 активируются и связываются (рекрутируют) с ранее существовавшими ферментами TET1, которые высоко экспрессируются в нейронах. Ферменты ТЕТ могут катализировать деметилирование 5-метилцитозина. Когда факторы транскрипции EGR1 доставляют ферменты TET1 к сайтам связывания EGR1 в промоторах, ферменты TET могут деметилировать метилированные островки CpG на этих промоторах. После деметилирования эти промоторы могут затем инициировать транскрипцию своих генов-мишеней. Сотни генов в нейронах дифференциально экспрессируются после активации нейронов посредством рекрутирования EGR1 TET1 на метилированные регуляторные последовательности в их промоторах. [20]
Около 600 регуляторных последовательностей в промоторах и около 800 регуляторных последовательностей в энхансерах, по-видимому, зависят от двухцепочечных разрывов, инициируемых топоизомеразой 2β (TOP2B), для активации. [22] [23] Индукция определенных двухцепочечных разрывов специфична в отношении индуцирующего сигнала. Когда нейроны активируются in vitro , в их геномах происходит всего 22 двухцепочечных разрыва, индуцированных TOP2B. [24] Однако, когда у мышей применяется контекстуальное формирование страха , это вызывает появление сотен связанных с генами DSB в медиальной префронтальной коре и гиппокампе, которые важны для обучения и памяти. [25]
Такие двухцепочечные разрывы, индуцированные TOP2B, сопровождаются как минимум четырьмя ферментами пути репарации ДНК негомологичного соединения концов (NHEJ) (DNA-PKcs, KU70, KU80 и ДНК-ЛИГАЗА IV) (см. рисунок). Эти ферменты восстанавливают двухцепочечные разрывы в течение периода от 15 минут до 2 часов. [24] [26] Таким образом, двухцепочечные разрывы в промоторе связаны с TOP2B и, по крайней мере, с этими четырьмя ферментами репарации. Эти белки присутствуют одновременно на одной нуклеосоме-промоторе (в последовательности ДНК, обернутой вокруг одной нуклеосомы, около 147 нуклеотидов), расположенной вблизи места начала транскрипции их гена-мишени. [26]
Двухцепочечный разрыв, вызванный TOP2B, по-видимому, освобождает часть промотора в сайте начала транскрипции, связанном с РНК-полимеразой, для физического перемещения к связанному с ним энхансеру. Это позволяет энхансеру со связанными с ним факторами транскрипции и белками-медиаторами напрямую взаимодействовать с РНК-полимеразой, которая была остановлена в сайте начала транскрипции, чтобы начать транскрипцию. [24] [10]
Аналогичным образом, ферменты топоизомеразы I (TOP1), по-видимому, расположены на многих энхансерах, и эти энхансеры активируются, когда TOP1 вводит одноцепочечный разрыв. [27] TOP1 вызывает одноцепочечные разрывы в определенных регуляторных последовательностях ДНК энхансера, когда сигнализируется специфическим транскрипционным фактором, связывающим энхансер. [27] Разрывы топоизомеразы I связаны с другими факторами репарации ДНК, чем те, которые окружают разрывы TOP2B. В случае TOP1 разрывы наиболее непосредственно связаны с ферментами репарации ДНК MRE11 , RAD50 и ATR . [27]
Геномы можно систематически анализировать для выявления регуляторных регионов. [28] Консервативные некодирующие последовательности часто содержат регуляторные области, и поэтому они часто являются предметом этих анализов.
Регуляторные последовательности гена инсулина : [29]