Цис -регуляторные элементы ( CRE ) или цис -регуляторные модули ( CRM ) — это области некодирующей ДНК , которые регулируют транскрипцию соседних генов. CRE — это жизненно важные компоненты генетических регуляторных сетей , которые, в свою очередь, контролируют морфогенез , развитие анатомии и другие аспекты эмбрионального развития , изучаемые в эволюционной биологии развития .
CRE находятся поблизости от генов, которые они регулируют. CRE обычно регулируют транскрипцию генов, связываясь с факторами транскрипции . Один фактор транскрипции может связываться со многими CRE и, следовательно, контролировать экспрессию многих генов ( плейотропия ). Латинский префикс cis означает «с этой стороны», т. е. на той же молекуле ДНК, что и ген(ы), которые должны транскрибироваться.
CRM представляют собой участки ДНК , обычно длиной 100–1000 пар оснований ДНК, [1] где ряд факторов транскрипции может связывать и регулировать экспрессию близлежащих генов и регулировать их скорость транскрипции. Они обозначены как цис , потому что они обычно расположены на той же цепи ДНК, что и гены, которые они контролируют, в отличие от транс , что относится к воздействию на гены, не расположенные на той же цепи или дальше, такие как факторы транскрипции. [1] Один цис -регуляторный элемент может регулировать несколько генов, [2] и наоборот, один ген может иметь несколько цис -регуляторных модулей. [3] Цис -регуляторные модули выполняют свою функцию, интегрируя активные факторы транскрипции и связанные с ними кофакторы в определенное время и в определенном месте в клетке, где эта информация считывается и дается выход. [4]
CRE часто, но не всегда, находятся выше сайта транскрипции. CRE контрастируют с трансрегуляторными элементами (TRE) . TRE кодируют факторы транскрипции. [ необходима цитата ]
Геном организма содержит от нескольких сотен до тысяч различных генов, все из которых кодируют один продукт или более. По многочисленным причинам, включая организационное поддержание, сохранение энергии и создание фенотипической дисперсии , важно, чтобы гены экспрессировались только тогда, когда они необходимы. Наиболее эффективным способом для организма регулировать экспрессию генов является уровень транскрипции. CRE функционируют для контроля транскрипции, действуя рядом или внутри гена. Наиболее хорошо охарактеризованными типами CRE являются энхансеры и промоторы . Оба этих элемента последовательности являются структурными областями ДНК, которые служат регуляторами транскрипции . [ требуется цитата ]
Цис -регуляторные модули являются одним из нескольких типов функциональных регуляторных элементов . Регуляторные элементы являются сайтами связывания для факторов транскрипции, которые участвуют в регуляции генов. [1] Цис -регуляторные модули выполняют большой объем обработки информации о развитии. [1] Цис -регуляторные модули представляют собой неслучайные кластеры в их определенном целевом сайте, которые содержат сайты связывания факторов транскрипции. [1]
Первоначальное определение представляло цис-регуляторные модули как усилители цис-действующей ДНК, которые увеличивали скорость транскрипции со связанного промотора . [4] Однако это определение было изменено, чтобы определить цис -регуляторные модули как последовательность ДНК с сайтами связывания факторов транскрипции, которые сгруппированы в модульные структуры, включая, помимо прочего, области контроля локуса, промоторы, усилители, сайленсеры, элементы пограничного контроля и другие модуляторы. [4]
Цис -регуляторные модули можно разделить на три класса: энхансеры , которые положительно регулируют экспрессию генов; [1] инсуляторы , которые работают косвенно, взаимодействуя с другими близлежащими цис -регуляторными модулями; и [1] сайленсеры , которые отключают экспрессию генов. [1]
Конструкция цис -регуляторных модулей такова, что факторы транскрипции и эпигенетические модификации служат входными данными, а выходными данными модуля является команда, отдаваемая транскрипционному аппарату, который, в свою очередь, определяет скорость транскрипции гена или то, включена она или выключена . [ 1] Существует два типа входных данных факторов транскрипции: те, которые определяют, когда целевой ген должен быть экспрессирован, и те, которые служат функциональными драйверами , которые вступают в игру только в определенных ситуациях во время развития. [1] Эти входные данные могут поступать из разных временных точек, могут представлять разные сигнальные лиганды или могут поступать из разных доменов или линий клеток. Однако многое еще остается неизвестным. [ необходима цитата ]
Кроме того, регуляция структуры хроматина и ядерной организации также играет роль в определении и контроле функции цис-регуляторных модулей. [4] Таким образом, функции регуляции генов (GRF) обеспечивают уникальную характеристику цис-регуляторного модуля (CRM), связывая концентрации факторов транскрипции (вход) с активностью промотора (выход). Задача состоит в том, чтобы предсказать GRF. Эта задача все еще остается нерешенной. В общем, функции регуляции генов не используют булеву логику , [2] хотя в некоторых случаях приближение булевой логики все еще очень полезно. [ необходима цитата ]
В рамках предположения о булевой логике принципы, определяющие работу этих модулей, включают конструкцию модуля, определяющую регуляторную функцию. В отношении разработки эти модули могут генерировать как положительные, так и отрицательные выходные данные. Выход каждого модуля является продуктом различных операций, выполняемых над ним. Общие операции включают в себя вентиль ИЛИ — эта конструкция указывает, что выход будет дан, когда дан любой вход [3], и вентиль И — в этой конструкции необходимы два различных регуляторных фактора, чтобы гарантировать, что результат положительный выход. [1] «Переключатели» — эта конструкция возникает, когда сигнальный лиганд отсутствует, а фактор транскрипции присутствует; этот фактор транскрипции в конечном итоге действует как доминирующий репрессор. Однако, как только сигнальный лиганд присутствует, роль фактора транскрипции как репрессора устраняется, и транскрипция может произойти. [1]
Также могут происходить другие операции булевой логики, такие как последовательность специфичных транскрипционных репрессоров, которые при связывании с цис -регуляторным модулем приводят к нулевому выходу. Кроме того, помимо влияния различных логических операций, выход «цис»-регуляторного модуля также будет зависеть от предшествующих событий. [1] 4) Цис -регуляторные модули должны взаимодействовать с другими регуляторными элементами. По большей части, даже при наличии функционального перекрытия между цис -регуляторными модулями гена, входы и выходы модулей, как правило, не совпадают. [1]
Хотя предположение о булевой логике важно для системной биологии , подробные исследования показывают, что в целом логика регуляции генов не является булевой. [2] Это означает, например, что в случае цис -регуляторного модуля, регулируемого двумя факторами транскрипции, экспериментально определенные функции регуляции генов не могут быть описаны 16 возможными булевыми функциями двух переменных. Для исправления этой проблемы были предложены небулевы расширения логики регуляции генов. [2]
Цис -регуляторные модули можно охарактеризовать по обработке информации, которую они кодируют, и по организации их сайтов связывания факторов транскрипции. Кроме того, цис -регуляторные модули также характеризуются тем, как они влияют на вероятность, пропорцию и скорость транскрипции. [4] Высококооперативные и скоординированные цис -регуляторные модули классифицируются как энхансеросомы . [4] Архитектура и расположение сайтов связывания факторов транскрипции имеют решающее значение, поскольку нарушение расположения может свести на нет функцию. [4] Функциональные гибкие цис -регуляторные модули называются билбордами. Их транскрипционный выход представляет собой эффект суммирования связанных факторов транскрипции. [4] Энхансеры влияют на вероятность активации гена, но оказывают незначительное или нулевое влияние на скорость. [4] Модель бинарного ответа действует как переключатель вкл/выкл для транскрипции. Эта модель увеличит или уменьшит количество клеток, которые транскрибируют ген, но не повлияет на скорость транскрипции. [4] Модель реостатического ответа описывает цис-регуляторные модули как регуляторы скорости инициации транскрипции соответствующего гена. [4]
Промоторы — это CRE, состоящие из относительно коротких последовательностей ДНК, которые включают сайт, где инициируется транскрипция, и область примерно в 35 п.н. выше или ниже сайта инициации (п.н.). [5] У эукариот промоторы обычно имеют следующие четыре компонента: TATA-бокс , сайт распознавания TFIIB , инициатор и элемент промотора ядра ниже по течению . [5] Было обнаружено, что один ген может содержать несколько сайтов промотора. [6] Для того чтобы инициировать транскрипцию нижестоящего гена, множество ДНК-связывающих белков, называемых факторами транскрипции (TF), должны последовательно связываться с этой областью. [5] Только после того, как эта область будет связана с соответствующим набором TF и в правильном порядке, РНК-полимераза может связаться и начать транскрибировать ген.
Энхансеры — это CRE, которые влияют (усиливают) транскрипцию генов на одной и той же молекуле ДНК и могут быть обнаружены выше, ниже, внутри интронов или даже относительно далеко от гена, который они регулируют. Несколько энхансеров могут действовать скоординированно, чтобы регулировать транскрипцию одного гена. [7] Ряд проектов по секвенированию генома показали, что энхансеры часто транскрибируются в длинную некодирующую РНК (lncRNA) или энхансерную РНК (eRNA), изменения уровней которой часто коррелируют с изменениями мРНК целевого гена. [8]
Сайленсеры — это CRE, которые могут связывать факторы регуляции транскрипции (белки), называемые репрессорами , тем самым предотвращая транскрипцию гена. Термин «сайленсер» может также относиться к области в 3'-нетранслируемой области информационной РНК, которая связывает белки, подавляющие трансляцию этой молекулы мРНК, но это использование отличается от его использования при описании CRE. [ необходима цитата ]
Операторы — это CRE у прокариот и некоторых эукариот, которые существуют внутри оперонов , где они могут связывать белки, называемые репрессорами , чтобы влиять на транскрипцию. [ необходима цитата ]
CRE играют важную эволюционную роль. Кодирующие области генов часто хорошо сохраняются среди организмов; тем не менее, различные организмы демонстрируют выраженное фенотипическое разнообразие. Было обнаружено, что полиморфизмы , возникающие в некодирующих последовательностях, оказывают глубокое влияние на фенотип, изменяя экспрессию генов . [7] Мутации , возникающие в CRE, могут генерировать дисперсию экспрессии, изменяя способ связывания TF. Более тесное или слабое связывание регуляторных белков приведет к повышению или понижению регуляции транскрипции.
Функция сети регуляции генов зависит от архитектуры узлов , чья функция зависит от множественных цис -регуляторных модулей. [1] Расположение цис -регуляторных модулей может предоставить достаточно информации для генерации пространственных и временных моделей экспрессии генов. [1] Во время развития каждый домен, представляющий различные пространственные области эмбриона, экспрессии генов будет находиться под контролем различных цис -регуляторных модулей. [1] Конструкция регуляторных модулей помогает в создании петель обратной связи , прямой связи и перекрестной регуляции. [9]
Цис -регуляторные модули могут регулировать свои целевые гены на больших расстояниях. Было предложено несколько моделей для описания способа, которым эти модули могут взаимодействовать с промоутером своего целевого гена. [4] К ним относятся модель сканирования ДНК, модель зацикливания последовательности ДНК и модель облегченного отслеживания. В модели сканирования ДНК комплекс фактора транскрипции и кофактора формируется в цис -регуляторном модуле, а затем продолжает двигаться по последовательности ДНК, пока не найдет промотор целевого гена. [4] В модели зацикливания фактор транскрипции связывается с цис -регуляторным модулем, который затем вызывает зацикливание последовательности ДНК и обеспечивает взаимодействие с промотором целевого гена. Комплекс фактора транскрипции и цис -регуляторного модуля вызывает медленное зацикливание последовательности ДНК по направлению к целевому промотору и образует стабильную петлевую конфигурацию. [4] Модель облегченного отслеживания объединяет части двух предыдущих моделей.
Помимо экспериментального определения CRM, существуют различные алгоритмы биоинформатики для их прогнозирования. Большинство алгоритмов пытаются искать значимые комбинации сайтов связывания факторов транскрипции ( сайты связывания ДНК ) в последовательностях промотора коэкспрессируемых генов. [10] Более продвинутые методы объединяют поиск значимых мотивов с корреляцией в наборах данных по экспрессии генов между факторами транскрипции и целевыми генами. [11] Оба метода были реализованы, например, в ModuleMaster. Другие программы, созданные для идентификации и прогнозирования цис -регуляторных модулей, включают:
INSECT 2.0 [12] — это веб-сервер, позволяющий искать цис-регуляторные модули по всему геному. Программа основана на определении строгих ограничений среди сайтов связывания факторов транскрипции (TFBS), которые составляют модуль, чтобы снизить частоту ложных срабатываний. INSECT разработан так, чтобы быть удобным для пользователя, поскольку он позволяет автоматически извлекать последовательности и несколько визуализаций и ссылок на сторонние инструменты, чтобы помочь пользователям находить те экземпляры, которые с большей вероятностью являются истинными регуляторными сайтами. Алгоритм INSECT 2.0 был ранее опубликован, а алгоритм и теория, лежащие в его основе, объясняются в [13].
Stubb использует скрытые марковские модели для определения статистически значимых кластеров комбинаций факторов транскрипции. Он также использует второй связанный геном для улучшения точности предсказания модели. [14]
Байесовские сети используют алгоритм, который объединяет прогнозы сайтов и данные специфической для тканей экспрессии для факторов транскрипции и целевых генов, представляющих интерес. Эта модель также использует деревья регрессии для отображения взаимосвязи между идентифицированным цис -регуляторным модулем и возможным набором связывания факторов транскрипции. [15]
CRÈME исследует кластеры целевых сайтов для интересующих факторов транскрипции. Эта программа использует базу данных подтвержденных сайтов связывания факторов транскрипции, которые были аннотированы по всему геному человека . Алгоритм поиска применяется к набору данных для выявления возможных комбинаций факторов транскрипции, которые имеют сайты связывания, которые находятся близко к промотору интересующего набора генов. Затем возможные цис-регуляторные модули статистически анализируются, и значимые комбинации представляются графически [16]
Активные цис -регуляторные модули в геномной последовательности было трудно идентифицировать. Проблемы с идентификацией возникают из-за того, что часто ученые оказываются с небольшим набором известных факторов транскрипции, поэтому становится сложнее идентифицировать статистически значимые кластеры сайтов связывания факторов транскрипции. [14] Кроме того, высокие затраты ограничивают использование больших массивов мозаичного размещения всего генома . [15]
Примером цис-действующей регуляторной последовательности является оператор в lac-опероне . Эта последовательность ДНК связана с lac-репрессором , который, в свою очередь, предотвращает транскрипцию соседних генов на той же молекуле ДНК. Таким образом, считается, что lac-оператор «действует в цис» на регуляцию соседних генов. Сам оператор не кодирует какой-либо белок или РНК .
Напротив, трансрегуляторные элементы — это диффундирующие факторы, обычно белки, которые могут изменять экспрессию генов, удаленных от гена, который был изначально транскрибирован для их создания. Например, фактор транскрипции , который регулирует ген на хромосоме 6, сам мог быть транскрибирован с гена на хромосоме 11. Термин трансрегуляторный образован от латинского корня trans , что означает «напротив».
Существуют цис-регуляторные и транс-регуляторные элементы. Цис-регуляторные элементы часто являются сайтами связывания для одного или нескольких транс-действующих факторов.
Подводя итог, можно сказать, что цис-регуляторные элементы присутствуют на той же молекуле ДНК, что и ген, который они регулируют, тогда как транс-регуляторные элементы могут регулировать гены, находящиеся на большом расстоянии от гена, с которого они были транскрибированы.