В генетике промотор — это последовательность ДНК , с которой связываются белки, чтобы инициировать транскрипцию одного транскрипта РНК из ДНК , расположенной ниже промотора. Транскрипт РНК может кодировать белок ( мРНК ) или может иметь функцию сам по себе, например тРНК или рРНК . Промоторы расположены вблизи мест начала транскрипции генов, выше ДНК (по направлению к 5'-области смысловой цепи ). Промоторы могут иметь длину около 100–1000 пар оснований , последовательность которых сильно зависит от гена и продукта транскрипции, типа или класса РНК-полимеразы, рекрутированной в сайт, и вида организма. [1] [2]
Промоторы контролируют экспрессию генов у бактерий и эукариот. [3] РНК-полимераза должна прикрепиться к ДНК рядом с геном, чтобы произошла транскрипция. Последовательности промоторной ДНК обеспечивают сайт связывания фермента. Последовательность -10 — это ТАТААТ. Последовательности -35 консервативны в среднем, но не в большинстве промоторов.
Искусственные промоторы с консервативными элементами -10 и -35 транскрибируются медленнее. Все ДНК имеют «близко расположенные промоторы». Возможны дивергентная, тандемная и конвергентная ориентации. Два близко расположенных промотора, скорее всего, будут мешать. Регуляторные элементы могут находиться на расстоянии нескольких тысяч оснований от места начала транскрипции в промоторах генов (энхансерах).
У эукариот транскрипционный комплекс может изгибать ДНК, позволяя располагать регуляторные последовательности далеко от места транскрипции. Дистальный промотор находится выше гена и может содержать дополнительные регуляторные элементы с более слабым влиянием. РНК-полимераза II (РНКП II), связанная с промотором сайта начала транскрипции, может запускать синтез мРНК. Он также обычно содержит островки CpG , блок TATA и элементы распознавания TFIIB .
Гиперметилирование подавляет оба гена, а деметилирование усиливает их. Согласно исследованиям, некодирующие РНК связаны с промоторными областями мРНК. Субгеномные промоторы имеют длину от 24 до 100 нуклеотидов (вирус некроза желтой жилки свеклы). Экспрессия гена зависит от связывания промотора. Нежелательные изменения генов могут увеличить риск развития рака в клетке.
Промоторы микроРНК часто содержат CpG-островки. Метилирование ДНК приводит к образованию 5-метилцитозинов в 5'-пиримидиновом кольце остатков цитозина CpG. Некоторые раковые гены подавляются мутациями, но большинство из них подавляются метилированием ДНК. Другие являются регулируемыми промоутерами. Отбор может способствовать менее энергичному транскрипционному связыванию.
Изменения в промоторах или факторах транскрипции вызывают некоторые заболевания. Недоразумения могут возникнуть в результате использования канонической последовательности для описания промотора.
Чтобы произошла транскрипция, фермент, синтезирующий РНК, известный как РНК-полимераза , должен прикрепиться к ДНК рядом с геном. Промоторы содержат определенные последовательности ДНК, такие как элементы ответа , которые обеспечивают безопасный начальный сайт связывания для РНК-полимеразы и белков, называемых факторами транскрипции , которые рекрутируют РНК-полимеразу. Эти факторы транскрипции имеют специфические активаторные или репрессорные последовательности соответствующих нуклеотидов, которые прикрепляются к конкретным промоторам и регулируют экспрессию генов.
Промоторы представляют собой критические элементы, которые могут работать совместно с другими регуляторными областями ( энхансерами , сайленсерами , пограничными элементами/ изоляторами ), чтобы управлять уровнем транскрипции данного гена. Промотор индуцируется в ответ на изменения количества или конформации регуляторных белков в клетке, что позволяет активировать факторы транскрипции для рекрутирования РНК-полимеразы. [4] [5]
Поскольку промоторы обычно находятся непосредственно рядом с рассматриваемым геном, позиции в промоторе обозначаются относительно сайта начала транскрипции , где начинается транскрипция ДНК для конкретного гена (т.е. позиции выше представляют собой отрицательные числа, отсчитываемые в обратном порядке от -1, например -100 представляет собой позицию на 100 пар оснований выше).
В ядре клетки, по-видимому, промоторы распределяются преимущественно на краях хромосомных территорий, вероятно, для совместной экспрессии генов на разных хромосомах. [6] Кроме того, у человека промоторы демонстрируют определенные структурные особенности, характерные для каждой хромосомы. [6]
У бактерий промотор содержит два элемента короткой последовательности, расположенные примерно в 10 ( Pribnow Box ) и 35 нуклеотидах выше места начала транскрипции . [2]
Вышеуказанные промоторные последовательности распознаются только голоферментом РНК-полимеразы , содержащим сигма-70 . Голоферменты РНК-полимеразы, содержащие другие сигма-факторы, распознают различные последовательности корового промотора.
← вверх по течению -->5'-XXXXXXXPPPPPPXXXXXXPPPPPPXXXXGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGXXXX-3' -35 -10 Ген, подлежащий транскрипции
для последовательности -10 ТАТААТ77% 76% 60% 61% 56% 82%
для последовательности -35 ТТГАКА69% 79% 61% 56% 54% 54%
Промоторы могут быть очень близко расположены в ДНК. Такие «близкорасположенные промоторы» наблюдались в ДНК всех форм жизни – от человека [9] до прокариотов [10] и являются высококонсервативными. [11] Таким образом, они могут обеспечить некоторые (пока неизвестные) преимущества. Эти пары промоторов могут быть расположены в расходящихся, тандемных и конвергентных направлениях. Они также могут регулироваться факторами транскрипции и различаются различными особенностями, такими как расстояние между нуклеотидами, сила двух промоторов и т. д. Наиболее важным аспектом двух близко расположенных промоторов является то, что они, скорее всего, будут мешать друг другу. . В нескольких исследованиях это изучалось с использованием как аналитических, так и стохастических моделей. [12] [13] [14] Существуют также исследования, в которых измерялась экспрессия генов в синтетических генах или в одном или нескольких генах, контролируемых двунаправленными промоторами. [15]
Совсем недавно в одном исследовании измерили большинство генов, контролируемых тандемными промоторами в E. coli . [16] В этом исследовании были измерены, а затем смоделированы две основные формы помех. Один из них — когда РНКП находится на нижестоящем промоторе, блокируя движение РНКП, удлиняющихся от вышестоящего промотора. Другой — когда два промотора расположены настолько близко, что когда РНКП находится на одном из промоторов, он блокирует достижение любой другой РНКП к другому промотору. Эти события возможны, поскольку РНКП занимает несколько нуклеотидов при связывании с ДНК, в том числе в сайтах начала транскрипции. Подобные события происходят, когда промоторы находятся в дивергентных и конвергентных образованиях. Возможные события также зависят от расстояния между ними.
Эукариотические промоторы разнообразны, и их сложно охарактеризовать, однако недавние исследования показывают, что они разделены более чем на 10 классов. [17]
Промоторы гена обычно располагаются выше гена и могут иметь регуляторные элементы, находящиеся на расстоянии нескольких тысяч оснований от места начала транскрипции (энхансеры). У эукариот транскрипционный комплекс может вызывать изгиб ДНК, что позволяет размещать регуляторные последовательности далеко от фактического места транскрипции. Эукариотические РНК-полимераза-II-зависимые промоторы могут содержать ТАТА-бокс ( консенсусная последовательность ТАТААА), который распознается общим фактором транскрипции ТАТА-связывающим белком (ТБР); и элемент распознавания B (BRE), который распознается общим фактором транскрипции TFIIB . [18] [19] [20] Элемент TATA и BRE обычно расположены близко к месту начала транскрипции (обычно в пределах 30–40 пар оснований).
Регуляторные последовательности эукариотического промотора обычно связывают белки, называемые факторами транскрипции, которые участвуют в формировании транскрипционного комплекса. Примером является E-box (последовательность CACGTG), который связывает факторы транскрипции в основном семействе спираль-петля-спираль (bHLH) (например, BMAL1-Clock , cMyc ). [21] Некоторые промоторы, на которые нацелены несколько факторов транскрипции, могут достигать гиперактивного состояния, что приводит к увеличению транскрипционной активности. [22]
Повышенная экспрессия генов у млекопитающих инициируется, когда сигналы передаются промоторам, связанным с генами. Последовательности ДНК промотора могут включать в себя различные элементы, такие как CpG-островки (присутствующие примерно в 70% промоторов), ТАТА-бокс (присутствующий примерно в 24% промоторов), инициатор (Inr) (присутствующий примерно в 49% промоторов), восходящие и нижестоящие элементы распознавания TFIIB (BREu и BREd) (присутствуют примерно в 22% промоторов) и нижестоящие коровые промоторные элементы (DPE) (присутствуют примерно в 12% промоторов). [24] Наличие множества метилированных сайтов CpG в CpG-островках промоторов вызывает стабильное молчание генов. [25] Однако присутствие или отсутствие других элементов оказывают относительно небольшое влияние на экспрессию генов в экспериментах. [26] Две последовательности, TATA-бокс и Inr, вызвали небольшое, но значительное увеличение экспрессии (увеличение на 45% и 28% соответственно). Элементы BREu и BREd значительно снижали экспрессию на 35% и 20% соответственно, а элемент DPE не оказывал влияния на экспрессию. [26]
Цис-регуляторные модули , локализованные в областях ДНК, удаленных от промоторов генов, могут оказывать очень сильное влияние на экспрессию генов, при этом экспрессия некоторых генов увеличивается до 100 раз из-за такого цис-регуляторного модуля. [27] Эти цис-регуляторные модули включают усилители , глушители , изоляторы и привязывающие элементы. [28] Среди этого созвездия элементов энхансеры и связанные с ними факторы транскрипции играют ведущую роль в регуляции экспрессии генов. [29]
Энхансеры — это участки генома, которые являются основными генно-регуляторными элементами. Энхансеры контролируют программы экспрессии генов, специфичные для конкретного типа клеток, чаще всего преодолевая большие расстояния, чтобы оказаться в физической близости с промоторами своих генов-мишеней. [30] При исследовании нейронов коры головного мозга было обнаружено 24 937 петель, приводящих энхансеры к промоторам. [27] Множественные энхансеры, каждый из которых часто находится на десятках или сотнях тысяч нуклеотидов, удаленных от генов-мишеней, соединяются с промоторами гена-мишени и координируются друг с другом, чтобы контролировать экспрессию общего гена-мишени. [30]
Схематическая иллюстрация в этом разделе показывает, как энхансер движется по кругу, чтобы вступить в тесную физическую близость к промотору целевого гена. Петля стабилизируется димером соединительного белка (например, димером CTCF или YY1 ), причем один член димера прикреплен к своему связывающему мотиву на энхансере, а другой член прикреплен к своему связывающему мотиву на промоторе (представленному красные зигзаги на иллюстрации). [31] Несколько факторов транскрипции, специфичных для клеточных функций (в клетке человека насчитывается около 1600 факторов транскрипции [32] ), как правило, связываются со специфическими мотивами на энхансере [33] и небольшой комбинацией этих связанных с энхансером факторов транскрипции, если их сблизить. к промотору посредством петли ДНК регулируют уровень транскрипции целевого гена. Медиатор (коактиватор) (комплекс, обычно состоящий примерно из 26 белков во взаимодействующей структуре) передает регуляторные сигналы от энхансерных ДНК-связанных факторов транскрипции непосредственно ферменту РНК-полимеразы II (pol II), связанному с промотором. [34]
Энхансеры, когда они активны, обычно транскрибируются с обеих цепей ДНК с помощью РНК-полимераз, действующих в двух разных направлениях, образуя две эРНК, как показано на рисунке. [35] Неактивный энхансер может быть связан с неактивным фактором транскрипции. Фосфорилирование фактора транскрипции может активировать его, и этот активированный фактор транскрипции может затем активировать энхансер, с которым он связан (см. маленькую красную звездочку, обозначающую фосфорилирование фактора транскрипции, связанного с энхансером, на иллюстрации). [36] Активированный энхансер начинает транскрипцию своей РНК перед активацией промотора, чтобы инициировать транскрипцию информационной РНК из его гена-мишени. [37]
Двунаправленные промоторы представляют собой короткие (<1 т.п.н.) межгенные участки ДНК между 5'-концами генов в двунаправленной паре генов. [38] «Пара двунаправленных генов» относится к двум соседним генам, закодированным на противоположных цепях, причем их 5'-концы ориентированы друг к другу. [39] Эти два гена часто функционально связаны, и модификация их общей промоторной области позволяет им совместно регулироваться и, таким образом, совместно экспрессироваться. [40] Двунаправленные промоторы являются общей чертой геномов млекопитающих . [41] Около 11% генов человека спарены в двух направлениях. [38]
Двунаправленно спаренные гены в базе данных Gene Ontology разделяли по крайней мере одну функциональную категорию, назначенную базой данных, со своими партнерами в 47% случаев. [42] Анализ микрочипов показал, что двунаправленно спаренные гены коэкспрессируются в более высокой степени, чем случайные гены или соседние однонаправленные гены. [38] Хотя совместная экспрессия не обязательно указывает на совместную регуляцию, было показано, что метилирование двунаправленных промоторных областей подавляет оба гена, а деметилирование активирует оба гена. [43] Однако из этого правила есть исключения. В некоторых случаях (около 11%) экспрессируется только один ген двунаправленной пары. [38] В этих случаях промотор участвует в подавлении неэкспрессируемого гена. Механизмом этого может быть конкуренция за одни и те же полимеразы или модификация хроматина . Дивергентная транскрипция может смещать нуклеосомы для усиления транскрипции одного гена или удалять связанные факторы транскрипции для подавления транскрипции одного гена. [44]
Некоторые функциональные классы генов с большей вероятностью будут двунаправленно спарены, чем другие. Гены, участвующие в репарации ДНК, в пять раз чаще регулируются двунаправленными промоторами, чем однонаправленными. Белки-шапероны встречаются в три раза чаще, а митохондриальные гены — более чем в два раза. Многие основные гены домашнего хозяйства и клеточного метаболизма регулируются двунаправленными промоторами. [38] Избыточное количество двунаправленно спаренных генов репарации ДНК связывает эти промоторы с раком . Сорок пять процентов соматических онкогенов человека , по-видимому, регулируются двунаправленными промоторами – значительно больше, чем гены, не вызывающие рак. Гиперметилирование промоторов между парами генов WNT9A /CD558500, CTDSPL /BC040563 и KCNK15 /BF195580 связано с опухолями. [43]
Определенные характеристики последовательности наблюдались в двунаправленных промоторах, включая отсутствие ТАТА-боксов , обилие CpG-островков и симметрию вокруг средней точки доминантных Cs и As с одной стороны и Gs и Ts с другой. Недавно было показано, что мотив с консенсусной последовательностью TCTCGCGAGA, также называемый элементом CGCG, управляет управляемой PolII двунаправленной транскрипцией в CpG-островках. [45] CCAAT-боксы являются обычными, как и во многих промоторах, в которых отсутствуют TATA-боксы. Кроме того, мотивы NRF-1, GABPA , YY1 и ACTACAnnTCCC представлены в двунаправленных промоторах значительно чаще, чем в однонаправленных промоторах. Отсутствие ТАТА-боксов в двунаправленных промоторах предполагает, что ТАТА-боксы играют роль в определении направленности промоторов, но противоположные примеры двунаправленных промоторов действительно обладают ТАТА-боксами, а однонаправленные промоторы без них указывают на то, что они не могут быть единственным фактором. [46]
Хотя термин «двунаправленный промотор» относится конкретно к промоторным областям генов, кодирующих мРНК , анализы люциферазы показали, что более половины человеческих генов не имеют сильной направленной смещенности. Исследования показывают, что некодирующие РНК часто связаны с промоторными областями генов, кодирующих мРНК. Была выдвинута гипотеза, что рекрутирование и инициация РНК-полимеразы II обычно начинается двунаправленно, но дивергентная транскрипция останавливается на контрольной точке позже во время элонгации. Возможные механизмы этой регуляции включают последовательности в промоторной области, модификацию хроматина и пространственную ориентацию ДНК. [44]
Субгеномный промотор — это промотор, добавленный к вирусу для конкретного гетерологичного гена, что приводит к образованию мРНК только для этого гена. Многие РНК-вирусы с положительным смыслом продуцируют эти субгеномные мРНК (сгРНК) в качестве одного из распространенных методов заражения, используемых этими вирусами, и обычно транскрибируют поздние вирусные гены. Субгеномные промоторы имеют длину от 24 нуклеотидов ( вирус Синдбис ) до более 100 нуклеотидов ( вирус некротической желтой жилки свеклы ) и обычно обнаруживаются выше начала транскрипции. [47]
Для облегчения обнаружения промоторов в геномной последовательности было разработано множество алгоритмов, а предсказание промоторов является общим элементом многих методов прогнозирования генов . Промоторная область расположена перед консенсусными последовательностями -35 и -10. Чем ближе область промотора к консенсусным последовательностям, тем чаще будет происходить транскрипция этого гена. Для промоторных областей не существует установленного шаблона, как для консенсусных последовательностей.
Изменения в последовательностях промоторов имеют решающее значение в эволюции, о чем свидетельствует относительно стабильное количество генов во многих линиях. Например, большинство позвоночных имеют примерно одинаковое количество генов, кодирующих белок (около 20 000), последовательность которых часто высоко консервативна, следовательно, большая часть эволюционных изменений должна происходить из-за изменений в экспрессии генов. [6] [17]
Учитывая короткие последовательности большинства элементов промотора, промоторы могут быстро развиваться из случайных последовательностей. Например, в E. coli ~60% случайных последовательностей могут развивать уровни экспрессии, сравнимые с уровнем экспрессии lac-промотора дикого типа только с одной мутацией, и что ~10% случайных последовательностей могут служить активными промоторами даже без эволюции. [48]
Инициация транскрипции представляет собой многоступенчатый последовательный процесс, включающий несколько механизмов: расположение промотора, начальное обратимое связывание РНК-полимеразы, конформационные изменения РНК-полимеразы, конформационные изменения ДНК, связывание нуклеозидтрифосфата (NTP) с функциональным промотором РНК-полимеразы. сложная, непродуктивная и продуктивная инициация синтеза РНК. [49] [2]
Процесс связывания промотора имеет решающее значение для понимания процесса экспрессии генов. Настройка синтетических генетических систем опирается на точно сконструированные синтетические промоторы с известными уровнями скорости транскрипции. [2]
Хотя голофермент РНК-полимеразы проявляет высокое сродство к неспецифическим участкам ДНК, эта особенность не позволяет уточнить процесс локализации промотора. [50] Этот процесс расположения промотора объясняется структурой голофермента ДНК и сигма 4 комплексов ДНК. [51]
Большинство заболеваний неоднородны по своей причине, а это означает, что одно «болезнь» часто представляет собой множество различных заболеваний на молекулярном уровне, хотя проявляющиеся симптомы и реакция на лечение могут быть идентичными. То, как заболевания различного молекулярного происхождения реагируют на лечение, частично рассматривается в дисциплине фармакогеномика .
Здесь не перечислены многие виды рака, связанные с аберрантной регуляцией транскрипции из-за создания химерных генов в результате патологической хромосомной транслокации . Важно отметить, что вмешательство в количество или структуру связанных с промотором белков является одним из ключей к лечению заболевания, не влияя на экспрессию несвязанных генов, имеющих общие элементы с геном-мишенью. [52] Некоторые гены, изменение которых нежелательно, способны влиять на способность клетки стать раковой. [53]
У человека около 70% промоторов, расположенных вблизи места начала транскрипции гена (проксимальные промоторы), содержат островок CpG . [54] [55] Островки CpG обычно имеют длину от 200 до 2000 пар оснований, имеют содержание пар оснований C:G > 50% и имеют участки ДНК , где за нуклеотидом цитозина следует нуклеотид гуанина , и это часто происходит в линейная последовательность оснований в направлении 5' → 3' .
Дистальные промоторы также часто содержат островки CpG, такие как промотор гена репарации ДНК ERCC1 , где промотор, содержащий островки CpG, расположен примерно на 5400 нуклеотидов выше кодирующей области гена ERCC1 . [56] Островки CpG также часто встречаются в промоторах функциональных некодирующих РНК, таких как микроРНК .
У людей метилирование ДНК происходит в 5'-положении пиримидинового кольца остатков цитозина в сайтах CpG с образованием 5-метилцитозинов . Наличие множества метилированных сайтов CpG в CpG-островках промоторов вызывает стабильное молчание генов. [25] Замалчивание гена может быть инициировано другими механизмами, но за этим часто следует метилирование сайтов CpG на острове CpG промотора, чтобы вызвать стабильное замалчивание гена. [25]
Как правило, при прогрессировании рака сотни генов подавляются или активируются . Хотя замалчивание некоторых генов при раке происходит в результате мутации, большая часть замалчивания канцерогенных генов является результатом изменения метилирования ДНК (см. Метилирование ДНК при раке ). Метилирование ДНК, вызывающее молчание при раке, обычно происходит в нескольких сайтах CpG на CpG-островках , которые присутствуют в промоторах генов, кодирующих белок.
Измененная экспрессия микроРНК также подавляет или активирует многие гены при прогрессировании рака (см. микроРНК при раке ). Изменение экспрессии микроРНК происходит посредством гипер/гипометилирования сайтов CpG в островках CpG в промоторах, контролирующих транскрипцию микроРНК .
Замалчивание генов репарации ДНК посредством метилирования CpG-островков в их промоторах, по-видимому, особенно важно при прогрессировании рака (см. Метилирование генов репарации ДНК при раке ).
Использование термина « каноническая последовательность» для обозначения промотора часто проблематично и может привести к неправильному пониманию последовательностей промотора. Канонический в каком-то смысле подразумевает идеальный.
В случае сайта связывания транскрипционного фактора может существовать одна последовательность, которая наиболее прочно связывает белок в определенных клеточных условиях. Это можно назвать каноническим.
Однако естественный отбор может способствовать менее энергичному связыванию как способу регуляции результатов транскрипции. В этом случае мы можем назвать наиболее распространенную последовательность в популяции последовательностью дикого типа. Возможно, это даже не самая выгодная последовательность действий в сложившихся условиях.
Недавние данные также указывают на то, что некоторые гены (включая протоонкоген c-myc ) имеют мотивы G-квадруплекса в качестве потенциальных регуляторных сигналов.
Промоторы являются важными регуляторными элементами генов, используемыми при настройке синтетически созданных генетических цепей и метаболических сетей . Например, чтобы сверхэкспрессировать важный ген в сети и обеспечить более высокую выработку целевого белка, синтетические биологи разрабатывают промоторы, повышающие его экспрессию . Автоматизированные алгоритмы можно использовать для создания нейтральной ДНК или инсуляторов, которые не запускают экспрессию генов в последующих последовательностях. [57] [2]
Некоторые случаи многих генетических заболеваний связаны с вариациями промоторов или факторов транскрипции.
Примеры включают в себя:
Некоторые промоторы называются конститутивными, поскольку они активны при любых обстоятельствах в клетке, тогда как другие регулируются , становясь активными в клетке только в ответ на определенные стимулы.
[62]
PDGF, PDGFRb, CX3CR1, TRPA1, Krt5, actb, aMHC, 1a1kin, Cck, zDC, cFos, Hand1, Rosa, Insl5, Cart, Sctr, Ins1, Nrsn1, Foxp3, Tph, Cnr1, Pzp, CD23, Cx40, Foxn1, Rspo3, Krt13, Pnoc, ChAT, MMTV, Myh6, Sftpc, Mlc2a, Atf3, Pirt, Dbh, Villin, Vav1, Sox2, Dat, Pdx1, Cal, Gfral, Cr, BAF53b, Cntn2, Nav1.8, ObRb, Krt5, Адвиллин, Mrgprd, PV, Pax7, Calb1, Mx1, Nmu, Aldh1, CAG, CD19, Krt14, Vil1, Stra8, E8i, BAF53b, Pf4, UBC, Vip, TCF21, Cart, Htr3b, Pdx1, Mgarp, Mx1, Nmu, GFAP, vGlut2, Tac1.
Говоря о промоторе, некоторые авторы фактически имеют в виду промотор + оператор ; т.е. lac-промотор индуцируется IPTG, а это означает, что помимо lac-промотора также присутствует lac-оперон . Если бы оператор lac не присутствовал, IPTG не имел бы индуцируемого эффекта. [ нужна цитация ] Другим примером является система Tac-Promoter (Ptac). Обратите внимание, что tac записывается как промоутер tac, хотя на самом деле tac одновременно является и промоутером, и оператором. [63]