Структура гена — это организация специализированных элементов последовательности внутри гена . Гены содержат большую часть информации, необходимой для выживания и размножения живых клеток . [1] [2] У большинства организмов гены состоят из ДНК, где конкретная последовательность ДНК определяет функцию гена. Ген транскрибируется ( копируется) из ДНК в РНК , которая может быть либо некодирующей ( нкРНК ) с прямой функцией, либо промежуточной мессенджерной ( мРНК ), которая затем транслируется в белок . Каждый из этих шагов контролируется определенными элементами последовательности или областями внутри гена. Таким образом, для функционирования каждого гена требуется несколько элементов последовательности. [2] Это включает в себя последовательность, которая фактически кодирует функциональный белок или нкРНК, а также несколько областей регуляторной последовательности . Эти области могут быть как короткими, так и состоять из нескольких пар оснований , и до многих тысяч пар оснований.
Большая часть структуры генов эукариот и прокариот в целом схожа . Эти общие элементы в значительной степени являются результатом общего происхождения клеточной жизни в организмах более 2 миллиардов лет назад. [3] Ключевые различия в структуре генов эукариот и прокариот отражают их расходящиеся механизмы транскрипции и трансляции. [4] [5] Понимание структуры генов является основой понимания аннотации генов , их экспрессии и функции . [6]
Структуры как эукариотических, так и прокариотических генов включают несколько вложенных элементов последовательности. Каждый элемент имеет определенную функцию в многоступенчатом процессе экспрессии генов . Последовательности и длины этих элементов различаются, но в большинстве генов присутствуют одни и те же общие функции. [2] Хотя ДНК является двухцепочечной молекулой, обычно только одна из цепей кодирует информацию, которую считывает РНК-полимераза для получения кодирующей белок мРНК или некодирующей РНК. Эта «смысловая» или «кодирующая» цепь проходит в направлении от 5' до 3', где числа относятся к атомам углерода рибозного сахара остова . Поэтому открытая рамка считывания (ORF) гена обычно представлена в виде стрелки, указывающей направление, в котором считывается смысловая цепь. [7]
Регуляторные последовательности расположены на концах генов. Эти области последовательности могут быть либо рядом с транскрибируемой областью ( промотором ), либо разделены многими тысячами пар оснований ( энхансерами и сайленсерами ). [8] Промотор расположен на 5'-конце гена и состоит из основной промотерной последовательности и проксимальной промотерной последовательности. Основной промотор отмечает стартовую площадку для транскрипции, связывая РНК-полимеразу и другие белки, необходимые для копирования ДНК в РНК. Проксимальная область промотера связывает факторы транскрипции , которые изменяют сродство основного промотера к РНК-полимеразе. [9] [10] Гены могут регулироваться множественными последовательностями энхансеров и сайленсеров, которые дополнительно изменяют активность промоторов, связывая активаторные или репрессорные белки. [11] [12] Энхансеры и сайленсеры могут быть расположены на расстоянии от гена, на расстоянии многих тысяч пар оснований. Таким образом, связывание различных факторов транскрипции регулирует скорость инициации транскрипции в разное время и в разных клетках. [13]
Регуляторные элементы могут перекрывать друг друга, при этом участок ДНК может взаимодействовать со многими конкурирующими активаторами и репрессорами, а также с РНК-полимеразой. Например, некоторые белки-репрессоры могут связываться с основным промотором, чтобы предотвратить связывание полимеразы. [14] Для генов с несколькими регуляторными последовательностями скорость транскрипции является произведением всех объединенных элементов. [15] Связывание активаторов и репрессоров с несколькими регуляторными последовательностями оказывает кооперативное влияние на инициацию транскрипции. [16]
Хотя все организмы используют как активаторы транскрипции, так и репрессоры, эукариотические гены считаются «выключенными по умолчанию», тогда как прокариотические гены «включенными по умолчанию». [5] Основной промотор эукариотических генов обычно требует дополнительной активации промоторными элементами для осуществления экспрессии. Основной промотор прокариотических генов, наоборот, достаточен для сильной экспрессии и регулируется репрессорами. [5]
Дополнительный уровень регуляции происходит для генов, кодирующих белок, после того, как мРНК была обработана для подготовки ее к трансляции в белок. Только область между стартовым и стоп - кодонами кодирует конечный белковый продукт. Фланговые нетранслируемые области (UTR) содержат дополнительные регуляторные последовательности. [18] 3 ' UTR содержит терминаторную последовательность, которая отмечает конечную точку транскрипции и высвобождает РНК-полимеразу. [19] 5 ' UTR связывает рибосому , которая транслирует белок-кодирующую область в цепочку аминокислот , которые сворачиваются , образуя конечный белковый продукт. В случае генов для некодирующих РНК РНК не транслируется, а вместо этого сворачивается, чтобы стать непосредственно функциональной. [20] [21]
Структура эукариотических генов включает особенности, не встречающиеся у прокариот. Большинство из них связаны с посттранскрипционной модификацией пре-мРНК для получения зрелой мРНК, готовой к трансляции в белок. Эукариотические гены обычно имеют больше регуляторных элементов для контроля экспрессии генов по сравнению с прокариотами. [5] Это особенно верно для многоклеточных эукариот, например, людей, где экспрессия генов сильно различается в разных тканях . [11]
Ключевой особенностью структуры эукариотических генов является то, что их транскрипты обычно подразделяются на экзонные и интронные области. Экзонные области сохраняются в конечной зрелой молекуле мРНК , в то время как интронные области сплайсируются ( вырезаются) во время посттранскрипционной обработки. [22] Действительно, интронные области гена могут быть значительно длиннее экзонных областей. После сплайсинга экзоны образуют одну непрерывную белок-кодирующую область, и границы сплайсинга не обнаруживаются. Эукариотическая посттранскрипционная обработка также добавляет 5' -кэп к началу мРНК и полиаденозиновый хвост к концу мРНК. Эти дополнения стабилизируют мРНК и направляют ее транспорт из ядра в цитоплазму , хотя ни одна из этих особенностей напрямую не закодирована в структуре гена. [18]
Общая организация прокариотических генов заметно отличается от таковой у эукариот. Наиболее очевидным отличием является то, что прокариотические ORF часто группируются в полицистронный оперон под контролем общего набора регуляторных последовательностей. Все эти ORF транскрибируются на одну и ту же мРНК и, таким образом, корегулируются и часто выполняют связанные функции. [23] [24] Каждая ORF обычно имеет свой собственный сайт связывания рибосомы (RBS), так что рибосомы одновременно транслируют ORF на одной и той же мРНК. Некоторые опероны также демонстрируют трансляционную связь, когда скорости трансляции нескольких ORF в пределах оперона связаны. [25] Это может происходить, когда рибосома остается прикрепленной к концу ORF и просто транслоцируется к следующей без необходимости в новой RBS. [26] Трансляционная связь также наблюдается, когда трансляция ORF влияет на доступность следующей RBS через изменения во вторичной структуре РНК. [27] Наличие нескольких ORF на одной мРНК возможно только у прокариот, поскольку их транскрипция и трансляция происходят в одно и то же время и в одном и том же субклеточном месте. [23] [28]
Последовательность оператора рядом с промотором является основным регуляторным элементом у прокариот. Репрессорные белки, связанные с последовательностью оператора, физически блокируют фермент РНК-полимеразу, предотвращая транскрипцию. [29] [30] Рибосвитчи являются еще одной важной регуляторной последовательностью, обычно присутствующей в прокариотических UTR. Эти последовательности переключаются между альтернативными вторичными структурами в РНК в зависимости от концентрации ключевых метаболитов . Затем вторичные структуры либо блокируют, либо раскрывают важные области последовательности, такие как RBS. Интроны чрезвычайно редки у прокариот и, следовательно, не играют существенной роли в регуляции прокариотических генов. [31]
Эта статья была адаптирована из следующего источника по лицензии CC BY 4.0 (2017) (отчеты рецензента): Thomas Shafee; Rohan Lowe (17 января 2017 г.). "Eukaryotic and prokaryotic gene structure" (PDF) . WikiJournal of Medicine . 4 (1). doi : 10.15347/WJM/2017.002 . ISSN 2002-4436. Wikidata Q28867140.