Консервативная некодирующая последовательность ( CNS ) — это последовательность ДНК некодирующей ДНК , которая эволюционно сохраняется . Эти последовательности представляют интерес из-за их потенциала регулировать производство генов . [1]
ЦНС в растениях [2] и животных [1] тесно связаны с сайтами связывания факторов транскрипции и другими цис -действующими регуляторными элементами . Сохраненные некодирующие последовательности могут быть важными участками эволюционной дивергенции [3], поскольку мутации в этих регионах могут изменять регуляцию сохраненных генов , создавая видоспецифичные паттерны экспрессии генов . Эти особенности сделали их бесценным ресурсом в сравнительной геномике .
Все ЦНС, вероятно, выполняют определенную функцию, что накладывает ограничения на их эволюцию, но их можно различить на основе того, где в геноме они находятся и как они туда попали.
Интроны — это участки последовательности, которые в основном встречаются в эукариотических организмах и прерывают кодирующие области генов, при этом длина пар оснований варьируется в пределах трех порядков. Последовательности интронов могут сохраняться, часто потому, что они содержат элементы, регулирующие экспрессию, которые накладывают функциональные ограничения на их эволюцию . [4] Модели сохраняющихся интронов между видами разных царств использовались для того, чтобы делать выводы о плотности интронов в разные моменты эволюционной истории. Это делает их важным ресурсом для понимания динамики приобретения и потери интронов у эукариот (1,28). [4] [5]
Некоторые из наиболее высококонсервативных некодирующих областей находятся в нетранслируемых областях (UTR) на 3'-конце зрелых транскриптов РНК , а не в интронах. Это предполагает важную функцию, действующую на посттранскрипционном уровне. Если эти области выполняют важную регуляторную функцию, увеличение длины 3'-UTR с течением эволюционного времени предполагает, что консервативные UTR вносят вклад в сложность организма. Регуляторные мотивы в UTR, часто сохраняющиеся в генах, принадлежащих к одному и тому же метаболическому семейству, потенциально могут быть использованы для разработки высокоспецифичных лекарств, нацеленных на транскрипты РНК. [4]
Повторяющиеся элементы могут накапливаться в геноме организма в результате нескольких различных процессов транспозиции . Степень, в которой это происходило в ходе эволюции эукариот, сильно различается: повторяющаяся ДНК составляет всего 3% генома мухи , но составляет 50% генома человека . [4]
Существуют различные теории, объясняющие сохранение мобильных элементов . Одна из них утверждает, что, подобно псевдогенам , они обеспечивают источник нового генетического материала, что позволяет быстрее адаптироваться к изменениям окружающей среды. Более простая альтернатива заключается в том, что, поскольку эукариотические геномы могут не иметь средств для предотвращения распространения мобильных элементов, они могут свободно накапливаться, пока они не вставлены в ген или рядом с ним таким образом, что это нарушит основные функции. [6] Недавнее исследование показало, что транспозоны вносят вклад по меньшей мере в 16% ЦНС , специфичных для плацентарных животных , что делает их «главной творческой силой» в эволюции регуляции генов у млекопитающих . [7] Существует три основных класса мобильных элементов, различающихся по механизмам, с помощью которых они распространяются. [6]
ДНК-транспозоны кодируют белок транспозазы , который фланкирован инвертированными повторными последовательностями. Транспозаза вырезает последовательность и реинтегрирует ее в другом месте генома. Вырезая сразу после репликации ДНК и вставляя в целевые сайты, которые еще не были реплицированы, количество транспозонов в геноме может увеличиться. [6]
Ретротранспозоны используют обратную транскриптазу для генерации кДНК из транскрипта TE. Они далее делятся на ретротранспозоны с длинными концевыми повторами (LTR), длинные вставленные ядерные элементы (LINE) и короткие вставленные ядерные элементы (SINE). В ретротранспозонах LTR после того, как шаблон РНК деградирует, цепь ДНК, комплементарная обратно транскрибированной кДНК, возвращает элемент в двухцепочечное состояние. Интеграза , фермент, кодируемый ретротранспозоном LTR, затем повторно включает элемент в новом целевом сайте. Эти элементы фланкированы длинными концевыми повторами (300–500 п.н.), которые опосредуют процесс транспозиции. [6]
LINE используют более простой метод, при котором кДНК синтезируется в целевом сайте после расщепления эндонуклеазой , кодируемой LINE . Обратная транскриптаза, кодируемая LINE, не является высокоспецифичной к последовательности. Включение механизмом LINE неродственных транскриптов РНК приводит к образованию нефункциональных обработанных псевдогенов. Если промотор небольшого гена включен в транскрибируемую часть гена, стабильный транскрипт может быть продублирован и повторно вставлен в геном несколько раз. Элементы, полученные в результате этого процесса, называются SINE. [6]
Когда консервативные регуляторные транспонируемые элементы активны в геноме, они могут вводить новые промоторные области, нарушать существующие регуляторные сайты или, если они вставлены в транскрибируемые области, изменять паттерны сплайсинга . Конкретный транспонируемый элемент будет выбран положительно, если измененная экспрессия, которую он производит, дает адаптивное преимущество. Это привело к тому, что некоторые из консервативных областей были обнаружены у людей. Почти 25% охарактеризованных промоторов у людей содержат транспонированные элементы. [8] Это представляет особый интерес в свете того факта, что большинство транспонируемых элементов у людей больше не активны. [6]
Псевдогены — это остатки некогда функциональных генов, отключенных из-за делеций, вставок или мутаций последовательностей . Основным доказательством этого процесса является наличие полностью функционирующих ортологов этих инактивированных последовательностей в других родственных геномах. [4] Псевдогены обычно возникают после дупликации гена или полиплоидизации . При наличии двух функциональных копий гена нет селективного давления для поддержания экспрессивности обеих, что позволяет одной из них накапливать мутации как нефункционирующему псевдогену. Это типичный случай, когда нейтральный отбор позволяет псевдогенам накапливать мутации, выступая в качестве «резервуаров» нового генетического материала с потенциалом повторного включения в геном. Однако было обнаружено, что некоторые псевдогены сохраняются у млекопитающих. [9] Самое простое объяснение этого заключается в том, что эти некодирующие области могут выполнять некоторую биологическую функцию, и это было обнаружено для нескольких консервативных псевдогенов. Например, было обнаружено, что мРНК Makorin1 стабилизируется его паралогичным псевдогеном Makorin1-p1, который сохраняется у нескольких видов мышей. Было обнаружено, что другие псевдогены также сохраняются у людей и мышей, а также у людей и шимпанзе , возникая в результате событий дупликации до расхождения видов . Доказательства транскрипции этих псевдогенов также подтверждают гипотезу о том, что они имеют биологическую функцию. [10] Находки потенциально функциональных псевдогенов создают трудности в их определении, поскольку этот термин изначально предназначался для вырожденных последовательностей без биологической функции. [11]
Примером псевдогена является ген L-гулонолактоноксидазы , фермента печени, необходимого для биосинтеза L-аскорбиновой кислоты (витамина С) у большинства птиц и млекопитающих, но который мутировал у подотряда приматов haplorrhini , включая людей, которым требуется аскорбиновая кислота или аскорбат из пищи. Остатки этого нефункционального гена со множеством мутаций все еще присутствуют в геномах морских свинок и людей. [12]
Ультраконсервативные регионы (UCR) — это регионы длиной более 200 п.н. со 100% идентичностью между видами. Эти уникальные последовательности в основном встречаются в некодирующих регионах. До сих пор не до конца понятно, почему отрицательное селективное давление на эти регионы настолько сильнее, чем отбор в белок-кодирующих регионах. [13] [14] Хотя эти регионы можно рассматривать как уникальные, различие между регионами с высокой степенью сохранения последовательностей и регионами с идеальной сохранением последовательностей не обязательно имеет биологическое значение. Одно исследование в Science показало, что все чрезвычайно консервативные некодирующие последовательности имеют важные регуляторные функции независимо от того, является ли сохранение идеальным, что делает различие ультраконсервации несколько произвольным. [14]
Сохранение как функциональных, так и нефункциональных некодирующих областей является важным инструментом для сравнительной геномики , хотя сохранение цис-регуляторных элементов оказалось особенно полезным. [4] Наличие ЦНС может быть обусловлено в некоторых случаях отсутствием времени расхождения, [15] хотя более распространенное мнение заключается в том, что они выполняют функции, которые накладывают различные степени ограничений на их эволюцию. В соответствии с этой теорией, цис-регуляторные элементы обычно находятся в консервативных некодирующих областях. Таким образом, сходство последовательностей часто используется в качестве параметра для ограничения пространства поиска при попытке идентифицировать регуляторные элементы, сохраняющиеся у разных видов, хотя это наиболее полезно при анализе отдаленно родственных организмов, поскольку более близкие родственники имеют сохранение последовательностей и среди нефункциональных элементов. [4] [16] [17]
Ортологи с высокой степенью сходства последовательностей могут не иметь одних и тех же регуляторных элементов. [18] Эти различия могут объяснять различные паттерны экспрессии у разных видов. [19] Сохранение некодирующей последовательности также важно для анализа паралогов в пределах одного вида. ЦНС, общие для паралогичных кластеров Hox-генов, являются кандидатами на роль регионов регуляции экспрессии, возможно, координирующих схожие паттерны экспрессии этих генов. [16]
Сравнительные геномные исследования промоторных областей ортологичных генов также могут обнаружить различия в наличии и относительном расположении участков связывания факторов транскрипции в промоторных областях. [20] Ортологи с высоким сходством последовательностей могут не иметь одних и тех же регуляторных элементов. [18] Эти различия могут объяснять различные паттерны экспрессии у разных видов. [19]
Регуляторные функции, обычно связанные с консервативными некодирующими областями, как полагают, играют роль в эволюции сложности эукариот. В среднем растения содержат меньше ЦНС на ген, чем млекопитающие. Считается, что это связано с тем, что они подверглись большему количеству полиплоидизации или событий дупликации генома. Во время субфункционализации, которая следует за дупликацией гена, существует потенциал для большей скорости потери ЦНС на ген. Таким образом, события дупликации генома могут объяснять тот факт, что растения имеют больше генов, каждый с меньшим количеством ЦНС. Предполагая, что количество ЦНС является показателем регуляторной сложности, это может объяснять разницу в сложности между растениями и млекопитающими. [21]
Поскольку считается, что изменения в регуляции генов объясняют большую часть различий между людьми и шимпанзе, исследователи обратились к ЦНС, чтобы попытаться это показать. Часть ЦНС между людьми и другими приматами имеет обогащение специфичными для человека однонуклеотидными полиморфизмами , что предполагает положительный отбор для этих SNP и ускоренную эволюцию этих ЦНС. Многие из этих SNP также связаны с изменениями в экспрессии генов, что предполагает, что эти ЦНС сыграли важную роль в эволюции человека . [22]
{{cite book}}
: |journal=
проигнорировано ( помощь )