Короткие вкрапленные ядерные элементы ( SINE ) — это неавтономные, некодирующие транспонируемые элементы (TE), длина которых составляет около 100–700 пар оснований . [1] Они представляют собой класс ретротранспозонов , элементов ДНК, которые амплифицируются по всему эукариотическому геному , часто через промежуточные РНК . SINE составляют около 13% генома млекопитающих . [2]
Внутренние области SINE происходят из тРНК и остаются высококонсервативными, что предполагает положительное давление для сохранения структуры и функции SINE. [3] Хотя SINE присутствуют у многих видов позвоночных и беспозвоночных, SINE часто специфичны для определенной линии, что делает их полезными маркерами дивергентной эволюции между видами. Изменение числа копий и мутации в последовательности SINE позволяют строить филогении на основе различий в SINE между видами. SINE также вовлечены в определенные типы генетических заболеваний у людей и других эукариот .
По сути, короткие вкрапленные ядерные элементы являются генетическими паразитами, которые эволюционировали очень рано в истории эукариот, чтобы использовать белковые механизмы внутри организма, а также кооптировать механизмы из подобных паразитических геномных элементов. Простота этих элементов делает их удивительно успешными в сохранении и усилении (через ретротранспозицию) в геномах эукариот. Эти «паразиты», которые стали повсеместными в геномах, могут быть очень вредными для организмов, как обсуждается ниже. Однако эукариоты смогли интегрировать короткие вкрапленные ядерные элементы в различные сигнальные, метаболические и регуляторные пути, и SINE стали большим источником генетической изменчивости. Они, по-видимому, играют особенно важную роль в регуляции экспрессии генов и создании генов РНК . Эта регуляция распространяется на реорганизацию хроматина и регуляцию геномной архитектуры. Различные линии, мутации и виды активности среди эукариот делают короткоперемежающиеся ядерные элементы полезным инструментом в филогенетическом анализе.
SINE классифицируются как не-LTR ретротранспозоны , поскольку они не содержат длинных концевых повторов (LTR) . [4] Существует три типа SINE, общих для позвоночных и беспозвоночных: CORE-SINE, V-SINE и AmnSINE. [3] SINE имеют внутренние области из 50-500 пар оснований, которые содержат сегмент, полученный из тРНК, с блоками A и B, которые служат внутренним промотором для РНК-полимеразы III . [5] [3]
SINE характеризуются различными модулями, которые по сути являются секцией их последовательности. SINE могут, но не обязательно должны, иметь головку, тело и хвост. Головка находится на 5'-конце коротких вкрапленных ядерных элементов и эволюционно произошла от РНК, синтезированной РНК-полимеразой III, такой как рибосомальные РНК и тРНК; 5'-головка указывает на то, из какого эндогенного элемента произошел SINE, и смогла паразитически использовать его транскрипционный аппарат. [1] Например, 5'-конец алузина получен из 7SL РНК , последовательности, транскрибируемой РНК-полимеразой III, которая кодирует элемент РНК SRP, распространенного рибонуклеопротеина. [6] Тело SINE имеет неизвестное происхождение, но часто разделяет большую гомологию с соответствующим LINE , что позволяет SINE паразитически кооптировать эндонуклеазы, кодируемые LINE (которые распознают определенные мотивы последовательности). Наконец, 3'-хвост SINE состоит из коротких простых повторов различной длины; эти простые повторы являются сайтами, где два (или более) коротко вставленных ядерных элемента могут объединяться, образуя димерный SINE. [7] Коротко вставленные ядерные элементы, которые имеют только голову и хвост, называются простыми SINE, тогда как коротко вставленные ядерные элементы, которые также имеют тело или являются комбинацией двух или более SINE, являются сложными SINE. [1]
Коротко вкрапленные ядерные элементы транскрибируются РНК-полимеразой III , которая, как известно, транскрибирует рибосомальную РНК и тРНК , два типа РНК, жизненно важных для сборки рибосом и трансляции мРНК . [8] SINE, как и тРНК и многие малые ядерные РНК, обладают внутренним промотором и, таким образом, транскрибируются иначе, чем большинство генов, кодирующих белки. [1] Другими словами, коротко вкрапленные ядерные элементы имеют свои ключевые промоторные элементы внутри самой транскрибируемой области. Хотя транскрибируются РНК-полимеразой III, SINE и другие гены, обладающие внутренними промоторами, задействуют другие транскрипционные механизмы и факторы, чем гены, обладающие вышестоящими промоторами. [9]
Изменения в структуре хромосомы влияют на экспрессию генов, в первую очередь, влияя на доступность генов для транскрипционного аппарата. Хромосома имеет очень сложную и иерархическую систему организации генома. Эта система организации, которая включает гистоны , метильные группы, ацетильные группы и различные белки и РНК, позволяет различным доменам внутри хромосомы быть доступными для полимераз, факторов транскрипции и других связанных белков в разной степени. [10] Кроме того, форма и плотность определенных областей хромосомы могут влиять на форму и плотность соседних (или даже отдаленных областей) на хромосоме посредством взаимодействия, облегчаемого различными белками и элементами. Некодирующие РНК, такие как короткоперемежающиеся ядерные элементы, которые, как известно, ассоциируются со структурой хроматина и вносят в нее свой вклад, могут, таким образом, играть огромную роль в регуляции экспрессии генов. [11] Короткоперемежающиеся ядерные элементы аналогичным образом могут быть вовлечены в регуляцию генов, изменяя геномную архитектуру.
Фактически, Усманова и др. 2008 предположили, что коротко вкрапленные ядерные элементы могут служить прямыми сигналами в перестройке и структуре хроматина . В статье исследовалось глобальное распределение SINE в хромосомах мыши и человека и было установлено, что это распределение очень похоже на геномное распределение генов и мотивов CpG . [12] Распределение SINE по генам было значительно более похожим, чем распределение других некодирующих генетических элементов, и даже значительно отличалось от распределения длинно вкрапленных ядерных элементов. [12] Это предполагает, что распределение SINE было не просто случайностью, вызванной опосредованной LINE ретротранспозицией, а скорее, что SINE играли роль в регуляции генов. Кроме того, SINE часто содержат мотивы для поликомбовых белков YY1 . [12] YY1 — это белок с цинковыми пальцами, который действует как транскрипционный репрессор для широкого спектра генов, необходимых для развития и передачи сигналов. [13] Считается, что белок Polycomb YY1 опосредует активность гистондеацетилаз и гистонацетилтрансфераз для облегчения реорганизации хроматина; это часто способствует образованию гетерохроматина (состояние подавления генов). [14] Таким образом, анализ предполагает, что коротко вкрапленные ядерные элементы могут функционировать как «усилитель сигнала» в зависимом от поликомба подавлении наборов генов посредством реорганизации хроматина. [12] По сути, это кумулятивный эффект многих типов взаимодействий, который приводит к различию между эухроматином , который не плотно упакован и, как правило, более доступен для транскрипционного аппарата, и гетерохроматином , который плотно упакован и, как правило, не доступен для транскрипционного аппарата; SINE, по-видимому, играют эволюционную роль в этом процессе.
Помимо прямого влияния на структуру хроматина, существует ряд способов, с помощью которых SINE могут потенциально регулировать экспрессию генов. Например, длинная некодирующая РНК может напрямую взаимодействовать с транскрипционными репрессорами и активаторами, ослабляя или изменяя их функцию. [15] Этот тип регуляции может происходить разными способами: транскрипт РНК может напрямую связываться с фактором транскрипции в качестве ко-регулятора; также РНК может регулировать и изменять способность ко-регуляторов связываться с фактором транскрипции. [15] Например, Evf-2, определенная длинная некодирующая РНК, как известно, функционирует как ко-активатор для определенных гомеобоксных факторов транскрипции, которые имеют решающее значение для развития и организации нервной системы. [16] Кроме того, транскрипты РНК могут влиять на функциональность транскрипционного комплекса, взаимодействуя или связываясь с РНК-полимеразами во время процессов транскрипции или загрузки. [15] Более того, некодирующие РНК, такие как SINE, могут связываться или взаимодействовать напрямую с дуплексом ДНК, кодирующим ген, и таким образом предотвращать его транскрипцию. [15]
Кроме того, многие некодирующие РНК распределены вблизи генов, кодирующих белки, часто в обратном направлении. Это особенно верно для коротко вкрапленных ядерных элементов, как показано в работе Усмановой и др. Эти некодирующие РНК, которые лежат рядом или перекрывают наборы генов, обеспечивают механизм, с помощью которого факторы транскрипции и механизмы могут быть задействованы для увеличения или подавления транскрипции локальных генов. Конкретный пример SINE, потенциально рекрутирующих транскрипционный репрессор YY1 polycomb, обсуждался выше. [12] В качестве альтернативы, он также обеспечивает механизм, с помощью которого локальная экспрессия генов может быть сокращена и отрегулирована, поскольку транскрипционные комплексы могут препятствовать или предотвращать транскрипцию близлежащих генов. Существуют исследования, предполагающие, что это явление особенно заметно в регуляции генов плюрипотентных клеток. [17]
В заключение, некодирующие РНК, такие как SINE, способны влиять на экспрессию генов на множестве различных уровней и различными способами. Считается, что коротко вкрапленные ядерные элементы глубоко интегрированы в сложную регуляторную сеть, способную тонко настраивать экспрессию генов по всему эукариотическому геному.
РНК, кодируемая коротким вкрапленным ядерным элементом, не кодирует какой-либо белковый продукт, но тем не менее подвергается обратной транскрипции и вставляется обратно в альтернативную область генома. По этой причине считается, что короткие вкрапленные ядерные элементы коэволюционировали с длинными вкрапленными ядерными элементами (LINE), поскольку LINE на самом деле кодируют белковые продукты, которые позволяют им подвергаться обратной транскрипции и интегрироваться обратно в геном. [4] Считается, что SINE кооптировали белки, кодируемые LINE, которые содержатся в 2 рамках считывания. Открытая рамка считывания 1 (ORF 1) кодирует белок, который связывается с РНК и действует как шаперон для облегчения и поддержания структуры комплекса белок-РНК LINE. [18] Открытая рамка считывания 2 (ORF 2) кодирует белок, который обладает как эндонуклеазной, так и обратной транскриптазной активностью. [19] Это позволяет мРНК LINE подвергаться обратной транскрипции в ДНК и интегрироваться в геном на основе мотивов последовательности, распознаваемых доменом эндонуклеазы белка.
LINE-1 (L1) транскрибируется и ретротранспонируется чаще всего в зародышевой линии и во время раннего развития; в результате SINE перемещаются по геному больше всего в эти периоды. Транскрипция SINE подавляется транскрипционными факторами в соматических клетках после раннего развития, хотя стресс может вызвать повышение регуляции обычно молчащих SINE. [20] SINE могут передаваться между особями или видами посредством горизонтального переноса через вирусный вектор . [21]
Известно, что SINE разделяют гомологию последовательностей с LINES, что дает основу, с помощью которой механизм LINE может осуществлять обратную транскрипцию и интегрировать транскрипты SINE. [22] В качестве альтернативы, некоторые SINE, как полагают, используют гораздо более сложную систему интеграции обратно в геном; эта система включает использование случайных двухцепочечных разрывов ДНК (а не эндонуклеазы, кодируемой связанными длинноперемежающимися ядерными элементами, создающими сайт вставки). [22] Эти разрывы ДНК используются для активации обратной транскриптазы, в конечном итоге интегрируя транскрипт SINE обратно в геном. [22] Тем не менее, SINE зависят от ферментов, кодируемых другими элементами ДНК, и поэтому известны как неавтономные ретротранспозоны, поскольку они зависят от механизма LINE, которые известны как автономные ретротранспозоны. [23]
Теория о том, что коротко вкрапленные ядерные элементы эволюционировали для использования ретротранспозонной машины длинно вкрапленных ядерных элементов, подтверждается исследованиями, которые изучают наличие и распределение LINE и SINE в таксонах разных видов. [24] Например, LINE и SINE у грызунов и приматов показывают очень сильную гомологию в мотиве сайта вставки. [24] Такие доказательства являются основой для предлагаемого механизма, в котором интеграция транскрипта SINE может быть кооптирована с LINE-кодируемыми белковыми продуктами. Это, в частности, продемонстрировано подробным анализом более 20 видов грызунов, профилированных LINE и SINE, в основном L1 и B1 соответственно; это семейства LINE и SINE, которые с высокой частотой встречаются у грызунов и других млекопитающих. [24] Исследование стремилось обеспечить филогенетическую ясность в контексте активности LINE и SINE.
Исследование пришло к таксону-кандидату, который, как полагают, является первым случаем вымирания L1 LINE; оно ожидаемо обнаружило, что нет никаких доказательств, позволяющих предположить, что активность B1 SINE имела место у видов, у которых не было активности L1 LINE. [24] Кроме того, исследование предположило, что подавление коротко-вкрапленных ядерных элементов B1 на самом деле произошло до вымирания длинно-вкрапленных ядерных элементов L1; это связано с тем, что B1 SINE подавлены в роде, наиболее тесно связанном с родом, который не содержит активных L1 LINE (хотя род с подавлением B1 SINE все еще содержит активные L1 LINE). [24] Был также обнаружен другой род, который аналогичным образом содержал активные длинно-вкрапленные ядерные элементы L1, но не содержал коротко-вкрапленных ядерных элементов B1; противоположный сценарий, в котором активные B1 SINE присутствовали в роде, который не обладал активными L1 LINE, не был обнаружен. [24] Этот результат был ожидаемым и решительно подтверждает теорию о том, что SINE эволюционировали, чтобы кооптировать РНК-связывающие белки, эндонуклеазы и обратные транскриптазы, кодируемые LINE. В таксонах, которые не транскрибируют и не транслируют активно длинноперемежающиеся ядерные элементы белков-продуктов, SINE не имеют теоретической основы для ретротранспозиции в геноме. Таким образом, результаты, полученные в работе Райнхарта и др., очень поддерживают текущую модель ретротранспозиции SINE.
Вставка SINE выше кодирующей области может привести к перетасовке экзонов или изменениям в регуляторной области гена. Вставка SINE в кодирующую последовательность гена может иметь пагубные последствия, а нерегулируемая транспозиция может вызвать генетическое заболевание . Считается, что транспозиция и рекомбинация SINE и других активных ядерных элементов являются одним из основных вкладов генетического разнообразия между линиями во время видообразования. [21]
Считается, что коротко-вкрапленные ядерные элементы имеют паразитическое происхождение в эукариотических геномах. Эти SINE мутировали и реплицировались большое количество раз в эволюционной шкале времени и, таким образом, образуют множество различных линий. Их раннее эволюционное происхождение привело к тому, что они стали вездесущими во многих эукариотических линиях.
Элементы Alu , короткие вкрапленные ядерные элементы из примерно 300 нуклеотидов, являются наиболее распространенными SINE у людей, с >1 000 000 копий по всему геному, что составляет более 10 процентов от общего генома; это не редкость среди других видов. [25] Различия в количестве копий элементов Alu можно использовать для различения и построения филогений видов приматов. [21] Собаки отличаются в первую очередь обилием повторов SINEC_Cf по всему геному, а не другими мутациями на уровне генов или аллелей. Эти специфичные для собак SINE могут кодировать акцепторный сайт сплайсинга, изменяя последовательности, которые появляются как экзоны или интроны у каждого вида. [26]
Помимо млекопитающих, SINE могут достигать большого числа копий у ряда видов, включая некостных позвоночных (слоновая акула) и некоторые виды рыб (латимерии). [27] У растений SINE часто ограничены близкородственными видами и часто появлялись, распадались и исчезали в ходе эволюции. [28] Тем не менее, некоторые семейства SINE, такие как Au-SINE [29] и Angio-SINE [30], необычайно широко распространены среди многих часто неродственных видов растений.
Существует более 50 заболеваний человека, связанных с SINE. [20] При вставке вблизи или внутри экзона SINE могут вызывать неправильный сплайсинг, становиться кодирующими областями или изменять рамку считывания , что часто приводит к фенотипам заболеваний у людей и других животных. [26] Вставка элементов Alu в геном человека связана с раком молочной железы , раком толстой кишки , лейкемией , гемофилией , болезнью Дента , муковисцидозом , нейрофиброматозом и многими другими. [4]
Роль коротких вкрапленных ядерных элементов в регуляции генов в клетках была подтверждена многочисленными исследованиями. В одном из таких исследований изучалась корреляция между определенным семейством SINE с микроРНК (у данио-рерио ). [31] Конкретным исследуемым семейством SINE были Anamnia V-SINE; это семейство коротких вкрапленных ядерных элементов часто встречается в нетранслируемой области 3'-конца многих генов и присутствует в геномах позвоночных. [31] Исследование включало вычислительный анализ, в котором были изучены геномное распределение и активность Anamnia V-SINE у данио-рерио ; кроме того, был проанализирован потенциал этих V-SINE для генерации новых локусов микроРНК. [31] Было обнаружено, что гены, которые, как предполагалось, обладали V-SINE, были нацелены на микроРНК со значительно более высокими значениями E гибридизации (по сравнению с другими областями генома). [31] Гены, которые имели высокие значения E гибридизации, были генами, особенно вовлеченными в метаболические и сигнальные пути. [31] Почти все микроРНК, идентифицированные как имеющие сильную способность гибридизоваться с предполагаемыми мотивами последовательности V-SINE в генах, были идентифицированы (у млекопитающих) как имеющие регуляторные роли. [31] Эти результаты, которые устанавливают корреляцию между короткими вкрапленными ядерными элементами и различными регуляторными микроРНК, убедительно свидетельствуют о том, что V-SINE играют значительную роль в ослаблении ответов на различные сигналы и стимулы, связанные с метаболизмом, пролиферацией и дифференциацией. Необходимо провести много других исследований, чтобы установить обоснованность и степень роли ретротранспозонов коротких вкрапленных ядерных элементов в регуляторных сетях экспрессии генов. В заключение, хотя не так много известно о роли и механизме, с помощью которых SINE генерируют локусы генов miRNA, в целом понятно, что SINE сыграли значительную эволюционную роль в создании «РНК-генов», это также затронуто выше в SINE и псевдогенах.
С такими доказательствами, предполагающими, что коротко вкрапленные ядерные элементы были эволюционными источниками для генерации локусов микроРНК, важно далее обсудить потенциальные связи между ними, а также механизм, с помощью которого микроРНК регулирует деградацию РНК и, в более широком смысле, экспрессию генов. МикроРНК представляет собой некодирующую РНК, как правило, длиной 22 нуклеотида. [32] Этот некодирующий белок олигонуклеотид сам по себе кодируется более длинной последовательностью ядерной ДНК, обычно транскрибируемой РНК-полимеразой II, которая также отвечает за транскрипцию большинства мРНК и мяРНК у эукариот. [33] Однако некоторые исследования показывают, что некоторые микроРНК, которые обладают вышестоящими коротко вкрапленными ядерными элементами, транскрибируются РНК-полимеразой III, которая широко вовлечена в рибосомальную РНК и тРНК, два транскрипта, жизненно важных для трансляции мРНК. [34] Это обеспечивает альтернативный механизм, с помощью которого коротко вкрапленные ядерные элементы могут взаимодействовать или опосредовать сети генной регуляции с участием микроРНК.
Регионы, кодирующие miRNA, могут быть независимыми РНК-генами, часто являющимися антисмысловыми по отношению к соседним генам, кодирующим белки, или могут быть обнаружены в интронах генов, кодирующих белки. [35] Совместная локализация микроРНК и генов, кодирующих белки, обеспечивает механистическую основу, с помощью которой микроРНК регулирует экспрессию генов. Кроме того, Скарпато и др. показывают (как обсуждалось выше), что гены, которые, как было предсказано, обладают короткими вкрапленными ядерными элементами (SINE) посредством анализа последовательностей, были нацелены и гибридизированы микроРНК, значительно большими, чем другие гены. [31] Это обеспечивает эволюционный путь, по которому паразитические SINE были кооптированы и использованы для формирования РНК-генов (таких как микроРНК), которые эволюционировали, чтобы играть роль в сложных сетях регуляции генов.
МикроРНК транскрибируются как часть более длинных цепей РНК, обычно около 80 нуклеотидов, которые посредством комплементарного спаривания оснований способны образовывать структуры шпильковых петель [36]. Эти структуры распознаются и обрабатываются в ядре ядерным белком критической области синдрома ДиДжорджи 8 (DGCR8), который рекрутируется и связывается с белком Дроша. [37] Этот комплекс отвечает за расщепление некоторых структур шпилек из пре-микроРНК, которая транспортируется в цитоплазму. Пре-микроРНК обрабатывается белком DICER в двухцепочечный 22 нуклеотида. [38] После этого одна из цепей включается в многобелковый комплекс РНК-индуцированного сайленсинга (RISC). [39] Среди этих белков есть белки из семейства Argonaute, которые имеют решающее значение для способности комплекса взаимодействовать с целевой мРНК и подавлять ее трансляцию. [40]
Понимание различных способов, которыми микроРНК регулирует экспрессию генов, включая трансляцию и деградацию мРНК, является ключом к пониманию потенциальной эволюционной роли SINE в регуляции генов и в образовании локусов микроРНК. Это, в дополнение к прямой роли SINE в регуляторных сетях (как обсуждалось в SINE как длинные некодирующие РНК), имеет решающее значение для начала понимания связи между SINE и определенными заболеваниями. Многочисленные исследования показали, что повышенная активность SINE коррелирует с определенными профилями экспрессии генов и посттранскрипционной регуляцией определенных генов. [41] [42] [43] Фактически, Петерсон и др. 2013 продемонстрировали, что высокая экспрессия РНК SINE коррелирует с посттранскрипционным снижением регуляции BRCA1 , супрессора опухолей, вовлеченного в множественные формы рака, а именно рак молочной железы. [43] Кроме того, исследования установили сильную корреляцию между транскрипционной мобилизацией SINE и определенными видами рака и состояниями, такими как гипоксия; это может быть связано с нестабильностью генома, вызванной активностью SINE, а также с более прямыми нисходящими эффектами. [42] SINE также были вовлечены в бесчисленное множество других заболеваний. По сути, коротко вкрапленные ядерные элементы стали глубоко интегрированными в бесчисленные регуляторные, метаболические и сигнальные пути и, таким образом, играют неизбежную роль в возникновении заболеваний. Многое еще предстоит узнать об этих геномных паразитах, но ясно, что они играют значительную роль в эукариотических организмах.
Однако активность SINE имеет генетические остатки, которые, по-видимому, не играют значительной роли, положительной или отрицательной, и проявляются в геноме как псевдогены . Однако SINE не следует путать с псевдогенами РНК. [1] В целом, псевдогены генерируются, когда обработанные мРНК генов, кодирующих белки, подвергаются обратной транскрипции и включаются обратно в геном (псевдогены РНК — это обратно транскрибированные гены РНК). [44] Псевдогены, как правило, бесфункциональны, поскольку они происходят от обработанных РНК независимо от их эволюционного контекста, который включает интроны и различные регуляторные элементы, которые обеспечивают транскрипцию и процессинг. Эти псевдогены, хотя и нефункциональные, в некоторых случаях все еще могут обладать промоторами, CpG-островками и другими особенностями, которые обеспечивают транскрипцию; таким образом, они все еще могут транскрибироваться и могут играть роль в регуляции экспрессии генов (как SINE и другие некодирующие элементы). [44] Таким образом, псевдогены отличаются от SINE тем, что они получены из транскрибированной функциональной РНК, тогда как SINE являются элементами ДНК, которые ретротранспонируются путем кооптации транскрипционного аппарата генов РНК. Однако есть исследования, которые предполагают, что ретротранспозируемые элементы, такие как коротко-вставленные ядерные элементы, не только способны копировать себя в альтернативных регионах генома, но и способны делать это для случайных генов. [45] [46] Таким образом, SINE могут играть жизненно важную роль в генерации псевдогенов, которые, как известно, сами по себе участвуют в регуляторных сетях. Это, возможно, еще один способ, с помощью которого SINE смогли повлиять и внести вклад в регуляцию генов.