Ретротранспозоны (также называемые транспозируемыми элементами класса I ) — это мобильные элементы , которые перемещаются в геноме хозяина, преобразуя свою транскрибированную РНК в ДНК посредством обратной транскрипции . [1] Таким образом, они отличаются от транспозируемых элементов класса II, или ДНК-транспозонов, тем, что используют промежуточный РНК для транспозиции и оставляют донорный участок транспозиции неизменным. [2]
Благодаря обратной транскрипции ретротранспозоны быстро амплифицируются и становятся многочисленными в эукариотических геномах, таких как кукуруза (49–78%) [3] и человек (42%). [4] Они присутствуют только в эукариотах, но имеют общие черты с ретровирусами , такими как ВИЧ , например, прерывистая внехромосомная рекомбинация, опосредованная обратной транскриптазой . [5] [6]
Существует два основных типа ретротранспозонов: длинные концевые повторы (LTR) и недлинные концевые повторы (non-LTR). Ретротранспозоны классифицируются на основе последовательности и метода транспозиции. [7] Большинство ретротранспозонов в геноме кукурузы являются LTR, тогда как у людей они в основном не-LTR.
LTR-ретротранспозоны характеризуются своими длинными концевыми повторами (LTR), которые присутствуют как на 5', так и на 3' концах их последовательностей. Эти LTR содержат промоторы для этих транспозируемых элементов (TE), необходимы для интеграции TE и могут варьироваться по длине от чуть более 100 пар оснований (пн) до более 1000 пн. В среднем LTR-ретротранспозоны охватывают несколько тысяч пар оснований, причем самые большие известные примеры достигают 30 килобаз (кб).
LTR являются высокофункциональными последовательностями, и по этой причине LTR и не-LTR ретротранспозоны сильно различаются по своим механизмам обратной транскрипции и интеграции. Не-LTR ретротранспозоны используют процесс целевой обратной транскрипции (TPRT), который требует, чтобы РНК TE была доставлена в сайт расщепления интегразы ретротранспозона, где она подвергается обратной транскрипции. Напротив, LTR ретротранспозоны подвергаются обратной транскрипции в цитоплазме, используя два раунда переключения шаблонов и образование преинтеграционного комплекса (PIC), состоящего из двухцепочечной ДНК и димера интегразы, связанного с LTR. Затем этот комплекс перемещается в ядро для интеграции в новое геномное местоположение.
LTR-ретротранспозоны обычно кодируют белки gag и pol , которые могут быть объединены в одну открытую рамку считывания (ORF) или разделены на отдельные ORF. Подобно ретровирусам, белок gag необходим для сборки капсида и упаковки РНК TE и связанных белков. Белок pol необходим для обратной транскрипции и включает следующие важные домены: PR (протеаза), RT (обратная транскриптаза), RH ( РНКаза H ) и INT (интеграза). Кроме того, некоторые LTR-ретротранспозоны имеют ORF для белка оболочки ( env ), который включен в собранный капсид, облегчая прикрепление к клеточным поверхностям.
Эндогенный ретровирус — это ретровирус без вирусных патогенных эффектов, который был интегрирован в геном хозяина путем вставки своей наследуемой генетической информации в клетки, которые могут передаваться следующему поколению как ретротранспозон. [8] Из-за этого они разделяют черты с ретровирусами и ретротранспозонами. Когда ретровирусная ДНК интегрируется в геном хозяина, они эволюционируют в эндогенные ретровирусы, которые влияют на эукариотические геномы. Так много эндогенных ретровирусов встраиваются в эукариотические геномы, что они позволяют понять биологию между вирусно-хозяинными взаимодействиями и ролью ретротранспозонов в эволюции и болезнях. Многие ретротранспозоны разделяют черты с эндогенными ретровирусами, свойство узнавать и сливаться с геномом хозяина. Однако между ретровирусами и ретротранспозонами есть ключевое различие, на которое указывает ген env. Хотя ген env похож на ген, выполняющий ту же функцию в ретровирусах, ген env используется для определения того, является ли ген ретровирусным или ретротранспозонным. Если ген ретровирусный, он может эволюционировать из ретротранспозона в ретровирус. Они отличаются порядком последовательностей в генах pol. Гены env обнаружены в типах LTR-ретротранспозонов Ty1-copia ( Pseudoviridae ), Ty3-gypsy ( Metaviridae ) и BEL/Pao. [9] [8] Они кодируют гликопротеины на оболочке ретровируса, необходимые для проникновения в клетку-хозяина. Ретровирусы могут перемещаться между клетками, тогда как LTR-ретротранспозоны могут перемещаться только в геном той же клетки. [10] Многие гены позвоночных были образованы из ретровирусов и LTR-ретротранспозонов. Один эндогенный ретровирус или LTR-ретротранспозон имеет ту же функцию и геномное расположение у разных видов, что предполагает их роль в эволюции. [11]
Подобно LTR-ретротранспозонам, не-LTR-ретротранспозоны содержат гены для обратной транскриптазы, РНК-связывающего белка, нуклеазы и иногда рибонуклеазного домена H [12], но у них отсутствуют длинные концевые повторы. РНК-связывающие белки связывают промежуточное вещество РНК-транспозиции, а нуклеазы — это ферменты, которые разрывают фосфодиэфирные связи между нуклеотидами в нуклеиновых кислотах. Вместо LTR, не-LTR-ретротранспозоны имеют короткие повторы, которые могут иметь инвертированный порядок оснований рядом друг с другом, помимо прямых повторов, обнаруженных в LTR-ретротранспозонах, которые представляют собой всего лишь одну последовательность оснований, повторяющуюся сама по себе.
Хотя они и являются ретротранспозонами, они не могут осуществлять обратную транскрипцию с использованием промежуточного звена транспозиции РНК таким же образом, как ретротранспозоны LTR. Эти два ключевых компонента ретротранспозона по-прежнему необходимы, но способ их включения в химические реакции отличается. Это связано с тем, что в отличие от ретротранспозонов LTR, ретротранспозоны non-LTR не содержат последовательностей, связывающих тРНК.
Они в основном делятся на два типа – LINE (длинные вкрапленные ядерные элементы) и SINE (короткие вкрапленные ядерные элементы). Элементы SVA являются исключением из этих двух, поскольку они имеют сходство как с LINE, так и с SINE, содержат элементы Alu и разное количество одинаковых повторов. SVA короче LINE, но длиннее SINE.
Хотя исторически они считались «мусорной ДНК», исследования показывают, что в некоторых случаях как LINE, так и SINE были включены в новые гены для формирования новых функций. [13]
Когда транскрибируется LINE, транскрипт содержит промотор РНК-полимеразы II, который обеспечивает возможность копирования LINE в любое место, куда он себя вставляет. РНК-полимераза II — это фермент, который транскрибирует гены в транскрипты мРНК. Концы транскриптов LINE богаты множественными аденинами [14] , основаниями, которые добавляются в конце транскрипции, чтобы транскрипты LINE не деградировали. Этот транскрипт является промежуточным звеном транспозиции РНК.
Промежуточный продукт транспозиции РНК перемещается из ядра в цитоплазму для трансляции. Это дает два кодирующих региона LINE, которые, в свою очередь, связываются с РНК, с которой они транскрибируются. Затем LINE РНК перемещается обратно в ядро, чтобы встроиться в эукариотический геном.
LINE встраиваются в области эукариотического генома, богатые основаниями AT. В областях AT LINE использует свою нуклеазу для разрезания одной цепи эукариотической двухцепочечной ДНК. Богатая аденином последовательность в транскрипте LINE спаривается с разрезанной цепью, чтобы пометить, где будет вставлена LINE с гидроксильными группами. Обратная транскриптаза распознает эти гидроксильные группы для синтеза ретротранспозона LINE там, где разрезается ДНК. Как и в случае с ретротранспозонами LTR, эта новая вставленная LINE содержит информацию о геноме эукариот, поэтому ее можно легко скопировать и вставить в другие области генома. Информационные последовательности длиннее и более изменчивы, чем в ретротранспозонах LTR.
Большинство копий LINE имеют переменную длину в начале, поскольку обратная транскрипция обычно останавливается до завершения синтеза ДНК. В некоторых случаях это приводит к потере промотора РНК-полимеразы II, поэтому LINE не могут транспонировать дальше. [15]
Ретротранспозоны LINE-1 (L1) составляют значительную часть генома человека, с предполагаемым количеством в 500 000 копий на геном. Гены, кодирующие человеческий LINE1, обычно имеют свою транскрипцию, ингибируемую метильными группами, связывающимися с его ДНК, которые осуществляются белками PIWI и ферментами ДНК-метилтрансферазами. Ретротранспозиция L1 может нарушить природу транскрибируемых генов, вставляя себя внутрь или рядом с генами, что, в свою очередь, может привести к заболеванию человека. LINE1 могут ретротранспонироваться только в некоторых случаях, образуя различные структуры хромосом, способствующие различиям в генетике между людьми. [17] По оценкам, в референтном геноме проекта «Геном человека» содержится 80–100 активных L1, и еще меньшее количество L1 внутри этих активных L1 часто ретротранспонируются. Вставки L1 были связаны с онкогенезом путем активации генов, связанных с раком (онкогенов), и уменьшения генов-супрессоров опухолей.
Каждый человеческий LINE1 содержит два региона, из которых могут быть закодированы продукты генов. Первый кодирующий регион содержит белок лейциновой молнии, участвующий в белок-белковых взаимодействиях, и белок, который связывается с концом нуклеиновых кислот. Второй кодирующий регион содержит пуриновую/пиримидиновую нуклеазу, обратную транскриптазу и белок, богатый аминокислотами цистеинами и гистидинами. Конец человеческого LINE1, как и других ретротранспозонов, богат аденином. [18] [19] [20]
Человеческий L1 активно ретротранспонирует в геноме человека. Недавнее исследование выявило 1708 соматических событий ретротранспозиции L1, особенно в эпителиальных клетках толстой кишки. Эти события происходят с раннего эмбриогенеза, а скорость ретротранспозиции существенно увеличивается во время колоректального опухолевого генеза. [21]
SINE намного короче (300 п.н.), чем LINE. [22] Они имеют сходство с генами, транскрибируемыми РНК-полимеразой II, ферментом, который транскрибирует гены в транскрипты мРНК, и последовательностью инициации РНК-полимеразы III, фермента, который транскрибирует гены в рибосомальную РНК, тРНК и другие малые молекулы РНК. [23] SINE, такие как элементы MIR млекопитающих, имеют ген тРНК в начале и богатый аденином конец, как в LINE.
SINE не кодируют функциональный белок обратной транскриптазы и полагаются на другие мобильные транспозоны, особенно LINE . [24] SINE используют компоненты транспозиции LINE, несмотря на то, что LINE-связывающие белки предпочитают связываться с LINE РНК. SINE не могут транспонировать сами по себе, поскольку они не могут кодировать транскрипты SINE. Обычно они состоят из частей, полученных из тРНК и LINE. Часть тРНК содержит промотор РНК-полимеразы III, который является тем же типом фермента, что и РНК-полимераза II. Это гарантирует, что копии LINE будут транскрибированы в РНК для дальнейшей транспозиции. Компонент LINE остается, поэтому LINE-связывающие белки могут распознавать часть LINE SINE.
Alu являются наиболее распространенными SINE у приматов. Они имеют длину около 350 пар оснований, не кодируют белки и могут распознаваться рестриктазой AluI ( отсюда и название). Их распределение может быть важным при некоторых генетических заболеваниях и раке. Для копирования и вставки Alu РНК требуется богатый аденином конец Alu и остальная часть последовательности, связанная с сигналом. Связанный с сигналом Alu затем может ассоциироваться с рибосомами. LINE РНК ассоциируется на тех же рибосомах, что и Alu. Связывание с той же рибосомой позволяет Alus SINE взаимодействовать с LINE. Эта одновременная трансляция элемента Alu и LINE позволяет копировать и вставлять SINE.
Элементы SVA присутствуют на более низких уровнях, чем SINES и LINE у людей. Начало элементов SVA и Alu похоже, за ним следуют повторы и конец, похожий на эндогенный ретровирус. LINE связываются с сайтами, фланкирующими элементы SVA, чтобы транспонировать их. SVA являются одними из самых молодых транспозонов в геноме человекообразных обезьян и одними из самых активных и полиморфных в популяции людей. SVA был создан путем слияния элемента Alu, VNTR (тандемный повтор переменного числа) и фрагмента LTR. [25]
Ретротранспозоны гарантируют, что они не будут потеряны случайно, поскольку встречаются только в генетике клеток, которые могут передаваться из поколения в поколение от родительских гамет. Однако LINE могут транспонироваться в клетки эмбриона человека, которые в конечном итоге развиваются в нервную систему, что поднимает вопрос о том, влияет ли эта ретротранспозиция LINE на функцию мозга. Ретротранспозиция LINE также является признаком нескольких видов рака, но неясно, вызывает ли сама ретротранспозиция рак, а не просто симптом. Неконтролируемая ретротранспозиция вредна как для организма-хозяина, так и для самих ретротранспозонов, поэтому их необходимо регулировать. Ретротранспозоны регулируются РНК-интерференцией . РНК-интерференция осуществляется группой коротких некодирующих РНК . Короткая некодирующая РНК взаимодействует с белком Argonaute, чтобы деградировать транскрипты ретротранспозонов и изменить их структуру гистонов ДНК, чтобы снизить их транскрипцию.
LTR-ретротранспозоны появились позже, чем не-LTR-ретротранспозоны, возможно, от предкового не-LTR-ретротранспозона, приобретшего интегразу от ДНК-транспозона. Ретровирусы приобрели дополнительные свойства своих вирусных оболочек, взяв соответствующие гены из других вирусов, используя силу LTR-ретротранспозона.
Благодаря механизму ретротранспозиции ретротранспозоны быстро увеличиваются в числе, составляя 40% человеческого генома. Скорости вставки для элементов LINE1, Alu и SVA составляют 1/200 – 1/20, 1/20 и 1/900 соответственно. Скорости вставки LINE1 сильно различались за последние 35 миллионов лет, поэтому они указывают на точки в эволюции генома.
Примечательно, что большое количество 100 килобаз в геноме кукурузы показывает разнообразие из-за наличия или отсутствия ретротранспозонов. Однако, поскольку кукуруза генетически необычна по сравнению с другими растениями, ее нельзя использовать для предсказания ретротранспозиции в других растениях.
Мутации, вызванные ретротранспозонами, включают: