Ретротранспозоны (также называемые мобильными элементами класса I ) — это мобильные элементы , которые перемещаются в геноме хозяина путем преобразования транскрибируемой ими РНК в ДНК посредством обратной транскрипции . [1] Таким образом, они отличаются от мобильных элементов класса II, или ДНК-транспозонов, тем, что используют промежуточную РНК для транспозиции и оставляют донорский сайт транспозиции неизменным. [2]
Благодаря обратной транскрипции ретротранспозоны быстро амплифицируются и становятся многочисленными в геномах эукариот , таких как кукуруза (49–78%) [3] и человек (42%). [4] Они присутствуют только у эукариот, но имеют общие черты с ретровирусами , такими как ВИЧ , например, прерывистую внехромосомную рекомбинацию, опосредованную обратной транскриптазой . [5] [6]
Существует два основных типа ретротранспозонов: длинные концевые повторы (LTR) и недлинные концевые повторы (не-LTR). Ретротранспозоны классифицируются на основе последовательности и метода транспозиции. [7] Большинство ретротранспозонов в геноме кукурузы являются LTR, тогда как у человека они в основном не LTR.
Ретротранспозоны LTR характеризуются длинными концевыми повторами (LTR), которые присутствуют как на 5'-, так и на 3'-концах их последовательностей. Эти LTR содержат промоторы для этих мобильных элементов (TE), необходимы для интеграции TE и могут варьироваться по длине от чуть более 100 пар оснований (п.н.) до более чем 1000 п.н. В среднем ретротранспозоны LTR охватывают несколько тысяч пар оснований, причем самые крупные известные примеры достигают 30 килобаз (кб).
LTR представляют собой высокофункциональные последовательности, и по этой причине ретротранспозоны LTR и не-LTR сильно различаются по механизмам обратной транскрипции и интеграции. Ретротранспозоны, не относящиеся к LTR, используют процесс обратной транскрипции с целевой привязкой (TPRT), который требует, чтобы РНК TE была доставлена в сайт расщепления интегразой ретротранспозона, где она подвергается обратной транскрипции. Напротив, ретротранспозоны LTR подвергаются обратной транскрипции в цитоплазме, используя два раунда переключения матрицы и образование преинтеграционного комплекса (PIC), состоящего из двухцепочечной ДНК и димера интегразы, связанного с LTR. Затем этот комплекс перемещается в ядро для интеграции в новое место генома.
Ретротранспозоны LTR обычно кодируют белки gag и pol , которые могут быть объединены в одну открытую рамку считывания (ORF) или разделены на отдельные ORF. Подобно ретровирусам, белок gag необходим для сборки капсида и упаковки РНК TE и связанных с ним белков. Белок pol необходим для обратной транскрипции и включает в себя следующие важные домены: PR (протеаза), RT (обратная транскриптаза), RH ( РНКаза H ) и INT (интеграза). Кроме того, некоторые ретротранспозоны LTR имеют ORF для белка оболочки ( env ), который включается в собранный капсид, облегчая прикрепление к клеточным поверхностям.
Эндогенный ретровирус — это ретровирус без вирусных патогенных эффектов, который был интегрирован в геном хозяина путем внедрения наследственной генетической информации в клетки, которая может передаваться следующему поколению, как ретротранспозон. [8] Из-за этого они имеют общие черты с ретровирусами и ретротранспозонами. Когда ретровирусная ДНК интегрируется в геном хозяина, они превращаются в эндогенные ретровирусы, которые влияют на геномы эукариот. В геномы эукариот внедрилось так много эндогенных ретровирусов, что они позволяют глубже понять биологию взаимодействия вируса с хозяином и роль ретротранспозонов в эволюции и заболеваниях. Многие ретротранспозоны имеют общие черты с эндогенными ретровирусами, а именно способность распознавать геном хозяина и сливаться с ним. Однако между ретровирусами и ретротранспозонами есть ключевое различие, на которое указывает ген env. Хотя ген env аналогичен гену, выполняющему ту же функцию в ретровирусах, он используется для определения того, является ли ген ретровирусным или ретротранспозонным. Если ген ретровирусный, он может превратиться из ретротранспозона в ретровирус. Они различаются порядком последовательностей в генах pol. Гены Env обнаружены в ретротранспозонах LTR типов Ty1-copia ( Pseudoviridae ), Ty3-gypsy ( Metaviridae ) и BEL/Pao. [9] [8] Они кодируют гликопротеины оболочки ретровируса, необходимые для проникновения в клетку-хозяина. Ретровирусы могут перемещаться между клетками, тогда как ретротранспозоны LTR могут перемещаться только в геном той же клетки. [10] Многие гены позвоночных образовались из ретровирусов и ретротранспозонов LTR. Один эндогенный ретровирус или ретротранспозон LTR имеет одинаковую функцию и местоположение в геноме у разных видов, что указывает на их роль в эволюции. [11]
Как и ретротранспозоны LTR, ретротранспозоны, не относящиеся к LTR, содержат гены обратной транскриптазы, РНК-связывающего белка, нуклеазы и иногда H-домена рибонуклеазы [12] , но у них отсутствуют длинные концевые повторы. РНК-связывающие белки связывают промежуточный продукт транспозиции РНК, а нуклеазы представляют собой ферменты, которые разрывают фосфодиэфирные связи между нуклеотидами в нуклеиновых кислотах. Вместо LTR ретротранспозоны, не относящиеся к LTR, имеют короткие повторы, которые могут иметь инвертированный порядок расположения оснований рядом друг с другом, за исключением прямых повторов , обнаруженных в ретротранспозонах LTR, которые представляют собой всего лишь одну последовательность повторяющихся оснований.
Хотя они являются ретротранспозонами, они не могут осуществлять обратную транскрипцию с использованием промежуточного продукта транспозиции РНК так же, как ретротранспозоны LTR. Эти два ключевых компонента ретротранспозона по-прежнему необходимы, но способ их включения в химические реакции иной. Это связано с тем, что в отличие от ретротранспозонов LTR ретротранспозоны, не относящиеся к LTR, не содержат последовательностей, связывающих тРНК.
В основном они делятся на два типа – LINE (длинные вкрапленные ядерные элементы) и SINE (короткие вкрапленные ядерные элементы). Элементы SVA являются исключением между ними, поскольку они имеют сходство как с LINE, так и с SINE, содержащими элементы Alu и разное количество одинаковых повторов. SVA короче, чем LINE, но длиннее, чем SINE.
Хотя исторически их считали «мусорной ДНК», исследования показывают, что в некоторых случаях и LINE, и SINE были включены в новые гены для формирования новых функций. [13]
Когда LINE транскрибируется, транскрипт содержит промотор РНК-полимеразы II, который обеспечивает копирование LINE в любое место, в которое он вставляется. РНК-полимераза II — это фермент, который транскрибирует гены в транскрипты мРНК. Концы транскриптов LINE богаты множеством аденинов, [14] оснований, которые добавляются в конце транскрипции, чтобы транскрипты LINE не разрушались. Этот транскрипт является промежуточным продуктом транспозиции РНК.
Промежуточный продукт транспозиции РНК перемещается из ядра в цитоплазму для трансляции. Это дает две кодирующие области LINE, которые, в свою очередь, снова связываются с РНК, с которой она транскрибируется. Затем LINE РНК возвращается в ядро и встраивается в геном эукариот.
LINE встраиваются в участки эукариотического генома, богатые основаниями AT. В АТ-областях LINE использует свою нуклеазу, чтобы разрезать одну цепь двухцепочечной ДНК эукариот. Богатая аденином последовательность в парах оснований транскрипта LINE с обрезанной цепью, обозначающей место, где LINE будет вставлен с гидроксильными группами. Обратная транскриптаза распознает эти гидроксильные группы и синтезирует ретротранспозон LINE, в котором ДНК разрезается. Как и в случае с ретротранспозонами LTR, эта новая вставленная LINE содержит информацию о геноме эукариот, поэтому ее можно легко скопировать и вставить в другие области генома. Информационные последовательности длиннее и более вариабельны, чем у ретротранспозонов LTR.
Большинство копий LINE вначале имеют переменную длину, поскольку обратная транскрипция обычно прекращается до завершения синтеза ДНК. В некоторых случаях это приводит к потере промотора РНК-полимеразы II, поэтому LINE не могут дальше транспонироваться. [15]
Ретротранспозоны LINE-1 (L1) составляют значительную часть генома человека, примерно 500 000 копий на геном. Транскрипция генов, кодирующих человеческий LINE1, обычно ингибируется связыванием метильных групп с его ДНК, осуществляемым белками PIWI и ферментами ДНК-метилтрансферазами. Ретротранспозиция L1 может нарушить природу транскрибируемых генов, вставив их внутрь или рядом с генами, что, в свою очередь, может привести к заболеванию человека. LINE1 могут лишь в некоторых случаях ретротранспонироваться с образованием разных хромосомных структур, что приводит к различиям в генетике между людьми. [17] По оценкам, в эталонном геноме Проекта «Геном человека» имеется 80–100 активных L1, и еще меньшее количество L1 внутри этих активных L1 часто ретротранспонируется. Вставки L1 связаны с онкогенезом за счет активации онкогенов генов, связанных с раком, и уменьшения количества генов-супрессоров опухолей.
Каждая LINE1 человека содержит две области, из которых могут кодироваться генные продукты. Первая кодирующая область содержит белок лейциновой молнии, участвующий в белок-белковых взаимодействиях, и белок, который связывается с концом нуклеиновых кислот. Вторая кодирующая область содержит пурин/пиримидиннуклеазу, обратную транскриптазу и белок, богатый аминокислотами цистеинами и гистидинами. Конец человеческого LINE1, как и другие ретротранспозоны, богат аденином. [18] [19] [20]
Человеческий L1 активно ретротранспонируется в геноме человека. Недавнее исследование выявило 1708 соматических событий ретротранспозиции L1, особенно в колоректальных эпителиальных клетках. Эти события происходят на ранних стадиях эмбриогенеза, а частота ретротранспозиции существенно увеличивается во время колоректального опухолевого генеза. [21]
SINE намного короче (300 бит), чем LINE. [22] Они имеют сходство с генами, транскрибируемыми РНК-полимеразой II, ферментом, который транскрибирует гены в транскрипты мРНК, и инициирующей последовательностью РНК-полимеразы III, фермента, который транскрибирует гены в рибосомальную РНК, тРНК и другие небольшие молекулы РНК. [23] SINE, такие как элементы MIR млекопитающих, имеют ген тРНК в начале и богатый аденином конец, как и в LINE.
SINE не кодируют функциональный белок обратной транскриптазы и полагаются на другие мобильные транспозоны, особенно LINE . [24] SINE используют компоненты транспозиции LINE, несмотря на то, что LINE-связывающие белки предпочитают связываться с LINE РНК. SINE не могут транспонироваться сами по себе, поскольку они не могут кодировать транскрипты SINE. Обычно они состоят из частей, полученных из тРНК и LINE. Часть тРНК содержит промотор РНК-полимеразы III, который представляет собой фермент того же типа, что и РНК-полимераза II. Это гарантирует, что копии LINE будут транскрибированы в РНК для дальнейшей транспозиции. Компонент LINE остается, поэтому LINE-связывающие белки могут распознавать LINE-часть SINE.
Alus — наиболее распространенный СИНУС у приматов. Они имеют длину около 350 пар оснований, не кодируют белки и могут распознаваться ферментом рестрикции AluI (отсюда и название). Их распределение может иметь важное значение при некоторых генетических заболеваниях и раке. Для копирования и вставки Alu-РНК требуется богатый аденином конец Alu, а остальная часть последовательности связана с сигналом. Связанный с сигналом Alu может затем связываться с рибосомами. LINE РНК связывается с теми же рибосомами, что и Alu. Связывание с одной и той же рибосомой позволяет Alus SINE взаимодействовать с LINE. Этот одновременный перевод элемента Alu и LINE позволяет копировать и вставлять SINE.
Элементы SVA присутствуют на более низких уровнях, чем SINES и LINE у человека. Начала элементов SVA и Alu схожи, за ними следуют повторы и конец, аналогичный эндогенному ретровирусу. LINEs связываются с сайтами, окружающими элементы SVA, чтобы транспонировать их. SVA являются одними из самых молодых транспозонов в геноме человекообразных обезьян и одними из самых активных и полиморфных в человеческой популяции. SVA был создан путем слияния элемента Alu, VNTR (тандемного повтора с переменным числом) и фрагмента LTR. [25]
Ретротранспозоны гарантируют, что они не будут потеряны случайно, поскольку встречаются только в генетике клеток и могут передаваться от одного поколения к другому от родительских гамет. Однако LINE могут транспонироваться в клетки человеческого эмбриона, которые в конечном итоге развиваются в нервную систему, что поднимает вопрос, влияет ли эта ретротранспозиция LINE на функцию мозга. Ретротранспозиция LINE также является особенностью некоторых видов рака, но неясно, вызывает ли ретротранспозиция сама по себе рак, а не просто симптом. Неконтролируемая ретротранспозиция вредна как для организма-хозяина, так и для самих ретротранспозонов, поэтому их приходится регулировать. Ретротранспозоны регулируются с помощью РНК-интерференции . РНК-интерференция осуществляется группой коротких некодирующих РНК . Короткая некодирующая РНК взаимодействует с белком Argonaute, разрушая транскрипты ретротранспозонов и изменяя структуру их гистонов ДНК, снижая их транскрипцию.
Ретротранспозоны LTR возникли позже, чем ретротранспозоны, не относящиеся к LTR, возможно, от предкового ретротранспозона, не относящегося к LTR, который приобрел интегразу из ДНК-транспозона. Ретровирусы приобрели дополнительные свойства своих вирусных оболочек, взяв соответствующие гены у других вирусов, используя силу ретротранспозона LTR.
Благодаря механизму ретротранспозиции количество ретротранспозонов быстро увеличивается, составляя 40% генома человека. Скорость установки элементов LINE1, Alu и SVA составляет 1/200–1/20, 1/20 и 1/900 соответственно. Скорость вставки LINE1 сильно менялась за последние 35 миллионов лет, поэтому они указывают на точки в эволюции генома.
Примечательно, что большое количество нуклеотидов в 100 тысяч оснований в геноме кукурузы демонстрирует разнообразие из-за присутствия или отсутствия ретротранспозонов. Однако, поскольку кукуруза генетически необычна по сравнению с другими растениями, ее нельзя использовать для прогнозирования ретротранспозиции у других растений.
Мутации, вызванные ретротранспозонами, включают: