Хелитроны являются одной из трех групп эукариотических мобильных элементов (TE) класса 2 , описанных до сих пор. Это эукариотические мобильные элементы катящегося кольца, которые, как предполагается, транспонируются с помощью механизма репликации катящегося кольца через одноцепочечный промежуточный ДНК. [1] Впервые они были обнаружены у растений ( Arabidopsis thaliana и Oryza sativa ) и у нематоды Caenorhabditis elegans , а теперь они были идентифицированы у самых разных видов, от простейших до млекопитающих . Хелитроны составляют значительную часть многих геномов , где неавтономные элементы часто превосходят по численности предполагаемого автономного партнера. Хелитроны, по-видимому, играют важную роль в эволюции геномов хозяина. Они часто захватывают разнообразные гены хозяина, некоторые из которых могут эволюционировать в новые гены хозяина или стать необходимыми для транспозиции Хелитрона . [2]
Гелитроны были первой группой ТЕ, обнаруженной с помощью вычислительного анализа последовательностей всего генома. Первые описанные гелитроны назывались Aie, AthE1, Atrep и Basho, которые являются неавтономными гелитронами, обнаруженными в геноме Arabidopsis thaliana , небольшого цветкового растения. [3] Несмотря на эти открытия, классификация гелитронов была неизвестна до 2001 года, когда были обнаружены кодирующие элементы белка, которые, как предполагалось, были автономными партнерами. Капитонов и Юрка исследовали кодирующую способность гелитронов в A. thaliana , Oryza sativa и Caenorhabditis elegans, используя исследования in silico повторяющейся ДНК этих организмов, вычислительный анализ и моделирование Монте-Карло . Они описали структуру и кодирующий потенциал канонических гелитронов и предложили механизм транспозиции по принципу катящегося круга, а также возможность того, что некоторые из закодированных генов, захваченных у хозяина, теперь используются для репликации. [4] Их исследование генома этих организмов показало, что активность гелитронов может вносить вклад в значительную часть (~ 2%) геномов растений и беспозвоночных, где они были обнаружены, но степень их распространения в других местах не ясна. [1]
В 2003 году группа исследователей изучала структуру белков, связанных с гелитронами, и различные кодирующие домены в них, ища элементы, подобные гелитрону, у позвоночных, в частности, у рыбы-зебры Danio rerio и рыбы-собаки Spheroides nephelus . Было предсказано, что белки Rep/Helicase будут на 500–700 аминокислот длиннее из-за слияния на С-конце домена с гомологией с апуриновой-апиримидиновой (AP) эндонуклеазой. [5] Предыдущие филогенетические исследования показали, что эндонуклеаза AP вложена в кладу Chicken Repeat 1 (CR1) ретротранспозонов с короткими концевыми повторами (non-LTR). [6] Эта связь предполагает, что эндонуклеаза AP произошла из вставки ретротранспозона либо поблизости, либо внутри гелитрона. [5] Эти исследователи не смогли идентифицировать концы блока Rep/Helicase/Endonuclease гелитронов.
В последние годы Helitrons были идентифицированы во всех эукариотических царствах, но их геномные числа копий сильно варьируются, даже среди близкородственных видов. Они составляют 1–5% геномной ДНК у разных плодовых мушек, 0–3% у млекопитающих, >0,5% у лягушек. [2] У большинства млекопитающих присутствие Helitron незначительно и ограничивается остатками старых транспозонов, за исключением геномов летучих мышей, которые заселены многочисленными молодыми элементами. [7] Однако спустя много лет после описания автономных Helitrons не было опубликовано никаких механистических исследований, и поэтому механизм транспозиции по принципу катящегося круга остается хорошо подкрепленной, но еще не проверенной гипотезой. [1]
Гелитроны структурно асимметричны и являются единственным классом эукариотических ДНК-транспозонов, которые не генерируют дупликации целевых участков во время транспозиции. Канонические гелитроны обычно начинаются с 5′ T (C/T) и заканчиваются нуклеотидами CTRR (чаще всего CTAG, но иногда отмечались вариации), но не содержат терминальных инвертированных повторов. Кроме того, они часто имеют короткую палиндромную последовательность (от 16 до 20 нуклеотидов) шпильку примерно в 11 п.н. от 3′ конца. Они интегрируются между динуклеотидом хозяина AT. [2] Некоторые семейства гелитронов также несут тандемные повторы, такие как микросателлиты и минисателлиты, которые, как правило, являются высокоизменяемыми последовательностями. [1]
Большинство Helitrons являются неавтономными элементами и имеют общие концы и другие структурные признаки с автономными Helitrons, но они не кодируют какой-либо полный набор белков, кодируемых автономными элементами. [4] Основными ферментативными признаками Helitrons являются домены инициатора репликации по типу катящегося кольца (RC) (Rep) и ДНК-хеликазы (Hel), которые присутствуют в белке, включающем 1000–3000 аминокислот (а.к.) (Rep/Hel), кодируемом всеми автономными элементами Helitron. Белок Rep/Helicase включает мотивы цинковых пальцев, домен Rep (который представляет собой ~100-а.к. и обладает активностью эндонуклеазы HUH) и восьмидоменную геликазу семейства PiF1 (SuperFamily1), которые универсально сохраняются в Helitrons. [2] Мотивы, подобные цинковым пальцам, связаны со связыванием ДНК. Домен Hel длиной ~400 аминокислот классифицируется как Hel ДНК от 5' до 3', который участвует в разрыве и соединении одноцепочечной ДНК и характеризуется как наличием мотива HUH (два остатка гистидина, разделенных гидрофобным остатком), так и мотива Y (один или два остатка тирозина , разделенные несколькими аминокислотами). Семейство геликаз PiF1 (Hel) обладает активностью раскручивания от 5' до 3', которая для многих сущностей катящегося кольца является кодируемой хозяином. [8] Растительные гелитроны также кодируют открытую рамку считывания с гомологией с белками, связывающими одноцепочечную ДНК (RPA). [7] Обычно белки RPA в гелитронах имеют длину 150–500 аминокислот и кодируются несколькими экзонами. Во всех гелитронах домен Rep предшествует домену Hel. [2]
Недавно методом криоЭМ была определена трехмерная структура транспозазы Helitron, ковалентно связанной с левым концом транспозона. [9]
Предполагается, что гелитроны транспонируются с помощью механизма, похожего на репликацию по принципу катящегося кольца через одноцепочечный промежуточный продукт ДНК. Для механизма транспозиции предложены две модели: согласованная и последовательная. В согласованной модели расщепление донорной нити и лигирование происходят одновременно, тогда как в последовательной модели они происходят поэтапно. Согласованная модель не требует кольцевого промежуточного продукта, хотя они могут возникнуть, если шаг не удается или обходится во время транспозиции. Последовательная модель отличается тем, что кольцевой промежуточный продукт является обязательным шагом транспозиции, и поскольку до недавнего времени кольцевые промежуточные продукты не были известны для гелитронов, согласованная модель была адаптирована для объяснения транспозиции. [1]
В любом случае, используя реконструированные транспозоны Helraiser для изучения транспозиции Helitron, было показано, что донорский участок должен быть двухцепочечным и что одноцепочечных доноров будет недостаточно. [10]
Helitron может быть как автономным, так и неавтономным. Одна молекула транспозазы расщепляет донор (первым остатком тирозина (Y1) белка Rep) и целевые сайты (вторым остатком тирозина (Y2)) и связывается с полученными 5' концами. Свободный 3' OH в целевой ДНК атакует связь ДНК–Y1 и образует связь с донорной цепью, что приводит к переносу цепи. [7] Репликация в расщепленном донорном сайте инициируется в свободном 3' OH, где донорная цепь служит праймером для синтеза ДНК ДНК-полимеразой хозяина, и репликация продолжается, замещая одну цепь гелитрона. Если палиндром и 3' конец элемента распознаны правильно, расщепление происходит после последовательности CTRR, и одна цепь гелитрона переносится на донорный сайт, где репликация ДНК разрешает гетеродуплекс. [11]
В 2016 году было опубликовано одно из первых механистических исследований транспозиции хелитрона, чтобы пролить свет на различные этапы транспозиции. [12] На основе консенсусной последовательности он реконструировал вероятного предка семейства хелитронов Helibat, присутствующих в геноме маленькой коричневой летучей мыши ( Myotis Lucifugus ), единственной группы млекопитающих, обладающих значительным количеством хелитронов в своем геноме . Этот активный транспозон был вставлен в плазмиду, выступающую в качестве донора хелитрона. Ген устойчивости к антибиотикам был включен между двумя концевыми последовательностями хелитрона, чтобы обеспечить изоляцию клеток, где произошла транспозиция.
Во время транспозиции хелитрона образуется кольцевой промежуточный продукт, который был изолирован в клетках, трансфицированных плазмидой. Он образуется путем соединения концевых концов и предполагает модель транспозиции по типу катящегося кольца, в ходе которой расщепление донорной и целевой цепей происходит не одновременно, поскольку сначала образуется одноцепочечная кольцевая ДНК с одной из цепей хелитрона.
Эта модель подтверждается тем фактом, что удаление одного из двух тирозинов (Y727) домена Rep, который, как считается, участвует в расщеплении нитей [1], на самом деле не влияет на эффективность транспозиции гелитрона. Потребуется только один из тирозинов [12] , чтобы обеспечить двухэтапный процесс: 1) расщепление донорской ДНК и 2) интеграция в целевой сайт.
Наличие смежных экзонов и интронов в ДНК хозяина, переносимой Helitron, предполагает механизм приобретения на основе ДНК. Было предложено, что захват гена Helitron происходит поэтапно или последовательно, т. е. захват гена происходит во время одной транспозиции, а захват второго гена происходит во время последующего события транспозиции. Поэтапный захват приведет к Helitrons, которые содержат фрагменты генов из разных мест. Модель последовательного захвата может объяснить Helitrons, несущие несколько фрагментов генов, наблюдаемых в других организмах. [1] Для объяснения механизма захвата гена на уровне ДНК в Helitrons предложены три основные модели.
Также известна как модель 1 «трансдукции» или «чтения через» (RTM1). Транспозиция начинается на 5′ конце, и захват гена происходит, если пропущен сигнал терминации 3′. Криптичный палиндром ниже по течению может предоставить новый терминатор, если нормальный терминатор будет обойден, и вся промежуточная последовательность будет захвачена. В этом отношении гелитроны можно рассматривать как машины для перетасовки экзонов. [11] Поскольку случайная последовательность обеспечивает новый сигнал терминации, эта модель не требует высокой плотности гелитронов в геноме.
Действительно, в слияниях одностороннего типа вставленный фрагмент донорской ДНК фланкируется с одного конца (константный конец) IRR, а с другого конца — последовательностью CTTG или GTTC, присутствующей в доноре (вариабельный конец), таким образом, что обычно приводит к множественным тандемным вставкам донорской плазмиды или захвату фланкирующей последовательности в целевом сайте. [13] Эта неспособность распознать сигнал терминации для транспозиции Helitron может привести к тому, что ДНК, фланкирующая 3'-конец Helitron, также будет перенесена вместе с Helitron в донорский сайт (захват гена). Возможно, именно так Helitron приобрели дополнительные кодирующие последовательности. Несмотря на эту гипотезу, необходимы дальнейшие эксперименты для проверки механизма транспозиции.
Также известна как модель "чтения-сквозь" 2 (RTM2). В этой модели транспозиция начинается на 5'-конце Helitron, и если 3'-конец этого Helitron отсутствует, то транспозиция завершается на следующем 3'-конце Helitron в правильной ориентации, и происходит захват гена. В результате захватывается вся промежуточная последовательность. [1]
В этой модели части генов или некодирующих областей могут случайно служить шаблонами во время репарации двухцепочечных разрывов (DSB), происходящих в Helitron во время их транспозиции. Низкоточная репарация DSB путем негомологичного соединения концов встречается у растений и млекопитающих чаще, чем репарация посредством гомологичной рекомбинации, и часто сопровождается вставками «заполняющей ДНК» длиной 100–4000 п.н., скопированной из различных геномных или внехромосомных участков ДНК в DSB. Эта модель предсказывает, что существуют области микрогомологии длиной от 2 до 8 п.н. между областями, которые фланкируют DSB в Helitron, и которые фланкируют исходную последовательность хозяина, захваченную Helitron. [2]
Существуют также другие модели механизма захвата генов, предложенные для Helitrons: Модель сайт-специфической рекомбинации, которая основана на общих чертах между Helitrons и Integrons ; Захват транспозируемых элементов, который основан на интеграции TE посредством транспозиции в другие TE, также называемый вложением TE. [1] Несмотря на все эти предложенные модели, не хватает примеров, чтобы ограничить механизм захвата генов одной моделью. Необходимы дальнейшие исследования, чтобы понять молекулярный механизм, лежащий в основе захвата генов, и то, как он способствует выживанию Helitrons.
Доказательства, подтверждающие модели «чтения насквозь», по-видимому, заключаются в относительной незначимости 3' RTS по сравнению с 5' LTS: [10] [12] удаление LTS приводит к серьезному снижению эффективности транспозиции гелитрона, тогда как полное удаление RTS все равно приводит к значительной транспозиции, несмотря на уменьшенное количество копий. [12] RTS указывает белку Rep-Hel на конец гелитрона и, таким образом, на конец транспозиции. Вся эта информация заключена в шпильковой структуре, образованной палиндромной последовательностью ДНК на 3' конце. Такая небольшая структура, вероятно, со временем модифицируется, позволяя обойти конец гелитрона во время его транспозиции и захватить соседнюю последовательность гена.
Хелитроны, как и все другие ТЕ, являются потенциальными инсерционными мутагенами . Они могут быть вставлены в промоторную область гена, что приводит к отмене измеряемых транскриптов и наблюдаемых фенотипов . В некоторых случаях было замечено, что вставка Хелитрона предоставила регуляторные мотивы, необходимые для инициации транскрипции. Исследователи представили доказательства того, что Хелитроны внесли предполагаемые промоторы, экзоны, сайты сплайсинга, сайты полиаденилирования и сайты связывания микроРНК в транскрипты, в противном случае сохраняющиеся у млекопитающих. [7] Хелитроны управляют экспрессией и предоставляют регуляторные элементы de novo, такие как CAAT-box, GCbox, октамерный мотив и сайты TATA-box . Хелитроны также могут изменять длину и последовательность как 5′ UTR, так и 3′ UTR кодирующих транскриптов. Другой способ, которым Helitrons может контролировать экспрессию генов, заключается в содействии новым вариантам сплайсинга путем содействия альтернативному сплайсингу и предоставления криптических сайтов сплайсинга. Было отмечено несколько спонтанных мутаций в растениях, вызванных интронными вставками Helitron, которые приводят к образованию видов химерных транскриптов. [1]
Нетипичная структура, отсутствие модификации целевого сайта и гетерогенность последовательностей Helitrons затруднили автоматическую идентификацию Helitrons. Для анализа всего генома применяются два подхода для поиска канонических Helitrons: подходы идентификации повторов de novo, которые можно использовать для создания консенсусных библиотек всех повторяющихся последовательностей, но подходы поиска повторов de novo будут идентифицировать только Helitrons, которые присутствуют в нескольких относительно однородных копиях в геноме. Поэтому низкокопийные и старые Helitrons будут иметь тенденцию быть фрагментированными и иметь плохо определенные концы. Эти подходы ограничены качеством сборки генома и гомогенностью повторов. Другой подход основан на структуре, которая опирается на структурные особенности канонических Helitrons и использует такие программы, как Helitronfinder, HelSearch, Helraizer и HelitronScanner. Поскольку эти программы обучаются на известных элементах Helitron, они могут быть неэффективны при идентификации расходящихся семейств и генерируют много ложноположительных результатов. Этот подход не создает консенсусных последовательностей кандидатов-Гелитронов, что приводит к большим наборам данных. [1]
Чувствительность подхода на основе структуры (правильно идентифицирован/(правильно идентифицирован + ложноотрицательные результаты)) составляет 93%, а специфичность (правильно идентифицирован/(правильно идентифицирован + ложноположительные результаты)) составляет 99%. Существует несколько причин, по которым все другие методы обнаружения Helitron были менее чувствительными и/или более подверженными ошибкам: Поиск на основе белка Rep/хеликазы дает большое количество ложноотрицательных результатов, поскольку большинство Helitron являются неавтономными элементами. Поиск на основе сходства не идентифицирует никаких новых семейств и, таким образом, будет плохо работать в недавно изученных геномах. Поиск на основе повторов требует обширного ручного курирования для идентификации семейств Helitron, что является непосильной задачей в больших геномах со значительным повторением ДНК. На основе общей чувствительности и специфичности подход на основе структуры для идентификации элементов Helitron является довольно успешным и особенно полезен для идентификации элементов Helitron в недавно охарактеризованном геноме. Однако, поскольку для выравнивания необходимо не менее 2 копий, будут пропущены единичные копии Helitron. [14]
Наследование: Анализы по всему геному показали, что основная масса Helitrons, как правило, довольно недавние. Молодой возраст семейств Helitrons, конечно, обусловлен тщательно изученными геномами, которые в основном принадлежат растениям и насекомым, где неограниченный период полураспада ДНК (среднее количество времени, в течение которого теряется половина ДНК, не сохраняющейся для функции) довольно быстр. В отличие от других ДНК-транспозонов, Helitrons некоторых видов, как сообщается, проявляют долгосрочную активность, вероятно, из-за механизма транспозиции или неспособности хозяина распознавать Helitrons из-за гетерогенности последовательностей или захвата генов хозяина. В отличие от относительно быстрого неограниченного периода полураспада ДНК (2,5–14 млн лет) геномов растений и насекомых, период полураспада ДНК млекопитающих оценивается как гораздо более медленный (884 млн лет), что наряду с минимальными требованиями к транспозиции Helitron и медленной скоростью распада у млекопитающих обусловило эту модель вертикальной устойчивости. [15]
Горизонтальный перенос: Влияние горизонтального переноса (ГП) мобильных элементов может быть значительным из-за их мутагенного потенциала, присущей им мобильности и распространенности. Исследователи обнаружили доказательства повторного ГП четырех различных семейств гелитронов в беспрецедентном наборе организмов, включая млекопитающих, рептилий, рыб, беспозвоночных и вирусы насекомых. Гелитроны, присутствующие в этих видах, имеют неоднородное распределение и тесно связаны (80–98% идентичности последовательностей), несмотря на глубокие времена расхождения между хозяевами. В отличие от генов, гелитроны, которые горизонтально перенесены в новые геномы хозяев, могут амплифицироваться, в некоторых случаях достигая нескольких сотен копий и представляя существенную часть генома. Поскольку гелитроны, как известно, часто захватывают и амплифицируют фрагменты генов, ГП этой уникальной группы ДНК-транспозонов может привести к горизонтальному переносу генов и вызвать резкие сдвиги в траектории эволюции генома. [1]
Два различных сценария описывают наиболее вероятную судьбу гена хозяина, захваченного гелитронами: 1. Захваченный ген будет уничтожен множественными мутациями, если он не обеспечит никакого селективного преимущества транспозонам. 2. Он будет сохранен как ген, связанный с исходным геном хозяина, если его захват будет выгоден для транспозона, что допускается хозяином. Гелитроны, как и большинство других мобильных элементов в геномах A. thaliana и C. elegans, присутствуют в геномах в нескольких сильно разошедшихся семействах. Учитывая молодой возраст этих семейств и степень консервации белков, крайне маловероятно, что наблюдаемое расхождение является результатом мутаций, накопленных транспозонами, интегрированными в геном хозяина, что доказывает, что гелитроны работают как мощный инструмент эволюции. Они рекрутировали гены хозяина, модифицировали их до степени, недостижимой для менделевского процесса, и размножили их в геномах хозяина. [4]
Хотя общепринято, что Helitrons являются RC-транспозонами, и в ходе многочисленных исследований была доказана роль транспозиции Helitron в дупликации генов и формировании генетической архитектуры, но ни различные механизмы, посредством которых это происходит, ни частота не изучены до конца. На данный момент даже неясно, инициирует или прекращает 3'-конец в транспозоне Helitron репликативную транспозицию Helitron. Важным шагом на пути к исследованию этого механизма станет выделение автономных Helitrons, активных in vitro и in vivo . Это можно сделать путем вычислительной идентификации полных молодых Helitrons. В ближайшем будущем подробные компьютерные исследования последовательностей позволят исследователям понять эволюционную историю Helitrons, а также их механизм захвата генов и их общее значение для эволюции генов. [2]