Естественные антисмысловые транскрипты (NAT) представляют собой группу РНК, закодированных в клетке, которые имеют транскриптную комплементарность другим РНК-транскриптам. [1] Они были идентифицированы у множества эукариот , включая людей, мышей, дрожжи и Arabidopsis thaliana . [2] Этот класс РНК включает как кодирующие, так и некодирующие белок РНК. [3] Текущие данные предполагают различные регуляторные роли NAT, такие как РНК-интерференция (РНКi), альтернативный сплайсинг , геномный импринтинг и инактивация X-хромосомы . [4] NAT в целом сгруппированы в две категории в зависимости от того, действуют ли они в цис- или транс-положении. [5] Транс-NAT транскрибируются из другого места, чем их мишени, и обычно имеют комплементарность нескольким транскриптам с некоторыми несовпадениями. [6] МикроРНК (miRNA) являются примером транс-NAT, которые могут быть нацелены на несколько транскриптов с несколькими несовпадениями. [6] С другой стороны, цис-естественные антисмысловые транскрипты ( цис-НАТ ) транскрибируются из того же геномного локуса , что и их цель, но из противоположной цепи ДНК и образуют идеальные пары. [7]
Цис-NAT имеют различные ориентации и различную длину перекрытия между парами. [7] На сегодняшний день было выявлено пять ориентаций для цис-NAT. [8] Наиболее распространенной ориентацией является ориентация «голова к голове», когда 5'-концы обоих транскриптов выравниваются вместе. [3] Эта ориентация приведет к наибольшему снижению экспрессии генов, если причиной ингибирования транскрипции является транскрипционное столкновение. [1] Однако есть некоторые исследования, которые предполагают, что ориентации «хвост к хвосту» являются наиболее распространенными парами NAT. [1] Другие, такие как «хвост к хвосту», перекрытие, близлежащая голова к голове и близлежащий хвост к хвосту, встречаются реже. [1] Полностью перекрывающиеся NAT подразумевают, что антисмысловой ген расположен полностью друг над другом. [3] Близлежащие ориентации «голова к голове» и «хвост к хвосту» физически отделены друг от друга, но расположены очень близко друг к другу. [1] Текущие данные свидетельствуют о том, что в генах, обладающих каталитической активностью, наблюдается чрезмерное представительство пар NAT. [3] Возможно, в этих генах есть что-то, что делает их более склонными к этому типу регуляции.
Идентификация NAT в целых геномах возможна благодаря большому набору данных о последовательностях, доступных для множества организмов. Методы in silico для обнаружения NAT страдают от нескольких недостатков в зависимости от источника информации о последовательностях. [7] Исследования, которые используют мРНК, имеют последовательности, ориентация которых известна, но объем доступной информации о последовательностях мРНК невелик. [3] Предсказанные модели генов с использованием алгоритмов, обученных искать гены, дают увеличенный охват генома за счет уверенности в идентифицированном гене. [7] Другим ресурсом являются обширные библиотеки экспрессируемых тегов последовательностей (EST), но этим небольшим последовательностям сначала необходимо назначить ориентацию, прежде чем из них можно будет извлечь полезную информацию. [3] Некоторые исследования использовали специальную информацию о последовательностях в EST, такую как сигнал поли(А), хвост поли(А) и сайты сплайсинга, как для фильтрации EST, так и для придания им правильной транскрипционной ориентации . [1] Комбинации различных источников последовательностей пытаются максимизировать охват, а также поддерживать целостность данных.
Пары NAT идентифицируются, когда они образуют перекрывающиеся кластеры. Существуют различия в пороговых значениях, используемых в разных исследованиях, но обычно ~20 нуклеотидов перекрытия последовательностей считаются минимальным значением для транскриптов, которые следует рассматривать как перекрывающийся кластер. [1] Кроме того, транскрипты должны сопоставляться только с одной другой молекулой мРНК, чтобы их можно было считать парой NAT. [1] [7] В настоящее время существует множество веб- и программных ресурсов, которые можно использовать для поиска антисмысловых пар. База данных NATsdb или Natural Antisense Transcript является богатым инструментом для поиска антисмысловых пар из нескольких организмов.
Молекулярные механизмы, лежащие в основе регуляторной роли цис-NAT, в настоящее время недостаточно изучены. [3] Для объяснения регуляторных эффектов, которые цис-NAT оказывают на экспрессию генов, были предложены три модели. Первая модель предполагает, что спаривание оснований между цис-NAT и его комплементарным транскриптом приводит к снижению экспрессии мРНК. [9] Предположение этой модели заключается в том, что будет точное выравнивание по крайней мере 6 пар оснований между парой цис-NAT для создания двухцепочечной РНК. [1] Эпигенетические модификации, такие как метилирование ДНК и посттрансляционная модификация основных гистонов , составляют основу второй модели. [1] Хотя это еще не до конца понятно, считается, что обратный транскрипт направляет комплексы метилирования и/или комплексы, модифицирующие гистоны, в промоторные области смыслового транскрипта и вызывает ингибирование экспрессии гена. [1] В настоящее время неизвестно, какие атрибуты цис-NAT имеют решающее значение для эпигенетической модели регуляции. [1] Последняя предложенная модель, которая получила одобрение благодаря недавним экспериментальным данным, — это модель транскрипционного столкновения. В процессе транскрипции цис-NAT транскрипционные комплексы собираются в промоторных областях гена. Затем РНК-полимеразы начнут транскрибировать ген в месте инициации транскрипции, выкладывая нуклеотиды в направлении от 5' к 3'. [6] В областях перекрытия между цис-NAT РНК-полимеразы будут сталкиваться и останавливаться в месте сбоя. [1] Транскрипция ингибируется, поскольку РНК-полимеразы преждевременно останавливаются, а их неполные транскрипты деградируют. [10]
Регулирование многих биологических процессов, таких как развитие, метаболизм и многих других, требует тщательной координации между множеством различных генов; это обычно называют сетью регуляции генов . Всплеск интереса к сетям регуляции генов был вызван появлением секвенированных геномов нескольких организмов. Следующий шаг — использовать эту информацию, чтобы выяснить, как гены работают вместе, а не только по отдельности. В процессе развития млекопитающих происходит инактивация дополнительной Х-хромосомы у самок. Было показано, что пара NAT, называемая Xist и Tsix , участвует в гиперметилировании хромосомы. [11] Было показано, что около 20–30% генов млекопитающих являются мишенями miRNA , что подчеркивает важность этих молекул как регуляторов для большого количества генов. [12] Эволюционные причины использования РНК для регуляции генов могут заключаться в том, что это менее затратно и быстрее, чем синтез белков, не нужных клетке. [1] Это могло иметь селективное преимущество для ранних эукариот с таким типом регуляции транскрипции.
Антисмысловая транскрипция может способствовать заболеванию через хромосомные изменения, которые приводят к образованию аберрантных антисмысловых транскриптов. [4] Задокументированный случай участия цис-NAT в заболевании человека происходит из наследственной формы α- талассемии , где происходит подавление гена гемоглобина α-2 посредством действия цис-NAT. [4] Считается, что в злокачественных раковых клетках с активированными мобильными элементами создается большое количество транскрипционного шума. [4] Вполне вероятно, что аберрантные антисмысловые транскрипты РНК, возникающие в результате этого транскрипционного шума, могут вызывать стохастическое метилирование CpG-островков , связанных с онкогенами и генами-супрессорами опухолей . [4] Это ингибирование будет еще больше прогрессировать злокачественность клеток, поскольку они теряют ключевые регуляторные гены. [4] Изучая активированные антисмысловые транскрипты в опухолевых клетках, исследователи могут искать больше потенциальных генов-супрессоров опухолей. [4] Кроме того, аномальные цис-НАТ связаны с неврологическими заболеваниями, такими как болезнь Паркинсона . [4]
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )