stringtranslate.com

Открытая рамка чтения

Пример последовательности, показывающий три различные возможные рамки считывания . Старт-кодоны выделены фиолетовым цветом, стоп-кодоны — красным.

В молекулярной биологии открытые рамки считывания ( ORF ) определяются как участки последовательности ДНК между стартовыми и стоп- кодонами . Обычно это рассматривают в пределах изучаемого участка последовательности ДНК прокариот , где только одна из шести возможных рамок считывания будет «открытой» («чтение», однако, относится к РНК, образующейся в результате транскрипции ДНК и ее последующей взаимодействие с рибосомой при трансляции ). Такая ORF может [1] содержать стартовый кодон (обычно AUG в терминах РНК ) и по определению не может выходить за пределы стоп-кодона (обычно UAA, UAG или UGA в РНК). [2] Этот стартовый кодон (не обязательно первый) указывает, где может начаться трансляция. Сайт терминации транскрипции расположен после ORF, за стоп-кодоном трансляции. Если бы транскрипция прекратилась до появления стоп-кодона, во время трансляции образовался бы неполный белок . [3]

В эукариотических генах с несколькими экзонами интроны удаляются , а экзоны затем соединяются вместе после транскрипции, образуя окончательную мРНК для трансляции белка. Таким образом, в контексте поиска генов определение старт-стоп ORF применимо только к сплайсированным мРНК , а не к геномной ДНК, поскольку интроны могут содержать стоп-кодоны и/или вызывать сдвиги между рамками считывания. Альтернативное определение гласит, что ORF — это последовательность, длина которой делится на три и ограничена стоп-кодонами. [1] [4] Это более общее определение может быть полезно в контексте транскриптомики и метагеномики , где стартовый или стоп-кодон может отсутствовать в полученных последовательностях. Такая ORF соответствует частям гена, а не целому гену.

Биологическое значение

Открытые рамки считывания (ORF) часто используются в качестве доказательства, помогающего прогнозировать гены . Длинные ORF часто используются наряду с другими данными для первоначальной идентификации областей -кандидатов , кодирующих белок , или функциональных областей, кодирующих РНК, в последовательности ДНК . [5] Наличие ORF не обязательно означает, что регион всегда транслируется . Например, в случайно сгенерированной последовательности ДНК с равным процентом каждого нуклеотида стоп -кодон можно ожидать один раз на каждый 21 кодон . [5] Простой алгоритм прогнозирования генов прокариот может искать стартовый кодон, за которым следует открытая рамка считывания, достаточно длинная для кодирования типичного белка, где использование кодонов в этой области соответствует частотной характеристике кодирующих областей данного организма. [5] Поэтому некоторые авторы говорят, что ORF должна иметь минимальную длину, например, 100 кодонов [6] или 150 кодонов. [5] Сама по себе даже длинная открытая рамка считывания не является убедительным доказательством присутствия гена . [5]

Короткие ORF (sORF)

Некоторые короткие ORF (sORF), также называемые малыми открытыми рамками считывания , [7] обычно длиной менее 100 кодонов, [8] которые лишены классических признаков белок-кодирующих генов (как из нкРНК, так и из мРНК), могут продуцировать функциональные пептиды. [9] Известно, что 5'-UTR около 50% мРНК млекопитающих содержит одну или несколько кОРС, [10] также называемых восходящими ORF или uORF . Однако менее 10% мРНК позвоночных, исследованных в более старом исследовании, содержали кодоны AUG перед основной ORF. Интересно, что uORF были обнаружены в двух третях протоонкогенов и родственных им белков. [11] 64–75% экспериментально обнаруженных сайтов инициации трансляции кОРС консервативны в геномах человека и мыши и могут указывать на наличие у этих элементов функции. [12] Однако кОРС часто можно обнаружить только в минорных формах мРНК и избежать отбора; Высокая консервативность сайтов инициации может быть связана с их расположением внутри промоторов соответствующих генов. Это характерно , например, для гена SLAMF1 . [13]

Шестикадровый перевод

Поскольку ДНК интерпретируется группами по три нуклеотида (кодона), цепь ДНК имеет три отдельные рамки считывания. [14] Двойная спираль молекулы ДНК имеет две антипараллельные цепи; поскольку две нити имеют по три рамки считывания каждая, существует шесть возможных трансляций кадров. [14]

Пример шестикадрового перевода. Нуклеотидная последовательность показана посередине, прямые трансляции вверху и обратные трансляции внизу. Выделены две возможные открытые рамки считывания с последовательностями.

Программное обеспечение

Искатель

ORF Finder (Поиск открытых рамок считывания) [15] представляет собой инструмент графического анализа, который находит все открытые рамки считывания выбранного минимального размера в последовательности пользователя или в последовательности, уже имеющейся в базе данных. Этот инструмент идентифицирует все открытые рамки считывания, используя стандартные или альтернативные генетические коды. Выведенная аминокислотная последовательность может быть сохранена в различных форматах и ​​найдена в базе данных последовательностей с использованием сервера базового инструмента поиска локального выравнивания (BLAST). ORF Finder должен быть полезен при подготовке полных и точных заявок на последовательность. Он также поставляется с программным обеспечением для отправки последовательностей Sequin (анализатор последовательностей).

Следователь

ORF Investigator [16] представляет собой программу, которая не только дает информацию о кодирующих и некодирующих последовательностях, но также может выполнять попарное глобальное выравнивание последовательностей различных генов/участков ДНК. Инструмент эффективно находит ORF для соответствующих аминокислотных последовательностей, преобразует их в однобуквенный аминокислотный код и указывает их расположение в последовательности. Попарное глобальное выравнивание между последовательностями позволяет удобно обнаруживать различные мутации, включая полиморфизм одиночных нуклеотидов . Для выравнивания генов используются алгоритмы Нидлмана-Вунша . ORF Investigator написан на портативном языке программирования Perl и поэтому доступен пользователям всех распространенных операционных систем.

Предсказатель

OrfPredictor [17] представляет собой веб-сервер, предназначенный для идентификации областей, кодирующих белок, в последовательностях, полученных с помощью экспрессируемых меток последовательностей (EST). Для последовательностей запросов с попаданием в BLASTX программа прогнозирует области кодирования на основе кадров считывания перевода, идентифицированных в выравниваниях BLASTX, в противном случае она прогнозирует наиболее вероятную область кодирования на основе внутренних сигналов последовательностей запроса. Выходными данными являются предсказанные пептидные последовательности в формате FASTA и строка определения, включающая идентификатор запроса, рамку считывания трансляции и положения нуклеотидов, где начинается и заканчивается кодирующая область. OrfPredictor облегчает аннотирование последовательностей, полученных из EST, особенно для крупномасштабных проектов EST.

ORF Predictor использует комбинацию двух разных определений ORF, упомянутых выше. Он ищет участки, начинающиеся со стартового кодона и заканчивающиеся стоп-кодоном. В качестве дополнительного критерия он ищет стоп-кодон в 5'- нетранслируемой области (UTR или NTR, нетранслируемая область [18] ).

ОРФик

ORFik — это R-пакет в Bioconductor для поиска открытых рамок считывания и использования технологий секвенирования нового поколения для обоснования ORF. [19] [20]

орфипия

orfipy — это инструмент, написанный на Python / Cython для чрезвычайно быстрого и гибкого извлечения ORF. [21] orfipy может работать с простыми или сжатыми в gzip последовательностями FASTA и FASTQ и предоставляет несколько опций для тонкой настройки поиска ORF; к ним относятся указание стартовых и стоп-кодонов, сообщение о частичных ORF и использование пользовательских таблиц перевода. Результаты можно сохранить в нескольких форматах, включая компактный формат BED. orfipy особенно быстрее работает с данными, содержащими несколько более мелких последовательностей FASTA, таких как сборки транскриптома de novo. [22]

Смотрите также

Рекомендации

  1. ^ ab Зибер П., Платцер М., Шустер С. (март 2018 г.). «Возвращение к определению открытой рамки чтения». Тенденции в генетике . 34 (3): 167–170. дои : 10.1016/j.tig.2017.12.009. ПМИД  29366605.
  2. ^ Броды LC (25 августа 2021 г.). «Стоп Кодон». Национальный институт исследования генома человека . Национальные институты здоровья . Проверено 25 августа 2021 г.
  3. ^ Слончевски Дж., Фостер Дж.В. (2009). Микробиология: развивающаяся наука . Нью-Йорк: WW Norton & Co. ISBN 978-0-393-97857-5. ОСЛК  185042615.
  4. ^ Клавери Дж.М. (1997). «Вычислительные методы идентификации генов в геномных последовательностях позвоночных». Молекулярная генетика человека . 6 (10): 1735–44. дои : 10.1093/hmg/6.10.1735 . ПМИД  9300666.
  5. ^ abcde Деониер Р., Таваре С. , Уотерман М. (2005). Компьютерный анализ генома: введение . Спрингер-Верлаг . п. 25. ISBN 978-0-387-98785-9.
  6. ^ Клавери Дж. М., Пуаро О., Лопес Ф. (1997). «Трудность идентификации генов в анонимных последовательностях позвоночных». Компьютеры и химия . 21 (4): 203–14. дои : 10.1016/s0097-8485(96)00039-3. ПМИД  9415985.
  7. ^ Вакирлис, Николаос; Вэнс, Зоя; Дагган, Кейт М.; МакЛисахт, Аойф (2022). «Рождение de novo функциональных микропротеинов в человеческой линии». Отчеты по ячейкам . 41 (12): 111808. doi :10.1016/j.celrep.2022.111808. ПМЦ 10073203 . PMID  36543139. S2CID  254966620. 
  8. ^ Куте, Прити Мадхав; Сукарие, Омар; Тьелднес, Хокон; Трегуэ, Давид-Александр; Вален, Эйвинд (2022). «Маленькие открытые рамки для чтения, как их найти и определить их функцию». Границы генетики . 12 : 796060. doi : 10.3389/fgene.2021.796060 . ПМЦ 8831751 . ПМИД  35154250. 
  9. ^ Занет Дж., Бенраба Э., Ли Т., Пелисье-Монье А., Чанут-Делаланд Х., Ронсен Б. и др. (сентябрь 2015 г.). «Пептиды PrisORF индуцируют селективный процессинг белка, опосредованный протеасомами». Наука . 349 (6254): 1356–1358. Бибкод : 2015Sci...349.1356Z. doi : 10.1126/science.aac5677. PMID  26383956. S2CID  206639549.
  10. ^ Ветмар К., Барбоза-Сильва А., Андраде-Наварро М.А., Лойц А. (январь 2014 г.). «uORFdb - обширная база данных литературы по биологии эукариотических uORF». Исследования нуклеиновых кислот . 42 (Проблема с базой данных): D60–D67. дои : 10.1093/nar/gkt952. ПМЦ 3964959 . ПМИД  24163100. 
  11. ^ Гебалле, AP; Моррис, доктор медицинских наук (апрель 1994 г.). «Инициативные кодоны в 5'-лидерах мРНК как регуляторы трансляции». Тенденции биохимических наук . 19 (4): 159–164. дои : 10.1016/0968-0004(94)90277-1. ISSN  0968-0004. ПМИД  8016865.
  12. ^ Ли С., Лю Б., Ли С., Хуан SX, Шен Б., Цянь С.Б. (сентябрь 2012 г.). «Глобальное картирование сайтов инициации трансляции в клетках млекопитающих с разрешением в один нуклеотид». Труды Национальной академии наук Соединенных Штатов Америки . 109 (37): Е2424–Е2432. дои : 10.1073/pnas.1207846109 . ПМЦ 3443142 . ПМИД  22927429. 
  13. ^ Шварц А.М., Путляева Л.В., Цович М., Клепикова А.В., Акулич К.А., Воронцов И.Е. и др. (октябрь 2016 г.). «Ранний B-клеточный фактор 1 (EBF1) имеет решающее значение для контроля транскрипции гена SLAMF1 в B-клетках человека». Biochimica et Biophysica Acta (BBA) - Механизмы регуляции генов . 1859 (10): 1259–1268. doi :10.1016/j.bbagrm.2016.07.004. ПМИД  27424222.
  14. ^ Аб Пирсон В.Р., Вуд Т., Чжан З., Миллер В. (ноябрь 1997 г.). «Сравнение последовательностей ДНК с последовательностями белков». Геномика . 46 (1): 24–36. дои : 10.1006/geno.1997.4995. PMID  9403055. S2CID  6413018.
  15. ^ "ORFfinder" . Национальный центр биотехнологической информации .
  16. ^ Дхар Д.В., Кумар М.С. (2012). «ORF Investigator: новый инструмент поиска ORF, сочетающий в себе парное глобальное выравнивание генов». Научно-исследовательский журнал новейших наук . 1 (11): 32–35.
  17. ^ "Орфпредиктор". bioinformatics.ysu.edu . Архивировано из оригинала 22 декабря 2015 г. Проверено 17 декабря 2015 г.
  18. ^ Кэррингтон Дж. К., Фрид Д. Д. (апрель 1990 г.). «Кэп-независимое усиление трансляции с помощью 5'-нетранслируемой области растительного потивируса». Журнал вирусологии . 64 (4): 1590–7. дои : 10.1128/JVI.64.4.1590-1597.1990. ПМК 249294 . ПМИД  2319646. 
  19. ^ Корнел Лабун, Хокон Тьелднес (2018). «ОРФик - Открытые рамки считывания в геномике». bioconductor.org . doi :10.18129/B9.bioc.ORFik.
  20. ^ Тьелднес, Хокон; Лабун, Корнель; Торрес Клерен, Ямила; Чижиньска, Катажина; Свирский, Михал; Вален, Эйвинд (2021). «ORFik: комплексный набор инструментов R для анализа перевода». БМК Биоинформатика . 22 (1): 336. doi : 10.1186/s12859-021-04254-w . ПМЦ 8214792 . ПМИД  34147079. 
  21. ^ Сингх У, Вуртеле ES (февраль 2021 г.). «orfipy: быстрый и гибкий инструмент для извлечения ORF». Биоинформатика . 37 (18): 3019–3020. doi : 10.1093/биоинформатика/btab090 . ISSN  1367-4803. ПМЦ 8479652 . ПМИД  33576786. 
  22. ^ Сингх У (13 февраля 2021 г.), urmi-21 / orfipy , получено 13 февраля 2021 г.

Внешние ссылки