stringtranslate.com

Регион кодирования

Кодирующая область гена , также известная как кодирующая последовательность ( CDS ), представляет собой часть ДНК или РНК гена, которая кодирует белок . [1] Изучение длины, состава, регуляции, сплайсинга, структуры и функций кодирующих областей по сравнению с некодирующими областями на протяжении разных видов и периодов времени может предоставить значительный объем важной информации относительно организации генов и эволюции прокариот и эукариот . [2] Это может дополнительно помочь в картировании генома человека и разработке генной терапии. [3]

Определение

Хотя этот термин также иногда используется взаимозаменяемо с экзоном , это не одно и то же: экзон состоит из кодирующей области, а также 3'- и 5'- нетранслируемых областей РНК, поэтому экзон будет называться частично состоит из кодирующих областей. 3'- и 5'- нетранслируемые области РНК, которые не кодируют белок, называются некодирующими областями и не обсуждаются на этой странице. [4]

Часто возникает путаница между кодирующими областями и экзомами , и между этими терминами существует четкое различие. В то время как экзом относится ко всем экзонам в геноме, кодирующая область относится к отдельному участку ДНК или РНК, который специфически кодирует определенный вид белка.  

История

В 1978 году Уолтер Гилберт опубликовал книгу «Почему гены разбиты на части», в которой впервые началось исследование идеи о том, что ген представляет собой мозаику — что каждая полная цепь нуклеиновой кислоты не кодируется непрерывно, а прерывается «молчащими» некодирующими областями. Это было первое указание на то, что необходимо проводить различие между частями генома, кодирующими белок (теперь называемые кодирующими областями), и теми, которые этого не делают. [5]

Состав

Типы точечных мутаций: количество переходов (синий) увеличено по сравнению с трансверсиями (красный) в кодирующих регионах, богатых GC.

Имеющиеся данные свидетельствуют о том, что существует общая взаимозависимость между шаблонами базового состава и доступностью региона кодирования. [6] Считается, что кодирующая область содержит более высокое содержание GC , чем некодирующая область. Дальнейшие исследования показали, что чем длиннее кодирующая цепь, тем выше содержание GC. Короткие кодирующие цепи все еще сравнительно бедны GC, подобно низкому содержанию GC в базовых стоп-кодонах трансляции , таких как TAG, TAA и TGA. [7]

Области, богатые GC, также немного изменяются в областях, где тип мутации точки отношения меняется: здесь больше переходов , которые представляют собой изменения от пурина к пурину или от пиримидина к пиримидину, по сравнению с трансверсиями , которые представляют собой изменения от пурина к пиримидину или от пиримидина к пурину. Переходы с меньшей вероятностью изменяют кодируемую аминокислоту и остаются молчащей мутацией (особенно если они происходят в третьем нуклеотиде кодона), что обычно полезно для организма во время трансляции и образования белка. [8]

Это указывает на то, что существенные кодирующие области (богатые генами) имеют более высокое содержание GC, более стабильны и устойчивы к мутациям по сравнению с дополнительными и несущественными областями (бедными генами). [9] Однако до сих пор неясно, произошло ли это в результате нейтральной и случайной мутации или в результате отбора . [10] Также ведутся споры о том, являются ли методы, используемые, такие как генные окна, для установления взаимосвязи между содержанием GC и кодирующей областью, точными и объективными. [11]

Структура и функции

Транскрипция : РНК-полимераза (РНКП) использует матричную цепь ДНК и начинает кодирование с последовательности промотора (зеленый) и заканчивается на терминаторной последовательности (красный), чтобы охватить всю кодирующую область в пре-мРНК (бирюзовый). Пре-мРНК полимеризуется от 5’ к 3’, а ДНК-матрица считывается от 3’ к 5’.
Электронно-микрофотография нитей ДНК, украшенных сотнями молекул РНКП, слишком маленьких, чтобы их можно было различить. Каждая РНКП транскрибирует цепь РНК, которая, как видно, отходит от ДНК. «Начало» указывает на 3'-конец ДНК, где РНКП инициирует транскрипцию; «Конец» указывает на 5'-конец, где полностью транскрибируются более длинные молекулы РНК.

В ДНК кодирующая область фланкирована промоторной последовательностью на 5'-конце матричной цепи и терминирующей последовательностью на 3'-конце. Во время транскрипции РНК -полимераза (РНКП) связывается с последовательностью промотора и перемещается по цепи матрицы к кодирующей области. Затем РНКП добавляет нуклеотиды РНК , комплементарные кодирующей области, чтобы сформировать мРНК , заменяя тимин урацилом . [12] Это продолжается до тех пор, пока РНКП не достигнет последовательности терминации. [12]

После транскрипции и созревания образующаяся зрелая мРНК включает в себя множество частей, важных для ее возможной трансляции в белок . Кодирующая область мРНК фланкирована 5'-нетранслируемой областью (5'-UTR) и 3'-нетранслируемой областью (3'-UTR), [1] 5' -кэпом и поли-А-хвостом . Во время трансляции рибосома облегчает прикрепление тРНК к кодирующей области по 3 нуклеотида за раз ( кодоны ) . [13] ТРНК переносят связанные с ними аминокислоты в растущую полипептидную цепь, в конечном итоге образуя белок, определенный в исходной кодирующей области ДНК.

Кодирующая область (бирюзовая) фланкирована нетранслируемыми областями, 5'-кэпом и поли(А)-хвостом, которые вместе образуют зрелую мРНК . [14]

Регулирование

Кодирующая область может быть модифицирована для регулирования экспрессии генов.

Алкилирование является одной из форм регуляции кодирующей области. [15] Ген, который должен был быть транскрибирован, можно заставить замолчать, нацелившись на определенную последовательность. Основания в этой последовательности будут блокироваться с помощью алкильных групп , которые создают эффект молчания . [16]

Хотя регуляция экспрессии генов управляет обилием РНК или белка, образующихся в клетке, регуляция этих механизмов может контролироваться регуляторной последовательностью , обнаруженной до того, как в цепи ДНК начнется открытая рамка считывания . Регуляторная последовательность затем будет определять место и время, когда будет происходить экспрессия области, кодирующей белок. [17]

Сплайсинг РНК в конечном итоге определяет, какая часть последовательности транслируется и экспрессируется, и этот процесс включает вырезание интронов и соединение экзонов. Однако место разрезания сплайсосомы РНК определяется распознаванием сайтов сплайсинга , в частности 5'-сайта сплайсинга, который является одним из субстратов для первого этапа сплайсинга. [18] Кодирующие области находятся внутри экзонов, которые ковалентно соединяются вместе, образуя зрелую информационную РНК .

Мутации

Мутации в кодирующей области могут оказывать весьма разнообразное влияние на фенотип организма. Хотя некоторые мутации в этой области ДНК/РНК могут привести к полезным изменениям, другие могут быть вредными, а иногда даже смертельными для выживания организма. Напротив, изменения в некодирующей области не всегда могут приводить к обнаруживаемым изменениям фенотипа.

Типы мутаций

Примеры различных форм точковых мутаций , которые могут существовать в кодирующих регионах. Такие изменения могут иметь или не иметь фенотипические изменения, в зависимости от того, кодируют ли они разные аминокислоты во время трансляции. [19]

Существуют различные формы мутаций, которые могут возникать в кодирующих регионах. Одной из форм являются молчащие мутации , при которых изменение нуклеотидов не приводит к каким-либо изменениям аминокислот после транскрипции и трансляции. [20] Также существуют нонсенс-мутации , при которых изменения оснований в кодирующей области кодируют преждевременный стоп-кодон, производя более короткий конечный белок. Точечные мутации или изменения одной пары оснований в кодирующей области, которые кодируют разные аминокислоты во время трансляции, называются миссенс-мутациями . Другие типы мутаций включают мутации сдвига рамки считывания , такие как вставки или делеции . [20]

Формирование

Некоторые формы мутаций являются наследственными ( мутации зародышевой линии ) или передаются от родителя к потомству. [21] Такие мутированные кодирующие области присутствуют во всех клетках организма. Другие формы мутаций приобретаются ( соматические мутации ) в течение жизни организма и не могут быть постоянными от клетки к клетке. [21] Эти изменения могут быть вызваны мутагенами , канцерогенами или другими агентами окружающей среды (например, УФ ). Приобретенные мутации также могут быть результатом ошибок копирования во время репликации ДНК и не передаются потомству. Изменения в области кодирования также могут быть de novo (новыми); Считается, что такие изменения происходят вскоре после оплодотворения , что приводит к мутации, присутствующей в ДНК потомства, но отсутствующей как в сперматозоидах, так и в яйцеклетках. [21]

Профилактика

Существует множество механизмов транскрипции и трансляции, предотвращающих летальность из-за вредных мутаций в кодирующей области. Такие меры включают корректуру некоторыми ДНК-полимеразами во время репликации, восстановление несоответствий после репликации [22] и « гипотезу колебания », которая описывает вырождение третьего основания в кодоне мРНК. [23]

Области ограниченного кодирования (CCR)

Хотя хорошо известно, что геном одного человека может иметь значительные различия по сравнению с геномом другого, недавние исследования показали, что некоторые кодирующие области сильно ограничены или устойчивы к мутациям между особями одного и того же вида. Это похоже на концепцию межвидового ограничения в консервативных последовательностях . Исследователи назвали эти сильно ограниченные последовательности ограниченными кодирующими областями (CCR), а также обнаружили, что такие области могут участвовать в отборе с высокой степенью очистки . В среднем на каждые 7 кодирующих оснований приходится примерно 1 мутация, изменяющая белок, но некоторые CCR могут иметь более 100 оснований в последовательности без наблюдаемых мутаций, изменяющих белок, а некоторые даже без синонимичных мутаций. [24] Эти закономерности ограничения между геномами могут дать ключ к разгадке источников редких заболеваний развития или, возможно, даже эмбриональной смертности. Клинически подтвержденные варианты и мутации de novo в CCR ранее были связаны с такими расстройствами, как детская эпилептическая энцефалопатия , задержка развития и тяжелые заболевания сердца. [24]

Обнаружение последовательности кодирования

Схематическая кариограмма человека, показывающая обзор генома человека по G-диапазону (включая окрашивание по Гимзе ), при этом кодирующие участки ДНК встречаются в большей степени в более светлых ( богатых GC ) участках. [25]

Хотя идентификация открытых рамок считывания в последовательности ДНК является простой задачей, идентификация кодирующих последовательностей не является сложной задачей, поскольку клетка транслирует в белки только подмножество всех открытых рамок считывания. [26] В настоящее время предсказание CDS использует выборку и секвенирование мРНК из клеток, хотя все еще существует проблема определения того, какие части данной мРНК на самом деле транслируются в белок. Прогнозирование CDS — это подмножество предсказания генов , причем последнее также включает предсказание последовательностей ДНК, которые кодируют не только белок, но и другие функциональные элементы, такие как гены РНК и регуляторные последовательности.

Как у прокариот , так и у эукариот перекрытие генов происходит относительно часто как в ДНК, так и в РНК-вирусах, что является эволюционным преимуществом, позволяющим уменьшить размер генома, сохраняя при этом способность производить различные белки из доступных кодирующих областей. [27] [28] Как для ДНК, так и для РНК парное выравнивание может обнаружить перекрывающиеся кодирующие области, включая короткие открытые рамки считывания в вирусах, но для сравнения с потенциально перекрывающейся кодирующей цепью потребуется известная кодирующая цепь. [29] Альтернативный метод с использованием отдельных последовательностей генома не потребует нескольких последовательностей генома для выполнения сравнений, но потребует перекрытия как минимум 50 нуклеотидов, чтобы быть чувствительным. [30]

Смотрите также

Рекомендации

  1. ^ аб Твайман, Ричард (1 августа 2003 г.). «Геновая структура». Велком Траст. Архивировано из оригинала 28 марта 2007 года . Проверено 6 апреля 2003 г.
  2. ^ Хёглунд М., Салл Т., Реме Д. (февраль 1990 г.). «О происхождении кодирующих последовательностей из случайных открытых рамок считывания». Журнал молекулярной эволюции . 30 (2): 104–108. Бибкод : 1990JMolE..30..104H. дои : 10.1007/bf02099936. ISSN  0022-2844. S2CID  5978109.
  3. ^ Сахаркар МК, Чоу В.Т., Кангеан П. (2004). «Распределение экзонов и интронов в геноме человека». В кремниевой биологии . 4 (4): 387–93. ПМИД  15217358.
  4. ^ Парнелл, Лоуренс Д. (1 января 2012 г.). «Достижения в области технологий и дизайна исследований». В Бушаре, К.; Ордовас, Дж. М. (ред.). Последние достижения в области нутригенетики и нутригеномики . Том. 108. Академическая пресса. стр. 17–50. дои : 10.1016/B978-0-12-398397-8.00002-2. ISBN 9780123983978. ПМИД  22656372 . Проверено 07.11.2019 . {{cite book}}: |journal=игнорируется ( помощь )
  5. ^ Гилберт В. (февраль 1978 г.). «Почему гены разбиты на кусочки?». Природа . 271 (5645): 501. Бибкод : 1978Natur.271..501G. дои : 10.1038/271501a0 . PMID  622185. S2CID  4216649.
  6. ^ Лерчер М.Д., Уррутия А.О., Павличек А., Херст Л.Д. (октябрь 2003 г.). «Объединение мозаичных структур в геноме человека». Молекулярная генетика человека . 12 (19): 2411–5. дои : 10.1093/hmg/ddg251 . ПМИД  12915446.
  7. ^ Оливер Дж.Л., Марин А. (сентябрь 1996 г.). «Взаимосвязь между содержанием GC и длиной кодирующей последовательности». Журнал молекулярной эволюции . 43 (3): 216–23. Бибкод : 1996JMolE..43..216O. дои : 10.1007/pl00006080. ПМИД  8703087.
  8. ^ "РОЗАЛИНДА | Глоссарий | Область генного кодирования" . rosalind.info . Проверено 31 октября 2019 г.
  9. ^ Виноградов А.Е. (апрель 2003 г.). «Спираль ДНК: важность богатства GC». Исследования нуклеиновых кислот . 31 (7): 1838–44. дои : 10.1093/nar/gkg296. ПМК 152811 . ПМИД  12654999. 
  10. ^ Болин Дж., Элдхольм В., Петтерссон Дж. Х., Бринильдсруд О., Снайпен Л. (февраль 2017 г.). «Нуклеотидный состав микробных геномов указывает на дифференциальные закономерности отбора основных и дополнительных геномов». БМК Геномика . 18 (1): 151. дои : 10.1186/s12864-017-3543-7 . ПМК 5303225 . ПМИД  28187704. 
  11. ^ Семон М., Муширу Д., Дюре Л. (февраль 2005 г.). «Связь между экспрессией генов и содержанием GC у млекопитающих: статистическая значимость и биологическая значимость». Молекулярная генетика человека . 14 (3): 421–7. дои : 10.1093/hmg/ddi038 . ПМИД  15590696.
  12. ^ ab Обзор транскрипции. (без даты). Получено с https://www.khanacademy.org/science/biology/gene-expression-central-dogma/transcription-of-dna-into-rna/a/overview-of-transcription.
  13. ^ Клэнси, Сюзанна (2008). «Перевод: ДНК в мРНК в белок». Scitable: естественное образование .
  14. ^ Plociam (08 августа 2005 г.), английский: Структура мРНК зрелых эукариот. Полностью процессированная мРНК включает 5'-кэп, 5'-UTR, кодирующую область, 3'-UTR и поли(А)-хвост. , получено 19 ноября 2019 г.
  15. ^ Шинохара К., Сасаки С., Миношима М., Бандо Т., Сугияма Х. (13 февраля 2006 г.). «Алкилирование матричной цепи кодирующей области вызывает эффективное подавление генов». Исследования нуклеиновых кислот . 34 (4): 1189–95. дои : 10.1093/nar/gkl005. ПМЦ 1383623 . ПМИД  16500890. 
  16. ^ «Термин онтологии гена алкилирования ДНК (GO: 0006305)» . www.informatics.jax.org . Проверено 30 октября 2019 г.
  17. ^ Шафи Т., Лоу Р. (2017). «Структура генов эукариот и прокариот». Викижурнал медицины . 4 (1). дои : 10.15347/wjm/2017.002 .
  18. ^ Конарская М.М. (1998). «Распознавание 5'-сайта сплайсинга сплайсосомой». Акта Биохимика Полоника . 45 (4): 869–81. дои : 10.18388/abp.1998_4346 . ПМИД  10397335.
  19. ^ Jonsta247 (10 мая 2013 г.), английский: Пример молчащей мутации , получено 19 ноября 2019 г.{{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  20. ^ Аб Ян, Дж. (23 марта 2016 г.). Что такое генетические мутации? Получено с https://www.singerinstruments.com/resource/what-are-genetic-mutation/.
  21. ^ abc Что такое генная мутация и как происходят мутации? - Домашний справочник по генетике - NIH. (без даты). Получено с https://ghr.nlm.nih.gov/primer/mutationsanddisorders/genemutation.
  22. ^ «Коррекция и восстановление ДНК (статья)» . Ханская академия . Проверено 22 мая 2023 г.
  23. ^ Перето Дж. (2011) Гипотеза колебания (генетика). В: Гарго М. и др. (ред.) Энциклопедия астробиологии. Шпрингер, Берлин, Гейдельберг
  24. ^ аб Хаврилла, Дж. М., Педерсен, Б. С., Лайер, РМ, и Куинлан, АР (2018). Карта областей ограниченного кодирования в геноме человека. Природная генетика , 88–95. дои : 10.1101/220814
  25. ^ Ромигье Дж., Ру С. (2017). «Аналитические предубеждения, связанные с содержанием GC в молекулярной эволюции». Фронт Генет . 8 : 16. дои : 10.3389/fgene.2017.00016 . ПМК 5309256 . ПМИД  28261263. 
  26. ^ Фуруно М., Касукава Т., Сайто Р., Адачи Дж., Сузуки Х., Балдарелли Р. и др. (июнь 2003 г.). «Аннотация CDS в полноразмерной последовательности кДНК». Геномные исследования . 13 (6Б). Лабораторное издательство Колд-Спринг-Харбор: 1478–87. дои : 10.1101/гр.1060303. ПМК 403693 . ПМИД  12819146. 
  27. ^ Рогозин И.Б., Спиридонов А.Н., Сорокин А.В., Вольф Ю.И., Джордан И.К., Татусов Р.Л., Кунин Е.В. (май 2002 г.). «Очистка и направленный отбор перекрывающихся прокариотических генов». Тенденции в генетике . 18 (5): 228–32. дои : 10.1016/S0168-9525(02)02649-5. ПМИД  12047938.
  28. ^ Кирико Н., Вианелли А., Белшоу Р. (декабрь 2010 г.). «Почему гены у вирусов перекрываются». Слушания. Биологические науки . 277 (1701): 3809–17. дои :10.1098/rspb.2010.1052. ПМЦ 2992710 . ПМИД  20610432. 
  29. ^ Ферт А.Э., Браун CM (февраль 2005 г.). «Обнаружение перекрывающихся кодирующих последовательностей с попарным выравниванием». Биоинформатика . 21 (3): 282–92. doi : 10.1093/биоинформатика/bti007 . ПМИД  15347574.
  30. ^ Schlub TE, Buchmann JP, Holmes EC (октябрь 2018 г.). Малик Х (ред.). «Простой метод обнаружения перекрывающихся генов-кандидатов в вирусах с использованием последовательностей одного генома». Молекулярная биология и эволюция . 35 (10): 2572–2581. doi : 10.1093/molbev/msy155. ПМК 6188560 . ПМИД  30099499.