stringtranslate.com

Предвзятость использования кодонов

Смещение использования кодонов у Physcomitrella patens

Предвзятость использования кодонов относится к различиям в частоте появления синонимичных кодонов в кодирующей ДНК . Кодон — это серия из трех нуклеотидов (триплет), кодирующая определенный аминокислотный остаток в полипептидной цепи или терминатор трансляции ( стоп-кодоны ).

Существует 64 различных кодона (61 кодон, кодирующий аминокислоты, и 3 стоп-кодона), но только 20 различных транслируемых аминокислот. Избыток числа кодонов позволяет многим аминокислотам кодироваться более чем одним кодоном. Из-за такой избыточности говорят, что генетический код вырожден. Генетические коды разных организмов часто склонны использовать один из нескольких кодонов, кодирующих одну и ту же аминокислоту, по сравнению с другими — то есть случайно будет обнаружена более высокая частота одного из них, чем ожидалось. То, как возникают такие предубеждения, является широко обсуждаемой областью молекулярной эволюции . Таблицы использования кодонов, подробно описывающие предвзятость использования геномных кодонов для организмов в GenBank и RefSeq , можно найти в проекте HIVE-Codon Usage Tables (HIVE-CUTs), [1] который содержит две отдельные базы данных: CoCoPUTs и TissueCoCoPUTs. Вместе эти две базы данных предоставляют полную и актуальную статистику использования кодонов, пар кодонов и динуклеотидов для всех организмов с доступной информацией о последовательностях и 52 тканях человека соответственно. [2] [3]

Общепризнано, что смещение кодонов отражает вклад трех основных факторов: конверсию генов, ориентированную на GC , которая благоприятствует кодонам, заканчивающимся GC, в диплоидных организмах, смещение прибытия , отражающее мутационные предпочтения (обычно в пользу кодонов, заканчивающихся AT), и естественный отбор кодонов, которые благоприятны в отношении перевода. [4] [5] [6] Оптимальные кодоны в быстрорастущих микроорганизмах, таких как Escherichia coli или Saccharomyces cerevisiae (пекарские дрожжи), отражают состав соответствующего пула геномных транспортных РНК (тРНК). [7] Считается, что оптимальные кодоны помогают достичь более высокой скорости трансляции и высокой точности. Ожидается, что в результате действия этих факторов трансляционный отбор будет сильнее в генах с высокой экспрессией , что действительно имеет место для вышеупомянутых организмов. [8] [9] В других организмах, которые не демонстрируют высоких темпов роста или имеют небольшие геномы, оптимизация использования кодонов обычно отсутствует, а предпочтения кодонов определяются характерными мутационными отклонениями, наблюдаемыми в этом конкретном геноме. Примерами этого являются Homo sapiens (человек) и Helicobacter pylori . [10] [11] К организмам, демонстрирующим промежуточный уровень оптимизации использования кодонов, относятся Drosophila melanogaster (плодовая мушка), Caenorhabditis elegans ( червь -нематода ), Strongylocentrotus purpuratus ( морской еж ) и Arabidopsis thaliana ( кресс-салат ). [12] Известно, что несколько семейств вирусов ( герпесвирус , лентивирус , папилломавирус , полиомавирус , аденовирус и парвовирус ) кодируют структурные белки , которые демонстрируют сильно искаженное использование кодонов по сравнению с клеткой-хозяином . Было высказано предположение, что эти смещения кодонов играют роль во временной регуляции их поздних белков. [13]

Природа оптимизации использования кодонов и тРНК активно обсуждается. Неясно, стимулирует ли использование кодонов эволюцию тРНК или наоборот. Была разработана по крайней мере одна математическая модель, в которой как использование кодонов, так и экспрессия тРНК развиваются совместно по принципу обратной связи ( т. е . кодоны, уже присутствующие на высоких частотах, повышают экспрессию соответствующих им тРНК, а тРНК, обычно экспрессируемые на высоких уровнях, повышают частоту соответствующих им кодонов). Однако эта модель, похоже, пока не имеет экспериментального подтверждения. Другая проблема заключается в том, что эволюция генов тРНК была очень неактивной областью исследований. [ нужна цитата ]

Способствующие факторы

Было высказано предположение, что с предвзятостью использования кодонов связаны различные факторы, включая уровень экспрессии генов (отражающий отбор для оптимизации процесса трансляции за счет обилия тРНК), содержание гуанина-цитозина (содержание GC, отражающее горизонтальный перенос генов или мутационную ошибку), гуанин-цитозин. перекос (перекос GC, отражающий мутационную предвзятость, специфичную для цепи), консервацию аминокислот , гидропатию белка , транскрипционную селекцию, стабильность РНК, оптимальную температуру роста, адаптацию к гиперсоленому раствору и пищевой азот. [14] [15] [16] [17] [18] [19]

Эволюционные теории

Мутационная предвзятость против отбора

Хотя механизм отбора смещения кодонов остается спорным, возможные объяснения этого смещения делятся на две общие категории. Одно из объяснений вращается вокруг селекционистской теории , согласно которой смещение кодонов способствует эффективности и/или точности экспрессии белка и, следовательно, подвергается положительному отбору . Селекционистская модель также объясняет, почему более частые кодоны распознаются более распространенными молекулами тРНК, а также корреляцию между предпочтительными кодонами, уровнями тРНК и количеством копий гена . Хотя было показано, что скорость включения аминокислот в более частые кодоны происходит с гораздо большей скоростью, чем в редких кодонах, не было показано, что на скорость трансляции это оказывает прямое влияние, и поэтому смещение в сторону более частых кодонов не может быть существенным. быть напрямую выгодным. Однако увеличение скорости элонгации трансляции все же может иметь косвенное преимущество за счет увеличения клеточной концентрации свободных рибосом и, возможно, скорости инициации информационных РНК (мРНК). [20]

Второе объяснение использования кодонов можно объяснить мутационной предвзятостью — теорией, которая утверждает, что смещение кодонов существует из-за неслучайности в мутационных закономерностях. Другими словами, некоторые кодоны могут претерпевать больше изменений и, следовательно, приводить к более низким равновесным частотам, также известным как «редкие» кодоны. Различные организмы также демонстрируют разные мутационные отклонения, и появляется все больше свидетельств того, что уровень содержания GC в масштабах всего генома является наиболее важным параметром, объясняющим различия в смещении кодонов между организмами. Дополнительные исследования показали, что смещения кодонов можно статистически предсказать у прокариот , используя только межгенные последовательности , что противоречит идее селективных сил в кодирующих областях и дополнительно подтверждает модель мутационной предвзятости. Однако сама по себе эта модель не может полностью объяснить, почему предпочтительные кодоны распознаются более распространенными тРНК. [20]

Модель баланса мутаций, выбора и дрейфа

Чтобы согласовать данные, полученные как от мутационного давления , так и от отбора, преобладающая гипотеза о смещении кодонов может быть объяснена с помощью модели баланса мутации-селекции-дрейфа . Эта гипотеза утверждает, что отбор отдает предпочтение главным кодонам над второстепенными, но второстепенные кодоны способны сохраняться из-за давления мутаций и генетического дрейфа . Это также предполагает, что отбор, как правило, слаб, но интенсивность отбора масштабируется до более высокой экспрессии и большего количества функциональных ограничений кодирующих последовательностей. [20]

Последствия состава кодонов

Влияние на вторичную структуру РНК

Поскольку вторичная структура 5'-конца мРНК влияет на эффективность трансляции, синонимичные изменения в этой области мРНК могут привести к глубоким эффектам на экспрессию генов. Таким образом , использование кодонов в некодирующих областях ДНК может играть важную роль во вторичной структуре РНК и последующей экспрессии белков, которые могут подвергаться дальнейшему селективному давлению. В частности, сильная вторичная структура в сайте связывания рибосомы или инициационном кодоне может ингибировать трансляцию, а сворачивание мРНК на 5'-конце приводит к значительному изменению уровней белка. [21]

Влияние на транскрипцию или экспрессию генов

Гетерологичная экспрессия генов используется во многих биотехнологических приложениях, включая производство белков и метаболическую инженерию . Поскольку пулы тРНК различаются у разных организмов, скорость транскрипции и трансляции конкретной кодирующей последовательности может быть менее эффективной, если ее поместить в ненативный контекст. Для сверхэкспрессируемого трансгена соответствующая мРНК составляет большой процент от общей клеточной РНК, а присутствие редких кодонов вдоль транскрипта может привести к неэффективному использованию и истощению рибосом и, в конечном итоге, к снижению уровня продукции гетерологичных белков. Кроме того, на точность трансляции может также влиять состав гена (например, общее количество редких кодонов и наличие последовательных редких кодонов). [22] [23] Однако использование кодонов, оптимизированных для пулов тРНК в конкретном хозяине, для сверхэкспрессии гетерологичного гена может также вызвать аминокислотное голодание и изменить равновесие пулов тРНК. Этот метод корректировки кодонов в соответствии с обилием тРНК хозяина, называемый оптимизацией кодонов , традиционно использовался для экспрессии гетерологичного гена. Однако новые стратегии оптимизации гетерологичной экспрессии учитывают глобальное содержание нуклеотидов, такое как локальное сворачивание мРНК, смещение пар кодонов, наклон кодонов, гармонизацию кодонов или корреляцию кодонов. [24] [25] Учитывая количество внесенных нуклеотидных изменений, для создания такого оптимизированного гена часто необходим искусственный синтез генов .

Специализированное смещение кодонов также наблюдается в некоторых эндогенных генах, например, участвующих в аминокислотном голодании. Например, ферменты биосинтеза аминокислот преимущественно используют кодоны, которые плохо адаптированы к нормальному содержанию тРНК, но имеют кодоны, которые адаптированы к пулам тРНК в условиях голодания. Таким образом, использование кодонов может ввести дополнительный уровень регуляции транскрипции для соответствующей экспрессии генов в определенных клеточных условиях. [25]

Влияние на скорость удлинения трансляции

Вообще говоря, для высокоэкспрессированных генов скорость элонгации трансляции выше в транскриптах с более высокой адаптацией кодонов к пулам тРНК и медленнее в транскриптах с редкими кодонами. Эта корреляция между скоростью трансляции кодонов и концентрацией родственных тРНК обеспечивает дополнительную модуляцию скорости элонгации трансляции, что может дать организму несколько преимуществ. В частности, использование кодонов может обеспечить глобальное регулирование этих скоростей, а редкие кодоны могут способствовать точности трансляции за счет скорости. [26]

Влияние на сворачивание белка

Складывание белка in vivo является векторным , то есть N-конец белка выходит из транслирующей рибосомы и подвергается воздействию растворителя раньше, чем его более C-концевые области. В результате котрансляционное сворачивание белка вводит несколько пространственных и временных ограничений на возникающую полипептидную цепь в ее траектории сворачивания. Поскольку скорость трансляции мРНК связана со сворачиванием белка, а адаптация кодонов связана с удлинением трансляции, было высказано предположение, что манипуляции на уровне последовательности могут быть эффективной стратегией регулирования или улучшения сворачивания белка. Несколько исследований показали, что для некоторых белков происходит приостановка трансляции в результате локальной структуры мРНК, что может быть необходимо для правильного сворачивания. Более того, было показано, что синонимичные мутации имеют значительные последствия в процессе сворачивания возникающего белка и могут даже изменить субстратную специфичность ферментов. Эти исследования показывают, что использование кодонов влияет на скорость, с которой полипептиды векторно выходят из рибосомы, что может дополнительно влиять на пути сворачивания белка во всем доступном структурном пространстве. [26]

Методы анализа

В области биоинформатики и вычислительной биологии было предложено и использовано множество статистических методов для анализа систематической ошибки использования кодонов. [27] Такие методы, как «частота оптимальных кодонов» (Fop), [28] относительная адаптация кодонов (RCA) [29] или индекс адаптации кодонов (CAI) [30] используются для прогнозирования уровней экспрессии генов, в то время как такие методы, как « эффективное число кодонов » (Nc) и энтропия Шеннона из теории информации, используются для измерения равномерности использования кодонов. [31] Многомерные статистические методы, такие как анализ соответствия и анализ главных компонентов , широко используются для анализа различий в использовании кодонов среди генов. [32] Существует множество компьютерных программ для реализации перечисленных выше статистических анализов, включая CodonW, GCUA, INCA и т. д. Оптимизация кодонов находит применение при разработке синтетических генов и ДНК-вакцин . Для этой цели в Интернете доступно несколько пакетов программного обеспечения (см. внешние ссылки). [ нужна цитата ]

Рекомендации

  1. ^ Эти, Джон; Алексаки, Айкатерини; Осипова Екатерина; Ростовцев, Александр; Сантана-Кинтеро, Луис В.; Катнени, Упендра; Симонян, Ваан; Кимчи-Сарфати, Хава (2 сентября 2017 г.). «Новый и обновленный ресурс таблиц использования кодонов». БМК Биоинформатика . 18 (391): 391. doi : 10.1186/s12859-017-1793-7 . ПМК  5581930 . ПМИД  28865429.
  2. ^ Алексаки, Айкатерини; Камес, Джейкоб; Холкомб, Дэвид Д.; Эти, Джон; Сантана-Кинтеро, Луис В.; Лам, Фук Винь Нгуен; Хамасаки-Катагири, Нобуко; Осипова Екатерина; Симонян, Ваган; Бар, Хаим; Комар, Антон А.; Кимчи-Сарфати, Хава (июнь 2019 г.). «Таблицы использования кодонов и пар кодонов (CoCoPUT): облегчение анализа генетических вариаций и дизайна рекомбинантных генов». Журнал молекулярной биологии . 431 (13): 2434–2441. дои : 10.1016/j.jmb.2019.04.021 . PMID  31029701. S2CID  139104807.
  3. ^ Камес, Джейкоб; Алексаки, Айкатерини; Холкомб, Дэвид Д.; Сантана-Кинтеро, Луис В.; Эти, Джон К.; Хамасаки-Катагири, Нобуко; Катнени, Упендра; Голиков, Антон; Ибла, Хуан К.; Бар, Хаим; Кимчи-Сарфати, Чава (январь 2020 г.). «TissueCoCoPUTs: новые таблицы использования тканеспецифичных кодонов и пар кодонов человека, основанные на дифференциальной экспрессии генов в тканях». Журнал молекулярной биологии . 432 (11): 3369–3378. дои : 10.1016/j.jmb.2020.01.011 . ПМИД  31982380.
  4. ^ П. Шах и М.А. Гилкрист (2011). «Объяснение сложных моделей использования кодонов с учетом эффективности трансляции, предвзятости мутаций и генетического дрейфа». Труды Национальной академии наук Соединенных Штатов Америки . 108 (25): 10231–6. дои : 10.1073/pnas.1016719108 . ПМК 3121864 . ПМИД  21646514. 
  5. ^ Л. Дюре и Н. Галтье (2009). «Предвзятая конверсия генов и эволюция геномных ландшафтов млекопитающих». Анну Рев Геномика Хум Генет . 10 : 285–311. doi : 10.1146/annurev-genom-082908-150001.
  6. ^ Н. Галтье, К. Ру, М. Руссель, Ж. Ромигье, Э. Фиге, С. Глемен, Н. Бьерн и Л. Дюре (2018). «Смещение использования кодонов у животных: распутывание эффектов естественного отбора, эффективного размера популяции и GC-предвзятой конверсии генов». Мол Биол Эвол . 35 (5): 1092–1103. дои : 10.1093/molbev/msy015 . hdl : 20.500.12210/34500 .{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  7. ^ Донг, Хэнцзян; Нильссон, Ларс; Курланд, Чарльз Г. (1996). «Ковариация содержания тРНК и использования кодонов в Escherichia coli при разных скоростях роста». Журнал молекулярной биологии . 260 (5): 649–663. дои : 10.1006/jmbi.1996.0428. ISSN  0022-2836. ПМИД  8709146.
  8. ^ Шарп, Пол М.; Стенико, Микеле; Педен, Джон Ф.; Ллойд, Эндрю Т. (1993). «Использование кодонов: мутационная предвзятость, трансляционный отбор или и то, и другое?». Биохим. Соц. Транс . 21 (4): 835–841. дои : 10.1042/bst0210835. PMID  8132077. S2CID  8582630.
  9. ^ Канайя, Сигэхико; Ямада, Юко; Кудо, Ёсихиро; Икемура, Тошимичи (1999). «Исследование использования кодонов и генов тРНК 18 одноклеточных организмов и количественная оценка тРНК Bacillus subtilis : уровень экспрессии генов и видоспецифическое разнообразие использования кодонов на основе многофакторного анализа». Джин . 238 (1): 143–155. дои : 10.1016/s0378-1119(99)00225-5. ISSN  0378-1119. ПМИД  10570992.
  10. ^ Атертон, Джон К.; Шарп, Пол М.; Лафай, Бенедикт (01 апреля 2000 г.). «Отсутствие предвзятости в использовании синонимичных кодонов, выбранных путем трансляции, у Helicobacter pylori». Микробиология . 146 (4): 851–860. дои : 10.1099/00221287-146-4-851 . ISSN  1350-0872. ПМИД  10784043.
  11. ^ Борнелёв, Сюзанна; Сельми, Томмазо; Флад, София; Дитманн, Сабина; Фрай, Микаэла (07.06.2019). «Оптимизация использования кодонов в плюрипотентных эмбриональных стволовых клетках». Геномная биология . 20 (1): 119. дои : 10.1186/s13059-019-1726-z . ISSN  1474-760X. ПМК 6555954 . ПМИД  31174582. 
  12. ^ Дюре, Лоран (2000). «Количество генов тРНК и использование кодонов в геноме C. elegans совместно адаптированы для оптимальной трансляции высокоэкспрессируемых генов». Тенденции в генетике . 16 (7): 287–289. дои : 10.1016/s0168-9525(00)02041-2. ISSN  0168-9525. ПМИД  10858656.
  13. ^ Шин, Янг К.; Бишоф, Георг Ф.; Лауэр, Уильям А.; Дерозье, Рональд К. (10 сентября 2015 г.). «Важность использования кодонов для временной регуляции экспрессии вирусных генов». Труды Национальной академии наук . 112 (45): 14030–14035. Бибкод : 2015PNAS..11214030S. дои : 10.1073/pnas.1515387112 . ПМЦ 4653223 . ПМИД  26504241. 
  14. ^ Ермолаева М.Д. (октябрь 2001 г.). «Использование синонимичных кодонов у бактерий». Curr Issues Мол Биол . 3 (4): 91–7. ПМИД  11719972.
  15. ^ Линн DJ, Singer GA, Hickey DA (октябрь 2002 г.). «У термофильных бактерий использование синонимичных кодонов подлежит отбору». Нуклеиновые кислоты Рез . 30 (19): 4272–7. дои : 10.1093/nar/gkf546. ПМК 140546 . ПМИД  12364606. 
  16. ^ Пол С., Бэг С.К., Дас С., Харвилл Э.Т., Датта С. (2008). «Молекулярная подпись гиперсоленой адаптации: данные о составе генома и протеома галофильных прокариот». Геном Биол . 9 (4): 70 рандов. дои : 10.1186/gb-2008-9-4-r70 . ПМЦ 2643941 . ПМИД  18397532. 
  17. ^ Кобер, К.М.; Погсон, GH (2013). «Общегеномные закономерности смещения кодонов сформированы естественным отбором у пурпурного морского ежа Strongylocentrotus purpuratus». Г3 . 3 (7): 1069–1083. дои : 10.1534/g3.113.005769. ПМЦ 3704236 . ПМИД  23637123. 
  18. ^ Макинерни, Джеймс О. (1 сентября 1998 г.). «Репликационная и транскрипционная селекция использования кодонов в Borrelia burgdorferi». Труды Национальной академии наук . 95 (18): 10698–10703. Бибкод : 1998PNAS...9510698M. дои : 10.1073/pnas.95.18.10698 . ISSN  0027-8424. ПМК 27958 . ПМИД  9724767. 
  19. ^ Сьюард, Эмили; Келли, Стив (2016). «Пищевой азот изменяет смещение кодонов и состав генома паразитических микроорганизмов». Геномная биология . 17 (226): 3–15. дои : 10.1186/s13059-016-1087-9 . ПМК 5109750 . ПМИД  27842572. 
  20. ^ abc Хершберг, Р; Петров, Д.А. (2008). «Отбор по смещению кодонов». Ежегодный обзор генетики . 42 : 287–99. doi : 10.1146/annurev.genet.42.110807.091442. PMID  18983258. S2CID  7085012.
  21. ^ Новоа, EM; Рибас Де Пуплана, L (2012). «Ускорение с контролем: использование кодонов, тРНК и рибосомы». Тенденции в генетике . 28 (11): 574–81. дои : 10.1016/j.tig.2012.07.006. ПМИД  22921354.
  22. ^ Шу, П.; Дай, Х.; Гао, В.; Гольдман, Э. (2006). «Ингибирование трансляции последовательными редкими лейциновыми кодонами в E. coli: отсутствие эффекта различной стабильности мРНК». Джин Экспр . 13 (2): 97–106. дои : 10.3727/000000006783991881. ПМК 6032470 . ПМИД  17017124. 
  23. ^ Корредду, Д.; Монтаньо Лопес, Дж. Д. Дж.; Ангермайр, ЮАР; Миддлдич, MJ; Пейн, Л.С.; Люнг, IKH (2019). «Влияние последовательных редких кодонов на рекомбинантное производство белков человека в Escherichia coli». ИУБМБ Жизнь . 72 (2): 266–274. дои : 10.1002/iub.2162. hdl : 11343/286411 . PMID  31509345. S2CID  202555575.
  24. ^ Миньон, К.; Мариано, Н.; Штадтхаген, Г.; Лугари, А.; Лагут, П.; Доннат, С.; Ченавас, С.; Перо, К.; Содойер, Р.; Верле, Б. (2018). «Гармонизация кодонов - выход за пределы скорости экспрессии белка». Письма ФЭБС . 592 (9): 1554–1564. дои : 10.1002/1873-3468.13046 . ПМИД  29624661.
  25. ^ аб Плоткин, Дж.Б.; Кудла, Г (2011). «Синонимы, но не то же самое: причины и последствия смещения кодонов». Обзоры природы Генетика . 12 (1): 32–42. дои : 10.1038/nrg2899. ПМК 3074964 . ПМИД  21102527. 
  26. ^ АБ Спенсер, PS; Баррал, Дж. М. (2012). «Избыточность генетического кода и ее влияние на кодируемые полипептиды». Журнал вычислительной и структурной биотехнологии . 1 : 1–8. дои : 10.5936/csbj.201204006. ПМЦ 3962081 . ПМИД  24688635. 
  27. ^ Комерон Дж. М., Агуаде М. (сентябрь 1998 г.). «Оценка мер систематической ошибки использования синонимических кодонов». Дж. Мол. Эвол . 47 (3): 268–74. Бибкод : 1998JMolE..47..268C. дои : 10.1007/PL00006384. PMID  9732453. S2CID  21862217.
  28. ^ Икемура Т. (сентябрь 1981 г.). «Корреляция между количеством транспортных РНК Escherichia coli и наличием соответствующих кодонов в генах ее белков: предложение по выбору синонимичных кодонов, оптимальному для системы трансляции E. coli». Дж. Мол. Биол . 151 (3): 389–409. дои : 10.1016/0022-2836(81)90003-6. ПМИД  6175758.
  29. ^ Fox JM, Эрилл I (июнь 2010 г.). «Относительная адаптация кодонов: общий индекс смещения кодонов для прогнозирования экспрессии генов». ДНК Рез . 17 (3): 185–96. doi : 10.1093/dnares/dsq012. ПМЦ 2885275 . ПМИД  20453079. 
  30. ^ Шарп, Пол М .; Ли, Вэнь-Сюн (1987). «Индекс адаптации кодонов - мера направленной предвзятости использования синонимичных кодонов и его потенциальные применения». Исследования нуклеиновых кислот . 15 (3): 1281–1295. дои : 10.1093/нар/15.3.1281. ПМК 340524 . ПМИД  3547335. 
  31. ^ Педен Дж (15 апреля 2005 г.). «Индексы использования кодонов». Соответствующий анализ использования кодонов . СоурсФордж . Проверено 20 октября 2010 г.
  32. ^ Suzuki H, Brown CJ, Forney LJ, Top EM (декабрь 2008 г.). «Сравнение методов анализа соответствия использования синонимичных кодонов у бактерий». ДНК Рез . 15 (6): 357–65. doi : 10.1093/dnares/dsn028. ПМЦ 2608848 . ПМИД  18940873. 

Внешние ссылки