stringtranslate.com

Смещение использования кодона

Смещение использования кодонов у Physcomitrella patens

Смещение использования кодонов относится к различиям в частоте встречаемости синонимичных кодонов в кодирующей ДНК . Кодон — это серия из трех нуклеотидов (триплет), которая кодирует определенный аминокислотный остаток в полипептидной цепи или для прекращения трансляции ( стоп-кодоны ).

Существует 64 различных кодона (61 кодон, кодирующий аминокислоты, и 3 стоп-кодона), но только 20 различных транслируемых аминокислот. Избыток кодонов позволяет кодировать многие аминокислоты более чем одним кодоном. Из-за такой избыточности говорят, что генетический код вырожден. Генетические коды разных организмов часто склонны использовать один из нескольких кодонов, кодирующих одну и ту же аминокислоту, по сравнению с другими, то есть будет обнаружена большая частота одного, чем ожидалось, случайно. То, как возникают такие смещения, является широко обсуждаемой областью молекулярной эволюции . Таблицы использования кодонов, подробно описывающие смещение использования геномных кодонов для организмов в GenBank и RefSeq, можно найти в проекте HIVE-Codon Usage Tables (HIVE-CUTs) [ нерабочая ссылка ] , [1], который содержит две отдельные базы данных, CoCoPUTs и TissueCoCoPUTs. Вместе эти две базы данных предоставляют полную, актуальную статистику использования кодонов, пар кодонов и динуклеотидов для всех организмов с доступной информацией о последовательностях и 52 тканей человека соответственно. [2] [3]

Общепризнано, что смещения кодонов отражают вклады 3 основных факторов: GC-смещенная генная конверсия , которая благоприятствует GC-оканчивающимся кодонам в диплоидных организмах, смещения прибытия, отражающие мутационные предпочтения (обычно благоприятствующие AT-оканчивающимся кодонам), и естественный отбор для кодонов, которые благоприятны в отношении трансляции. [4] [5] [6] Оптимальные кодоны в быстрорастущих микроорганизмах, таких как Escherichia coli или Saccharomyces cerevisiae (пекарские дрожжи), отражают состав их соответствующего геномного пула транспортной РНК (тРНК). [7] Считается, что оптимальные кодоны помогают достичь более высоких скоростей трансляции и высокой точности. В результате этих факторов ожидается, что трансляционный отбор будет сильнее в высокоэкспрессируемых генах , как это действительно имеет место для вышеупомянутых организмов. [8] [9] В других организмах, которые не показывают высоких скоростей роста или которые представляют небольшие геномы, оптимизация использования кодонов обычно отсутствует, и предпочтения кодонов определяются характерными мутационными смещениями, наблюдаемыми в этом конкретном геноме. Примерами этого являются Homo sapiens (человек) и Helicobacter pylori . [10] [11] Организмы, которые показывают промежуточный уровень оптимизации использования кодонов, включают Drosophila melanogaster (плодовая мушка), Caenorhabditis elegans (круглый червь ), Strongylocentrotus purpuratus ( морской еж ) и Arabidopsis thaliana ( кресс-салат Таля ). [12] Известно, что несколько семейств вирусов ( герпесвирус , лентивирус , папилломавирус , полиомавирус , аденовирус и парвовирус ) кодируют структурные белки , которые демонстрируют сильно искаженное использование кодонов по сравнению с клеткой-хозяином . Было высказано предположение, что эти смещения кодонов играют роль во временной регуляции их поздних белков. [13]

Природа оптимизации использования кодонов-тРНК была предметом яростных споров. Неясно, влияет ли использование кодонов на эволюцию тРНК или наоборот. Была разработана по крайней мере одна математическая модель, в которой и использование кодонов, и экспрессия тРНК ко-эволюционируют по принципу обратной связи ( т. е . кодоны, уже присутствующие на высоких частотах, увеличивают экспрессию соответствующих им тРНК, а тРНК, обычно экспрессирующиеся на высоких уровнях, увеличивают частоту соответствующих им кодонов). Однако эта модель, похоже, пока не получила экспериментального подтверждения. Другая проблема заключается в том, что эволюция генов тРНК была очень неактивной областью исследований. [ требуется цитата ]

Факторы, способствующие

Было предложено связать различные факторы со смещением использования кодонов, включая уровень экспрессии генов (отражающий отбор для оптимизации процесса трансляции по обилию тРНК), содержание гуанина-цитозина (содержание GC, отражающее горизонтальный перенос генов или мутационное смещение), перекос гуанина-цитозина (перекос GC, отражающий мутационное смещение, специфичное для цепи), сохранение аминокислот , гидропатию белков , транскрипционный отбор, стабильность РНК, оптимальную температуру роста, адаптацию к гиперсолености и диетический азот. [14] [15] [16] [17] [18] [19]

Теории эволюции

Мутационная предвзятость против отбора

Хотя механизм выбора смещения кодонов остается спорным, возможные объяснения этого смещения делятся на две общие категории. Одно объяснение вращается вокруг теории селекционизма , в которой смещение кодонов способствует эффективности и/или точности экспрессии белка и, следовательно, подвергается положительному отбору . Модель селекционизма также объясняет, почему более частые кодоны распознаются более распространенными молекулами тРНК, а также корреляцию между предпочтительными кодонами, уровнями тРНК и числом копий генов . Хотя было показано, что скорость включения аминокислот в более частые кодоны происходит с гораздо большей скоростью, чем в редких кодонах, не было показано, что скорость трансляции напрямую затронута, и поэтому смещение в сторону более частых кодонов может не быть напрямую выгодным. Однако увеличение скорости удлинения трансляции все еще может быть косвенно выгодным за счет увеличения клеточной концентрации свободных рибосом и, возможно, скорости инициации для матричных РНК (мРНК). [20]

Второе объяснение использования кодонов можно объяснить мутационным смещением , теорией, которая утверждает, что смещение кодонов существует из-за неслучайности в мутационных моделях. Другими словами, некоторые кодоны могут претерпевать больше изменений и, следовательно, приводить к более низким частотам равновесия, также известным как «редкие» кодоны. Различные организмы также демонстрируют различные мутационные смещения, и появляется все больше доказательств того, что уровень содержания GC по всему геному является наиболее значимым параметром при объяснении различий смещения кодонов между организмами. Дополнительные исследования продемонстрировали, что смещения кодонов можно статистически предсказать у прокариот, используя только межгенные последовательности , что противоречит идее селективных сил на кодирующих областях и дополнительно подтверждает модель смещения мутаций. Однако эта модель сама по себе не может полностью объяснить, почему предпочтительные кодоны распознаются более распространенными тРНК. [20]

Модель баланса мутации-селекции-дрейфа

Чтобы примирить доказательства как мутационного давления , так и отбора, преобладающая гипотеза смещения кодонов может быть объяснена моделью баланса мутация-селекция-дрейф . Эта гипотеза утверждает, что отбор благоприятствует основным кодонам по сравнению с второстепенными, но второстепенные кодоны способны сохраняться из-за мутационного давления и генетического дрейфа . Она также предполагает, что отбор, как правило, слаб, но что интенсивность отбора масштабируется до более высокой экспрессии и более функциональных ограничений кодирующих последовательностей. [20]

Последствия состава кодонов

Влияние на вторичную структуру РНК

Поскольку вторичная структура 5'-конца мРНК влияет на эффективность трансляции, синонимичные изменения в этой области мРНК могут привести к глубоким эффектам на экспрессию генов. Использование кодонов в некодирующих областях ДНК может, таким образом, играть важную роль во вторичной структуре РНК и экспрессии белка ниже по течению, которые могут подвергаться дальнейшему селективному давлению. В частности, сильная вторичная структура в месте связывания рибосомы или инициирующем кодоне может ингибировать трансляцию, а сворачивание мРНК на 5'-конце генерирует большое количество вариаций в уровнях белка. [21]

Влияние на транскрипцию или экспрессию генов

Гетерологичная экспрессия генов используется во многих биотехнологических приложениях, включая производство белков и метаболическую инженерию . Поскольку пулы тРНК различаются у разных организмов, скорость транскрипции и трансляции определенной кодирующей последовательности может быть менее эффективной при помещении в неродной контекст. Для сверхэкспрессированного трансгена соответствующая мРНК составляет большой процент от общей клеточной РНК, а наличие редких кодонов вдоль транскрипта может привести к неэффективному использованию и истощению рибосом и в конечном итоге снизить уровни производства гетерологичного белка. Кроме того, состав гена (например, общее количество редких кодонов и наличие последовательных редких кодонов) также может влиять на точность трансляции. [22] [23] Однако использование кодонов, оптимизированных для пулов тРНК в конкретном хозяине, для сверхэкспрессии гетерологичного гена также может вызвать аминокислотное голодание и изменить равновесие пулов тРНК. Этот метод корректировки кодонов для соответствия распространенности тРНК хозяина, называемый оптимизацией кодонов , традиционно использовался для экспрессии гетерологичного гена. Однако новые стратегии оптимизации гетерологичной экспрессии учитывают глобальное содержание нуклеотидов, такое как локальная укладка мРНК, смещение пар кодонов, рампа кодонов, гармонизация кодонов или корреляции кодонов. [24] [25] С учетом количества внесенных изменений нуклеотидов для создания такого оптимизированного гена часто необходим искусственный синтез генов .

Специализированный смещение кодонов далее наблюдается в некоторых эндогенных генах, таких как те, которые участвуют в аминокислотном голодании. Например, ферменты биосинтеза аминокислот предпочтительно используют кодоны, которые плохо адаптированы к нормальному содержанию тРНК, но имеют кодоны, которые адаптированы к пулам тРНК в условиях голодания. Таким образом, использование кодонов может ввести дополнительный уровень транскрипционной регуляции для соответствующей экспрессии генов в определенных клеточных условиях. [25]

Влияние на скорость удлинения трансляции

В целом, для высокоэкспрессируемых генов скорость удлинения трансляции выше вдоль транскриптов с более высокой адаптацией кодонов к пулам тРНК и ниже вдоль транскриптов с редкими кодонами. Эта корреляция между скоростью трансляции кодонов и концентрацией родственных тРНК обеспечивает дополнительную модуляцию скорости удлинения трансляции, что может дать организму несколько преимуществ. В частности, использование кодонов может обеспечить глобальную регуляцию этих скоростей, а редкие кодоны могут способствовать точности трансляции за счет скорости. [26]

Влияние на сворачивание белка

Сворачивание белка in vivo является векторным , так что N-конец белка выходит из транслирующей рибосомы и становится открытым для растворителя до его более C-концевых областей. В результате котрансляционное сворачивание белка вводит несколько пространственных и временных ограничений на формирующуюся полипептидную цепь в ее траектории сворачивания. Поскольку скорости трансляции мРНК связаны с сворачиванием белка, а адаптация кодонов связана с удлинением трансляции, была выдвинута гипотеза, что манипуляция на уровне последовательности может быть эффективной стратегией для регулирования или улучшения сворачивания белка. Несколько исследований показали, что приостановка трансляции в результате локальной структуры мРНК происходит для определенных белков, что может быть необходимо для правильного сворачивания. Кроме того, было показано, что синонимичные мутации имеют значительные последствия в процессе сворачивания формирующегося белка и могут даже изменить субстратную специфичность ферментов. Эти исследования показывают, что использование кодонов влияет на скорость, с которой полипептиды векторно выходят из рибосомы, что может дополнительно влиять на пути сворачивания белка во всем доступном структурном пространстве. [26]

Методы анализа

В области биоинформатики и вычислительной биологии было предложено и использовано множество статистических методов для анализа смещения использования кодонов. [27] Такие методы, как «частота оптимальных кодонов» (Fop), [28] относительная адаптация кодонов (RCA) [29] или индекс адаптации кодонов (CAI) [30] используются для прогнозирования уровней экспрессии генов, в то время как такие методы, как « эффективное число кодонов » (Nc) и энтропия Шеннона из теории информации , используются для измерения равномерности использования кодонов. [ 31] Многомерные статистические методы, такие как анализ соответствий и анализ главных компонентов , широко используются для анализа вариаций использования кодонов среди генов. [32] Существует множество компьютерных программ для реализации перечисленных выше статистических анализов, включая CodonW, GCUA, INCA и т. д. Оптимизация кодонов применяется при проектировании синтетических генов и ДНК-вакцин . Для этой цели в Интернете доступно несколько пакетов программного обеспечения (см. внешние ссылки). [ требуется цитирование ]

Ссылки

  1. ^ Athey, John; Alexaki, Aikaterini; Osipova, Ekaterina; Growthtsev, Alexandre; Santana-Quintero, Luis V.; Katneni, Upendra; Simonyan, Vahan; Kimchi-Sarfaty, Chava (2017-09-02). "Новый и обновленный ресурс для таблиц использования кодонов". BMC Bioinformatics . 18 (391): 391. doi : 10.1186/s12859-017-1793-7 . PMC  5581930 . PMID  28865429.
  2. ^ Алексаки, Айкатерини; Камес, Джейкоб; Холкомб, Дэвид Д.; Атей, Джон; Сантана-Кинтеро, Луис В.; Лам, Фук Вьен Нгуен; Хамасаки-Катагири, Нобуко; Осипова, Екатерина; Симонян, Вахан; Бар, Хаим; Комар, Антон А.; Кимчи-Сарфати, Чава (июнь 2019 г.). «Таблицы использования кодонов и кодоновых пар (CoCoPUTs): упрощение анализа генетических вариаций и дизайна рекомбинантных генов». Журнал молекулярной биологии . 431 (13): 2434–2441. doi : 10.1016/j.jmb.2019.04.021 . PMID  31029701. S2CID  139104807.
  3. ^ Камес, Якоб; Алексаки, Айкатерини; Холкомб, Дэвид Д.; Сантана-Кинтеро, Луис В.; Атей, Джон К.; Хамасаки-Катагири, Нобуко; Катнени, Упендра; Голиков, Антон; Ибла, Хуан К.; Бар, Хаим; Кимчи-Сарфати, Чава (январь 2020 г.). «TissueCoCoPUTs: Новые таблицы использования кодонов и пар кодонов, специфичных для тканей человека, на основе дифференциальной экспрессии генов в тканях». Журнал молекулярной биологии . 432 (11): 3369–3378. doi : 10.1016/j.jmb.2020.01.011 . PMID  31982380.
  4. ^ P. Shah и MA Gilchrist (2011). «Объяснение сложных моделей использования кодонов с помощью отбора для трансляционной эффективности, смещения мутаций и генетического дрейфа». Труды Национальной академии наук Соединенных Штатов Америки . 108 (25): 10231–6. doi : 10.1073/pnas.1016719108 . PMC 3121864. PMID  21646514 . 
  5. ^ Л. Дюре и Н. Гальтье (2009). «Предвзятая конверсия генов и эволюция геномных ландшафтов млекопитающих». Annu Rev Genomics Hum Genet . 10 : 285–311. doi :10.1146/annurev-genom-082908-150001.
  6. ^ N. Galtier, C. Roux, M. Rousselle, J. Romiguier, E. Figuet, S. Glemin, N. Bierne и L. Duret (2018). «Смещение использования кодонов у животных: распутывание эффектов естественного отбора, эффективного размера популяции и GC-смещенной конверсии генов». Mol Biol Evol . 35 (5): 1092–1103. doi : 10.1093/molbev/msy015 . hdl : 20.500.12210/34500 .{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  7. ^ Dong, Hengjiang; Nilsson, Lars; Kurland, Charles G. (1996). «Ковариация обилия тРНК и использования кодонов в Escherichia coli при разных скоростях роста». Журнал молекулярной биологии . 260 (5): 649–663. doi :10.1006/jmbi.1996.0428. ISSN  0022-2836. PMID  8709146.
  8. ^ Sharp, Paul M.; Stenico, Michele; Peden, John F.; Lloyd, Andrew T. (1993). «Использование кодонов: мутационное смещение, трансляционный отбор или оба?». Biochem. Soc. Trans . 21 (4): 835–841. doi :10.1042/bst0210835. PMID  8132077. S2CID  8582630.
  9. ^ Каная, Шигехико; Ямада, Юко; Кудо, Ёсихиро; Икемура, Тошимичи (1999). «Исследования использования кодонов и генов тРНК 18 одноклеточных организмов и количественная оценка тРНК Bacillus subtilis : уровень экспрессии генов и видовое разнообразие использования кодонов на основе многомерного анализа». Gene . 238 (1): 143–155. doi :10.1016/s0378-1119(99)00225-5. ISSN  0378-1119. PMID  10570992.
  10. ^ Атертон, Джон К.; Шарп, Пол М.; Лафей, Бенедикт (2000-04-01). «Отсутствие смещения использования синонимичных кодонов в Helicobacter pylori, выбранного в ходе трансляции». Микробиология . 146 (4): 851–860. doi : 10.1099/00221287-146-4-851 . ISSN  1350-0872. PMID  10784043.
  11. ^ Борнелёв, Сюзанна; Сельми, Томмасо; Флад, София; Дитманн, Сабина; Фрай, Микаэла (2019-06-07). «Оптимизация использования кодонов в плюрипотентных эмбриональных стволовых клетках». Genome Biology . 20 (1): 119. doi : 10.1186/s13059-019-1726-z . ISSN  1474-760X. PMC 6555954. PMID  31174582 . 
  12. ^ Дюре, Лоран (2000). «Число генов тРНК и использование кодонов в геноме C. elegans коадаптированы для оптимальной трансляции высокоэкспрессируемых генов». Trends in Genetics . 16 (7): 287–289. doi :10.1016/s0168-9525(00)02041-2. ISSN  0168-9525. PMID  10858656.
  13. ^ Шин, Янг К.; Бишоф, Георг Ф.; Лауэр, Уильям А.; Дерозье, Рональд К. (2015-09-10). «Важность использования кодонов для временной регуляции экспрессии вирусных генов». Труды Национальной академии наук . 112 (45): 14030–14035. Bibcode : 2015PNAS..11214030S. doi : 10.1073/pnas.1515387112 . PMC 4653223. PMID  26504241 . 
  14. ^ Ермолаева МД (октябрь 2001). «Использование синонимичных кодонов у бактерий». Curr Issues Mol Biol . 3 (4): 91–7. PMID  11719972.
  15. ^ Lynn DJ, Singer GA, Hickey DA (октябрь 2002 г.). «Использование синонимичных кодонов у термофильных бактерий зависит от отбора». Nucleic Acids Res . 30 (19): 4272–7. doi :10.1093/nar/gkf546. PMC 140546. PMID  12364606 . 
  16. ^ Paul S, Bag SK, Das S, Harvill ET, Dutta C (2008). «Молекулярная сигнатура адаптации к гиперсолености: выводы из состава генома и протеома галофильных прокариот». Genome Biol . 9 (4): R70. doi : 10.1186/gb-2008-9-4-r70 . PMC 2643941. PMID  18397532 . 
  17. ^ Кобер, К. М.; Погсон, Г. Х. (2013). «Геномные паттерны смещения кодонов формируются естественным отбором у пурпурного морского ежа Strongylocentrotus purpuratus». G3 . 3 (7): 1069–1083. doi :10.1534/g3.113.005769. PMC 3704236 . PMID  23637123. 
  18. ^ МакИнерни, Джеймс О. (1998-09-01). «Репликативный и транскрипционный отбор по использованию кодонов в Borrelia burgdorferi». Труды Национальной академии наук . 95 (18): 10698–10703. Bibcode : 1998PNAS...9510698M. doi : 10.1073/pnas.95.18.10698 . ISSN  0027-8424. PMC 27958. PMID 9724767  . 
  19. ^ Сьюард, Эмили; Келли, Стив (2016). «Диетический азот изменяет смещение кодонов и состав генома у паразитических микроорганизмов». Genome Biology . 17 (226): 3–15. doi : 10.1186/s13059-016-1087-9 . PMC 5109750. PMID  27842572 . 
  20. ^ abc Hershberg, R; Petrov, DA (2008). «Отбор по смещению кодонов». Annual Review of Genetics . 42 : 287–99. doi : 10.1146/annurev.genet.42.110807.091442. PMID  18983258. S2CID  7085012.
  21. ^ Новоа, Э. М.; Рибас Де Поуплана, Л. (2012). «Ускорение с контролем: использование кодонов, тРНК и рибосомы». Тенденции в генетике . 28 (11): 574–81. doi :10.1016/j.tig.2012.07.006. PMID  22921354.
  22. ^ Шу, П.; Дай, Х.; Гао, В.; Голдман, Э. (2006). «Ингибирование трансляции последовательными редкими кодонами лейцина в E. coli: отсутствие эффекта различной стабильности мРНК». Gene Expr . 13 (2): 97–106. doi :10.3727/000000006783991881. PMC 6032470. PMID  17017124 . 
  23. ^ Correddu, D.; Montaño López, J. d. J.; Angermayr, SA; Middleditch, MJ; Payne, LS; Leung, IKH (2019). «Влияние последовательных редких кодонов на рекомбинантное производство человеческих белков в Escherichia coli». IUBMB Life . 72 (2): 266–274. doi : 10.1002/iub.2162. hdl : 11343/286411 . PMID  31509345. S2CID  202555575.
  24. ^ Миньон, К.; Мариано, Н.; Штадтаген, Г.; Лугари, А.; Лагут, П.; Доннат, С.; Ченавас, С.; Перо, К.; Содоер, Р.; Верле, Б. (2018). «Гармонизация кодонов — выход за пределы ограничения скорости экспрессии белка». FEBS Letters . 592 (9): 1554–1564. doi : 10.1002/1873-3468.13046 . PMID  29624661.
  25. ^ ab Plotkin, JB; Kudla, G (2011). «Синонимичные, но не одинаковые: причины и последствия смещения кодонов». Nature Reviews Genetics . 12 (1): 32–42. doi :10.1038/nrg2899. PMC 3074964. PMID  21102527 . 
  26. ^ ab Spencer, PS; Barral, JM (2012). «Избыточность генетического кода и ее влияние на кодируемые полипептиды». Computational and Structural Biotechnology Journal . 1 : 1–8. doi : 10.5936/csbj.201204006. PMC 3962081. PMID  24688635 . 
  27. ^ Comeron JM, Aguadé M (сентябрь 1998 г.). «Оценка мер смещения синонимичного использования кодонов». J. Mol. Evol . 47 (3): 268–74. Bibcode :1998JMolE..47..268C. doi :10.1007/PL00006384. PMID  9732453. S2CID  21862217.
  28. ^ Ikemura T (сентябрь 1981 г.). «Корреляция между обилием РНК-переносчиков Escherichia coli и встречаемостью соответствующих кодонов в генах ее белков: предложение о выборе синонимичного кодона, оптимального для трансляционной системы E. coli». J. Mol. Biol . 151 (3): 389–409. doi :10.1016/0022-2836(81)90003-6. PMID  6175758.
  29. ^ Fox JM, Erill I (июнь 2010 г.). «Относительная адаптация кодонов: общий индекс смещения кодонов для прогнозирования экспрессии генов». DNA Res . 17 (3): 185–96. doi :10.1093/dnares/dsq012. PMC 2885275. PMID  20453079 . 
  30. ^ Шарп, Пол М .; Ли, Вэнь-Сюн (1987). «Индекс адаптации кодонов — мера направленного смещения синонимичного использования кодонов и его потенциальное применение». Nucleic Acids Research . 15 (3): 1281–1295. doi :10.1093/nar/15.3.1281. PMC 340524. PMID  3547335 . 
  31. ^ Peden J (2005-04-15). "Индексы использования кодонов". Анализ соответствия использования кодонов . SourceForge . Получено 2010-10-20 .
  32. ^ Suzuki H, Brown CJ, Forney LJ, Top EM (декабрь 2008 г.). «Сравнение методов анализа соответствий для использования синонимичных кодонов у бактерий». DNA Res . 15 (6): 357–65. doi :10.1093/dnares/dsn028. PMC 2608848. PMID  18940873 . 

Внешние ссылки