Смещение использования кодонов относится к различиям в частоте встречаемости синонимичных кодонов в кодирующей ДНК . Кодон — это серия из трех нуклеотидов (триплет), которая кодирует определенный аминокислотный остаток в полипептидной цепи или для прекращения трансляции ( стоп-кодоны ).
Существует 64 различных кодона (61 кодон, кодирующий аминокислоты, и 3 стоп-кодона), но только 20 различных транслируемых аминокислот. Избыток кодонов позволяет кодировать многие аминокислоты более чем одним кодоном. Из-за такой избыточности говорят, что генетический код вырожден. Генетические коды разных организмов часто склонны использовать один из нескольких кодонов, кодирующих одну и ту же аминокислоту, по сравнению с другими, то есть, будет обнаружена большая частота одного, чем ожидалось, случайно. То, как возникают такие смещения, является широко обсуждаемой областью молекулярной эволюции . Таблицы использования кодонов, подробно описывающие смещение использования геномных кодонов для организмов в GenBank и RefSeq, можно найти в проекте HIVE-Codon Usage Tables (HIVE-CUTs) [ нерабочая ссылка ] , [1] , который содержит две отдельные базы данных, CoCoPUTs и TissueCoCoPUTs. Вместе эти две базы данных предоставляют полную, актуальную статистику использования кодонов, пар кодонов и динуклеотидов для всех организмов с доступной информацией о последовательностях и 52 тканей человека соответственно. [2] [3]
Общепризнано, что смещения кодонов отражают вклады 3 основных факторов: GC-смещенная генная конверсия , которая благоприятствует GC-оканчивающимся кодонам в диплоидных организмах, смещения прибытия, отражающие мутационные предпочтения (обычно благоприятствующие AT-оканчивающимся кодонам), и естественный отбор для кодонов, которые благоприятны в отношении трансляции. [4] [5] [6] Оптимальные кодоны в быстрорастущих микроорганизмах, таких как Escherichia coli или Saccharomyces cerevisiae (пекарские дрожжи), отражают состав их соответствующего геномного пула транспортной РНК (тРНК). [7] Считается, что оптимальные кодоны помогают достичь более высоких скоростей трансляции и высокой точности. В результате этих факторов ожидается, что трансляционный отбор будет сильнее в высокоэкспрессируемых генах , как это действительно имеет место для вышеупомянутых организмов. [8] [9] В других организмах, которые не показывают высоких скоростей роста или которые представляют небольшие геномы, оптимизация использования кодонов обычно отсутствует, и предпочтения кодонов определяются характерными мутационными смещениями, наблюдаемыми в этом конкретном геноме. Примерами этого являются Homo sapiens (человек) и Helicobacter pylori . [10] [11] Организмы, которые показывают промежуточный уровень оптимизации использования кодонов, включают Drosophila melanogaster (плодовая мушка), Caenorhabditis elegans (круглый червь ), Strongylocentrotus purpuratus ( морской еж ) и Arabidopsis thaliana ( кресс-салат Таля ). [12] Известно, что несколько семейств вирусов ( герпесвирус , лентивирус , папилломавирус , полиомавирус , аденовирус и парвовирус ) кодируют структурные белки , которые демонстрируют сильно перекошенное использование кодонов по сравнению с клеткой-хозяином . Было высказано предположение, что эти смещения кодонов играют роль во временной регуляции их поздних белков. [13]
Природа оптимизации использования кодонов-тРНК была предметом яростных споров. Неясно, влияет ли использование кодонов на эволюцию тРНК или наоборот. Была разработана по крайней мере одна математическая модель, в которой и использование кодонов, и экспрессия тРНК ко-эволюционируют по принципу обратной связи ( т. е . кодоны, уже присутствующие на высоких частотах, увеличивают экспрессию соответствующих им тРНК, а тРНК, обычно экспрессирующиеся на высоких уровнях, увеличивают частоту соответствующих им кодонов). Однако эта модель, похоже, пока не получила экспериментального подтверждения. Другая проблема заключается в том, что эволюция генов тРНК была очень неактивной областью исследований. [ требуется цитата ]
Было предложено связать различные факторы со смещением использования кодонов, включая уровень экспрессии генов (отражающий отбор для оптимизации процесса трансляции по обилию тРНК), содержание гуанина-цитозина (содержание GC, отражающее горизонтальный перенос генов или мутационное смещение), перекос гуанина-цитозина (перекос GC, отражающий мутационное смещение, специфичное для цепи), сохранение аминокислот , гидропатию белков , транскрипционный отбор, стабильность РНК, оптимальную температуру роста, адаптацию к гиперсолености и диетический азот. [14] [15] [16] [17] [18] [19]
Хотя механизм выбора смещения кодонов остается спорным, возможные объяснения этого смещения делятся на две общие категории. Одно объяснение вращается вокруг теории селекционизма , в которой смещение кодонов способствует эффективности и/или точности экспрессии белка и, следовательно, подвергается положительному отбору . Модель селекционизма также объясняет, почему более частые кодоны распознаются более распространенными молекулами тРНК, а также корреляцию между предпочтительными кодонами, уровнями тРНК и числом копий генов . Хотя было показано, что скорость включения аминокислот в более частые кодоны происходит с гораздо большей скоростью, чем в редких кодонах, не было показано, что скорость трансляции напрямую затронута, и поэтому смещение в сторону более частых кодонов может не быть напрямую выгодным. Однако увеличение скорости удлинения трансляции все еще может быть косвенно выгодным за счет увеличения клеточной концентрации свободных рибосом и, возможно, скорости инициации для матричных РНК (мРНК). [20]
Второе объяснение использования кодонов можно объяснить мутационным смещением , теорией, которая утверждает, что смещение кодонов существует из-за неслучайности в мутационных моделях. Другими словами, некоторые кодоны могут претерпевать больше изменений и, следовательно, приводить к более низким частотам равновесия, также известным как «редкие» кодоны. Различные организмы также демонстрируют различные мутационные смещения, и появляется все больше доказательств того, что уровень содержания GC по всему геному является наиболее значимым параметром при объяснении различий смещения кодонов между организмами. Дополнительные исследования продемонстрировали, что смещения кодонов можно статистически предсказать у прокариот, используя только межгенные последовательности , что противоречит идее селективных сил на кодирующих областях и дополнительно подтверждает модель смещения мутаций. Однако эта модель сама по себе не может полностью объяснить, почему предпочтительные кодоны распознаются более распространенными тРНК. [20]
Чтобы примирить доказательства как мутационного давления , так и отбора, преобладающая гипотеза смещения кодонов может быть объяснена моделью баланса мутация-селекция-дрейф . Эта гипотеза утверждает, что отбор благоприятствует основным кодонам по сравнению с второстепенными, но второстепенные кодоны способны сохраняться из-за мутационного давления и генетического дрейфа . Она также предполагает, что отбор, как правило, слаб, но что интенсивность отбора масштабируется до более высокой экспрессии и более функциональных ограничений кодирующих последовательностей. [20]
Поскольку вторичная структура 5'-конца мРНК влияет на эффективность трансляции, синонимичные изменения в этой области мРНК могут привести к глубоким эффектам на экспрессию генов. Использование кодонов в некодирующих областях ДНК может, таким образом, играть важную роль во вторичной структуре РНК и экспрессии белка ниже по течению, которые могут подвергаться дальнейшему селективному давлению. В частности, сильная вторичная структура в месте связывания рибосомы или инициирующем кодоне может ингибировать трансляцию, а сворачивание мРНК на 5'-конце генерирует большое количество вариаций в уровнях белка. [21]
Гетерологичная экспрессия генов используется во многих биотехнологических приложениях, включая производство белков и метаболическую инженерию . Поскольку пулы тРНК различаются у разных организмов, скорость транскрипции и трансляции определенной кодирующей последовательности может быть менее эффективной при помещении в неродной контекст. Для сверхэкспрессированного трансгена соответствующая мРНК составляет большой процент от общей клеточной РНК, а наличие редких кодонов вдоль транскрипта может привести к неэффективному использованию и истощению рибосом и в конечном итоге снизить уровни производства гетерологичного белка. Кроме того, состав гена (например, общее количество редких кодонов и наличие последовательных редких кодонов) также может влиять на точность трансляции. [22] [23] Однако использование кодонов, оптимизированных для пулов тРНК в конкретном хозяине, для сверхэкспрессии гетерологичного гена также может вызвать аминокислотное голодание и изменить равновесие пулов тРНК. Этот метод корректировки кодонов для соответствия распространенности тРНК хозяина, называемый оптимизацией кодонов , традиционно использовался для экспрессии гетерологичного гена. Однако новые стратегии оптимизации гетерологичной экспрессии учитывают глобальное содержание нуклеотидов, такое как локальная укладка мРНК, смещение пар кодонов, рампа кодонов, гармонизация кодонов или корреляции кодонов. [24] [25] С учетом количества внесенных изменений нуклеотидов для создания такого оптимизированного гена часто необходим искусственный синтез генов .
Специализированный смещение кодонов далее наблюдается в некоторых эндогенных генах, таких как те, которые участвуют в аминокислотном голодании. Например, ферменты биосинтеза аминокислот предпочтительно используют кодоны, которые плохо адаптированы к нормальному содержанию тРНК, но имеют кодоны, которые адаптированы к пулам тРНК в условиях голодания. Таким образом, использование кодонов может ввести дополнительный уровень транскрипционной регуляции для соответствующей экспрессии генов в определенных клеточных условиях. [25]
В целом, для высокоэкспрессируемых генов скорость удлинения трансляции выше вдоль транскриптов с более высокой адаптацией кодонов к пулам тРНК и ниже вдоль транскриптов с редкими кодонами. Эта корреляция между скоростью трансляции кодонов и концентрациями родственных тРНК обеспечивает дополнительную модуляцию скорости удлинения трансляции, что может дать организму несколько преимуществ. В частности, использование кодонов может обеспечить глобальную регуляцию этих скоростей, а редкие кодоны могут способствовать точности трансляции за счет скорости. [26]
Сворачивание белка in vivo является векторным , так что N-конец белка выходит из транслирующей рибосомы и становится открытым для растворителя до его более C-концевых областей. В результате котрансляционное сворачивание белка вводит несколько пространственных и временных ограничений на формирующуюся полипептидную цепь в ее траектории сворачивания. Поскольку скорости трансляции мРНК связаны с сворачиванием белка, а адаптация кодонов связана с удлинением трансляции, была выдвинута гипотеза, что манипуляция на уровне последовательности может быть эффективной стратегией для регулирования или улучшения сворачивания белка. Несколько исследований показали, что приостановка трансляции в результате локальной структуры мРНК происходит для определенных белков, что может быть необходимо для правильного сворачивания. Кроме того, было показано, что синонимичные мутации имеют значительные последствия в процессе сворачивания формирующегося белка и могут даже изменить субстратную специфичность ферментов. Эти исследования показывают, что использование кодонов влияет на скорость, с которой полипептиды векторно выходят из рибосомы, что может дополнительно влиять на пути сворачивания белка во всем доступном структурном пространстве. [26]
В области биоинформатики и вычислительной биологии было предложено и использовано множество статистических методов для анализа смещения использования кодонов. [27] Такие методы, как «частота оптимальных кодонов» (Fop), [28] относительная адаптация кодонов (RCA) [29] или индекс адаптации кодонов (CAI) [30] используются для прогнозирования уровней экспрессии генов, в то время как такие методы, как « эффективное число кодонов » (Nc) и энтропия Шеннона из теории информации , используются для измерения равномерности использования кодонов. [ 31] Многомерные статистические методы, такие как анализ соответствий и анализ главных компонентов , широко используются для анализа вариаций использования кодонов среди генов. [32] Существует множество компьютерных программ для реализации перечисленных выше статистических анализов, включая CodonW, GCUA, INCA и т. д. Оптимизация кодонов применяется при проектировании синтетических генов и ДНК-вакцин . Для этой цели в Интернете доступно несколько пакетов программного обеспечения (см. внешние ссылки). [ требуется цитирование ]
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )