stringtranslate.com

GC-контент

Нуклеотидные связи с парами AT и GC. Стрелки указывают на водородные связи .

В молекулярной биологии и генетике содержание GC (или содержание гуанина-цитозина ) — это процент азотистых оснований в молекуле ДНК или РНК , которые представляют собой либо гуанин (G), либо цитозин (C). [1] Эта мера показывает долю оснований G и C из четырех подразумеваемых оснований, включая аденин и тимин в ДНК и аденин и урацил в РНК.

GC-контент может быть указан для определенного фрагмента ДНК или РНК или для всего генома . Когда оно относится к фрагменту, оно может обозначать GC-содержание отдельного гена или участка гена (домена), группы генов или кластеров генов, некодирующей области или синтетического олигонуклеотида , такого как праймер .

Состав

Качественно гуанин (G) и цитозин (C) образуют специфическую водородную связь друг с другом, тогда как аденин (А) связывается специфически с тимином (Т) в ДНК и с урацилом (U) в РНК. Количественно каждая пара оснований GC удерживается вместе тремя водородными связями, а пары оснований AT и AU удерживаются вместе двумя водородными связями. Чтобы подчеркнуть это различие, пары оснований часто обозначаются как «G≡C» вместо «A=T» или «A=U».

ДНК с низким содержанием GC менее стабильна, чем ДНК с высоким содержанием GC; однако сами по себе водородные связи не оказывают особенно существенного влияния на молекулярную стабильность, которая вместо этого обусловлена ​​главным образом молекулярными взаимодействиями при упаковке оснований. [2] Несмотря на более высокую термостабильность , присущую нуклеиновой кислоте с высоким содержанием GC, было замечено, что по крайней мере некоторые виды бактерий с ДНК с высоким содержанием GC легче подвергаются аутолизу , тем самым сокращая продолжительность жизни клетки. как таковой . [3] Из-за термостабильности пар GC когда-то предполагалось, что высокое содержание GC было необходимой адаптацией к высоким температурам, но эта гипотеза была опровергнута в 2001 году. [4] Несмотря на это, было показано, что существует сильная корреляция между оптимальным ростом прокариот при более высоких температурах и содержанием GC в структурных РНК, таких как рибосомальная РНК , транспортная РНК и многие другие некодирующие РНК . [4] [5] Пары оснований AU менее стабильны, чем пары оснований GC, что делает структуры РНК с высоким содержанием GC более устойчивыми к воздействию высоких температур.

Совсем недавно было продемонстрировано, что наиболее важный фактор, способствующий термической стабильности двухцепочечных нуклеиновых кислот, на самом деле обусловлен укладкой оснований соседних оснований, а не количеством водородных связей между основаниями. Для пар GC существует более благоприятная энергия упаковки, чем для пар AT или AU из-за относительного положения экзоциклических групп. Кроме того, существует корреляция между порядком укладки оснований и термической стабильностью молекулы в целом. [6]

Определение

Схематическая кариограмма человека, показывающая обзор генома человека по G-диапазону (включая окрашивание по Гимзе ), при этом области, богатые GC, светлее, а области с низким содержанием GC - темнее.

Содержание GC обычно выражается в процентах, но иногда и в виде соотношения (так называемое соотношение G+C или соотношение GC ). Процент содержания GC рассчитывается как [7]

тогда как соотношение AT/GC рассчитывается как [8]

.

Процентное содержание GC, а также соотношение GC можно измерить несколькими способами, но одним из самых простых методов является измерение температуры плавления двойной спирали ДНК с помощью спектрофотометрии . Поглощение ДНК на длине волны 260 нм довольно резко возрастает , когда двухцепочечная молекула ДНК при достаточном нагревании разделяется на две одиночные нити. [9] Наиболее часто используемый протокол для определения GC-соотношений использует проточную цитометрию для большого количества образцов. [10]

Альтернативно, если исследуемая молекула ДНК или РНК была надежно секвенирована , то содержание GC можно точно рассчитать с помощью простой арифметики или с помощью различных общедоступных программных инструментов, таких как бесплатный онлайн-калькулятор GC.

Геномный контент

Внутригеномная вариация

Обнаружено, что соотношение GC в геноме заметно варьирует. Эти изменения в соотношении GC в геномах более сложных организмов приводят к мозаичному образованию с островковыми областями, называемыми изохорами . [11] Это приводит к различиям в интенсивности окрашивания хромосом . [12] Изохоры, богатые GC, обычно включают в себя множество генов, кодирующих белок, и, таким образом, определение соотношений GC в этих конкретных регионах способствует картированию богатых генами областей генома. [13] [14]

Кодирующие последовательности

В пределах длинной области геномной последовательности гены часто характеризуются более высоким содержанием GC по сравнению с фоновым содержанием GC для всего генома. [15] Имеются данные о том , что длина кодирующей области гена прямо пропорциональна более высокому содержанию G+C. [16] Это было указано на тот факт, что стоп-кодон имеет смещение в сторону нуклеотидов А и Т, и, таким образом, чем короче последовательность, тем выше смещение АТ. [17]

Сравнение более 1000 ортологичных генов млекопитающих показало заметные внутригеномные вариации содержания GC в положении третьего кодона в диапазоне от менее 30% до более 80%. [18]

Межгеномная вариация

Было обнаружено, что содержание GC варьируется у разных организмов, и предполагается, что на этот процесс влияют различия в отборе , мутационная предвзятость и предвзятая рекомбинация, связанная с репарацией ДНК . [19]

Среднее содержание GC в геномах человека колеблется от 35% до 60% для фрагментов размером 100 КБ, в среднем 41%. [20] Содержание GC в дрожжах ( Saccharomyces cerevisiae ) составляет 38%, [21] а в другом распространенном модельном организме , кресс-салате ( Arabidopsis thaliana ), — ​​36%. [22] Из-за природы генетического кода для организма практически невозможно иметь геном с содержанием GC, приближающимся к 0% или 100%. Однако видом с чрезвычайно низким содержанием GC является Plasmodium falciparum (GC% = ~20%) [23] , и такие примеры обычно называют богатыми АТ, а не бедными GC. [24]

Несколько видов млекопитающих (например, землеройка , летучая мышь , тенрек , кролик ) независимо претерпели заметное увеличение содержания GC в своих генах. Эти изменения содержания GC коррелируют с особенностями жизненного цикла вида (например, массой тела или продолжительностью жизни) и размером генома [18] и могут быть связаны с молекулярным феноменом, называемым конверсией генов , ориентированной на GC . [25]

Приложения

Молекулярная биология

В экспериментах с полимеразной цепной реакцией (ПЦР) содержание GC в коротких олигонуклеотидах, известных как праймеры, часто используется для прогнозирования температуры их отжига с матричной ДНК. Более высокий уровень содержания GC указывает на относительно более высокую температуру плавления.

Многие технологии секвенирования, такие как секвенирование Illumina , не позволяют считывать последовательности с высоким содержанием GC. Известно, что в геномах птиц много таких частей, что вызывает проблему «отсутствующих генов», которые, как ожидается, будут присутствовать в результате эволюции и фенотипа, но никогда не были секвенированы — до тех пор, пока не были использованы улучшенные методы. [26]

Систематика

Проблема видов в неэукариотической таксономии привела к различным предложениям по классификации бактерий, а специальный комитет по согласованию подходов к бактериальной систематике в 1987 году рекомендовал использовать GC-отношения в иерархической классификации более высокого уровня. [27] Например, Actinomycetota характеризуются как « бактерии с высоким содержанием GC ». [28] В Streptomyces coelicolor A3(2) содержание GC составляет 72%. [29] С использованием более надежных, современных методов молекулярной систематики определение содержания GC в Actinomycetota было отменено и были обнаружены бактерии этой клады с низким содержанием GC. [30]

Программные инструменты

GCSpeciesSorter [31] и TopSort [32] — это программные инструменты для классификации видов на основе их GC-содержания.

Смотрите также

Рекомендации

  1. ^ Определение GC - контент на CancerWeb Университета Ньюкасла , Великобритания.
  2. ^ Яковчук П., Протозанова Е., Франк-Каменецкий, М.Д. (2006). «Вклад укладки оснований и спаривания оснований в термическую стабильность двойной спирали ДНК». Нуклеиновые кислоты Рез . 34 (2): 564–74. дои : 10.1093/nar/gkj454. ПМЦ  1360284 . ПМИД  16449200.
  3. ^ Левин Р.Э., Ван Сикл С. (1976). «Аутолиз изолятов Pseudomonas putrefaciens с высоким содержанием GC». Антони ван Левенгук . 42 (1–2): 145–55. дои : 10.1007/BF00399459. PMID  7999. S2CID  9960732.
  4. ^ ab Hurst LD, Merchant AR (март 2001 г.). «Высокое содержание гуанина-цитозина не является адаптацией к высокой температуре: сравнительный анализ прокариот». Учеб. Биол. Наука . 268 (1466): 493–7. дои :10.1098/rspb.2000.1397. ПМЦ 1088632 . ПМИД  11296861. 
  5. ^ Галтье, Н.; Лобри, младший (1997). «Связь между содержанием G+C в геноме, вторичными структурами РНК и оптимальной температурой роста у прокариот». Журнал молекулярной эволюции . 44 (6): 632–636. Бибкод : 1997JMolE..44..632G. дои : 10.1007/PL00006186. PMID  9169555. S2CID  19054315.
  6. ^ Яковчук, Петр; Протозанова Екатерина; Франк-Каменецкий, Максим Д. (2006). «Вклад укладки оснований и спаривания оснований в термическую стабильность двойной спирали ДНК». Исследования нуклеиновых кислот . 34 (2): 564–574. дои : 10.1093/nar/gkj454. ISSN  0305-1048. ПМЦ 1360284 . ПМИД  16449200. 
  7. ^ Мэдиган, Монтана. и Мартинко Ю.М. (2003). Брока биология микроорганизмов (10-е изд.). Пирсон-Прентис Холл. ISBN 978-84-205-3679-8.
  8. ^ «Определение соотношения GC в Северо-Западном университете, Иллинойс, США». Архивировано из оригинала 20 июня 2010 года . Проверено 11 июня 2007 г.
  9. ^ Вильгельм Дж., Пингуд А., Хан М. (май 2003 г.). «Метод оценки размеров генома на основе ПЦР в реальном времени». Нуклеиновые кислоты Рез . 31 (10): е56. дои : 10.1093/nar/gng056. ПМК 156059 . ПМИД  12736322. 
  10. ^ Виноградов А.Е. (май 1994 г.). «Измерение с помощью проточной цитометрии геномного соотношения AT/GC и размера генома». Цитометрия . 16 (1): 34–40. дои : 10.1002/cyto.990160106 . ПМИД  7518377.
  11. ^ Бернарди Дж. (январь 2000 г.). «Изохоры и эволюционная геномика позвоночных». Джин . 241 (1): 3–17. дои : 10.1016/S0378-1119(99)00485-0. ПМИД  10607893.
  12. ^ Фьюри Т.С., Хаусслер Д. (май 2003 г.). «Интеграция цитогенетической карты с проектом последовательности генома человека». Хм. Мол. Жене . 12 (9): 1037–44. дои : 10.1093/hmg/ddg113 . ПМИД  12700172.
  13. ^ Самнер А.Т., де ла Торре Дж., Ступпия Л. (август 1993 г.). «Распределение генов по хромосомам: цитологический подход». Дж. Мол. Эвол . 37 (2): 117–22. Бибкод : 1993JMolE..37..117S. дои : 10.1007/BF02407346. PMID  8411200. S2CID  24677431.
  14. ^ Айссани Б., Бернарди Дж. (октябрь 1991 г.). «CpG-островки, гены и изохоры в геномах позвоночных». Джин . 106 (2): 185–95. дои : 10.1016/0378-1119(91)90198-К. ПМИД  1937049.
  15. ^ Ромигье Дж., Ру С. (2017). «Аналитические предубеждения, связанные с содержанием GC в молекулярной эволюции». Фронт Генет . 8 : 16. дои : 10.3389/fgene.2017.00016 . ПМК 5309256 . ПМИД  28261263. 
  16. ^ Поццоли Ю, Меноцци Г, Фумагалли М и др. (2008). «Как селективные, так и нейтральные процессы стимулируют эволюцию содержания GC в геноме человека». БМК Эвол. Биол . 8 (1): 99. Бибкод : 2008BMCEE...8...99P. дои : 10.1186/1471-2148-8-99 . ПМК 2292697 . ПМИД  18371205. 
  17. ^ Вуитчик Дж. Д., Каррер К. М. (1999). «Анализ геномного содержания G + C, использования кодонов, контекста инициаторных кодонов и сайтов терминации трансляции у Tetrahymena thermophila ». Дж. Эукариот. Микробиол . 46 (3): 239–47. doi :10.1111/j.1550-7408.1999.tb05120.x. PMID  10377985. S2CID  28836138.
  18. ^ аб Ромигьер, Джонатан; Ранвез, Винсент; Дузери, Эммануэль Дж. П.; Галтье, Николя (1 августа 2010 г.). «Сопоставление динамики содержания GC в 33 геномах млекопитающих: связь с особенностями жизненного цикла и размерами хромосом». Геномные исследования . 20 (8): 1001–1009. дои : 10.1101/гр.104372.109. ISSN  1088-9051. ПМЦ 2909565 . ПМИД  20530252. 
  19. ^ Бердселл JA (1 июля 2002 г.). «Интеграция геномики, биоинформатики и классической генетики для изучения влияния рекомбинации на эволюцию генома». Мол. Биол. Эвол . 19 (7): 1181–97. CiteSeerX 10.1.1.337.1535 . doi : 10.1093/oxfordjournals.molbev.a004176. ПМИД  12082137. 
  20. ^ Международный консорциум по секвенированию генома человека (февраль 2001 г.). "Начальная последовательность и анализ человеческого генома". Природа . 409 (6822): 860–921. Бибкод : 2001Natur.409..860L. дои : 10.1038/35057062 . hdl : 2027.42/62798 . ПМИД  11237011.(стр. 876)
  21. ^ Данные полного генома Saccharomyces cerevisiae в NCBI.
  22. ^ Данные всего генома Arabidopsis thaliana в NCBI.
  23. ^ Данные всего генома Plasmodium falciparum на NCBI.
  24. ^ Мусто Х, Каччо С, Родригес-Маседа Х, Бернарди Г (1997). «Композиционные ограничения в крайне бедном GC геноме Plasmodium falciparum» (PDF) . Память Инст. Освальдо Круз . 92 (6): 835–41. дои : 10.1590/S0074-02761997000600020 . ПМИД  9566216.
  25. ^ Дюре Л., Галтье Н. (2009). «Предвзятая конверсия генов и эволюция геномных ландшафтов млекопитающих». Анну Рев Геном Хум Генет . 10 : 285–311. doi : 10.1146/annurev-genom-082908-150001. PMID  19630562. S2CID  9126286.
  26. ^ Хаттенер Р., Торрес Л., Вельд Т.И. и др. (2021). «Рефрактерные к секвенированию области в геномах птиц являются горячими точками ускоренной эволюции белков». БМК Эколь Эвол . 21 (176): 176. дои : 10.1186/s12862-021-01905-7 . ПМЦ 8449477 . ПМИД  34537008. 
  27. ^ Уэйн Л.Г.; и другие. (1987). «Отчет специального комитета по согласованию подходов к бактериальной систематике». Международный журнал систематической бактериологии . 37 (4): 463–4. дои : 10.1099/00207713-37-4-463 .
  28. ^ Браузер таксономии в NCBI
  29. ^ Данные всего генома Streptomyces coelicolor A3 (2) в NCBI.
  30. ^ Гай Р., МакМахон К.Д., Родригес-Валера Ф (2012). «Нарушение парадигмы: космополитические и многочисленные пресноводные актинобактерии имеют низкий GC». Отчеты по экологической микробиологии . 4 (1): 29–35. Бибкод : 2012EnvMR...4...29G. дои : 10.1111/j.1758-2229.2011.00274.x. ПМИД  23757226.
  31. ^ Карими К., Вуитчик Д., Олдах М., Визе П. (2018). «Выделение видов с использованием содержания GC в смешанных последовательностях ДНК или РНК». Эвол Биоинформ Онлайн . 14 (1 января 2018 г.): 1176934318788866. doi : 10.1177/1176934318788866. ПМК 6052495 . ПМИД  30038485. 
  32. ^ Ленерт Э., Мушка М., Буррески М., Галло Н., Шварц Дж., Прингл Дж. (2014). «Обширные различия в экспрессии генов между симбиотическими и апосимбиотическими книдариями». G3 (Бетесда) . 4 (2): 277–95. дои : 10.1534/g3.113.009084. ПМЦ 3931562 . ПМИД  24368779. 

Внешние ссылки

  1. Таблица с GC-содержанием всех секвенированных прокариот
  2. Таксономический браузер бактерий на основе соотношения GC на веб-сайте NCBI.
  3. Соотношение GC у разных видов.