Значение C — это количество ДНК , выраженное в пикограммах , содержащейся в гаплоидном ядре (например, гамете ), или половина количества в диплоидной соматической клетке эукариотического организма . В некоторых случаях (особенно среди диплоидных организмов) термины значение C и размер генома используются взаимозаменяемо; однако у полиплоидов значение C может представлять два или более генома, содержащихся в одном и том же ядре. Грейлхубер и др. [1] предложили несколько новых уровней терминологии и связанных с ними сокращений для прояснения этого вопроса, но эти довольно сложные дополнения еще не использовались другими авторами.
Многие авторы ошибочно предполагали, что «C» в «C-value» относится к «характеристике», «содержанию» или «дополнению». Даже среди авторов, которые пытались проследить происхождение термина, возникла некоторая путаница, поскольку Хьюсон Свифт не определил его явно, когда он придумал его в 1950 году. [2] В своей оригинальной статье Свифт, по-видимому, использовал обозначение «1C value», «2C value» и т. д. в отношении «классов» содержания ДНК (например, Gregory 2001, [3] 2002 [4] ); однако Свифт объяснил в личной переписке с профессором Майклом Д. Беннеттом в 1975 году, что «боюсь, буква C не означала ничего более гламурного, чем «константа», т. е. количество ДНК, которое было характерно для определенного генотипа » (цитируется в Bennett and Leitch 2005 [5] ). Это относится к докладу 1948 года Вендрели и Вендрели о «замечательном постоянстве содержания ядерной ДНК во всех клетках всех особей данного вида животных» (перевод с французского оригинала ). [6] Исследование Свифтом этой темы было конкретно связано с вариациями (или их отсутствием) среди наборов хромосом в различных типах клеток у особей, но его обозначение эволюционировало в «C-value» по отношению к гаплоидному содержанию ДНК отдельных видов и сохраняет это употребление сегодня.
Значения C сильно различаются между видами. У животных они варьируются более чем в 3300 раз, а у наземных растений они различаются примерно в 1000 раз. [5] [7] Сообщалось, что геномы простейших различаются более чем в 300 000 раз по размеру, но верхняя граница этого диапазона ( амеба ) была поставлена под сомнение. Изменение значений C не имеет никакого отношения к сложности организма или количеству генов, содержащихся в его геноме; например, некоторые одноклеточные простейшие имеют геномы, намного большие, чем у человека . Это наблюдение считалось нелогичным до открытия повторяющейся ДНК . В результате оно стало известно как парадокс значения C. Однако, хотя больше нет никакого парадоксального аспекта в несоответствии между значением C и числом генов, этот термин остается общеупотребительным. По причинам концептуального прояснения, различные загадки, которые остаются в отношении вариации размера генома, были предложены вместо этого более точно, чтобы составить сложную, но четко определенную загадку, известную как загадка C-значения. C-значения коррелируют с рядом характеристик на уровне клетки и организма, включая размер клетки , скорость деления клетки и, в зависимости от таксона , размер тела, скорость метаболизма , скорость развития, сложность органов , географическое распределение или риск вымирания (для недавних обзоров см. Bennett and Leitch 2005; [5] Gregory 2005 [7] ).
Theзагадка C-значения илиПарадокс C-значения — это сложная загадка, окружающая обширные вариацииразмера ядерного геномасредиэукариотическихвидов. В центре загадки C-значения лежит наблюдение, что размер генома не коррелирует со сложностью организма; например, некоторые одноклеточныепротистыимеют геномы, намного большие, чем улюдей.
Некоторые предпочитают термин «загадка C-value», поскольку он явно включает в себя все вопросы, на которые необходимо ответить, если необходимо достичь полного понимания эволюции размера генома (Gregory 2005). Более того, термин «парадокс» подразумевает отсутствие понимания одной из самых основных особенностей эукариотических геномов: а именно, что они в основном состоят из некодирующей ДНК . Некоторые утверждают, что термин «парадокс» также имеет неудачную тенденцию побуждать авторов искать простые одномерные решения того, что на самом деле является многогранной головоломкой. [8] По этим причинам в 2003 году термин «загадка C-value» был одобрен вместо «парадокса C-value» на Втором совещании и семинаре по обсуждению размера генома растений в Королевских ботанических садах Кью , Великобритания , [8] и все большее число авторов начали принимать этот термин.
В 1948 году Роджер и Колетт Вендрели сообщили о «замечательном постоянстве содержания ядерной ДНК во всех клетках всех особей данного вида животных» [9] , что они приняли в качестве доказательства того, что ДНК , а не белок , является субстанцией, из которой состоят гены . Термин C-значение отражает это наблюдаемое постоянство. Однако вскоре было обнаружено, что C-значения ( размеры генома ) сильно различаются среди видов и что это не имеет никакого отношения к предполагаемому числу генов ( что отражается в сложности организма ). [10] Например, клетки некоторых саламандр могут содержать в 40 раз больше ДНК, чем клетки человека. [ 11] Учитывая, что C-значения считались постоянными, поскольку генетическая информация кодируется ДНК, и при этом не имели никакого отношения к предполагаемому числу генов, это было по понятным причинам сочтено парадоксальным ; термин «парадокс C-значения» был использован для описания этой ситуации CA Thomas Jr. в 1971 году.
Открытие повторяющейся ДНК в конце 1960-х годов решило главный вопрос парадокса C-значения: размер генома не отражает количество генов у эукариот, поскольку большая часть избыточной ДНК у многих видов, по-видимому, является мусорной ДНК . Например, человеческий геном содержит около 10% функциональных элементов, а остальные 90% считаются мусорными. Считается, что виды с более крупными геномами содержат более высокую долю мусорной ДНК.
Термин «загадка C-value» представляет собой обновление более распространенного, но устаревшего термина «парадокс C-value» (Thomas 1971), который в конечном итоге произошел от термина «C-value» (Swift 1950) в отношении гаплоидного ядерного содержимого ДНК . Термин был придуман канадским биологом доктором Т. Райаном Грегори из Университета Гвельфа в 2000/2001 годах. В общих чертах загадка C-value относится к вопросу вариации количества некодирующей ДНК, обнаруженной в геномах различных эукариот.
Загадка C-значения, в отличие от более старого парадокса C-значения, явно определяется как ряд независимых, но одинаково важных составных вопросов, включая:
†Источник таблицы: Dolezhel et al. , 2003 [12]
Формулы для перевода числа пар нуклеотидов (или пар оснований) в пикограммы ДНК и наоборот: [12]
размер генома (пн) = (0,978 x 10 9 ) x содержание ДНК (пг)Содержание ДНК (пг) = размер генома (пн) / (0,978 x 10 9 )1 стр = 978 Мбит/с
Используя данные Таблицы 1, можно рассчитать относительные массы пар нуклеотидов следующим образом: A/T = 615,383 и G/C = 616,3711, имея в виду, что образование одной фосфодиэфирной связи влечет за собой потерю одной молекулы H 2 O. Кроме того, фосфаты нуклеотидов в цепи ДНК являются кислыми, поэтому при физиологическом pH ион H + диссоциирует. При условии, что соотношение пар A/T к G/C составляет 1:1 ( содержание GC составляет 50%), средняя относительная масса одной пары нуклеотидов составляет 615,8771.
Относительная молекулярная масса может быть преобразована в абсолютное значение путем умножения ее на атомную единицу массы (1 u) в пикограммах. Таким образом, 615,8771 умножается на 1,660539 × 10 −12 пг. Следовательно, средняя масса на пару нуклеотидов будет 1,023 × 10 −9 пг, а 1 пг ДНК будет представлять 0,978 × 10 9 пар оснований (978 Мбн). [12]
Ни один вид не имеет содержания GC точно 50% (равное количество нуклеотидных оснований A/T и G/C), как предполагают Долежел и др. Однако, поскольку пара G/C тяжелее пары A/T всего на 1/6 от 1%, влияние вариаций содержания GC невелико. Фактическое содержание GC варьируется между видами, между хромосомами и между изохорами (участками хромосомы с одинаковым содержанием GC). Корректируя расчеты Долежеля для содержания GC, теоретическое изменение пар оснований на пикограмм варьируется от 977,0317 Мбн/пг для 100% содержания GC до 978,6005 Мбн/пг для 0% содержания GC (A/T легче, имеет больше Мбн/пг), со средней точкой 977,8155 Мбн/пг для 50% содержания GC.
Геном человека [13] различается по размеру; однако, текущая оценка ядерного гаплоидного размера эталонного генома человека [14] составляет 3 031 042 417 п.н. для гаметы X и 2 932 228 937 п.н. для гаметы Y. Гамета X и гамета Y содержат по 22 аутосомы, объединенная длина которых составляет большую часть генома в обеих гаметах. Гамета X содержит хромосому X , в то время как гамета Y содержит хромосому Y. Больший размер хромосомы X отвечает за разницу в размере двух гамет. Когда гаметы объединяются, женская зигота XX имеет размер 6 062 084 834 п.н., в то время как мужская зигота XY имеет размер 5 963 271 354 п.н. Однако пары оснований женской зиготы XX распределены между 2 гомологичными группами по 23 гетерологичных хромосомы каждая, в то время как пары оснований мужской зиготы XY распределены между 2 гомологичными группами по 22 гетерологичных хромосомы каждая плюс 2 гетерологичных хромосомы. Хотя каждая зигота имеет 46 хромосом, 23 хромосомы женской зиготы XX являются гетерологичными, а 24 хромосомы мужской зиготы XY являются гетерологичными. В результате значение C для женской зиготы XX составляет 3,099361, в то время как значение C для мужской зиготы XY составляет 3,157877.
Содержание GC в геноме человека составляет около 41%. [15] С учетом аутосомных, X и Y хромосом [16] гаплоидное содержание GC у человека составляет 40,97460% для X гамет и 41,01724% для Y гамет.
Подводя итог этим цифрам: