Правила Чаргаффа (данные Эрвином Чаргаффом ) гласят, что в ДНК любого вида и организма количество гуанина должно быть равно количеству цитозина , а количество аденина должно быть равно количеству тимина . Кроме того, должно существовать стехиометрическое соотношение 1:1 пуриновых и пиримидиновых оснований (т. е. A+G=T+C
). Эта закономерность обнаруживается в обеих цепях ДНК. Они были открыты австрийским химиком Эрвином Чаргаффом [1] [2] в конце 1940-х годов.
Первое правило гласит, что двухцепочечная молекула ДНК в целом имеет процентное равенство пар оснований: A% = T% и G% = C%. Строгая проверка правила составляет основу пар оснований Уотсона-Крика в модели двойной спирали ДНК.
Второе правило гласит, что как Α% ≈ Τ%, так и G% ≈ C% справедливы для каждой из двух цепей ДНК. [3] Это описывает только глобальную особенность состава оснований в одной цепи ДНК. [4]
Второе правило четности было открыто в 1968 году. [3] Оно гласит, что в одноцепочечной ДНК число единиц аденина приблизительно равно числу тимина (%A ≈ %T), а число единиц цитозина приблизительно равно числу гуанина (%C ≈ %G).
Первое эмпирическое обобщение второго правила четности Чаргаффа, называемое принципом симметрии, было предложено Винаякумаром В. Прабху [5] в 1993 году. Этот принцип гласит, что для любого заданного олигонуклеотида его частота приблизительно равна частоте его комплементарного обратного олигонуклеотида. Теоретическое обобщение [6] было математически получено Мишелем Э. Б. Ямагиши и Роберто Х. Хераи в 2011 году. [7]
В 2006 году было показано, что это правило применимо к четырем [2] из пяти типов двухцепочечных геномов; в частности, оно применимо к эукариотическим хромосомам , бактериальным хромосомам, двухцепочечным ДНК- вирусным геномам и архейным хромосомам. [8] Оно не применимо к органеллярным геномам ( митохондриям и пластидам ) размером менее ~20-30 кбн , а также не применимо к одноцепочечным ДНК- (вирусным) геномам или любому типу РНК- генома. Основа этого правила все еще исследуется, хотя размер генома может играть роль.
Правило само по себе имеет последствия. В большинстве бактериальных геномов (которые, как правило, на 80-90% кодирующие) гены организованы таким образом, что примерно 50% кодирующей последовательности лежит на одной из нитей. Вацлав Шибальский в 1960-х годах показал, что в кодирующих последовательностях бактериофагов пурины (A и G) превышают пиримидины (C и T). [9] Это правило с тех пор было подтверждено и в других организмах, и теперь его, вероятно, следует называть « правилом Шибальского ». Хотя правило Шибальского в целом выполняется, известно, что существуют исключения. [10] [11] [12] Биологическая основа правила Шибальского пока неизвестна.
Совместный эффект второго правила Чаргаффа и правила Шибальского можно увидеть в бактериальных геномах, где кодирующие последовательности распределены неравномерно. Генетический код имеет 64 кодона , из которых 3 функционируют как терминирующие кодоны: в белках обычно присутствует только 20 аминокислот . (Существуют две необычные аминокислоты — селеноцистеин и пирролизин — обнаруженные в ограниченном количестве белков и кодируемые стоп-кодонами — TGA и TAG соответственно.) Несоответствие между количеством кодонов и аминокислот позволяет нескольким кодонам кодировать одну аминокислоту — такие кодоны обычно различаются только в третьей позиции основания кодона.
Многомерный статистический анализ использования кодонов в геномах с неравным количеством кодирующих последовательностей на двух цепях показал, что использование кодонов в третьей позиции зависит от цепи, на которой расположен ген. Это, вероятно, является результатом правил Шибальского и Чаргаффа. Из-за асимметрии в использовании пиримидина и пурина в кодирующих последовательностях цепь с большим содержанием кодирования будет иметь большее количество пуриновых оснований (правило Шибальского). Поскольку количество пуриновых оснований будет, в очень хорошем приближении, равно количеству их комплементарных пиримидинов в той же цепи, и поскольку кодирующие последовательности занимают 80–90% цепи, по-видимому, существует (1) селективное давление на третье основание, чтобы минимизировать количество пуриновых оснований в цепи с большим содержанием кодирования; и (2) что это давление пропорционально несоответствию в длине кодирующих последовательностей между двумя цепями.
Происхождение отклонения от правила Чаргаффа в органеллах, как предполагается, является следствием механизма репликации. [13] Во время репликации цепи ДНК разделяются. В одноцепочечной ДНК цитозин спонтанно медленно дезаминируется в аденозин ( трансверсия C в A ). Чем длиннее разделены цепи, тем больше количество дезаминирования. По причинам, которые пока не ясны, цепи имеют тенденцию существовать дольше в одиночной форме в митохондриях, чем в хромосомной ДНК. Этот процесс имеет тенденцию давать одну цепь, которая обогащена гуанином (G) и тимином (T), с ее комплементом, обогащенным цитозином (C) и аденозином (A), и этот процесс мог привести к отклонениям, обнаруженным в митохондриях. [ необходима цитата ] [ сомнительно – обсудить ]
Второе правило Чаргаффа, по-видимому, является следствием более сложного правила четности: в пределах одной цепи ДНК любой олигонуклеотид ( k-мер или n-грамм ; длина ≤ 10) присутствует в равных количествах с его обратным комплементарным нуклеотидом. Из-за вычислительных требований это не было проверено во всех геномах для всех олигонуклеотидов. Это было проверено для триплетных олигонуклеотидов для большого набора данных. [14] Альбрехт-Бюлер предположил, что это правило является следствием геномов, эволюционирующих в процессе инверсии и транспозиции . [ 14] Этот процесс, по-видимому, не действовал на митохондриальные геномы. Второе правило четности Чаргаффа, по-видимому, распространяется с уровня нуклеотидов на популяции триплетов кодонов в случае всей одноцепочечной ДНК человеческого генома. [15] Предлагается своего рода «второе правило четности Чаргаффа на уровне кодонов» следующим образом:
Примеры — вычисление всего генома человека с использованием первой рамки считывания кодонов обеспечивает:
36530115 TTT и 36381293 AAA (соотношение % = 1,00409). 2087242 TCG и 2085226 CGA (соотношение % = 1,00096) и т. д.
В 2020 году было высказано предположение, что физические свойства dsDNA (двуцепочечной ДНК) и тенденция к максимальной энтропии всех физических систем являются причиной второго правила четности Чаргаффа. [16] Симметрии и закономерности, присутствующие в последовательностях dsDNA, могут возникать только из-за физических особенностей молекулы dsDNA и принципа максимальной энтропии, а не из-за биологического или экологического эволюционного давления.
Следующая таблица представляет собой репрезентативную выборку данных Эрвина Чаргаффа 1952 года, в которых перечислены основные составы ДНК различных организмов и которые подтверждают оба правила Чаргаффа. [17] Такой организм, как φX174, со значительными вариациями A/T и G/C, равными единице, указывает на одноцепочечную ДНК.
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )