Пара оснований ( п.о. ) — это фундаментальная единица двухцепочечных нуклеиновых кислот , состоящая из двух азотистых оснований , связанных друг с другом водородными связями . Они образуют строительные блоки двойной спирали ДНК и вносят вклад в складчатую структуру как ДНК, так и РНК . Продиктованные специфическими моделями водородных связей , пары оснований «Уотсона–Крика» (или «Уотсона–Крика–Франклина») ( гуанин – цитозин и аденин – тимин ) [ 1] позволяют спирали ДНК поддерживать регулярную спиральную структуру, которая тонко зависит от ее нуклеотидной последовательности . [2] Комплементарная природа этой парной по основанию структуры обеспечивает избыточную копию генетической информации, закодированной в каждой цепи ДНК. Регулярная структура и избыточность данных, обеспечиваемые двойной спиралью ДНК, делают ДНК хорошо подходящей для хранения генетической информации, в то время как спаривание оснований между ДНК и входящими нуклеотидами обеспечивает механизм, посредством которого ДНК-полимераза реплицирует ДНК, а РНК-полимераза транскрибирует ДНК в РНК. Многие связывающие ДНК белки могут распознавать определенные паттерны спаривания оснований, которые идентифицируют определенные регуляторные области генов.
Внутримолекулярные пары оснований могут встречаться в одноцепочечных нуклеиновых кислотах. Это особенно важно в молекулах РНК (например, транспортной РНК ), где пары оснований Уотсона–Крика (гуанин–цитозин и аденин– урацил ) позволяют формировать короткие двухцепочечные спирали, а широкий спектр не-Уотсона–Криковских взаимодействий (например, G–U или A–A) позволяет РНК складываться в широкий спектр специфических трехмерных структур . Кроме того, спаривание оснований между транспортной РНК (тРНК) и информационной РНК (мРНК) формирует основу для событий молекулярного распознавания , которые приводят к тому, что нуклеотидная последовательность мРНК транслируется в аминокислотную последовательность белков через генетический код .
Размер отдельного гена или всего генома организма часто измеряется в парах оснований, поскольку ДНК обычно двухцепочечная. Следовательно, общее количество пар оснований равно количеству нуклеотидов в одной из нитей (за исключением некодирующих одноцепочечных участков теломер ). Гаплоидный геном человека (23 хромосомы ) оценивается примерно в 3,2 миллиарда пар оснований в длину и содержит 20 000–25 000 различных генов, кодирующих белки. [3] [4] [5] [6] Килобаза (кб) — единица измерения в молекулярной биологии, равная 1000 парам оснований ДНК или РНК. [7] Общее количество пар оснований ДНК на Земле оценивается в 5,0 × 1037 с весом 50 миллиардов тонн . [8] Для сравнения, общая масса биосферыоценивается примерно в 4 ТтС (триллиона тонн углерода ). [9]
Водородная связь — это химическое взаимодействие, которое лежит в основе правил спаривания оснований, описанных выше. Соответствующее геометрическое соответствие доноров и акцепторов водородных связей позволяет стабильно образовывать только «правильные» пары. ДНК с высоким содержанием GC более стабильна, чем ДНК с низким содержанием GC. Однако, что особенно важно, стэкинговые взаимодействия в первую очередь отвечают за стабилизацию двойной спиральной структуры; вклад спаривания оснований Уотсона-Крика в глобальную структурную стабильность минимален, но его роль в специфичности, лежащей в основе комплементарности, напротив, имеет максимальное значение, поскольку это лежит в основе зависимых от шаблона процессов центральной догмы (например, репликации ДНК ). [10]
Более крупные азотистые основания , аденин и гуанин, являются членами класса двухкольцевых химических структур, называемых пуринами ; более мелкие азотистые основания, цитозин и тимин (и урацил), являются членами класса однокольцевых химических структур, называемых пиримидинами . Пурины комплементарны только пиримидинам: пары пиримидин–пиримидин энергетически невыгодны, поскольку молекулы находятся слишком далеко друг от друга для образования водородных связей; пары пурин–пурин энергетически невыгодны, поскольку молекулы находятся слишком близко, что приводит к перекрывающемуся отталкиванию. Спаривание пурин–пиримидиновых оснований AT или GC или UA (в РНК) приводит к правильной дуплексной структуре. Единственными другими парами пурин–пиримидин были бы AC и GT и UG (в РНК); эти пары являются несоответствиями, поскольку паттерны доноров и акцепторов водорода не соответствуют друг другу. Спаривание GU с двумя водородными связями встречается в РНК довольно часто (см. колебательную пару оснований ).
Спаренные молекулы ДНК и РНК сравнительно стабильны при комнатной температуре, но две нуклеотидные цепи будут разделяться выше точки плавления , которая определяется длиной молекул, степенью неправильного спаривания (если таковое имеется) и содержанием GC. Более высокое содержание GC приводит к более высоким температурам плавления; поэтому неудивительно, что геномы экстремофильных организмов, таких как Thermus thermophilus, особенно богаты GC. Наоборот, области генома, которые должны часто разделяться — например, области промотора для часто транскрибируемых генов — сравнительно бедны GC (например, см. вставку TATA ). Содержание GC и температура плавления также должны учитываться при разработке праймеров для реакций ПЦР . [ необходима цитата ]
Следующие последовательности ДНК иллюстрируют парные двухцепочечные паттерны. По соглашению верхняя нить записывается от 5′-конца к 3′-концу ; таким образом, нижняя нить записывается от 3′ к 5′.
ATCGATTGAGCTCTAGCG
TAGCTAACTCGAGATCGC
AUCGAUUGAGCUCUAGCG
UAGCUAACUCGAGAUCGC
Химические аналоги нуклеотидов могут занимать место настоящих нуклеотидов и устанавливать неканоническое спаривание оснований, что приводит к ошибкам (в основном точечным мутациям ) в репликации ДНК и транскрипции ДНК . Это связано с их изостерической химией. Одним из распространенных мутагенных аналогов оснований является 5-бромурацил , который напоминает тимин, но может образовывать пары оснований с гуанином в его енольной форме. [11]
Другие химические вещества, известные как ДНК-интеркаляторы , вписываются в зазор между соседними основаниями на одной нити и вызывают мутации со сдвигом рамки считывания , «маскируясь» под основание, заставляя механизм репликации ДНК пропускать или вставлять дополнительные нуклеотиды в интеркалированный сайт. Большинство интеркаляторов представляют собой крупные полиароматические соединения и являются известными или предполагаемыми канцерогенами . Примерами служат бромистый этидий и акридин . [12] [ необходима цитата ]
Несовпадающие пары оснований могут быть получены из-за ошибок репликации ДНК и в качестве промежуточных продуктов во время гомологичной рекомбинации . Процесс исправления несовпадений обычно должен распознавать и правильно исправлять небольшое количество несовпадений оснований в длинной последовательности нормальных пар оснований ДНК. Для исправления несовпадений, образованных во время репликации ДНК, было разработано несколько отличительных процессов исправления, чтобы различать нить шаблона и вновь образованную нить, так что удаляется только вновь вставленный неправильный нуклеотид (чтобы избежать возникновения мутации). [13] Белки, используемые для исправления несовпадений во время репликации ДНК, и клиническое значение дефектов в этом процессе описаны в статье Репарация несовпадений ДНК . Процесс исправления несовпадений во время рекомбинации описан в статье Конверсия генов .
Для описания длины молекулы D/R NA обычно используются следующие сокращения :
Для одноцепочечной ДНК/РНК используются единицы нуклеотидов — сокращенно nt (или knt, Mnt, Gnt) — поскольку они не парные. Чтобы различать единицы хранения компьютера и основания, для пар оснований можно использовать kbp, Mbp, Gbp и т. д.
Сантиморган также часто используется для обозначения расстояния вдоль хромосомы, но число пар оснований, которым он соответствует, сильно варьируется. В геноме человека сантиморган составляет около 1 миллиона пар оснований. [ 15] [16]
Неестественная пара оснований (UBP) — это спроектированная субъединица (или нуклеиновая кислота ) ДНК , которая создается в лаборатории и не встречается в природе. Описаны последовательности ДНК, которые используют вновь созданные нуклеиновые кислоты для формирования третьей пары оснований в дополнение к двум парам оснований, обнаруженным в природе, AT ( аденин — тимин ) и GC ( гуанин — цитозин ). Несколько исследовательских групп искали третью пару оснований для ДНК, включая группы под руководством Стивена А. Беннера , Филиппа Марлиера, Флойда Э. Ромесберга и Ичиро Хирао. [17] Сообщалось о некоторых новых парах оснований, основанных на альтернативных водородных связях, гидрофобных взаимодействиях и координации металлов. [18] [19] [20] [21]
В 1989 году Стивен Беннер (тогда работавший в Швейцарском федеральном технологическом институте в Цюрихе) и его команда возглавили работу с модифицированными формами цитозина и гуанина в молекулах ДНК in vitro . [22] Нуклеотиды, которые кодировали РНК и белки, были успешно воспроизведены in vitro . С тех пор команда Беннера пыталась сконструировать клетки, которые могли бы производить чужеродные основания с нуля, устраняя необходимость в исходном сырье. [23]
В 2002 году группа Ичиро Хирао в Японии разработала неестественную пару оснований между 2-амино-8-(2-тиенил)пурином (s) и пиридин-2-оном (y), которая функционирует в транскрипции и трансляции для сайт-специфического включения нестандартных аминокислот в белки. [24] В 2006 году они создали 7-(2-тиенил)имидазо[4,5-b]пиридин (Ds) и пиррол-2-карбальдегид (Pa) в качестве третьей пары оснований для репликации и транскрипции. [25] После этого Ds и 4-[3-(6-аминогексанамидо)-1-пропинил]-2-нитропиррол (Px) были обнаружены как пара с высокой точностью в ПЦР-амплификации. [26] [27] В 2013 году они применили пару Ds-Px для генерации ДНК-аптамеров путем отбора in vitro (SELEX) и продемонстрировали, что расширение генетического алфавита значительно увеличивает сродство ДНК-аптамеров к целевым белкам. [28]
В 2012 году группа американских ученых во главе с Флойдом Ромесбергом, химическим биологом из Научно-исследовательского института Скриппса в Сан-Диего, Калифорния, опубликовала информацию о том, что его команда разработала неестественную пару оснований (UBP). [20] Два новых искусственных нуклеотида или неестественная пара оснований (UBP) были названы d5SICS и dNaM . Более технически, эти искусственные нуклеотиды , несущие гидрофобные азотистые основания , имеют два слитых ароматических кольца , которые образуют комплекс (d5SICS–dNaM) или пару оснований в ДНК. [23] [29] Его команда разработала множество in vitro или «пробирочных» шаблонов, содержащих неестественную пару оснований, и они подтвердили, что она эффективно реплицировалась с высокой точностью практически во всех контекстах последовательностей с использованием современных стандартных методов in vitro , а именно ПЦР-амплификации ДНК и приложений на основе ПЦР. [20] Их результаты показывают, что для ПЦР и приложений, основанных на ПЦР, неестественная пара оснований d5SICS–dNaM функционально эквивалентна естественной паре оснований, а в сочетании с двумя другими естественными парами оснований, используемыми всеми организмами, A–T и G–C, они обеспечивают полностью функциональный и расширенный шестибуквенный «генетический алфавит». [29]
В 2014 году та же группа из Научно-исследовательского института Скриппса сообщила, что они синтезировали участок кольцевой ДНК, известный как плазмида, содержащий естественные пары оснований TA и CG вместе с наиболее эффективным UBP, который лаборатория Ромесберга разработала и вставила в клетки обычной бактерии E. coli , которая успешно реплицировала неестественные пары оснований на протяжении нескольких поколений. [17] Трансфекция не препятствовала росту клеток E. coli и не показала никаких признаков потери неестественных пар оснований из-за естественных механизмов репарации ДНК . Это первый известный пример того, как живой организм передает расширенный генетический код последующим поколениям. [29] [30] Ромесберг сказал, что он и его коллеги создали 300 вариантов для уточнения дизайна нуклеотидов, которые были бы достаточно стабильными и реплицировались бы так же легко, как и естественные, при делении клеток. Это было частично достигнуто путем добавления поддерживающего гена водоросли , который экспрессирует транспортер нуклеотидтрифосфата , который эффективно импортирует трифосфаты как d5SICSTP, так и dNaMTP в бактерии E. coli . [29] Затем естественные пути бактериальной репликации используют их для точной репликации плазмиды, содержащей d5SICS–dNaM. Другие исследователи были удивлены тем, что бактерии реплицируют эти созданные человеком субъединицы ДНК. [31]
Успешное включение третьей пары оснований является значительным прорывом на пути к цели значительного расширения числа аминокислот , которые могут быть закодированы ДНК, с существующих 20 аминокислот до теоретически возможных 172, тем самым расширяя потенциал живых организмов для производства новых белков . [17] Искусственные цепочки ДНК пока ничего не кодируют, но ученые предполагают, что они могут быть разработаны для производства новых белков, которые могли бы иметь промышленное или фармацевтическое применение. [32] Эксперты заявили, что синтетическая ДНК, включающая неестественную пару оснований, повышает вероятность существования форм жизни, основанных на другом коде ДНК. [31] [32]
В дополнение к каноническому спариванию, некоторые условия могут также благоприятствовать спариванию оснований с альтернативной ориентацией оснований, а также числом и геометрией водородных связей. Эти спаривания сопровождаются изменениями в локальной форме остова. [ необходима цитата ]
Наиболее распространенным из них является спаривание оснований с колебанием , которое происходит между тРНК и мРНК в третьей позиции основания многих кодонов во время транскрипции [34] и во время зарядки тРНК некоторыми тРНК-синтетазами . [35] Они также наблюдались во вторичных структурах некоторых последовательностей РНК. [36]
Кроме того, спаривание оснований Хугстина (обычно обозначается как A•U/T и G•C) может существовать в некоторых последовательностях ДНК (например, динуклеотидах CA и TA) в динамическом равновесии со стандартным спариванием Уотсона-Крика. [33] Они также наблюдались в некоторых комплексах белок-ДНК. [37]
В дополнение к этим альтернативным парам оснований, во вторичной и третичной структуре РНК наблюдается широкий спектр водородных связей основание-основание. [38] Эти связи часто необходимы для точной, сложной формы РНК, а также для ее связывания с партнерами по взаимодействию. [38]
Каждое мутагенное событие в присутствии акридина приводит к добавлению или удалению одной пары оснований.
у человека 1 сантиморган в среднем соответствует расстоянию около 7,5x10 5 пар оснований.