Пара оснований ( п.н. ) — это фундаментальная единица двухцепочечных нуклеиновых кислот , состоящая из двух нуклеиновых оснований , связанных друг с другом водородными связями . Они образуют строительные блоки двойной спирали ДНК и участвуют в складчатой структуре как ДНК, так и РНК . Продиктованные специфическими паттернами водородных связей , пары оснований «Уотсон-Крик» (или «Уотсон-Крик-Франклин») ( гуанин - цитозин и аденин - тимин ) [1] позволяют спирали ДНК поддерживать регулярную спиральную структуру, которая тонко зависит от структуры водородных связей. по его нуклеотидной последовательности . [2] Комплементарный характер этой парной структуры обеспечивает избыточную копию генетической информации , закодированной в каждой нити ДНК. Регулярная структура и избыточность данных, обеспечиваемая двойной спиралью ДНК, делают ДНК хорошо подходящей для хранения генетической информации, в то время как спаривание оснований между ДНК и входящими нуклеотидами обеспечивает механизм, с помощью которого ДНК- полимераза реплицирует ДНК, а РНК-полимераза транскрибирует ДНК в РНК. Многие ДНК-связывающие белки могут распознавать определенные закономерности спаривания оснований, которые идентифицируют определенные регуляторные области генов.
Внутримолекулярные пары оснований могут встречаться в составе одноцепочечных нуклеиновых кислот. Это особенно важно в молекулах РНК (например, транспортных РНК ), где пары оснований Уотсона-Крика (гуанин-цитозин и аденин- урацил ) допускают образование коротких двухцепочечных спиралей и широкий спектр взаимодействий, не относящихся к Уотсону-Крику. (например, G–U или A–A) позволяют РНК сворачиваться в широкий спектр специфических трехмерных структур . Кроме того, спаривание оснований между транспортной РНК (тРНК) и информационной РНК (мРНК) формирует основу для событий молекулярного распознавания , которые приводят к тому, что нуклеотидная последовательность мРНК транслируется в аминокислотную последовательность белков через генетический код .
Размер отдельного гена или всего генома организма часто измеряется в парах оснований, поскольку ДНК обычно двухцепочечная. Следовательно, общее количество пар оснований равно числу нуклеотидов в одной из цепей (за исключением некодирующих одноцепочечных участков теломер ) . По оценкам, гаплоидный геном человека (23 хромосомы ) имеет длину около 3,2 миллиарда оснований и содержит 20 000–25 000 различных генов, кодирующих белки. [3] [4] [5] Килобаза (кб) — единица измерения в молекулярной биологии , равная 1000 парам оснований ДНК или РНК . [6] Общее количество пар оснований ДНК на Земле оценивается в 5,0 × 10.37 весом 50 миллиардов тонн . [7] Для сравнения , общая масса биосферыоценивается в 4 TtC (триллион тонн углерода ). [8]
Водородная связь — это химическое взаимодействие, лежащее в основе описанных выше правил спаривания оснований. Соответствующее геометрическое соответствие доноров и акцепторов водородных связей позволяет стабильно образовывать только «правильные» пары. ДНК с высоким содержанием GC более стабильна, чем ДНК с низким содержанием GC. Однако важно отметить, что стэкинг-взаимодействия в первую очередь ответственны за стабилизацию двойной спиральной структуры; Вклад спаривания оснований Уотсона-Крика в глобальную структурную стабильность минимален, но его роль в специфичности, лежащей в основе комплементарности, напротив, имеет максимальное значение, поскольку это лежит в основе зависимых от матрицы процессов центральной догмы (например, репликации ДНК ). [9]
Более крупные азотистые основания , аденин и гуанин, относятся к классу химических структур с двойным кольцом, называемых пуринами ; меньшие азотистые основания, цитозин и тимин (и урацил), являются членами класса однокольцевых химических структур, называемых пиримидинами . Пурины комплементарны только пиримидинам: пары пиримидин-пиримидин энергетически невыгодны, поскольку молекулы расположены слишком далеко друг от друга для установления водородной связи; Пурин-пуриновые пары энергетически невыгодны, поскольку молекулы расположены слишком близко, что приводит к перекрывающемуся отталкиванию. Спаривание пурин-пиримидиновых оснований AT, GC или UA (в РНК) приводит к правильной структуре дуплекса. Единственными другими пурин-пиримидиновыми парами могут быть AC, GT и UG (в РНК); эти пары являются несовпадениями, поскольку структуры доноров и акцепторов водорода не совпадают. Спаривание GU с двумя водородными связями действительно встречается в РНК довольно часто (см. Пара оснований колебания ).
Парные молекулы ДНК и РНК сравнительно стабильны при комнатной температуре, но две нуклеотидные цепи разделяются при температуре выше точки плавления , которая определяется длиной молекул, степенью неправильного спаривания (если таковое имеется) и содержанием GC. Более высокое содержание GC приводит к более высоким температурам плавления; поэтому неудивительно, что геномы экстремофильных организмов, таких как Thermus thermophilus, особенно богаты GC. И наоборот, области генома, которые необходимо часто разделять — например, промоторные области часто транскрибируемых генов — сравнительно бедны GC (например, см. вставку TATA ). Содержание GC и температуру плавления также необходимо учитывать при разработке праймеров для реакций ПЦР . [ нужна цитата ]
Следующие последовательности ДНК иллюстрируют парные двухцепочечные структуры. По соглашению верхняя цепь записывается от 5'-конца к 3'-концу ; таким образом, нижняя цепь записывается от 3' до 5'.
ATCGATTGAGCTCTAGCG
TAGCTAACTCGAGATCGC
AUCGAUUGAGCUCUAGCG
UAGCUAACUCGAGAUCGC
Химические аналоги нуклеотидов могут занять место собственных нуклеотидов и установить неканоническое спаривание оснований, что приводит к ошибкам (в основном точечным мутациям ) в репликации и транскрипции ДНК . Это связано с их изостерическим химическим составом. Одним из распространенных аналогов мутагенных оснований является 5-бромурацил , который напоминает тимин, но может образовывать пару оснований с гуанином в его енольной форме. [10]
Другие химические вещества, известные как интеркаляторы ДНК , встраиваются в зазор между соседними основаниями на одной цепи и вызывают мутации сдвига рамки считывания , «маскируясь» под основание, заставляя механизм репликации ДНК пропускать или вставлять дополнительные нуклеотиды в интеркалированный сайт. Большинство интеркаляторов представляют собой крупные полиароматические соединения и являются известными или предполагаемыми канцерогенами . Примеры включают бромид этидия и акридин . [11] [ нужна ссылка ]
Несовпадающие пары оснований могут возникать в результате ошибок репликации ДНК и в качестве промежуточных продуктов во время гомологичной рекомбинации . Процесс репарации ошибочных спариваний обычно должен распознавать и правильно восстанавливать небольшое количество неправильных пар оснований в длинной последовательности нормальных пар оснований ДНК. Для исправления несоответствий, образовавшихся во время репликации ДНК, было разработано несколько различных процессов восстановления, позволяющих различать матричную цепь и вновь образованную цепь, так что удаляется только вновь вставленный неправильный нуклеотид (во избежание возникновения мутации). [12] Белки, используемые для восстановления несоответствий во время репликации ДНК, а также клиническое значение дефектов в этом процессе описаны в статье « Репарация несоответствий ДНК ». Процесс исправления ошибочных пар при рекомбинации описан в статье «Конверсия генов» .
Для описания длины молекулы D/R NA обычно используются следующие сокращения :
Для одноцепочечной ДНК/РНК используются единицы нуклеотидов , сокращенно nt (или knt, Mnt, Gnt), поскольку они не спарены. Чтобы различать единицы компьютерной памяти и базы, для пар оснований можно использовать kbp, Mbp, Gbp и т. д.
Сантиморган также часто используется для обозначения расстояния вдоль хромосомы, но количество пар оснований, которым он соответствует, широко варьируется . В геноме человека сентиморган составляет около 1 миллиона пар оснований. [14] [15]
Неестественная пара оснований (UBP) — это спроектированная субъединица (или азотистое основание ) ДНК , созданная в лаборатории и не встречающаяся в природе. Были описаны последовательности ДНК, которые используют вновь созданные нуклеиновые основания для образования третьей пары оснований в дополнение к двум парам оснований, обнаруженным в природе: AT ( аденин - тимин ) и GC ( гуанин - цитозин ). Несколько исследовательских групп искали третью пару оснований ДНК, в том числе команды под руководством Стивена А. Беннера , Филиппа Марлиера, Флойда Э. Ромесберга и Ичиро Хирао. [16] Сообщалось о некоторых новых парах оснований, основанных на альтернативных водородных связях, гидрофобных взаимодействиях и координации металлов. [17] [18] [19] [20]
В 1989 году Стивен Беннер (тогда работавший в Швейцарском федеральном технологическом институте в Цюрихе) и его команда начали использовать модифицированные формы цитозина и гуанина в молекулах ДНК in vitro . [21] Нуклеотиды, кодирующие РНК и белки, были успешно реплицированы in vitro . С тех пор команда Беннера пытается создать ячейки, которые смогут создавать зарубежные базы с нуля, устраняя необходимость в сырье. [22]
В 2002 году группа Ичиро Хирао в Японии разработала неестественную пару оснований между 2-амино-8-(2-тиенил)пурином (s) и пиридин-2-оном (y), которая участвует в транскрипции и трансляции, для сайт-специфических включение нестандартных аминокислот в белки. [23] В 2006 году они создали 7-(2-тиенил)имидазо[4,5-b]пиридин (Ds) и пиррол-2-карбальдегид (Pa) в качестве третьей пары оснований для репликации и транскрипции. [24] Впоследствии Ds и 4-[3-(6-аминогексанамидо)-1-пропинил]-2-нитропиррол (Px) были обнаружены как высокоточная пара при ПЦР-амплификации. [25] [26] В 2013 году они применили пару Ds-Px для генерации аптамеров ДНК путем селекции in vitro (SELEX) и продемонстрировали, что расширение генетического алфавита значительно увеличивает сродство аптамеров ДНК к белкам-мишеням. [27]
В 2012 году группа американских ученых во главе с Флойдом Ромесбергом, химиком-биологом из Исследовательского института Скриппса в Сан-Диего, Калифорния, опубликовала информацию о том, что его команда разработала неестественную пару оснований (UBP). [19] Два новых искусственных нуклеотида или пары неестественных оснований (UBP) были названы d5SICS и dNaM . С технической точки зрения, эти искусственные нуклеотиды , несущие гидрофобные азотистые основания , имеют два слитых ароматических кольца , которые образуют комплекс (d5SICS – dNaM) или пару оснований в ДНК. [22] [28] Его команда разработала множество шаблонов in vitro или «пробирок», содержащих неестественную пару оснований, и они подтвердили, что она эффективно реплицируется с высокой точностью практически во всех контекстах последовательностей с использованием современных стандартных методов in vitro , а именно ПЦР-амплификация ДНК и приложения на основе ПЦР. [19] Их результаты показывают, что для ПЦР и приложений на основе ПЦР неестественная пара оснований d5SICS–dNaM функционально эквивалентна природной паре оснований, а в сочетании с двумя другими природными парами оснований, используемыми всеми организмами, A–T и G – C, они предоставляют полностью функциональный и расширенный шестибуквенный «генетический алфавит». [28]
В 2014 году та же команда из Научно-исследовательского института Скриппса сообщила, что они синтезировали участок кольцевой ДНК, известный как плазмида, содержащую природные пары оснований TA и CG, а наиболее эффективная лаборатория UBP Ромесберга разработала и вставила его в клетки обычной бактерии. E. coli , которая успешно воспроизводила неестественные пары оснований в нескольких поколениях. [16] Трансфекция не препятствовала росту клеток E. coli и не выявила признаков потери неестественных пар оснований из-за естественных механизмов репарации ДНК . Это первый известный пример передачи живым организмом расширенного генетического кода последующим поколениям. [28] [29] Ромесберг сказал, что он и его коллеги создали 300 вариантов, чтобы усовершенствовать конструкцию нуклеотидов, которые будут достаточно стабильными и будут воспроизводиться так же легко, как и естественные, при делении клеток. Частично это было достигнуто за счет добавления вспомогательного гена водорослей , который экспрессирует переносчик нуклеотид-трифосфата , который эффективно импортирует трифосфаты как d5SICSTP, так и dNaMTP в бактерии E. coli . [28] Затем естественные пути репликации бактерий используют их для точной репликации плазмиды , содержащей d5SICS–dNaM. Другие исследователи были удивлены тем, что бактерии воспроизвели эти субъединицы ДНК, созданные человеком. [30]
Успешное включение третьей пары оснований является значительным прорывом на пути к значительному расширению числа аминокислот , которые могут кодироваться ДНК, с существующих 20 аминокислот до теоретически возможных 172, тем самым расширяя возможности живых организмов производить новые белки . [16] Искусственные нити ДНК пока ничего не кодируют, но ученые предполагают, что они могут быть разработаны для производства новых белков, которые могут найти промышленное или фармацевтическое применение. [31] Эксперты заявили, что синтетическая ДНК, включающая неестественную пару оснований, повышает вероятность существования форм жизни, основанных на другом коде ДНК. [30] [31]
Помимо канонического спаривания, некоторые условия могут также благоприятствовать спариванию оснований с альтернативной ориентацией оснований, а также количеством и геометрией водородных связей. Эти пары сопровождаются изменениями формы локального позвоночника. [ нужна цитата ]
Наиболее распространенным из них является колебательное спаривание оснований , которое происходит между тРНК и мРНК в положении третьего основания многих кодонов во время транскрипции [33] и во время зарядки тРНК некоторыми тРНК-синтетазами . [34] Они также наблюдались во вторичных структурах некоторых последовательностей РНК. [35]
Кроме того, спаривание оснований Хугстина (обычно обозначаемое как A•U/T и G•C) может существовать в некоторых последовательностях ДНК (например, динуклеотидах CA и TA) в динамическом равновесии со стандартным спариванием Уотсона-Крика. [32] Они также наблюдались в некоторых комплексах белок-ДНК. [36]
Помимо этих альтернативных пар оснований, во вторичной и третичной структуре РНК наблюдается широкий спектр водородных связей основания-основания. [37] Эти связи часто необходимы для точной и сложной формы РНК, а также для ее связывания с партнерами по взаимодействию. [37]
Каждое мутагенное событие в присутствии акридина приводит к добавлению или удалению одной пары оснований.
...у людей 1 сантиморган в среднем представляет собой расстояние примерно 7,5x10 5 пар оснований.