Пара оснований Хугстина — это разновидность спаривания оснований в нуклеиновых кислотах, например, пара A•T. Таким образом, два азотистых основания , по одному на каждой нити, могут удерживаться вместе водородными связями в большой бороздке. Пара оснований Хугстина использует положение N7 пуринового основания (как акцептор водородной связи ) и аминогруппу C6 (как донор), которые связывают поверхность Уотсона–Крика (N3–C4) пиримидинового основания .
Спустя десять лет после того, как Джеймс Уотсон и Фрэнсис Крик опубликовали свою модель двойной спирали ДНК, [2] Карст Хугстин сообщил [3] о кристаллической структуре комплекса, в котором аналоги A и T образовали пару оснований, которая имела геометрию, отличную от описанной Уотсоном и Криком. Аналогично, альтернативная геометрия спаривания оснований может иметь место для пар G•C. Хугстин указал, что если бы в ДНК присутствовали альтернативные модели водородных связей, то двойная спираль должна была бы принять совершенно иную форму. Пары оснований Хугстина наблюдаются в альтернативных структурах, таких как четырехцепочечные G-квадруплексные структуры, которые образуются в ДНК и РНК.
Пары Хугстина имеют совершенно иные свойства, чем пары оснований Уотсона–Крика . Угол между двумя гликозидными связями (около 80° в паре A• T) больше, а расстояние C1 ′ –C1 ′ (около 860 пм или 8,6 Å) меньше, чем в обычной геометрии. В некоторых случаях, называемых обращенными парами оснований Хугстина , одно основание повернуто на 180° относительно другого.
В некоторых последовательностях ДНК, особенно в динуклеотидах CA и TA, пары оснований Хугстина существуют как переходные сущности, которые присутствуют в тепловом равновесии со стандартными парами оснований Уотсона-Крика. Обнаружение переходных видов потребовало использования релаксационной дисперсионной спектроскопии ЯМР, применяемой к макромолекулам. [1]
Пары оснований Хугстина наблюдались в комплексах белок–ДНК. [4] Некоторые белки эволюционировали так, чтобы распознавать только один тип пар оснований и использовать межмолекулярные взаимодействия для смещения равновесия между двумя геометриями.
ДНК имеет много особенностей, которые позволяют белкам распознавать ее последовательность-специфическую. Первоначально считалось, что это распознавание в первую очередь включает специфические водородные связи между боковыми цепями аминокислот и основаниями. Но вскоре стало ясно, что не существует идентифицируемого соответствия один к одному — то есть не существует простого кода для считывания. Часть проблемы заключается в том, что ДНК может претерпевать конформационные изменения, которые искажают классическую двойную спираль. Получающиеся изменения изменяют представление оснований ДНК молекулам белков и, таким образом, влияют на механизм распознавания.
Поскольку искажения в двойной спирали сами по себе зависят от последовательности оснований, белки способны распознавать ДНК способом, аналогичным тому, как они распознают другие белки и малые молекулы лигандов, т. е. через геометрическую форму (вместо конкретной последовательности). Например, растяжения оснований A и T могут привести к сужению малой бороздки ДНК (более узкой из двух бороздок в двойной спирали), что приводит к усилению локальных отрицательных электростатических потенциалов, что в свою очередь создает сайты связывания для положительно заряженных остатков аминокислоты аргинина на белке.
Это не-Уотсон-Криковское спаривание оснований позволяет третьим цепям обвиваться вокруг дуплексов, которые собираются в шаблоне Уотсона-Крика , и образовывать трехцепочечные спирали, такие как (поли(dA)•2поли(dT)) и (поли(rG)•2поли(rC)). [5] Это также можно увидеть в трехмерных структурах транспортной РНК , таких как T54•A58 и U8•A14. [6] [7]
Пары оснований Уотсона–Крика обозначаются символами «•», «-» или «.» (пример: A•T или poly(rC)•2poly(rC)).
Трехцепочечные пары оснований ДНК Хугстина обозначаются символом «*» или «:» (пример: C•G*C+, T•A*T, C•G*G или T•A*A).
Пары Хугстина также позволяют формировать вторичные структуры одноцепочечной ДНК и РНК, богатые G, называемые G-квадруплексами (G4-ДНК и G4-РНК). Существуют доказательства образования G4 как in vitro, так и in vivo. Геномные G4, как предполагается, регулируют транскрипцию генов и на уровне РНК ингибируют синтез белка посредством стерического ингибирования функции рибосомы. Для этого необходимы четыре триплета G, разделенных короткими спейсерами. Это позволяет собирать плоские квартеты, которые состоят из сложенных ассоциаций молекул гуанина, связанных Хугстином. [8]