Вторичная структура нуклеиновой кислоты

Вторичная структура нуклеиновой кислоты — это взаимодействия пар оснований в пределах одного полимера нуклеиновой кислоты или между двумя полимерами. Ее можно представить в виде списка оснований, которые спарены в молекуле нуклеиновой кислоты. ^[1] Вторичные структуры биологических ДНК и РНК , как правило, различаются: биологическая ДНК в основном существует в виде полностью спаренных оснований двойных спиралей, в то время как биологическая РНК является одноцепочечной и часто образует сложные и запутанные взаимодействия пар оснований из-за ее повышенной способности образовывать водородные связи, обусловленные дополнительной гидроксильной группой в сахаре рибозы . ^{[ необходима цитата ]}

В небиологическом контексте вторичная структура является жизненно важным фактором при проектировании структур нуклеиновых кислот для ДНК-нанотехнологий и ДНК-вычислений , поскольку схема спаривания оснований в конечном итоге определяет общую структуру молекул.

Фундаментальные концепции

Спаривание оснований

Вверху — пара оснований AT, демонстрирующая две межмолекулярные водородные связи; внизу — пара оснований GC, демонстрирующая три межмолекулярные водородные связи .

В молекулярной биологии два нуклеотида на противоположных комплементарных цепях ДНК или РНК , которые соединены водородными связями , называются парой оснований (часто сокращенно bp). В каноническом спаривании оснований Уотсона-Крика аденин (A) образует пару оснований с тимином (T), а гуанин (G) образует пару оснований с цитозином (C) в ДНК. В РНК тимин заменяется урацилом (U). Альтернативные модели водородных связей, такие как пара оснований качания и пара оснований Хугстина , также встречаются — особенно в РНК — приводя к образованию сложных и функциональных третичных структур . Важно отметить, что спаривание — это механизм, с помощью которого кодоны на молекулах информационной РНК распознаются антикодонами на транспортной РНК во время трансляции белка . Некоторые ДНК- или РНК-связывающие ферменты могут распознавать определенные модели спаривания оснований, которые идентифицируют определенные регуляторные области генов. Водородная связь — это химический механизм, который лежит в основе правил спаривания оснований, описанных выше. Соответствующее геометрическое соответствие доноров и акцепторов водородных связей позволяет стабильно образовываться только «правильным» парам. ДНК с высоким содержанием GC более стабильна, чем ДНК с низким содержанием GC , но вопреки распространенному мнению, водородные связи не стабилизируют ДНК в значительной степени, а стабилизация в основном обусловлена взаимодействиями при стэкинге . ^[2]

Более крупные азотистые основания , аденин и гуанин, являются членами класса двухкольцевых химических структур, называемых пуринами ; более мелкие азотистые основания, цитозин и тимин (и урацил), являются членами класса однокольцевых химических структур, называемых пиримидинами . Пурины комплементарны только пиримидинам: пары пиримидин-пиримидин энергетически невыгодны, поскольку молекулы находятся слишком далеко друг от друга для образования водородных связей; пары пурин-пурин энергетически невыгодны, поскольку молекулы находятся слишком близко, что приводит к перекрывающемуся отталкиванию. Единственными другими возможными парами являются GT и AC; эти пары являются несоответствиями, поскольку паттерны доноров и акцепторов водорода не соответствуют друг другу. Пара оснований GU с двумя водородными связями довольно часто встречается в РНК .

Гибридизация нуклеиновых кислот

Гибридизация — это процесс связывания комплементарных пар оснований с образованием двойной спирали . Плавление — это процесс, при котором взаимодействия между цепями двойной спирали разрываются, разделяя две цепи нуклеиновой кислоты. Эти связи слабые, легко разделяются при легком нагревании, ферментами или физической силой. Плавление происходит преимущественно в определенных точках нуклеиновой кислоты. ^{[3] Последовательности, богатые} T и A, плавятся легче, чем области, богатые C и G. Определенные ступени оснований также подвержены плавлению ДНК, особенно ступени оснований TA и TG . ^[4] Эти механические особенности отражаются в использовании последовательностей, таких как TATAA, в начале многих генов, чтобы помочь РНК-полимеразе плавить ДНК для транскрипции.

Разделение цепей путем осторожного нагревания, как это используется в ПЦР , является простым, если молекулы имеют менее 10 000 пар оснований (10 килобаз или 10 кбн). Переплетение цепей ДНК затрудняет разделение длинных сегментов. Клетка избегает этой проблемы, позволяя своим ферментам, плавящим ДНК ( хеликазам ), работать одновременно с топоизомеразами , которые могут химически расщеплять фосфатный остов одной из цепей, чтобы она могла вращаться вокруг другой. Хеликазы раскручивают цепи, чтобы облегчить продвижение ферментов, считывающих последовательность, таких как ДНК-полимераза .

Мотивы вторичной структуры

Вторичная структура нуклеиновой кислоты обычно делится на спирали (смежные пары оснований) и различные виды петель (неспаренные нуклеотиды, окруженные спиралями). Часто эти элементы или их комбинации далее классифицируются по дополнительным категориям, включая, например, тетрапетли , псевдоузлы и стебель-петли . Топологические подходы могут использоваться для категоризации и сравнения сложных структур, которые возникают в результате объединения этих элементов в различных расположениях.

Двойная спираль

Двойная спираль — важная третичная структура в молекулах нуклеиновых кислот, которая тесно связана с вторичной структурой молекулы. Двойная спираль образована областями многих последовательных пар оснований.

Двойная спираль нуклеиновой кислоты представляет собой спиральный полимер, обычно правосторонний, содержащий две нуклеотидные нити, которые спариваются вместе. Один виток спирали составляет около десяти нуклеотидов и содержит большую и малую бороздки, большая бороздка шире малой бороздки. ^[5] Учитывая разницу в ширине большой и малой бороздки, многие белки, которые связываются с ДНК, делают это через более широкую большую бороздку. ^[6] Возможны многие формы двойной спирали; для ДНК тремя биологически значимыми формами являются A-ДНК , B-ДНК и Z-ДНК , в то время как двойные спирали РНК имеют структуры, похожие на форму A ДНК.

Структуры стебель-петля

Вторичная структура молекул нуклеиновых кислот часто может быть однозначно разложена на стебли и петли. Структура стебель-петля (также часто называемая «шпилькой»), в которой спаренная спираль заканчивается короткой неспаренной петлей, чрезвычайно распространена и является строительным блоком для более крупных структурных мотивов, таких как структуры клеверного листа, которые представляют собой четырехспиральные соединения, такие как те, что встречаются в транспортной РНК . Внутренние петли (короткая серия неспаренных оснований в более длинной парной спирали) и выпуклости (области, в которых одна нить спирали имеет «дополнительные» вставленные основания без аналогов в противоположной нити) также часто встречаются.

Существует множество элементов вторичной структуры, имеющих функциональное значение для биологических РНК; некоторые известные примеры — Rho-независимые терминаторные петли-стебли и тРНК-клеверный лист . Продолжаются активные исследования по определению вторичной структуры молекул РНК, с подходами, включающими как экспериментальные , так и вычислительные методы (см. также Список программного обеспечения для прогнозирования структуры РНК ).

Псевдоузлы

Структура псевдоузла РНК . Например, компонент РНК человеческой теломеразы . ^[7]

Псевдоузел — это вторичная структура нуклеиновой кислоты, содержащая по крайней мере две структуры стебель-петля , в которых половина одного стебля вставлена между двумя половинами другого стебля. Псевдоузлы складываются в трехмерные конформации в форме узла, но не являются истинными топологическими узлами . Спаривание оснований в псевдоузлах не является хорошо вложенным; то есть пары оснований встречаются так, что «перекрывают» друг друга в положении последовательности. Это делает невозможным предсказание наличия общих псевдоузлов в последовательностях нуклеиновых кислот стандартным методом динамического программирования , который использует рекурсивную систему подсчета для идентификации парных стеблей и, следовательно, не может обнаружить невложенные пары оснований с помощью общих алгоритмов. Однако ограниченные подклассы псевдоузлов можно предсказать с помощью модифицированных динамических программ. ^[8] Более новые методы предсказания структуры, такие как стохастические контекстно-свободные грамматики, также не способны рассматривать псевдоузлы.

Псевдоузлы могут образовывать различные структуры с каталитической активностью ^[9] , и несколько важных биологических процессов зависят от молекул РНК, которые образуют псевдоузлы. Например, РНК-компонент человеческой теломеразы содержит псевдоузел, который имеет решающее значение для ее активности. ^[7] Рибозим вируса гепатита дельта является хорошо известным примером каталитической РНК с псевдоузлом в ее активном центре. ^[10]^[11] Хотя ДНК также может образовывать псевдоузлы, они, как правило, не присутствуют в стандартных физиологических условиях .

Прогнозирование вторичной структуры

Большинство методов предсказания вторичной структуры нуклеиновых кислот основаны на термодинамической модели ближайшего соседа. ^[12]^[13] Обычный метод определения наиболее вероятных структур с учетом последовательности нуклеотидов использует алгоритм динамического программирования , который стремится найти структуры с низкой свободной энергией. ^[14] Алгоритмы динамического программирования часто запрещают псевдоузлы или другие случаи, в которых пары оснований не полностью вложены, поскольку рассмотрение этих структур становится вычислительно очень дорогим даже для небольших молекул нуклеиновых кислот. Другие методы, такие как стохастические контекстно-свободные грамматики, также могут использоваться для предсказания вторичной структуры нуклеиновых кислот.

Для многих молекул РНК вторичная структура очень важна для правильной функции РНК — часто даже важнее, чем фактическая последовательность. Этот факт помогает в анализе некодирующих РНК, иногда называемых «РНК-генами». Одно из приложений биоинформатики использует предсказанные вторичные структуры РНК для поиска в геноме некодирующих, но функциональных форм РНК. Например, микроРНК имеют канонические длинные структуры стебля-петли, прерываемые небольшими внутренними петлями.

Вторичная структура РНК применяется в сплайсинге РНК у некоторых видов. Было показано, что у людей и других четвероногих без белка U2AF2 процесс сплайсинга подавляется. Однако у данио-рерио и других костистых процесс сплайсинга РНК все еще может происходить на определенных генах в отсутствие U2AF2. Это может быть связано с тем, что 10% генов у данио-рерио имеют чередующиеся пары оснований TG и AC в 3'-сайте сплайсинга (3'ss) и 5'-сайте сплайсинга (5'ss) соответственно на каждом интроне, что изменяет вторичную структуру РНК. Это говорит о том, что вторичная структура РНК может влиять на сплайсинг, потенциально без использования белков, таких как U2AF2, которые, как считалось, необходимы для сплайсинга. ^[15]

Определение вторичной структуры

Вторичная структура РНК может быть определена из атомных координат (третичная структура), полученных с помощью рентгеновской кристаллографии , часто депонированной в Protein Data Bank . Текущие методы включают 3DNA/DSSR ^[16] и MC-аннотацию. ^[17]

Смотрите также

ДНК-нанотехнология
Молекулярные модели ДНК
DiProDB . База данных предназначена для сбора и анализа термодинамических, структурных и других свойств динуклеотидов.
РНК CoSSMos

Ссылки

^ Диркс, Роберт М.; Лин, Мило; Уинфри, Эрик и Пирс, Найлс А. (2004). «Парадигмы для вычислительного проектирования нуклеиновых кислот». Nucleic Acids Research . 32 (4): 1392–1403. doi :10.1093/nar/gkh291. PMC 390280. PMID 14990744 .
^ Яковчук, Питер; Протозанова, Екатерина; Франк-Каменецкий, Максим Д. (2006). «Вклад стэкинга и спаривания оснований в термическую стабильность двойной спирали ДНК». Nucleic Acids Research . 34 (2): 564–574. doi :10.1093/nar/gkj454. PMC 1360284. PMID 16449200.
^ Бреслауер К. Дж., Франк Р., Блокер Х., Марки ЛА (1986). «Предсказание стабильности дуплекса ДНК по последовательности оснований». PNAS . 83 (11): 3746–3750. Bibcode :1986PNAS...83.3746B. doi : 10.1073/pnas.83.11.3746 . PMC 323600 . PMID 3459152.
^ Ричард Овчарзи (28.08.2008). "Температура плавления ДНК - как ее рассчитать?". Высокопроизводительная биофизика ДНК . owczarzy.net. Архивировано из оригинала 30.04.2015 . Получено 02.10.2008 .
^ Альбертс и др. (1994). Молекулярная биология клетки . Нью-Йорк: Garland Science. ISBN 978-0-8153-4105-5.
^ Пабо С., Зауэр Р. (1984). «Распознавание белка-ДНК». Анну Рев Биохим . 53 : 293–321. doi : 10.1146/annurev.bi.53.070184.001453. ПМИД 6236744.
^ ab Chen JL, Greider CW (2005). "Функциональный анализ структуры псевдоузла в РНК человеческой теломеразной молекулы". Proc Natl Acad Sci USA . 102 (23): 8080–5. Bibcode : 2005PNAS..102.8080C. doi : 10.1073/pnas.0502259102 . PMC 1149427. PMID 15849264 .
^ Ривас Э., Эдди СР (1999). «Алгоритм динамического программирования для предсказания структуры РНК, включая псевдоузлы». J Mol Biol . 285 (5): 2053–2068. arXiv : physics/9807048 . doi :10.1006/jmbi.1998.2436. PMID 9925784. S2CID 2228845.
^ Staple, David W.; Butcher, Samuel E. (2005-06-14). "Псевдоузлы: структуры РНК с разнообразными функциями". PLOS Biol . 3 (6): e213. doi : 10.1371/journal.pbio.0030213 . ISSN 1545-7885. PMC 1149493. PMID 15941360 .
^ Дудна, Дженнифер А.; Ферре-Д'Амаре, Адриан Р.; Чжоу, Кайхонг (октябрь 1998 г.). «Кристаллическая структура рибозима вируса гепатита дельта». Nature . 395 (6702): 567–574. Bibcode :1998Natur.395..567F. doi :10.1038/26912. PMID 9783582. S2CID 4359811.
^ Lai, Michael MC (1995-06-01). «Молекулярная биология вируса гепатита Дельта». Annual Review of Biochemistry . 64 (1): 259–286. doi :10.1146/annurev.bi.64.070195.001355. ISSN 0066-4154. PMID 7574482.
^ Xia T, SantaLucia J Jr, Burkard ME, Kierzek R, Schroeder SJ, Jiao X, Cox C, Turner DH (октябрь 1998 г.). «Термодинамические параметры для расширенной модели ближайшего соседа для образования дуплексов РНК с парами оснований Уотсона-Крика». Биохимия . 37 (42): 14719–35. CiteSeerX 10.1.1.579.6653 . doi :10.1021/bi9809425. PMID 9778347.
^ Mathews DH, Disney MD, Childs JL, Schroeder SJ, Zuker M, Turner DH (май 2004 г.). «Включение ограничений химической модификации в алгоритм динамического программирования для предсказания вторичной структуры РНК». PNAS . 101 (19): 7287–92. Bibcode :2004PNAS..101.7287M. doi : 10.1073/pnas.0401799101 . PMC 409911 . PMID 15123812.
^ Цукер, М. (1989-04-07). «О поиске всех субоптимальных складок молекулы РНК». Science . 244 (4900): 48–52. Bibcode :1989Sci...244...48Z. doi :10.1126/science.2468181. ISSN 0036-8075. PMID 2468181.
^ Лин, Чиен-Лин; Таггарт, Эллисон Дж.; Лим, Киан Хуат; Сиган, Камил Дж.; Феррарис, Лучиана; Кретон, Роберт; Хуан, Йен-Цунг; Фейрбразер, Уильям Г. (13 ноября 2015 г.). «Структура РНК заменяет потребность в U2AF2 при сплайсинге». Genome Research . 26 (1): 12–23. doi :10.1101/gr.181008.114. PMC 4691745 . PMID 26566657.
^ Lu, XJ; Bussemaker, HJ; Olson, WK (2 декабря 2015 г.). «DSSR: интегрированный программный инструмент для анализа пространственной структуры РНК». Nucleic Acids Research . 43 (21): e142. doi :10.1093/nar/gkv716. PMC 4666379. PMID 26184874 .
^ "MC-Annotate". www-lbit.iro.umontreal.ca .

Внешние ссылки

MDDNA: Структурная биоинформатика ДНК
Abalone — Коммерческое программное обеспечение для моделирования ДНК
DNAlive: веб-интерфейс для вычисления физических свойств ДНК. Также позволяет сшивать результаты с браузером UCSC Genome и динамикой ДНК.