Дизайн нуклеиновых кислот

Дизайн нуклеиновых кислот — это процесс создания набора последовательностей оснований нуклеиновых кислот , которые будут ассоциироваться в желаемую конформацию. Дизайн нуклеиновых кислот занимает центральное место в областях ДНК-нанотехнологий и ДНК-вычислений . ^[2] Он необходим, поскольку существует множество возможных последовательностей цепей нуклеиновых кислот, которые будут складываться в заданную вторичную структуру , но многие из этих последовательностей будут иметь нежелательные дополнительные взаимодействия, которых следует избегать. Кроме того, существует множество соображений третичной структуры , которые влияют на выбор вторичной структуры для заданного дизайна. ^[3]^[4]

Дизайн нуклеиновых кислот имеет схожие цели с дизайном белков : в обоих случаях последовательность мономеров рационально спроектирована так, чтобы благоприятствовать желаемой свернутой или связанной структуре и не благоприятствовать альтернативным структурам. Однако дизайн нуклеиновых кислот имеет то преимущество, что он является гораздо более простой в вычислительном отношении проблемой, поскольку простота правил спаривания оснований Уотсона-Крика приводит к простым эвристическим методам, которые дают экспериментально надежные конструкции. Вычислительные модели для сворачивания белков требуют информации о третичной структуре , тогда как дизайн нуклеиновых кислот может работать в основном на уровне вторичной структуры . Однако структуры нуклеиновых кислот менее универсальны, чем белки по своей функциональности. ^[2]^[5]

Проектирование нуклеиновых кислот можно считать обратным процессом прогнозирования структуры нуклеиновых кислот . При прогнозировании структуры структура определяется из известной последовательности, тогда как при проектировании нуклеиновых кислот генерируется последовательность, которая сформирует желаемую структуру. ^[2]

Фундаментальные концепции

Структура нуклеиновых кислот состоит из последовательности нуклеотидов . Существует четыре типа нуклеотидов, различающихся по тому, какое из четырех азотистых оснований они содержат: в ДНК это аденин (A), цитозин (C), гуанин (G) и тимин (T). Нуклеиновые кислоты обладают свойством связываться друг с другом, образуя двойную спираль , только если две последовательности комплементарны , то есть они могут образовывать соответствующие последовательности пар оснований . Таким образом, в нуклеиновых кислотах последовательность определяет схему связывания и, следовательно, общую структуру. ^[5]

Дизайн нуклеиновой кислоты — это процесс, посредством которого, учитывая желаемую целевую структуру или функциональность, генерируются последовательности для цепей нуклеиновой кислоты, которые будут самоорганизовываться в эту целевую структуру. Дизайн нуклеиновой кислоты охватывает все уровни структуры нуклеиновой кислоты :

Первичная структура — исходная последовательность азотистых оснований каждой из составляющих цепей нуклеиновой кислоты;
Вторичная структура — совокупность взаимодействий между основаниями, т. е. какие части каких нитей связаны друг с другом; и
Третичная структура — расположение атомов в трехмерном пространстве с учетом геометрических и стерических ограничений.

Одной из самых больших проблем в дизайне нуклеиновых кислот является обеспечение того, чтобы целевая структура имела самую низкую свободную энергию (т.е. была наиболее термодинамически благоприятной), тогда как деформированные структуры имеют более высокие значения свободной энергии и, таким образом, неблагоприятны. ^[2] Эти цели могут быть достигнуты с помощью ряда подходов, включая эвристические , термодинамические и геометрические. Почти все задачи дизайна нуклеиновых кислот решаются с помощью компьютеров, и для многих из этих задач доступно множество программных пакетов.

Два соображения при проектировании нуклеиновых кислот заключаются в том, что желаемые гибридизации должны иметь температуры плавления в узком диапазоне, а любые ложные взаимодействия должны иметь очень низкие температуры плавления (т. е. они должны быть очень слабыми). ^[5] Существует также контраст между оптимизирующим сродство «позитивным проектированием», которое стремится минимизировать энергию желаемой структуры в абсолютном смысле, и оптимизирующим специфичность «негативным проектированием», которое учитывает энергию целевой структуры относительно энергии нежелательных структур. Алгоритмы, реализующие оба вида проектирования, как правило, работают лучше, чем те, которые рассматривают только один тип. ^[2]

Подходы

Эвристические методы

Эвристические методы используют простые критерии, которые можно быстро оценить, чтобы судить о пригодности различных последовательностей для данной вторичной структуры. Они имеют преимущество в том, что они намного менее затратны в вычислительном отношении, чем алгоритмы минимизации энергии , необходимые для термодинамического или геометрического моделирования, и их легче реализовать, но ценой этого является их меньшая строгость, чем эти модели.

Минимизация симметрии последовательности является старейшим подходом к проектированию нуклеиновых кислот и впервые была использована для проектирования неподвижных версий разветвленных структур ДНК. Минимизация симметрии последовательности делит последовательность нуклеиновой кислоты на перекрывающиеся подпоследовательности фиксированной длины, называемой длиной критерия. Каждая из 4 ^N возможных подпоследовательностей длины N может появляться в последовательности только один раз. Это гарантирует, что не может произойти нежелательной гибридизации, длина которой больше или равна длине критерия. ^[2]^[3]

Связанный эвристический подход заключается в рассмотрении «расстояния несоответствия», то есть числа позиций в определенном кадре, где основания не являются комплементарными . Большее расстояние несоответствия уменьшает вероятность того, что может произойти сильное ложное взаимодействие. ^[5] Это связано с концепцией расстояния Хэмминга в теории информации . Другой связанный, но более сложный подход заключается в использовании методов из теории кодирования для построения последовательностей нуклеиновых кислот с желаемыми свойствами.

Термодинамические модели

Информацию о вторичной структуре комплекса нуклеиновой кислоты, а также ее последовательности можно использовать для прогнозирования термодинамических свойств комплекса.

При использовании термодинамических моделей в дизайне нуклеиновых кислот обычно учитываются два фактора: желаемые гибридизации должны иметь температуры плавления в узком диапазоне, а любые ложные взаимодействия должны иметь очень низкие температуры плавления (т. е. они должны быть очень слабыми). Свободную энергию Гиббса идеально подобранного дуплекса нуклеиновой кислоты можно предсказать с помощью модели ближайшего соседа . Эта модель учитывает только взаимодействия между нуклеотидом и его ближайшими соседями на цепи нуклеиновой кислоты, суммируя свободную энергию каждого из перекрывающихся двухнуклеотидных подслов дуплекса. Затем это корректируется для самокомплементарных мономеров и для содержания GC . Как только свободная энергия известна, можно определить температуру плавления дуплекса. Содержание GC само по себе также можно использовать для оценки свободной энергии и температуры плавления дуплекса нуклеиновой кислоты. Это менее точно, но и гораздо менее затратно с точки зрения вычислений. ^[5]

Программное обеспечение для термодинамического моделирования нуклеиновых кислот включает Nupack , ^[6]^[7] mfold/UNAFold, ^[8] и Vienna. ^[9]

Связанный подход, обратное предсказание вторичной структуры, использует стохастический локальный поиск, который улучшает последовательность нуклеиновой кислоты путем запуска алгоритма предсказания структуры и модификации последовательности для устранения нежелательных особенностей. ^[5]

Геометрические модели

Геометрические модели нуклеиновых кислот используются для прогнозирования третичной структуры . Это важно, поскольку разработанные комплексы нуклеиновых кислот обычно содержат несколько точек соединения, что вносит геометрические ограничения в систему. Эти ограничения вытекают из базовой структуры нуклеиновых кислот , в основном из того, что двойная спираль, образованная дуплексами нуклеиновых кислот, имеет фиксированную спиральность около 10,4 пар оснований на виток и является относительно жесткой . Из-за этих ограничений комплексы нуклеиновых кислот чувствительны к относительной ориентации больших и малых канавок в точках соединения. Геометрическое моделирование может обнаружить деформацию , возникающую из-за несоответствий в структуре, которые затем могут быть исправлены проектировщиком. ^[4]^[11]

Геометрические модели нуклеиновых кислот для ДНК-нанотехнологий обычно используют сокращенные представления нуклеиновой кислоты, поскольку моделирование каждого атома было бы очень затратным в вычислительном отношении для таких больших систем. Сообщалось, что модели с тремя псевдоатомами на пару оснований, представляющие два основных сахара и ось спирали, имеют достаточный уровень детализации для прогнозирования экспериментальных результатов. ^[11] Однако также используются модели с пятью псевдоатомами на пару оснований, явно включая основные фосфаты. ^[12]

Программное обеспечение для геометрического моделирования нуклеиновых кислот включает GIDEON, ^[11] Tiamat, ^[13] Nanoengineer-1 и UNIQUIMER 3D. ^[14] Геометрические проблемы особенно интересны при проектировании ДНК-оригами , поскольку последовательность предопределена выбором нити каркаса. Было создано программное обеспечение специально для проектирования ДНК-оригами, включая caDNAno ^[15] и SARSE. ^[16]

Приложения

Нуклеиновая кислота дизайн используется в ДНК нанотехнологии для проектирования нитей, которые будут самособираться в желаемую целевую структуру. К ним относятся такие примеры, как ДНК машины , периодические двух- и трехмерные решетки, многогранники и ДНК оригами . ^[2] Его также можно использовать для создания наборов нитей нуклеиновой кислоты, которые являются «ортогональными» или не взаимодействующими друг с другом, чтобы минимизировать или исключить ложные взаимодействия. Это полезно в ДНК вычислениях , а также для молекулярного штрихкодирования приложений в химической биологии и биотехнологии . ^[5]

Смотрите также

Ссылки

^ Мао, Чэндэ (декабрь 2004 г.). «Возникновение сложности: уроки ДНК». PLOS Biology . 2 (12): 2036–2038. doi : 10.1371/journal.pbio.0020431 . ISSN 1544-9173. PMC 535573. PMID 15597116 .
^ abcdefg Диркс, Роберт М.; Лин, Мило; Уинфри, Эрик; Пирс, Найлс А. (2004). «Парадигмы для вычислительного проектирования нуклеиновых кислот». Nucleic Acids Research . 32 (4): 1392–1403. doi :10.1093/nar/gkh291. PMC 390280. PMID 14990744 .
^ ab Seeman, N (1982). «Соединения и решетки нуклеиновых кислот». Журнал теоретической биологии . 99 (2): 237–47. Bibcode :1982JThBi..99..237S. doi :10.1016/0022-5193(82)90002-9. PMID 6188926.
^ ab Шерман, В.; Симан, Н. (2006). «Проектирование минимально напряженных нанотрубок нуклеиновых кислот». Biophysical Journal . 90 (12): 4546–57. Bibcode :2006BpJ....90.4546S. doi :10.1529/biophysj.105.080390. PMC 1471877 . PMID 16581842.
^ abcdefg Бреннеман, Арвен; Кондон, Энн (2002). «Проектирование цепей для биомолекулярных вычислений». Теоретическая информатика . 287 : 39–58. doi : 10.1016/S0304-3975(02)00135-4 .
^ Диркс, Роберт М.; Буа, Джастин С.; Шеффер, Джозеф М.; Уинфри, Эрик; Пирс, Найлс А. (2007). «Термодинамический анализ взаимодействующих цепей нуклеиновых кислот». Обзор SIAM . 49 (1): 65–88. Bibcode : 2007SIAMR..49...65D. CiteSeerX 10.1.1.523.4764 . doi : 10.1137/060651100.
^ Заде, Джозеф Н.; Вольф, Брайан Р.; Пирс, Найлс А. (2011). «Проектирование последовательности нуклеиновой кислоты с помощью эффективной оптимизации дефектов ансамбля» (PDF) . Журнал вычислительной химии . 32 (3): 439–452. doi :10.1002/jcc.21633. PMID 20717905. S2CID 1803200.
^ Zuker, M. (2003). "Mfold веб-сервер для предсказания фолдинга и гибридизации нуклеиновых кислот". Nucleic Acids Research . 31 (13): 3406–15. doi :10.1093/nar/gkg595. PMC 169194. PMID 12824337 .
^ Gruber AR, Lorenz R, Bernhart SH, Neuböck R, Hofacker IL (2008). "The Vienna RNA websuite". Nucleic Acids Res . 36 (выпуск веб-сервера): W70–4. doi :10.1093/nar/gkn188. PMC 2447809. PMID 18424795 .
^ Goodman, RP; Schaap, IAT; Tardin, CF; Erben, CM; Berry, RM; Schmidt, CF; Turberfield, AJ (9 декабря 2005 г.). «Быстрая хиральная сборка жестких строительных блоков ДНК для молекулярной нанофабрикации». Science . 310 (5754): 1661–1665. Bibcode :2005Sci...310.1661G. doi :10.1126/science.1120367. ISSN 0036-8075. PMID 16339440. S2CID 13678773.
^ abc Birac, Jeffrey J.; Sherman, William B.; Kopatsch, Jens; Constantinou, Pamela E.; Seeman, Nadrian C. (2006). «Архитектура с GIDEON, программой для проектирования в структурной ДНК-нанотехнологии». Журнал молекулярной графики и моделирования . 25 (4): 470–80. doi :10.1016/j.jmgm.2006.03.005. PMC 3465968. PMID 16630733 .
^ "Описания моделей PAM3 и PAM5". Документация Nanoengineer-1 wiki . Nanorex . Получено 2010-04-15 .
^ Уильямс, Шон; Ланд, Кайл; Линь, Чэньсян; Вонка, Питер; Линдси, Стюарт; Янь, Хао (2009). «Тиамат: трехмерный инструмент редактирования сложных структур ДНК». Вычисления ДНК . Конспект лекций по информатике. Том 5347. Springer Berlin / Heidelberg. стр. 90–101. doi :10.1007/978-3-642-03076-5_8. ISBN 978-3-642-03075-8. ISSN 0302-9743.
^ Zhu, J.; Wei, B.; Yuan, Y.; Mi, Y. (2009). «UNIQUIMER 3D, программная система для проектирования, анализа и оценки структурных нанотехнологий ДНК». Nucleic Acids Research . 37 (7): 2164–75. doi :10.1093/nar/gkp005. PMC 2673411. PMID 19228709 .
^ Дуглас, SM; Марблстоун, AH; Тирапиттаянон, S.; Васкес, A.; Чёрч, GM; Ши, WM (2009). «Быстрое прототипирование 3D-форм ДНК-оригами с помощью caDNAno». Nucleic Acids Research . 37 (15): 5001–6. doi :10.1093/nar/gkp436. PMC 2731887. PMID 19531737 .
^ Андерсен, Эббе С.; Донг, Миндонг; Нильсен, Мортен М.; Ян, Каспер; Линд-Томсен, Аллан; Мамду, Ваэль; Готельф, Курт В.; Безенбахер, Флемминг; Кьемс, Йорген (2008). «ДНК-оригами-конструкции в форме дельфинов с гибкими хвостами». АСУ Нано . 2 (6): 1213–8. дои : 10.1021/nn800215j. ПМИД 19206339.

Дальнейшее чтение

Бреннеман, Арвен; Кондон, Энн (2002). «Проектирование цепей для биомолекулярных вычислений». Теоретическая информатика . 287 : 39–58. doi : 10.1016/S0304-3975(02)00135-4 .—Обзор подходов к проектированию первичной структуры нуклеиновых кислот.
Диркс, Роберт М.; Лин, Мило; Уинфри, Эрик; Пирс, Найлс А. (2004). «Парадигмы для вычислительного проектирования нуклеиновых кислот». Nucleic Acids Research . 32 (4): 1392–1403. doi :10.1093/nar/gkh291. PMC 390280. PMID 14990744 .—Сравнение и оценка ряда эвристических и термодинамических методов проектирования нуклеиновых кислот.
Симан, Н (1982). «Соединения и решетки нуклеиновых кислот». Журнал теоретической биологии . 99 (2): 237–47. Bibcode : 1982JThBi..99..237S. doi : 10.1016/0022-5193(82)90002-9. PMID 6188926.— Одна из самых ранних статей по дизайну нуклеиновых кислот, описывающая использование минимизации симметрии последовательности для построения неподвижных разветвленных соединений.
Андерсен, Эббе Слот (2010). «Прогнозирование и проектирование структур ДНК и РНК». Новая биотехнология . 27 (3): 184–193. doi :10.1016/j.nbt.2010.02.012. PMID 20193785.—Обзор, сравнивающий возможности доступного программного обеспечения для проектирования нуклеиновых кислот.