Дизайн нуклеиновых кислот — это процесс создания набора последовательностей оснований нуклеиновых кислот , которые будут ассоциироваться в желаемую конформацию. Дизайн нуклеиновых кислот занимает центральное место в областях ДНК-нанотехнологий и ДНК-вычислений . [2] Он необходим, поскольку существует множество возможных последовательностей цепей нуклеиновых кислот, которые будут складываться в заданную вторичную структуру , но многие из этих последовательностей будут иметь нежелательные дополнительные взаимодействия, которых следует избегать. Кроме того, существует множество соображений третичной структуры , которые влияют на выбор вторичной структуры для заданного дизайна. [3] [4]
Дизайн нуклеиновых кислот имеет схожие цели с дизайном белков : в обоих случаях последовательность мономеров рационально спроектирована так, чтобы благоприятствовать желаемой свернутой или связанной структуре и не благоприятствовать альтернативным структурам. Однако дизайн нуклеиновых кислот имеет то преимущество, что он является гораздо более простой в вычислительном отношении проблемой, поскольку простота правил спаривания оснований Уотсона-Крика приводит к простым эвристическим методам, которые дают экспериментально надежные конструкции. Вычислительные модели для сворачивания белков требуют информации о третичной структуре , тогда как дизайн нуклеиновых кислот может работать в основном на уровне вторичной структуры . Однако структуры нуклеиновых кислот менее универсальны, чем белки по своей функциональности. [2] [5]
Проектирование нуклеиновых кислот можно считать обратным процессом прогнозирования структуры нуклеиновых кислот . При прогнозировании структуры структура определяется из известной последовательности, тогда как при проектировании нуклеиновых кислот генерируется последовательность, которая сформирует желаемую структуру. [2]
Структура нуклеиновых кислот состоит из последовательности нуклеотидов . Существует четыре типа нуклеотидов, различающихся по тому, какое из четырех азотистых оснований они содержат: в ДНК это аденин (A), цитозин (C), гуанин (G) и тимин (T). Нуклеиновые кислоты обладают свойством связываться друг с другом, образуя двойную спираль , только если две последовательности комплементарны , то есть они могут образовывать соответствующие последовательности пар оснований . Таким образом, в нуклеиновых кислотах последовательность определяет схему связывания и, следовательно, общую структуру. [5]
Дизайн нуклеиновой кислоты — это процесс, посредством которого, учитывая желаемую целевую структуру или функциональность, генерируются последовательности для цепей нуклеиновой кислоты, которые будут самоорганизовываться в эту целевую структуру. Дизайн нуклеиновой кислоты охватывает все уровни структуры нуклеиновой кислоты :
Одной из самых больших проблем в дизайне нуклеиновых кислот является обеспечение того, чтобы целевая структура имела самую низкую свободную энергию (т.е. была наиболее термодинамически благоприятной), тогда как деформированные структуры имеют более высокие значения свободной энергии и, таким образом, неблагоприятны. [2] Эти цели могут быть достигнуты с помощью ряда подходов, включая эвристические , термодинамические и геометрические. Почти все задачи дизайна нуклеиновых кислот решаются с помощью компьютеров, и для многих из этих задач доступно множество программных пакетов.
Два соображения при проектировании нуклеиновых кислот заключаются в том, что желаемые гибридизации должны иметь температуры плавления в узком диапазоне, а любые ложные взаимодействия должны иметь очень низкие температуры плавления (т. е. они должны быть очень слабыми). [5] Существует также контраст между оптимизирующим сродство «позитивным проектированием», которое стремится минимизировать энергию желаемой структуры в абсолютном смысле, и оптимизирующим специфичность «негативным проектированием», которое учитывает энергию целевой структуры относительно энергии нежелательных структур. Алгоритмы, реализующие оба вида проектирования, как правило, работают лучше, чем те, которые рассматривают только один тип. [2]
Эвристические методы используют простые критерии, которые можно быстро оценить, чтобы судить о пригодности различных последовательностей для данной вторичной структуры. Они имеют преимущество в том, что они намного менее затратны в вычислительном отношении, чем алгоритмы минимизации энергии , необходимые для термодинамического или геометрического моделирования, и их легче реализовать, но ценой этого является их меньшая строгость, чем эти модели.
Минимизация симметрии последовательности является старейшим подходом к проектированию нуклеиновых кислот и впервые была использована для проектирования неподвижных версий разветвленных структур ДНК. Минимизация симметрии последовательности делит последовательность нуклеиновой кислоты на перекрывающиеся подпоследовательности фиксированной длины, называемой длиной критерия. Каждая из 4 N возможных подпоследовательностей длины N может появляться в последовательности только один раз. Это гарантирует, что не может произойти нежелательной гибридизации, длина которой больше или равна длине критерия. [2] [3]
Связанный эвристический подход заключается в рассмотрении «расстояния несоответствия», то есть числа позиций в определенном кадре, где основания не являются комплементарными . Большее расстояние несоответствия уменьшает вероятность того, что может произойти сильное ложное взаимодействие. [5] Это связано с концепцией расстояния Хэмминга в теории информации . Другой связанный, но более сложный подход заключается в использовании методов из теории кодирования для построения последовательностей нуклеиновых кислот с желаемыми свойствами.
Информацию о вторичной структуре комплекса нуклеиновой кислоты, а также ее последовательности можно использовать для прогнозирования термодинамических свойств комплекса.
При использовании термодинамических моделей в дизайне нуклеиновых кислот обычно учитываются два фактора: желаемые гибридизации должны иметь температуры плавления в узком диапазоне, а любые ложные взаимодействия должны иметь очень низкие температуры плавления (т. е. они должны быть очень слабыми). Свободную энергию Гиббса идеально подобранного дуплекса нуклеиновой кислоты можно предсказать с помощью модели ближайшего соседа . Эта модель учитывает только взаимодействия между нуклеотидом и его ближайшими соседями на цепи нуклеиновой кислоты, суммируя свободную энергию каждого из перекрывающихся двухнуклеотидных подслов дуплекса. Затем это корректируется для самокомплементарных мономеров и для содержания GC . Как только свободная энергия известна, можно определить температуру плавления дуплекса. Содержание GC само по себе также можно использовать для оценки свободной энергии и температуры плавления дуплекса нуклеиновой кислоты. Это менее точно, но и гораздо менее затратно с точки зрения вычислений. [5]
Программное обеспечение для термодинамического моделирования нуклеиновых кислот включает Nupack , [6] [7] mfold/UNAFold, [8] и Vienna. [9]
Связанный подход, обратное предсказание вторичной структуры, использует стохастический локальный поиск, который улучшает последовательность нуклеиновой кислоты путем запуска алгоритма предсказания структуры и модификации последовательности для устранения нежелательных особенностей. [5]
Геометрические модели нуклеиновых кислот используются для прогнозирования третичной структуры . Это важно, поскольку разработанные комплексы нуклеиновых кислот обычно содержат несколько точек соединения, что вносит геометрические ограничения в систему. Эти ограничения вытекают из базовой структуры нуклеиновых кислот , в основном из того, что двойная спираль, образованная дуплексами нуклеиновых кислот, имеет фиксированную спиральность около 10,4 пар оснований на виток и является относительно жесткой . Из-за этих ограничений комплексы нуклеиновых кислот чувствительны к относительной ориентации больших и малых канавок в точках соединения. Геометрическое моделирование может обнаружить деформацию , возникающую из-за несоответствий в структуре, которые затем могут быть исправлены проектировщиком. [4] [11]
Геометрические модели нуклеиновых кислот для ДНК-нанотехнологий обычно используют сокращенные представления нуклеиновой кислоты, поскольку моделирование каждого атома было бы очень затратным в вычислительном отношении для таких больших систем. Сообщалось, что модели с тремя псевдоатомами на пару оснований, представляющие два основных сахара и ось спирали, имеют достаточный уровень детализации для прогнозирования экспериментальных результатов. [11] Однако также используются модели с пятью псевдоатомами на пару оснований, явно включая основные фосфаты. [12]
Программное обеспечение для геометрического моделирования нуклеиновых кислот включает GIDEON, [11] Tiamat, [13] Nanoengineer-1 и UNIQUIMER 3D. [14] Геометрические проблемы особенно интересны при проектировании ДНК-оригами , поскольку последовательность предопределена выбором нити каркаса. Было создано программное обеспечение специально для проектирования ДНК-оригами, включая caDNAno [15] и SARSE. [16]
Нуклеиновая кислота дизайн используется в ДНК нанотехнологии для проектирования нитей, которые будут самособираться в желаемую целевую структуру. К ним относятся такие примеры, как ДНК машины , периодические двух- и трехмерные решетки, многогранники и ДНК оригами . [2] Его также можно использовать для создания наборов нитей нуклеиновой кислоты, которые являются «ортогональными» или не взаимодействующими друг с другом, чтобы минимизировать или исключить ложные взаимодействия. Это полезно в ДНК вычислениях , а также для молекулярного штрихкодирования приложений в химической биологии и биотехнологии . [5]