Nucleic Acid Package ( NUPACK ) — это растущий программный пакет для анализа и проектирования систем нуклеиновых кислот . [1] Задания можно запускать онлайн на веб-сервере NUPACK или исходный код NUPACK можно загрузить и скомпилировать локально для некоммерческого академического использования. [2] Алгоритмы NUPACK сформулированы в терминах вторичной структуры нуклеиновых кислот. В большинстве случаев псевдоузлы исключаются из структурного ансамбля.
Вторичная структура нескольких взаимодействующих нитей определяется списком пар оснований . [3] Полимерный граф для вторичной структуры может быть построен путем упорядочивания нитей по кругу, рисования остовов последовательно от 5' до 3' по окружности с надрезом между каждой нитью и рисования прямых линий, соединяющих парные основания. Вторичная структура псевдоузловая, если каждое упорядочение нитей соответствует полимерному графу с пересекающимися линиями. Вторичная структура связана, если ни одно подмножество нитей не свободно от других. Алгоритмы формулируются в терминах упорядоченных комплексов, каждый из которых соответствует структурному ансамблю всех связанных полимерных графов без пересекающихся линий для конкретного упорядочения набора нитей. Свободная энергия непсевдоузловой вторичной структуры рассчитывается с использованием эмпирических параметров ближайшего соседа для РНК в 1M Na+ [4] [5] или для ДНК в указанных пользователем концентрациях Na+ и Mg++; [6] [7] [8] Для анализа псевдоузлов (только одиночные цепи РНК) используются дополнительные параметры. [9] [10]
Страница «Анализ» позволяет пользователям анализировать термодинамические свойства разбавленного раствора взаимодействующих цепей нуклеиновых кислот при отсутствии псевдоузлов (например, пробирка с видами цепей ДНК или РНК). [1] [3] Для разбавленного раствора, содержащего несколько видов цепей, взаимодействующих с образованием нескольких видов упорядоченных комплексов, NUPACK вычисляет для каждого упорядоченного комплекса:
включая тщательное рассмотрение вопросов различимости, возникающих в многоцепочечной среде.
Страница Design позволяет пользователям проектировать последовательности для одной или нескольких нитей, предназначенных для принятия непсевдоузловой целевой вторичной структуры в равновесии. [1] Проектирование последовательности формулируется как задача оптимизации с целью уменьшения дефекта ансамбля ниже указанного пользователем условия остановки. [11] Для последовательности-кандидата и заданной целевой вторичной структуры дефект ансамбля представляет собой среднее число неправильно спаренных по структурному ансамблю упорядоченного комплекса. [12] Для целевой вторичной структуры с N нуклеотидами алгоритм стремится достичь дефекта ансамбля ниже N/100. Эмпирически алгоритм проектирования демонстрирует асимптотическую оптимальность по мере увеличения N: для достаточно большого N стоимость проектирования последовательности обычно составляет всего 4/3 стоимости единичной оценки дефекта ансамбля. [11]
Страница Utilities позволяет пользователям оценивать, отображать и аннотировать свойства равновесия комплекса взаимодействующих цепей нуклеиновых кислот. [1] Страница принимает в качестве входных данных либо информацию о последовательности, либо информацию о структуре, либо обе, выполняя различные функции на основе предоставленной информации, включая автоматическую компоновку и визуализацию вторичных структур с идеальной спиральной геометрией или без нее. В любом случае компоновку структуры можно динамически редактировать в веб-приложении.
Веб-приложение NUPACK [1] запрограммировано в рамках Ruby on Rails , использующей Ajax и Dojo Toolkit для реализации динамических функций и интерактивной графики. Графики и графики генерируются с использованием NumPy и matplotlib . Сайт поддерживается текущими версиями веб-браузеров Safari , Chrome и Firefox . Библиотека алгоритмов анализа и проектирования NUPACK написана на языке программирования C. Динамические программы распараллеливаются с использованием интерфейса передачи сообщений (MPI).
Веб-сервер NUPACK и исходный код NUPACK предоставляются в некоммерческих исследовательских целях и в связи с этим ограничением не являются свободным программным обеспечением с открытым исходным кодом .
Разработка NUPACK финансируется Национальным научным фондом через проект молекулярного программирования [13] и Институтом Бекмана [14] при Калифорнийском технологическом институте (Калтех).