MUMmer — это биоинформатическая программная система для выравнивания последовательностей . Она основана на структуре данных суффиксного дерева . Она использовалась для сравнения различных геномных сборок друг с другом, что позволяет ученым определять, как изменился геном. Аббревиатура «MUMmer» происходит от «Maximal Unique Matches» или MUMs.
Оригинальные алгоритмы в программном пакете MUMMER были разработаны Артом Делчером, Саймоном Касифом и Стивеном Зальцбергом. Mummer была первой системой сравнения целых геномов, разработанной в биоинформатике. Первоначально она применялась для сравнения двух родственных штаммов бактерий.
Программное обеспечение MUMmer имеет открытый исходный код . Система поддерживается в основном Стивеном Зальцбергом и Артуром Делчером в Центре вычислительной биологии Университета Джонса Хопкинса .
MUMmer — это высокоцитируемая биоинформатическая система в научной литературе. Согласно Google Scholar, по состоянию на начало 2013 года оригинальная статья MUMmer (Delcher et al., 1999) [1] была процитирована 691 раз; статья MUMmer 2 (Delcher et al., 2002) [2] была процитирована 455 раз; а статья MUMmer 3.0 (Kurtz et al., 2004) [3] была процитирована 903 раза.
Mummer — быстрый алгоритм, используемый для быстрого выравнивания целых геномов. Алгоритм MUMmer относительно новый и имеет 4 версии.
MUMmer1 или просто MUMmer состоит из трех частей: первая часть состоит из создания деревьев суффиксов (для получения MUM), вторая часть — из самой длинной возрастающей подпоследовательности или самой длинной общей подпоследовательности (для упорядочивания MUM), и, наконец, любое выравнивание для закрытия пробелов.
Прерывания между MUM-выравниванием известны как пробелы. Другие алгоритмы выравнивания заполняют эти пробелы. Пробелы попадают в следующие четыре класса: [4]
Этот алгоритм был переработан, чтобы требовать меньше памяти и увеличить скорость и точность. Он также позволяет выравнивать геномы большего размера.
Улучшение заключалось в количестве, хранящемся в суффиксных деревьях, за счет использования дерева, созданного Курцем.
По словам Стефана Курца и его коллег по команде, «наиболее значительным техническим улучшением в MUMmer 3.0 является полная переработка кода суффиксного дерева на основе компактного представления суффиксного дерева» [5] , описанного в статье «Сокращение требуемого пространства для суффиксных деревьев» [6] .
По словам Гийома и его команды, есть некоторые дополнительные улучшения в реализации, а также инновации с параллелизмом запросов. «MUMmer4 теперь включает опции для сохранения и загрузки массива суффиксов для заданной ссылки». [7] Это позволяет строить дерево суффиксов один раз и строить его снова после запуска из сохраненного дерева суффиксов.
MUMmer имеет программное обеспечение с открытым исходным кодом и доступен онлайн.
Существуют и другие типы выравнивания последовательностей: