stringtranslate.com

МУМмер

MUMmer — это биоинформатическая программная система для выравнивания последовательностей . Она основана на структуре данных суффиксного дерева . Она использовалась для сравнения различных геномных сборок друг с другом, что позволяет ученым определять, как изменился геном. Аббревиатура «MUMmer» происходит от «Maximal Unique Matches» или MUMs.

Оригинальные алгоритмы в программном пакете MUMMER были разработаны Артом Делчером, Саймоном Касифом и Стивеном Зальцбергом. Mummer была первой системой сравнения целых геномов, разработанной в биоинформатике. Первоначально она применялась для сравнения двух родственных штаммов бактерий.

Программное обеспечение MUMmer имеет открытый исходный код . Система поддерживается в основном Стивеном Зальцбергом и Артуром Делчером в Центре вычислительной биологии Университета Джонса Хопкинса .

MUMmer — это высокоцитируемая биоинформатическая система в научной литературе. Согласно Google Scholar, по состоянию на начало 2013 года оригинальная статья MUMmer (Delcher et al., 1999) [1] была процитирована 691 раз; статья MUMmer 2 (Delcher et al., 2002) [2] была процитирована 455 раз; а статья MUMmer 3.0 (Kurtz et al., 2004) [3] была процитирована 903 раза.

Обзор

Mummer — быстрый алгоритм, используемый для быстрого выравнивания целых геномов. Алгоритм MUMmer относительно новый и имеет 4 версии.

Версии MUMmers

MUMmer1

MUMmer1 или просто MUMmer состоит из трех частей: первая часть состоит из создания деревьев суффиксов (для получения MUM), вторая часть — из самой длинной возрастающей подпоследовательности или самой длинной общей подпоследовательности (для упорядочивания MUM), и, наконец, любое выравнивание для закрытия пробелов.

Прерывания между MUM-выравниванием известны как пробелы. Другие алгоритмы выравнивания заполняют эти пробелы. Пробелы попадают в следующие четыре класса: [4]

МУМмер 2

Этот алгоритм был переработан, чтобы требовать меньше памяти и увеличить скорость и точность. Он также позволяет выравнивать геномы большего размера.

Улучшение заключалось в количестве, хранящемся в суффиксных деревьях, за счет использования дерева, созданного Курцем.

МУМмер 3

По словам Стефана Курца и его коллег по команде, «наиболее значительным техническим улучшением в MUMmer 3.0 является полная переработка кода суффиксного дерева на основе компактного представления суффиксного дерева» [5] , описанного в статье «Сокращение требуемого пространства для суффиксных деревьев» [6] .

МУМмер 4

По словам Гийома и его команды, есть некоторые дополнительные улучшения в реализации, а также инновации с параллелизмом запросов. «MUMmer4 теперь включает опции для сохранения и загрузки массива суффиксов для заданной ссылки». [7] Это позволяет строить дерево суффиксов один раз и строить его снова после запуска из сохраненного дерева суффиксов.

Программное обеспечение - с открытым исходным кодом

MUMmer имеет программное обеспечение с открытым исходным кодом и доступен онлайн.

Связанные выравнивания последовательностей

Существуют и другие типы выравнивания последовательностей:

Ссылки

  1. ^ Delcher, AL; Kasif, S.; Fleischmann, RD; Peterson, J.; White, O.; Salzberg, SL (1999). «Выравнивание целых геномов». Nucleic Acids Research . 27 (11): 2369–2376. doi : 10.1093 /nar/27.11.2369. PMC  148804. PMID  10325427.
  2. ^ Delcher, AL; Phillippy, A.; Carlton, J.; Salzberg, SL (2002). «Быстрые алгоритмы для крупномасштабного выравнивания и сравнения геномов». Nucleic Acids Research . 30 (11): 2478–2483. doi :10.1093/nar/30.11.2478. PMC 117189. PMID  12034836. 
  3. ^ Delcher, A.; Harmon, D.; Kasif, S.; White, O.; Salzberg, S. (1999). «Улучшенная идентификация микробных генов с помощью GLIMMER». Nucleic Acids Research . 27 (23): 4636–4641. doi :10.1093/nar/27.23.4636. PMC 148753. PMID  10556321 . 
  4. ^ Delcher, A.; Kasif, S.; Fleischmann, R.; Peterson, J.; White, O.; Salzberg, S. (1999). «Выравнивание целых геномов». Nucleic Acids Research . 27 (11): 2369–2376. doi : 10.1093 /nar/27.23.4636 . PMC 148804. PMID  10325427. 
  5. ^ Курц, С.; Филлиппи, А.; Делчер, А.; Смут, М.; Шамвей, М.; Антонеску, К.; Зальцберг, С. (2004). «Универсальное и открытое программное обеспечение для сравнения больших геномов» (PDF) . Биология генома . 5 (2): R12. doi : 10.1186/gb-2004-5-2-r12 . PMC 395750 . PMID  14759262. Архивировано (PDF) из оригинала 2019-07-11 . Получено 2021-05-06 . 
  6. ^ Курц, С. (1999). «Сокращение требуемого пространства для суффиксных деревьев». Software: Practice and Experience . 29 (13): 1149–1171. doi :10.1002/(SICI)1097-024X(199911)29:13<1149::AID-SPE274>3.0.CO;2-O. Архивировано из оригинала 2021-05-06 . Получено 2021-05-06 .
  7. ^ Marçais, Guillaume.; Pillippy, A.; Delcher, A.; Coston, R.; Salzberg, S.; Zimin, A. (2018). "MUMmer4: быстрая и универсальная система выравнивания генома". PLOS Computational Biology . 14 (1): e1005944. Bibcode : 2018PLSCB..14E5944M. doi : 10.1371/journal.pcbi.1005944 . PMC 5802927. PMID  29373581 . 

Внешние ссылки