stringtranslate.com

Список программного обеспечения для выравнивания последовательностей

Этот список программного обеспечения для выравнивания последовательностей представляет собой подборку программных инструментов и веб-порталов, используемых в парном выравнивании последовательностей и множественном выравнивании последовательностей . См. программное обеспечение для структурного выравнивания для структурного выравнивания белков.

Только поиск в базе данных

* Тип последовательности: белок или нуклеотид

Парное выравнивание

* Тип последовательности: белок или нуклеотид ** Тип выравнивания: локальное или глобальное

Множественное выравнивание последовательностей

* Тип последовательности: белок или нуклеотид. ** Тип выравнивания: локальное или глобальное.

Геномный анализ

* Тип последовательности: белок или нуклеотид


Поиск мотива

* Тип последовательности: белок или нуклеотид


Бенчмаркинг

Просмотрщики, редакторы выравнивания

См. Список программного обеспечения для визуализации выравнивания .

Выравнивание последовательности коротких прочтений

Смотрите также

Ссылки

  1. ^ Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ; Gish; Miller; Myers; Lipman (октябрь 1990 г.). "Базовый инструмент поиска локального выравнивания". Журнал молекулярной биологии . 215 (3): 403–10. doi :10.1016/S0022-2836(05)80360-2. PMID  2231712. S2CID  14441902.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  2. ^ Репозиторий кода HPC-BLAST https://github.com/UTennessee-JICS/HPC-BLAST
  3. ^ Angermüller, C.; Biegert, A.; Söding, J. (декабрь 2012 г.). «Дискриминативное моделирование вероятностей замен аминокислот в зависимости от контекста». Bioinformatics . 28 (24): 3240–7. doi : 10.1093/bioinformatics/bts622 . hdl : 11858/00-001M-0000-0015-8D22-F . PMID  23080114.
  4. ^ Бухфинк, Кси и Хасон (2015). «Быстрое и чувствительное выравнивание белков с использованием DIAMOND». Nature Methods . 12 (1): 59–60. doi :10.1038/nmeth.3176. PMID  25402007. S2CID  5346781.
  5. ^ B Buchfink, K Reuter и HG Drost (2021). «Чувствительные выравнивания белков в масштабе дерева жизни с использованием DIAMOND». Nature Methods . 18 (4): 366–368. doi : 10.1038/s41592-021-01101-x . PMC 8026399. PMID  33828273 . 
  6. ^ Дурбин, Ричард; Эдди, Шон Р.; Крог, Андерс ; Митчисон, Грэм, ред. (1998). Анализ биологической последовательности: вероятностные модели белков и нуклеиновых кислот . Кембридж, Великобритания: Cambridge University Press. ISBN 978-0-521-62971-3.[ нужна страница ]
  7. ^ Söding J (апрель 2005 г.). «Определение гомологии белков путем сравнения HMM-HMM». Биоинформатика . 21 (7): 951–60. doi : 10.1093/bioinformatics/bti125 . hdl : 11858/00-001M-0000-0017-EC7A-F . PMID  15531603.
  8. ^ Реммерт, Михаэль; Бигерт, Андреас; Хаузер, Андреас; Сёдинг, Йоханнес (2011-12-25). "HHblits: молниеносный итеративный поиск белковой последовательности с помощью выравнивания HMM-HMM". Nature Methods . 9 (2): 173–175. doi :10.1038/nmeth.1818. hdl : 11858/00-001M-0000-0015-8D56-A . ISSN  1548-7105. PMID  22198341. S2CID  205420247.
  9. ^ Хаусведелл Х., Сингер Дж., Рейнерт К. (2014-09-01). «Лямбда: локальный выравниватель для массивных биологических данных». Биоинформатика . 30 (17): 349–355. doi :10.1093/bioinformatics/btu439. PMC 4147892. PMID  25161219 . 
  10. ^ Steinegger, Martin; Soeding, Johannes (2017-10-16). «MMseqs2 обеспечивает чувствительный поиск белковых последовательностей для анализа больших наборов данных». Nature Biotechnology . 35 (11): 1026–1028. doi :10.1038/nbt.3988. hdl : 11858/00-001M-0000-002E-1967-3 . PMID  29035372. S2CID  402352.
  11. ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Джусти, Армандо Э. Де; Найуф, Марсело; Прието-Матиас, Мануэль (2016-06-30). "OSWALD: OpenCL Smith–Waterman на FPGA Altera для больших баз данных белков". Международный журнал по высокопроизводительным вычислительным приложениям . 32 (3): 337–350. doi : 10.1177/1094342016654215. hdl : 11336/48798 . ISSN  1094-3420. S2CID  212680914.
  12. ^ Altschul SF, Madden TL, Schäffer AA и др. (сентябрь 1997 г.). «Gapped BLAST и PSI-BLAST: новое поколение программ поиска в базе данных белков». Nucleic Acids Research . 25 (17): 3389–402. doi :10.1093/nar/25.17.3389. PMC 146917 . PMID  9254694. 
  13. ^ Li W, McWilliam H, Goujon M и др. (июнь 2012 г.). «PSI-Search: итеративный поиск SSEARCH с уменьшенным профилем HOE». Биоинформатика . 28 (12): 1650–1651. doi :10.1093/bioinformatics/bts240. PMC 3371869. PMID  22539666 . 
  14. ^ Oehmen, C.; Nieplocha, J. (август 2006 г.). «ScalaBLAST: масштабируемая реализация BLAST для высокопроизводительного анализа биоинформатики с интенсивным использованием данных». IEEE Transactions on Parallel and Distributed Systems . 17 (8): 740–749. doi :10.1109/TPDS.2006.112. S2CID  11122366.
  15. ^ Хьюи, Р.; Карплус, К.; Крог, А. (2003). SAM: система программного обеспечения для выравнивания и моделирования последовательностей. Технический отчет UCSC-CRL-99-11 (Отчет). Калифорнийский университет, Санта-Круз, Калифорния.
  16. ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Де Джусти, Армандо; Наиуф, Марсело; Прието-Матиас, Мануэль (2015-12-25). «Анализ производительности SWIMM с учетом энергопотребления: реализация Смита–Уотермана на архитектурах Intel Multicore и Manycore». Параллелизм и вычисления: практика и опыт . 27 (18): 5517–5537. doi :10.1002/cpe.3598. hdl : 11336/53930 . ISSN  1532-0634. S2CID  42945406.
  17. ^ Руччи, Энцо; Гарсиа, Карлос; Ботелла, Гильермо; Де Джусти, Армандо; Науф, Марсело; Прието-Матиас, Мануэль (25 декабря 2015 г.). «SWIMM 2.0: усовершенствованная технология Смита-Уотермана для многоядерных и многоядерных архитектур Intel на основе векторных расширений AVX-512». Международный журнал параллельного программирования . 47 (2): 296–317. дои : 10.1007/s10766-018-0585-7. ISSN  1573-7640. S2CID  49670113.
  18. ^ Schwartz S, Kent WJ, Smit A, Zhang Z, Baertsch R, Hardison RC, Haussler D, Miller W; Kent; Smit; Zhang; Baertsch; Hardison; Haussler; Miller (2003). "Выравнивание человека и мыши с помощью BLASTZ". Genome Research . 13 (1): 103–107. doi :10.1101/gr.809403. PMC 430961 . PMID  12529312. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  19. ^ Харрис RS (2007). Улучшенное попарное выравнивание геномной ДНК (диссертация).
  20. ^ Сандес, Эданс Ф. де О.; де Мело, Альба Кристина М. А. (май 2013 г.). «Извлечение выравниваний Смита-Уотермана с оптимизацией для биологических последовательностей Megabase с использованием GPU». Труды IEEE по параллельным и распределенным системам . 24 (5): 1009–1021. doi :10.1109/TPDS.2012.194.
  21. ^ Sandes, Edans F. de O.; Miranda, G.; De Melo, ACMA; Martorell, X.; Ayguade, E. (май 2014 г.). CUDAlign 3.0: Параллельное сравнение биологических последовательностей в больших кластерах GPU . Кластерные, облачные и сеточные вычисления (CCGrid), 2014 14-й Международный симпозиум IEEE/ACM. стр. 160. doi :10.1109/CCGrid.2014.18.
  22. ^ Сандес, Эданс Ф. де О.; Миранда, Г.; Де Мело, ACMA; Марторелл, Х.; Айгуаде, Э. (август 2014 г.). Сравнение мелкозернистой параллельной мегабазовой последовательности с несколькими гетерогенными графическими процессорами . Труды 19-го симпозиума ACM SIGPLAN по принципам и практике параллельного программирования. стр. 383–384. doi :10.1145/2555243.2555280.
  23. ^ Chivian, D; Baker, D (2006). "Моделирование гомологии с использованием параметрической генерации ансамбля выравнивания с консенсусом и выбором модели на основе энергии". Nucleic Acids Research . 34 (17): e112. doi :10.1093/nar/gkl480. PMC 1635247 . PMID  16971460. 
  24. ^ Girdea, M; Noe, L; Kucherov, G (январь 2010 г.). "Обратная трансляция для обнаружения отдаленных белковых гомологий при наличии мутаций со сдвигом рамки считывания". Алгоритмы для молекулярной биологии . 5 (6): 6. doi : 10.1186/1748-7188-5-6 . PMC 2821327. PMID  20047662 . 
  25. ^ Ma, B.; Tromp, J.; Li, M. (2002). «PatternHunter: более быстрый и чувствительный поиск гомологии». Биоинформатика . 18 (3): 440–445. doi : 10.1093/bioinformatics/18.3.440 . PMID  11934743.
  26. ^ Ли, М.; Ма, Б.; Кисман, Д.; Тромп, Дж. (2004). «Patternhunter II: высокочувствительный и быстрый поиск гомологии». Журнал биоинформатики и вычислительной биологии . 2 (3): 417–439. CiteSeerX 10.1.1.1.2393 . doi :10.1142/S0219720004000661. PMID  15359419. 
  27. ^ Гасфилд, Дэн (1997). Алгоритмы на строках, деревьях и последовательностях . Cambridge university press. ISBN 978-0-521-58519-4.
  28. ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Наиуф, Марсело; Де Джусти, Армандо; Прието-Матиас, Мануэль (2018). "SWIFOLD: реализация Смита-Уотермана на FPGA с OpenCL для длинных последовательностей ДНК". BMC Systems Biology . 12 (Suppl 5): 96. doi : 10.1186/s12918-018-0614-6 . PMC 6245597 . PMID  30458766. 
  29. ^ Руччи, Энцо; Гарсия, Карлос; Ботелла, Гильермо; Наиуф, Марсело; Де Джусти, Армандо; Прието-Матиас, Мануэль. Ускорение выравнивания Смита-Уотермана длинных последовательностей ДНК с помощью OpenCL на ПЛИС . 5-я Международная рабочая конференция по биоинформатике и биомедицинской инженерии. стр. 500–511. doi :10.1007/978-3-319-56154-7_45.
  30. ^ Rasmussen K, Stoye J, Myers EW; Stoye; Myers (2006). «Эффективные фильтры q-грамм для поиска всех совпадений эпсилона на заданной длине». Журнал вычислительной биологии . 13 (2): 296–308. CiteSeerX 10.1.1.465.2084 . doi :10.1089/cmb.2006.13.296. PMID  16597241. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  31. ^ Ноэ Л., Кучеров Г.; Кучеров (2005). «YASS: повышение чувствительности поиска сходства ДНК». Nucleic Acids Research . 33 (suppl_2): W540–W543. doi :10.1093/nar/gki478. PMC 1160238. PMID  15980530 . 
  32. ^ Пратас, Диого; Сильва, Хорхе (2020). «Стойкие минимальные последовательности SARS-CoV-2». Биоинформатика . 36 (21): 5129–5132. doi : 10.1093/биоинформатика/btaa686 . ПМК 7559010 . ПМИД  32730589. 
  33. ^ Уилтон, Ричард; Будавари, Тамас; Лэнгмид, Бен; Уилан, Сара Дж.; Зальцберг, Стивен Л.; Салэй, Александр С. (2015). «Arioc: высокопроизводительное выравнивание чтения с ускоренным на GPU исследованием пространства поиска «seed-and-extend»». PeerJ . 3 : e808. doi : 10.7717/peerj.808 . PMC 4358639 . PMID  25780763. 
  34. ^ Гомер, Нильс; Мерриман, Барри; Нельсон, Стэнли Ф. (2009). "BFAST: инструмент выравнивания для крупномасштабного повторного секвенирования генома". PLOS ONE . 4 (11): e7767. Bibcode : 2009PLoSO...4.7767H. doi : 10.1371/journal.pone.0007767 . PMC 2770639. PMID  19907642 . 
  35. ^ Абуин, Дж. М.; Пичель, Дж. К.; Пена, TF; Амиго, Дж. (2015). «BigBWA: приближение к выравнивателю Берроуза–Уиллера для технологий больших данных». Биоинформатика . 31 (24): 4003–5. doi : 10.1093/bioinformatics/btv506 . PMID  26323715.
  36. ^ Кент, У. Дж. (2002). «BLAT — инструмент выравнивания, подобный BLAST». Genome Research . 12 (4): 656–664. doi : 10.1101/gr.229202. ISSN  1088-9051. PMC 187518. PMID  11932250. 
  37. ^ Лэнгмид, Бен; Трапнелл, Коул; Поп, Михай; Зальцберг, Стивен Л. (2009). «Сверхбыстрое и эффективное с точки зрения памяти выравнивание коротких последовательностей ДНК с человеческим геномом». Genome Biology . 10 (3): R25. doi : 10.1186/gb-2009-10-3-r25 . ISSN  1465-6906. PMC 2690996. PMID 19261174  . 
  38. ^ Ли, Х.; Дурбин, Р. (2009). «Быстрое и точное выравнивание коротких прочтений с помощью преобразования Барроуза–Уиллера». Биоинформатика . 25 (14): 1754–1760. doi :10.1093/bioinformatics/btp324. ISSN  1367-4803. PMC 2705234. PMID 19451168  . 
  39. ^ ab Kerpedjiev, Peter; Frellsen, Jes; Lindgreen, Stinus; Krogh, Anders (2014). «Адаптивное вероятностное отображение коротких прочтений с использованием матриц оценки, специфичных для позиции». BMC Bioinformatics . 15 (1): 100. doi : 10.1186/1471-2105-15-100 . ISSN  1471-2105. PMC 4021105 . PMID  24717095. 
  40. ^ Лю, Y.; Шмидт, B.; Маскелл, DL (2012). «CUSHAW: совместимый с CUDA выравниватель коротких прочтений для больших геномов на основе преобразования Барроуза–Уиллера». Биоинформатика . 28 (14): 1830–1837. doi : 10.1093/bioinformatics/bts276 . ISSN  1367-4803. PMID  22576173.
  41. ^ Лю, И.; Шмидт, Б. (2012). «Выравнивание длинных прочтений на основе максимального точного соответствия семян». Биоинформатика . 28 (18): i318–i324. doi :10.1093/bioinformatics/bts414. ISSN  1367-4803. PMC 3436841. PMID 22962447  . 
  42. ^ Ризк, Гийом; Лавенье, Доминик (2010). «GASSST: инструмент поиска коротких последовательностей глобального выравнивания». Биоинформатика . 26 (20): 2534–2540. doi : 10.1093/bioinformatics/btq485. PMC 2951093. PMID  20739310. 
  43. ^ Марко-Сола, Сантьяго; Саммет, Майкл; Гиго, Родерик; Рибека, Паоло (2012). «GEM-картограф: быстрое, точное и универсальное выравнивание с помощью фильтрации». Nature Methods . 9 (12): 1185–1188. doi :10.1038/nmeth.2221. ISSN  1548-7091. PMID  23103880. S2CID  2004416.
  44. ^ Клемент, Н. Л.; Снелл, К.; Клемент, М. Дж.; Холленхорст, П. К.; Пурвар, Дж.; Грейвс, Б. Дж.; Кэрнс, Б. Р.; Джонсон, У. Э. (2009). «Алгоритм GNUMAP: беспристрастное вероятностное картирование олигонуклеотидов из секвенирования следующего поколения». Биоинформатика . 26 (1): 38–45. doi :10.1093/bioinformatics/btp614. ISSN  1367-4803. PMC 6276904. PMID 19861355  . 
  45. ^ Сантана-Кинтеро, Луис; Дингердиссен, Хейли; Тьерри-Миг, Жан; Мазумдер, Раджа; Симонян, Вахан (2014). «HIVE-Hexagon: высокопроизводительное параллельное выравнивание последовательностей для анализа данных секвенирования следующего поколения». PLOS ONE . 9 (6): 1754–1760. Bibcode : 2014PLoSO...999033S. doi : 10.1371/journal.pone.0099033 . PMC 4053384. PMID  24918764 . 
  46. ^ Kielbasa, SM; Wan, R.; Sato, K.; Horton, P.; Frith, MC (2011). «Адаптивные семена приручают сравнение геномных последовательностей». Genome Research . 21 (3): 487–493. doi :10.1101/gr.113985.110. PMC 3044862. PMID  21209072 . 
  47. ^ Rivals, Eric; Salmela, Leena; Kiiskinen, Petteri; Kalsi, Petri; Tarhio, Jorma (2009). "Mpscan: Быстрая локализация множественных прочтений в геномах". Алгоритмы в биоинформатике . Конспект лекций по информатике. Том 5724. С. 246–260. Bibcode :2009LNCS.5724..246R. CiteSeerX 10.1.1.156.928 . doi :10.1007/978-3-642-04241-6_21. ISBN  978-3-642-04240-9. S2CID  17187140.
  48. ^ Sedlazeck, Fritz J.; Rescheneder, Philipp; von Haeseler, Arndt (2013). «NextGenMap: быстрое и точное картирование прочтений в высокополиморфных геномах». Биоинформатика . 29 (21): 2790–2791. doi : 10.1093/bioinformatics/btt468 . PMID  23975764.
  49. ^ Чен, Янго; Соуайя, Таде; Чен, Тин (2009). «PerM: эффективное картирование коротких прочтений секвенирования с периодическими полностью чувствительными разнесенными семенами». Биоинформатика . 25 (19): 2514–2521. doi :10.1093/bioinformatics/btp486. PMC 2752623 . PMID  19675096. 
  50. ^ Searls, David B.; Hoffmann, Steve; Otto, Christian; Kurtz, Stefan; Sharma, Cynthia M.; Khaitovich, Philipp; Vogel, Jörg; Stadler, Peter F.; Hackermüller, Jörg (2009). "Быстрое картирование коротких последовательностей с несовпадениями, вставками и удалениями с использованием индексных структур". PLOS Computational Biology . 5 (9): e1000502. Bibcode : 2009PLSCB...5E0502H. doi : 10.1371/journal.pcbi.1000502 . ISSN  1553-7358. PMC 2730575. PMID 19750212  . 
  51. ^ Рамбл, Стивен М.; Лакрут, Фил; Далка, Адриан В.; Фиуме, Марк; Сидов, Аренд; Брудно, Майкл (2009). "SHRiMP: Точное картирование коротких цветовых пространственных считываний". PLOS Computational Biology . 5 (5): e1000386. Bibcode : 2009PLSCB...5E0386R. doi : 10.1371/journal.pcbi.1000386 . PMC 2678294. PMID  19461883 . 
  52. ^ Дэвид, Матей; Дзамба, Миско; Листер, Дэн; Илие, Люциан; Брудно, Майкл (2011). «SHRiMP2: чувствительное, но практичное картирование коротких прочтений». Биоинформатика . 27 (7): 1011–1012. doi : 10.1093/bioinformatics/btr046 . PMID  21278192.
  53. ^ Малхис, Навар; Баттерфилд, Ярон SN; Эстер, Мартин; Джонс, Стивен JM (2009). «Слайдер – Максимальное использование вероятностной информации для выравнивания коротких последовательностей прочтений и обнаружения SNP». Биоинформатика . 25 (1): 6–13. doi :10.1093/bioinformatics/btn565. PMC 2638935 . PMID  18974170. 
  54. ^ Малхис, Навар; Джонс, Стивен Дж. М. (2010). «Высококачественный вызов SNP с использованием данных Illumina при неглубоком покрытии». Биоинформатика . 26 (8): 1029–1035. doi :10.1093/bioinformatics/btq092. PMID  20190250.
  55. ^ Ли, Р.; Ли, И.; Кристиансен, К.; Ванг, Дж. (2008). «SOAP: программа выравнивания коротких олигонуклеотидов». Биоинформатика . 24 (5): 713–714. doi : 10.1093/bioinformatics/btn025 . ISSN  1367-4803. PMID  18227114.
  56. ^ Ли, Р.; Ю, Ч.; Ли, Й.; Лам, Т.-В.; Ю, С.-М.; Кристиансен, К.; Ванг, Дж. (2009). «SOAP2: улучшенный сверхбыстрый инструмент для выравнивания коротких прочтений». Биоинформатика . 25 (15): 1966–1967. doi :10.1093/bioinformatics/btp336. ISSN  1367-4803. PMID  19497933.
  57. ^ Абуин, Хосе М.; Пишель, Хуан К.; Пенья, Томас Ф.; Амиго, Хорхе (16 мая 2016 г.). «SparkBWA: ускорение согласования данных высокопроизводительного секвенирования ДНК». ПЛОС ОДИН . 11 (5): e0155461. Бибкод : 2016PLoSO..1155461A. дои : 10.1371/journal.pone.0155461 . ISSN  1932-6203. ПМЦ 4868289 . ПМИД  27182962. 
  58. ^ Lunter, G.; Goodson, M. (2010). «Stampy: статистический алгоритм для чувствительного и быстрого картирования прочтений последовательностей Illumina». Genome Research . 21 (6): 936–939. doi :10.1101/gr.111120.110. ISSN  1088-9051. PMC 3106326. PMID 20980556  . 
  59. ^ Ноэ, Л.; Гирдеа, М.; Кучеров, Г. (2010). «Проектирование эффективных разнесенных семян для картирования прочтений SOLiD». Достижения в области биоинформатики . 2010 : 708501. doi : 10.1155/2010/708501 . PMC 2945724. PMID  20936175 . 
  60. ^ Линь, Х.; Чжан, З.; Чжан, М.К.; Ма, Б.; Ли, М. (2008). «ZOOM! Картировано множество олигонуклеотидов». Биоинформатика . 24 (21): 2431–2437. doi :10.1093/bioinformatics/btn416. PMC 2732274. PMID  18684737 .