BAM — это сжатое бинарное представление SAM (Sequence Alignment Map), компактное и индексируемое представление выравниваний последовательностей нуклеотидов. [4] Цель индексации — быстрое извлечение выравниваний, которые перекрывают определенное местоположение, без необходимости проходить по всем из них. Перед индексацией BAM необходимо отсортировать по идентификатору ссылки, а затем по крайней левой координате. [5] BAM находится в сжатом формате BGZF.
Структура BAM-файлов включает раздел заголовка и раздел выравнивания: [6]
Заголовок — Имя образца, длина образца и метод выравнивания включены в этот раздел. Раздел выравниваний содержит выравнивания, которые связаны с определенной информацией в разделе заголовка.
Выравнивания — имя чтения, последовательность чтения, качество чтения, информация о выравнивании и пользовательские теги включены в этот файл. Хромосома, начальная координата, качество выравнивания и строка дескриптора соответствия включены в имя чтения.
Раздел «Выравнивание» включает в себя следующее:
Группа чтения (РГ)
Тег со штрих-кодом (BC)
Качество выравнивания одного конца (SM)
Качество выравнивания парных концов (AS)
Редактировать тег расстояния (NM)
Тег имени ампликона (XN)
Формат BAM использует систему координат , начинающуюся с 0 , тогда как SAM использует систему координат, начинающуюся с 1. BAM может представлять значения в диапазоне [−2^31, 2^32). [5]
Чтобы просмотреть список инструментов секвенирования и анализа, работающих с SAM/BAM, нажмите здесь.