Формат аудиофайла — это формат файла для хранения цифровых аудиоданных в компьютерной системе. Битовая структура аудиоданных (исключая метаданные ) называется форматом аудиокодирования и может быть распакована или сжата для уменьшения размера файла, часто с использованием сжатия с потерями . Данные могут быть необработанным битовым потоком в формате аудиокодирования, но обычно они встроены в формат контейнера или формат аудиоданных с определенным слоем хранения.
Важно различать формат кодирования аудио , контейнер, содержащий необработанные аудиоданные , и аудиокодек . Кодек выполняет кодирование и декодирование необработанных аудиоданных, в то время как эти закодированные данные (обычно) хранятся в файле-контейнере. Хотя большинство форматов аудиофайлов поддерживают только один тип данных кодирования аудио (создаваемых с помощью аудиокодера ) , формат контейнера мультимедиа (например, Matroska или AVI ) может поддерживать несколько типов аудио- и видеоданных.
Существует три основные группы форматов аудиофайлов:
.ape
), WavPack ( расширение имени файла .wv
), TTA, ATRAC Advanced Lossless, ALAC ( расширение имени файла .m4a
), MPEG-4 SLS , MPEG-4 ALS , MPEG-4 DST , Windows Media Audio Lossless (WMA Lossless) и Shorten (SHN).Один из основных форматов несжатого аудио, LPCM , представляет собой ту же разновидность PCM, которая используется в Compact Disc Digital Audio , и является форматом, наиболее часто принимаемым низкоуровневыми аудио API и оборудованием ЦАП . Хотя LPCM может храниться на компьютере как необработанный аудиоформат , он обычно хранится в .wav
файле в Windows или в .aiff
файле в macOS . Формат Audio Interchange File Format (AIFF) основан на Interchange File Format (IFF), а формат WAV основан на похожем Resource Interchange File Format (RIFF). WAV и AIFF предназначены для хранения самых разных аудиоформатов, как с потерями, так и без; они просто добавляют небольшой заголовок, содержащий метаданные, перед аудиоданными, чтобы объявить формат аудиоданных, например LPCM с определенной частотой дискретизации , битовой глубиной , порядком байтов и количеством каналов . Поскольку WAV и AIFF широко поддерживаются и могут хранить LPCM, они являются подходящими форматами файлов для хранения и архивирования исходной записи.
BWF (Broadcast Wave Format) — стандартный аудиоформат, созданный Европейским вещательным союзом в качестве преемника WAV. Помимо других усовершенствований, BWF позволяет хранить в файле более надежные метаданные . См. European Broadcasting Union: Specification of the Broadcast Wave Format (EBU Technical document 3285, July 1997). Это основной формат записи, используемый во многих профессиональных звуковых рабочих станциях в теле- и киноиндустрии. Файлы BWF включают стандартизированную временную метку, которая позволяет легко синхронизироваться с отдельным элементом изображения. Автономные, основанные на файлах, многодорожечные рекордеры от AETA, [1] Sound Devices, [2] Zaxcom, [3] HHB Communications Ltd, [4] Fostex , Nagra, Aaton, [5] и TASCAM используют BWF в качестве предпочтительного формата.
Сжатый без потерь аудиоформат хранит данные в меньшем пространстве без потери информации. Исходные несжатые данные могут быть воссозданы из сжатой версии.
Несжатые аудиоформаты кодируют и звук, и тишину с одинаковым количеством бит в единицу времени. Кодирование несжатой минуты абсолютной тишины создает файл того же размера, что и кодирование несжатой минуты музыки. Однако в сжатом без потерь формате музыка будет занимать меньший файл, чем несжатый формат, а тишина вообще не будет занимать места .
Форматы сжатия без потерь включают FLAC , WavPack , Monkey's Audio , ALAC (Apple Lossless). Они обеспечивают степень сжатия около 2:1 (т.е. их файлы занимают половину пространства PCM). Развитие форматов сжатия без потерь направлено на сокращение времени обработки при сохранении хорошей степени сжатия.
Формат аудио с потерями позволяет еще больше уменьшить размер файла, удаляя часть аудиоинформации и упрощая данные. Это, конечно, приводит к снижению качества звука, но используются различные методы, в основном с использованием психоакустики , чтобы удалить части звука, которые оказывают наименьшее влияние на воспринимаемое качество, и минимизировать количество слышимого шума, добавляемого в процессе. Популярный формат MP3 , вероятно, является самым известным примером, но формат AAC , найденный в iTunes Music Store, также распространен. Большинство форматов предлагают ряд степеней сжатия, обычно измеряемых в битрейте . Чем ниже скорость, тем меньше файл и тем значительнее потеря качества.