stringtranslate.com

WAV

Формат аудиофайла Waveform ( WAVE или WAV из-за расширения имени файла ; [3] [6] [7] произносится / w æ v / или / w v / [8] ) — стандарт формата аудиофайлов , разработанный IBM и Microsoft для хранения аудиопотока на персональных компьютерах . Это основной формат, используемый в системах Microsoft Windows для несжатого аудио . Обычное кодирование битового потока представляет собой формат линейной импульсно-кодовой модуляции (LPCM).

WAV представляет собой применение метода формата битового потока формата файла обмена ресурсами (RIFF) для хранения данных в виде фрагментов и, таким образом, аналогично формату 8SVX и формату файла обмена аудио (AIFF), используемому на компьютерах Amiga и Macintosh соответственно.

Описание

Файл WAV является экземпляром формата файла обмена ресурсами (RIFF), определенного IBM и Microsoft . [3] Формат RIFF действует как оболочка для различных форматов кодирования звука .

Хотя файл WAV может содержать сжатый звук, наиболее распространенным аудиоформатом WAV является несжатый звук в формате линейной импульсно-кодовой модуляции (LPCM). LPCM также является стандартным форматом кодирования звука для аудио компакт-дисков , на которых хранится двухканальный звук LPCM, дискретизированный с частотой 44,1 кГц и 16 битами на выборку . Поскольку LPCM не имеет сжатия и сохраняет все образцы звуковой дорожки, профессиональные пользователи или эксперты в области звука могут использовать формат WAV со звуком LPCM для достижения максимального качества звука. [9] Файлы WAV также можно относительно легко редактировать и манипулировать ими с помощью программного обеспечения.

В Microsoft Windows формат WAV поддерживает сжатие звука с помощью диспетчера сжатия звука (ACM). Для сжатия файла WAV можно использовать любой кодек ACM. Доступ к пользовательскому интерфейсу (UI) Audio Compression Manager можно получить через различные программы, которые его используют, включая Sound Recorder в некоторых версиях Windows.

Начиная с Windows 2000 , WAVE_FORMAT_EXTENSIBLEбыл определен заголовок, который определяет данные нескольких аудиоканалов вместе с позициями динамиков, устраняет неоднозначность в отношении типов сэмплов и размеров контейнеров в стандартном формате WAV и поддерживает определение пользовательских расширений этого формата. [4] [5] [10]

Спецификация

РИФФ

Файл RIFF представляет собой формат файла с тегами. Он имеет определенный формат контейнера ( чанк ) с заголовком, который включает четырехсимвольный тег ( FourCC ) и размер (количество байтов) чанка. Тег определяет, как следует интерпретировать данные внутри фрагмента. Существует несколько стандартных тегов FourCC. Теги, состоящие только из заглавных букв, являются зарезервированными. Самый внешний фрагмент файла RIFF имеет RIFFтег; первые четыре байта данных фрагмента представляют собой дополнительный тег FourCC, который определяет тип формы, за которым следует последовательность подфрагментов. В случае файла WAV дополнительный тег — WAVE. Остальная часть данных RIFF представляет собой последовательность фрагментов, описывающих аудиоинформацию.

Преимущество формата файла с тегами состоит в том, что в дальнейшем этот формат можно расширить, сохраняя при этом обратную совместимость . [11] Правило для программы чтения RIFF (или WAV) заключается в том, что она должна игнорировать любой помеченный фрагмент, который она не распознает. [12] Читатель не сможет воспользоваться новой информацией, но читатель не должен запутаться.

Спецификация файлов RIFF включает определение фрагмента INFO. Чанк может включать в себя такую ​​информацию, как название произведения, автор, дата создания и информация об авторских правах. Хотя INFOчанк был определен для RIFF в версии 1.0, он не упоминался в формальной спецификации файла WAV. У многих читателей возникли проблемы с этим. Следовательно, самым безопасным с точки зрения обмена было бы опустить INFOфрагмент и другие расширения и отправить файл с наименьшим общим знаменателем. Существуют и другие проблемы с размещением блоков INFO .

Предполагалось, что файлы RIFF будут использоваться в международных средах, поэтому существует CSETфрагмент для указания кода страны, языка, диалекта и кодовой страницы для строк в файле RIFF. [13] Например, указание соответствующего фрагмента должно позволить интерпретировать CSETстроки в фрагменте (и других фрагментах в файле RIFF) как символы кириллицы или японского языка.INFO

RIFF также определяет JUNKчанк, содержимое которого не представляет интереса. [14] Чанк позволяет удалить чанк, просто изменив его FourCC. Этот фрагмент также можно использовать для резервирования некоторого места для будущих изменений, чтобы файл можно было изменять без изменения размера. Более позднее определение RIFF представило аналогичный PADфрагмент. [15]

РИФ ВОЛНА

Определение верхнего уровня файла WAV: [16]

<WAVE-форма> → RIFF('WAVE' <fmt-ck> // Формат файла [<fact-ck>] // Факт. [<cue-ck>] // Точки разметки [<playlist-ck>] // Список воспроизведения [<assoc-data-list>] // Список связанных данных <wave-data> ) // Волновые данные

Форма RIFF верхнего уровня использует WAVEтег. За ним следует обязательный <fmt-ck>фрагмент, описывающий формат следующих за ним образцов данных. Этот фрагмент включает в себя такую ​​информацию, как кодирование выборки, количество бит на канал, количество каналов и частоту дискретизации.

Спецификация WAV включает некоторые дополнительные функции. Дополнительный <fact-ck>фрагмент сообщает количество выборок для некоторых схем сжатого кодирования. Этот <cue-ck>фрагмент идентифицирует некоторые важные номера выборок в волновом файле. Чанк <playlist-ck>позволяет воспроизводить семплы не по порядку или повторять их, а не просто от начала до конца. Связанный список данных ( <assoc-data-list>) позволяет прикреплять метки и примечания к ключевым точкам; текстовая аннотация может быть предоставлена ​​для группы образцов (например, информация о подписи).

Наконец, обязательный <wave-data>фрагмент содержит фактические образцы в указанном ранее формате.

Обратите внимание, что определение файла WAV не показывает, где INFOследует разместить фрагмент. Также ничего не говорится о размещении фрагмента CSET(который определяет используемый набор символов).

Спецификация RIFF пытается быть формальной спецификацией, но ее формализму не хватает точности, наблюдаемой в других форматах с тегами. Например, спецификация RIFF не проводит четкого различия между набором фрагментов и упорядоченной последовательностью фрагментов. Чанк формы RIFF предполагает, что это должен быть контейнер последовательности. Информация о последовательности указывается в форме RIFF файла WAV в соответствии с формализмом: «Однако это <fmt-ck>всегда должно происходить до <wave-data>, и оба этих фрагмента являются обязательными в файле WAVE». [17] Спецификация предполагает, что LISTфрагмент также является последовательностью: «Чанк LIST содержит список или упорядоченную последовательность подфрагментов». [18] Однако спецификация не дает формального описания фрагмента INFO; пример INFO LISTфрагмента игнорирует последовательность фрагментов, подразумеваемую в INFOописании. [19] Определение LISTфрагмента <wave-data>действительно использует LISTфрагмент как контейнер последовательности с хорошей формальной семантикой.

Спецификация WAV поддерживает, и в большинстве файлов WAV используется один непрерывный массив аудиосэмплов. Спецификация также поддерживает дискретные блоки семплов и тишины, которые воспроизводятся по порядку. Спецификация выборочных данных содержит очевидные ошибки: [20]

<wave-data> содержит данные формы сигнала. Оно определяется следующим образом: <wave-data> → { <data-ck> | <список-данных> } <data-ck> → данные( <wave-data> ) <wave-list> → LIST( 'wavl' { <data-ck> | // Выборки волн <silence-ck> }... ) // Тишина <silence-ck> → slnt( <dwSamples:DWORD>) // Количество тихих выборок

Очевидно <data-list>, (неопределено) и <wave-list>(определено, но не указано) должны быть идентичными. Даже если это решено, продукция позволяет a <data-ck>содержать рекурсию <wave-data> (что подразумевает проблемы с интерпретацией данных). Чтобы избежать рекурсии, спецификацию можно интерпретировать как:

<wave-data> → { <data-ck> | <волновой список> } <data-ck> → данные( <bSampleData:BYTE> ... ) <wave-list> → LIST( 'wavl' { <data-ck> | // Выборки волн <silence-ck> }... ) // Тишина <silence-ck> → slnt( <dwSamples:DWORD>) // Количество тихих выборок

Файлы WAV могут содержать встроенные «списки» IFF, которые могут содержать несколько «подчастей». [21] [22] [23]

Метаданные

Являясь производным от RIFF, файлы WAV могут быть помечены метаданными в фрагменте INFO. Кроме того, в файлы WAV можно встраивать метаданные любого типа, включая, помимо прочего, данные Extensible Metadata Platform (XMP) [24] или теги ID3 [25] в дополнительных фрагментах. Приложения могут не обрабатывать эту дополнительную информацию или ожидать ее появления в определенном месте. Хотя спецификация RIFF требует, чтобы приложения игнорировали фрагменты, которые они не распознают, некоторые приложения сбиваются с толку дополнительными фрагментами. [ нужна цитата ]

Популярность

Несжатые файлы WAV имеют большой размер, поэтому совместное использование файлов WAV через Интернет встречается редко, за исключением профессионалов в области видео, музыки и аудио, где несжатая форма стала наиболее популярной из всех аудиоформатов, и для большинства из них доступны высокоскоростные веб-соединения с большой пропускной способностью. обычное дело. Многие производители аудио- и музыкального программного обеспечения теперь предпочитают его в качестве формата файлов по умолчанию, хотя часто поддерживаются и другие. Высокое разрешение формата делает его подходящим для хранения архивных файлов первого поколения высокого качества, для использования в системе, где дисковое пространство не является ограничением, или в таких приложениях, как редактирование аудио, где время, необходимое для сжатия и распаковки данных, и потери качества таких преобразований вызывают беспокойство.

Использование вещательными компаниями

Несмотря на большой размер, несжатые файлы WAV используются большинством радиовещательных компаний, особенно теми, которые внедрили безленточную систему.

Ограничения

Формат WAV ограничен файлами размером менее 4 ГиБ из-за использования 32-битного целого числа без знака для записи заголовка размера файла. Хотя это эквивалентно примерно 6,8 часам звука CD-качества (44,1 кГц, 16-битное стерео), иногда необходимо превысить этот предел, особенно когда требуются более высокие частоты дискретизации , битовое разрешение или количество каналов . Поэтому формат W64 был создан для использования в Sound Forge . Его 64-битный заголовок позволяет значительно увеличить время записи. Формат RF64 , определенный Европейским вещательным союзом, также был создан для решения этой проблемы.

Неаудио данные

Поскольку частота дискретизации файла WAV может варьироваться от 1 Гц до 4,3 ГГц , а количество каналов может достигать 65535, файлы .wav также используются для неаудиоданных. LTspice , например, может хранить несколько сигналов трассировки цепи в отдельных каналах с любой подходящей частотой дискретизации, при этом полномасштабный диапазон представляет собой ± 1 В или А , а не звуковое давление. [26]

Аудио компакт-диски

Аудиокомпакт -диски (CD) не используют формат файлов WAV, вместо этого используется аудио из Красной книги . Общим является то, что аудио компакт-диски кодируются как несжатая импульсно-кодовая модуляция (PCM), которая является одним из форматов, поддерживаемых WAV. WAV — это формат файла для использования на компьютере, который не может быть понят напрямую большинством проигрывателей компакт-дисков. Чтобы записать файлы WAV на аудио компакт-диск, заголовки файлов должны быть удалены, содержимое должно быть перекодировано, если оно еще не сохранено в формате PCM, а данные PCM записаны непосредственно на диск в виде отдельных дорожек с добавлением заполнения нулями, чтобы соответствовать размеру сектора компакт-диска. .

Чтобы звук PCM можно было записать на компакт-диск, он должен быть в стереоформате 44,1 кГц, 16 бит.

Сравнение схем кодирования

Звук в файлах WAV может быть закодирован в различные форматы аудиокодирования, такие как GSM или MP3 , чтобы уменьшить размер файла.

Это ссылка для сравнения качества монофонического (не стереофонического ) звука и битрейта сжатия форматов кодирования звука, доступных для файлов WAV, включая PCM , ADPCM , Microsoft GSM 06.10 , CELP , SBC , Truespeech и MPEG Layer-3. Это кодеки ACM по умолчанию, поставляемые с Windows.

Вышеупомянутые файлы WAV; даже те, которые используют сжатие MP3, имеют .wavрасширение.

Смотрите также

Рекомендации

  1. ^ Флейшман, Э. (июнь 1998 г.). Реестры кодеков WAVE и AVI. IETF. дои : 10.17487/RFC2361 . РФК 2361 . Проверено 6 декабря 2009 г.
  2. ^ «Подробности о расширении файла .WAV» . Filext.com . Проверено 10 августа 2015 г.
  3. ^ abc IBM; Microsoft (август 1991 г.). «Мультимедийный программный интерфейс и спецификации данных 1.0» (PDF) . Проверено 26 декабря 2020 г.
  4. ^ аб П. Кабал (19 июня 2006 г.). «Характеристики формата аудиофайла — звуковой файл WAVE или RIFF WAVE». Университет Макгилла . Проверено 16 марта 2010 г.
  5. ^ ab «Многоканальные аудиоданные и файлы WAVE». Корпорация Майкрософт. 07.03.2007 . Проверено 16 марта 2010 г.
  6. ^ «Формат аудиофайла WAVE» . Библиотека Конгресса . 12 сентября 2008 г. Проверено 03 декабря 2023 г.
  7. ^ Ди Сильвестро, Лейле Л.; Барибо, Грег (20 июня 1999 г.). Формат аудиофайла Waveform, регистрация подтипа MIME. IETF. Идентификатор черновика-ema-vpim-wav-00 . Проверено 6 декабря 2009 г.
  8. ^ «Определение файла WAV на английском языке» . Оксфордский живой словарь английского языка . Архивировано из оригинала 7 февраля 2018 года.
  9. Брэнсон, Райан (21 октября 2015 г.) (21 октября 2015 г.). «Чем WAV лучше MP3». Онлайн видео конвертер . Проверено 18 июня 2016 г.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  10. ^ EBU (июль 2009 г.), EBU Tech 3306 - MBWF / RF64: Расширенный формат файла для аудио (PDF) , заархивировано из оригинала (PDF) 22 ноября 2009 г. , получено 19 января 2010 г.
  11. ^ IBM и Microsoft 1991, с. 1-1: «Основным преимуществом RIFF является его расширяемость; форматы файлов, основанные на RIFF, могут быть адаптированы к будущему, поскольку изменения формата могут игнорироваться существующими приложениями».
  12. ^ IBM и Microsoft 1991, PDF, стр. 56: «Программы должны ожидать (и игнорировать) любые неизвестные фрагменты, как и во всех формах RIFF».
  13. ^ IBM и Microsoft 1991, стр. 2–17–2–18.
  14. ^ IBM и Microsoft 1991, с. 2-18
  15. ^ Обновление стандартов мультимедиа Microsoft, Новые типы мультимедийных данных и методы обработки данных, версия 3.0, 15 апреля 1994 г., стр. 6.
  16. ^ IBM и Microsoft 1991, PDF, стр. 56
  17. ^ IBM и Microsoft 1991, PDF, стр. 56
  18. ^ IBM и Microsoft 1991, PDF, стр. 23
  19. ^ IBM и Microsoft 1991, PDF, стр. 21, INAMпоявляется раньшеICOP
  20. ^ Спецификация IBM и Microsoft 1991, которая также описывает интерпретацию производственного синтаксиса.
  21. ^ «Формат файла WAVE» . 15 ноября 1999 г. Архивировано из оригинала 15 ноября 1999 г. Проверено 16 марта 2010 г.
  22. ^ «Формат звукового файла WAVE PCM» . 20 января 2003 г. Архивировано из оригинала 27 августа 2009 г. Проверено 16 марта 2010 г.
  23. ^ «Формат файла WAVE» . Архивировано из оригинала 22 июля 2011 г. Проверено 16 марта 2010 г.
  24. ^ СПЕЦИФИКАЦИЯ XMP, ЧАСТЬ 3: ХРАНЕНИЕ В ФАЙЛАХ (PDF) . Adobe Systems Incorporated. 2016. С. 24–25. Архивировано из оригинала (PDF) 25 февраля 2018 года . Проверено 8 января 2020 г.
  25. Ссылки _ Мужество. Архивировано из оригинала 06.11.2020 . Проверено 8 января 2020 г.
  26. ^ "LTspice IV" (PDF) . Корпорация Линейные Технологии. 2009. с. 95. Архивировано из оригинала (PDF) 27 февраля 2012 г. Проверено 4 сентября 2015 г.

Внешние ссылки