Windows Media Audio ( WMA ) — это серия аудиокодеков и соответствующих им форматов кодирования звука, разработанных Microsoft . Это запатентованная технология, являющаяся частью платформы Windows Media . WMA состоит из четырех различных кодеков. Оригинальный кодек WMA, известный просто как WMA , был задуман как конкурент популярным кодекам MP3 и RealAudio . [2] [3] WMA Pro , новый и более совершенный кодек, поддерживает многоканальный звук и звук высокого разрешения . [4] Кодек без потерь , WMA Lossless , сжимает аудиоданные без потери качества звука (обычный формат WMA имеет потери ). [4] WMA Voice , ориентированный на голосовой контент, применяет сжатие с использованием диапазона низких скоростей передачи данных . [4] Microsoft также разработала формат цифрового контейнера под названием Advanced Systems Format для хранения аудио, закодированного с помощью WMA.
Первый кодек WMA был основан на более ранней работе Энрике Мальвара и его команды, которая была передана команде Windows Media в Microsoft. [5] Малвар был старшим научным сотрудником и менеджером группы обработки сигналов в Microsoft Research , [6] чья команда работала над проектом MSAudio . [7] Первый доработанный кодек первоначально назывался MSAudio 4.0 . [8] [9] Позже он был официально выпущен как Windows Media Audio , [1] как часть Windows Media Technologies 4.0. Microsoft утверждала, что WMA может создавать файлы, размер которых вдвое меньше файлов MP3 эквивалентного качества; [10] Microsoft также заявила, что WMA обеспечивает звук «почти CD-качества» со скоростью 64 кбит/с. [10] Однако первое утверждение было отвергнуто некоторыми аудиофилами [11] , и оба утверждения были опровергнуты общедоступными тестами прослушивания кодеков . RealNetworks также оспорила заявления Microsoft относительно превосходного качества звука WMA по сравнению с RealAudio. [3]
Стали доступны новые версии WMA: Windows Media Audio 2 в 1999 году, [12] Windows Media Audio 7 в 2000 году, [13] Windows Media Audio 8 в 2001 году, [14] и Windows Media Audio 9 в 2003 году. [4] Впервые Microsoft объявила о своих планах лицензировать технологию WMA третьим лицам в 1999 году. [15] До Windows XP файлы WMA в основном передавались в потоковом режиме с использованием фильтра источника Windows Media ( кодек DirectShow ), который позже был удален в Windows Vista с добавлением Media Foundation. [16] Хотя более ранние версии проигрывателя Windows Media воспроизводили файлы WMA, поддержка создания файлов WMA не была добавлена до седьмой версии. [17] В 2003 году Microsoft выпустила новые аудиокодеки, которые не были совместимы с исходным кодеком WMA. Этими кодеками были Windows Media Audio 9 Professional , [4] Windows Media Audio 9 Lossless , [4] и Windows Media Audio 9 Voice . [4]
Все версии WMA, выпущенные после версии 9.0, а именно 9.1, 9.2 и 10, обратно совместимы с исходным декодером v9 и поэтому не считаются отдельными кодеками. Единственным исключением из этого правила является кодек WMA 10 Professional, режим низкой скорости передачи данных (LBR) которого обратно совместим со старыми декодерами WMA Professional только при половинной частоте дискретизации (аналогично тому, как HE-AAC обратно совместим с AAC-LC). Для полноценного декодирования битовых потоков WMA 10 Professional LBR требуется декодер WMA версии 10 или более поздней версии.
Файл WMA в большинстве случаев содержится в расширенном системном формате (ASF), собственном контейнерном формате Microsoft для цифрового аудио или цифрового видео . [18] Формат контейнера ASF определяет, как должны кодироваться метаданные о файле, подобно тегам ID3 , используемым в файлах MP3. Метаданные могут включать название песни, номер дорожки, имя исполнителя, а также значения нормализации звука . Этот контейнер может дополнительно поддерживать управление цифровыми правами (DRM), используя комбинацию обмена ключами шифрования с эллиптической кривой , блочного шифра DES , специального блочного шифра, потокового шифрования RC4 и функции хеширования SHA-1 . Дополнительную информацию см. в разделе Windows Media DRM .
С 2008 года Microsoft также использует WMA Professional в своем защищенном взаимодействующем формате файлов (PIFF), основанном на базовом формате медиафайлов ISO и наиболее часто используемом для Smooth Streaming, формы потоковой передачи с адаптивным битрейтом через HTTP. Сопутствующие отраслевые стандарты, такие как DECE UltraViolet и MPEG-DASH , не стандартизировали WMA в качестве поддерживаемого аудиокодека, в результате чего было принято решение в пользу более распространенных в отрасли аудиокодеков MPEG и Dolby.
Каждый файл WMA содержит одну звуковую дорожку в одном из четырех подформатов: WMA, WMA Pro, WMA Lossless или WMA Voice. Эти форматы реализованы по-разному, поэтому они технически различны и несовместимы; иными словами, устройство или программное обеспечение, совместимое с одним подформатом, не поддерживает автоматически ни один из других кодеков. Подробное описание каждого кодека приведено ниже.
Windows Media Audio (WMA) — наиболее распространенный из четырех кодеков WMA. Разговорное использование термина WMA , особенно в маркетинговых материалах и спецификациях устройств, обычно относится только к этому кодеку. Первая версия кодека, выпущенная в 1999 году, считается WMA 1. В том же году синтаксис битового потока , или алгоритм сжатия , был незначительно изменен и стал WMA 2. [12] С тех пор появились более новые версии кодека. были выпущены, но процесс декодирования остался прежним, что обеспечивает совместимость между версиями кодеков. [12] WMA — аудиокодек с потерями, основанный на исследованиях психоакустики . Аудиосигналы, которые считаются незаметными для человеческого уха, в процессе сжатия кодируются с пониженным разрешением.
WMA может кодировать аудиосигналы с частотой дискретизации до 48 кГц с использованием до двух дискретных каналов ( стерео ). В WMA 9 в кодировщик MS были введены методы кодирования с переменной скоростью передачи данных (VBR) и средней скоростью передачи данных (ABR), хотя оба технически поддерживались исходным форматом. [12] В WMA 9.1 также добавлена поддержка звука с низкой задержкой, [19] что уменьшает задержку при кодировании и декодировании.
По сути, WMA — это кодировщик преобразований, основанный на модифицированном дискретном косинусном преобразовании (MDCT), чем-то похожий на AAC , Cook и Vorbis . Битовый поток WMA состоит из суперкадров, каждый из которых содержит 1 или более кадров по 2048 выборок. Если битовый резервуар не используется, кадр равен суперкадру. Каждый кадр содержит несколько блоков, которые представляют собой 128, 256, 512, 1024 или 2048 выборок после преобразования в частотную область посредством MDCT. В частотной области определяется маска для преобразованных выборок, а затем используется для повторного квантования выборок. Наконец, выборки с плавающей запятой разлагаются на части коэффициентов и экспонент и независимо кодируются Хаффманом . Стереоинформация обычно закодирована в середине/стороне . При низких скоростях передачи данных для улучшения качества также можно использовать линейные спектральные пары (обычно менее 17 кбит/с) и форму шумового кодирования (обычно менее 33 кбит/с).
Подобно AAC и Ogg Vorbis, WMA был призван устранить очевидные недостатки стандарта MP3. Учитывая общие цели дизайна, все три формата в конечном итоге сделали одинаковый выбор дизайна. Все три являются кодеками чистого преобразования. Более того, реализация MDCT, используемая в WMA, по сути, является расширенным набором реализаций, используемых в Ogg и AAC, так что WMA iMDCT и процедуры обработки окон могут использоваться для декодирования AAC и Ogg Vorbis практически без изменений. Однако квантование и стереокодирование обрабатываются по-разному в каждом кодеке. Основной отличительной чертой стандартного формата WMA является уникальное использование 5 различных размеров блоков по сравнению с MP3, AAC и Ogg Vorbis, каждый из которых ограничивает файлы только двумя размерами. WMA Pro расширяет эту возможность, добавляя шестой размер блока, используемый с частотой дискретизации 88,2/96 кГц.
Сертифицированные PlaysForSure устройства, а также большое количество несертифицированных устройств, от портативных портативных музыкальных плееров до приставок DVD-плееров , поддерживают воспроизведение файлов WMA. Большинство интернет-магазинов, сертифицированных PlaysForSure, распространяют контент только с использованием этого кодека. В 2005 году Nokia объявила о своих планах поддерживать воспроизведение WMA в будущих телефонах Nokia. [20] В том же году для PlayStation Portable было доступно обновление (версия 2.60), которое впервые позволило воспроизводить файлы WMA на устройстве. [21]
Windows Media Audio Professional (WMA Pro) — это улучшенный кодек с потерями, тесно связанный со стандартами WMA. Он сохраняет большинство тех же общих функций кодирования, но также имеет улучшенные стратегии энтропийного кодирования и квантования, а также более эффективное стереокодирование. Примечательно, что многие функции стандарта WMA с низким битрейтом были удалены, поскольку основной кодек предназначен для эффективного кодирования при большинстве битрейтов. Его основными конкурентами являются AAC , HE-AAC , Vorbis , Dolby Digital и DTS. Он поддерживает 16-битную и 24-битную глубину дискретизации, частоту дискретизации до 96 кГц и до восьми дискретных каналов ( 7.1-канальный объемный звук ). [22] WMA Pro также поддерживает сжатие динамического диапазона , которое уменьшает разницу в громкости между самыми громкими и самыми тихими звуками звуковой дорожки. По словам Амира Маджидимера из Microsoft, WMA Pro теоретически может выходить за рамки объемного звука 7.1 и поддерживать «неограниченное количество каналов»; однако Microsoft решила ограничить свои текущие возможности восемью (7.1 дискретных каналов). [23]
Синтаксис битового потока кодека был заморожен в первой версии WMA 9 Pro. [24] Более поздние версии WMA Pro представили кодирование с низкой скоростью передачи данных, звук с малой задержкой, [25] режим интерполяции частоты, [26] и расширенный диапазон вариантов частоты дискретизации и битовой глубины кодирования. Файл WMA 10 Pro, сжатый в режиме частотной интерполяции, содержит дорожку WMA 9 Pro, закодированную с половиной исходной частоты дискретизации, которая затем восстанавливается с использованием нового алгоритма сжатия. [27] В этой ситуации проигрыватели WMA 9 Pro, которые не были обновлены до кодека WMA 10 Pro, могут декодировать только поток WMA 9 Pro более низкого качества. Начиная с WMA 10 Pro, восьмиканальное кодирование начинается со скорости 128 кбит/с, а дорожки можно кодировать с собственным разрешением аудио компакт-диска (44,1 кГц, 16 бит), ранее входившим в стандарт WMA.
Несмотря на растущее число поддерживаемых устройств и превосходство над WMA, WMA Pro по-прежнему имеет слабую аппаратную и программную поддержку. Некоторыми заметными исключениями из этого правила являются Microsoft Zune (ограничено стерео), [28] Xbox 360 , [29] устройства под управлением Windows Mobile с Windows Media Player 10 Mobile, [30] новые устройства Toshiba Gigabeat и Motorola , [31] [ 32] и устройства с последними версиями альтернативной прошивки Rockbox . [33] Кроме того, WMA Pro является обязательным требованием для программы сертификации WMV HD . [34] Что касается программного обеспечения, Verizon использует WMA 10 Pro для своей музыкальной службы V CAST, [35] а проигрыватель Windows Media 11 продвигает этот кодек как альтернативу WMA для копирования дорожек аудио-CD. [36] WMA Pro поддерживается в Silverlight начиная с версии 2 (но только в стереорежиме). При отсутствии соответствующего аудиооборудования WMA Pro может автоматически микшировать многоканальный звук в стерео или моно , а 24-битное разрешение — в 16-битное во время воспроизведения.
Ярким примером использования WMA Pro вместо WMA Standard является веб-сайт NBC Olympics, на котором используется WMA 10 Pro в режиме с низким битрейтом 48 кбит/с. [ нужна цитата ]
Windows Media Audio 9 Lossless — это воплощение Windows Media Audio без потерь , аудиокодека Microsoft , выпущенного в начале 2003 года . Он сжимает аудио компакт-диск до размера от 206 до 411 МБ со скоростью передачи данных от 470 до 940 кбит/с. Результатом является побитовая копия исходного аудиофайла; другими словами, качество звука на компакт-диске будет таким же, как и качество файла при воспроизведении. WMA Lossless использует то же расширение файла .WMA, что и другие форматы Windows Media Audio. Он поддерживает 6 дискретных каналов и звук без потерь до 24 бит/96 кГц. Формат никогда не был публично документирован, хотя декодер с открытым исходным кодом был разработан для платформ сторонних разработчиков проектами libav и ffmpeg .
Windows Media Audio Lossless (WMA Lossless) — аудиокодек без потерь, конкурирующий с ATRAC Advanced Lossless, Dolby TrueHD , DTS-HD Master Audio , Shorten , Monkey's Audio , FLAC , Apple Lossless и WavPack (с конца 2011 года [37] [ 38] [39] последние три имеют то преимущество, что являются программным обеспечением с открытым исходным кодом и доступны практически для любой операционной системы .) Разработанный для архивных целей, [40] он сжимает аудиосигналы без потери качества по сравнению с оригиналом с использованием VBR. В распакованном состоянии аудиосигнал является точной копией оригинала. Первая версия кодека WMA 9 Lossless и ее версии поддерживают 24-битный звук с частотой до 96 кГц для до 6 дискретных каналов ( 5.1-канальный объемный звук ) с управлением сжатием динамического диапазона. Типичная степень сжатия музыки варьируется от 1,7:1 до 3:1. [40] [41] [42]
Аппаратная поддержка кодека доступна на моделях Cowon A3, [43] Cowon S9, Bang & Olufsen Serenata [44] Sony Walkman серии NWZ-A и NWZ-S, Zune 4, 8 , 80 30 , Zune 120 (с версией прошивки). 2.2 или новее) и Zune HD , Xbox 360 , [29] устройства под управлением Windows Mobile с Windows Media Player 10 Mobile, [30] Windows Phone (версия 8 и выше), модели Toshiba Gigabeat S и V, Toshiba T-400 , Meizu M3 и музыкальные плееры Insignia NS-DV, Pilot и Sport от Best Buy . Logitech Squeezebox Touch теперь изначально поддерживает этот формат, хотя раньше он поддерживался только посредством перекодирования. Как и стандарт WMA, WMA Lossless используется несколькими интернет-магазинами для распространения музыки в Интернете. [45] [46] Подобно WMA Pro, декодер WMA Lossless может выполнять микширование при отсутствии соответствующего аудиооборудования. [ нужна цитация ] По состоянию на 2012 год проекты ffmpeg и libav имеют декодеры WMA Lossless с открытым исходным кодом, основанные на обратном проектировании официального декодера. По состоянию на 20 июня 2012 г. только 16-битные файлы WMA могут быть успешно декодированы с помощью ffmpeg.
Windows Media Audio Voice (WMA Voice) — это аудиокодек с потерями, который конкурирует со Speex (используется в собственной онлайн-службе Microsoft Xbox Live [47] ), ACELP и другими кодеками. Разработанный для приложений воспроизведения голоса с низкой пропускной способностью, [48] он использует низкочастотную и высокочастотную фильтрацию звука за пределами диапазона частот человеческой речи для достижения более высокой эффективности сжатия, чем WMA. Он может автоматически обнаруживать участки аудиодорожки, содержащие как голос, так и музыку, и вместо этого использовать стандартный алгоритм сжатия WMA. [24] WMA Voice поддерживает частоту до 22,05 кГц только для одного канала (моно). [48] Кодирование ограничено постоянной скоростью передачи данных (CBR) и скоростью до 20 кбит/с. Первая и единственная версия кодека — WMA 9 Voice.
Устройства под управлением Windows Mobile с Windows Media Player 10 Mobile имеют встроенную поддержку воспроизведения WMA 9 Voice. [30] Кроме того, BBC World Service использовала WMA Voice для своей службы потокового интернет-радио . [49]
Microsoft утверждает, что звук, закодированный в формате WMA, звучит лучше, чем MP3 при той же скорости передачи данных; Microsoft также утверждает, что звук, закодированный с помощью WMA при более низкой скорости передачи данных, звучит лучше, чем MP3 при более высокой скорости передачи данных. [50] Тесты двойного слепого прослушивания с другими аудиокодеками с потерями показали разные результаты: от неспособности поддержать заявления Microsoft о превосходном качестве до превосходства над другими кодеками. Один независимый тест, проведенный в мае 2004 года на скорости 128 кбит/с, показал, что WMA примерно эквивалентен LAME MP3; уступает AAC и Vorbis; и превосходит ATRAC3 (версия программного обеспечения). [51]
Некоторые исследования пришли к выводу:
Заявления Microsoft о качестве звука WMA часто вызывают жалобы. «Некоторые аудиофилы оспаривают заявления Microsoft относительно качества WMA», — говорится в опубликованной статье EDN. [11] В другой статье MP3 Developments говорится, что утверждение Microsoft о звуке CD-качества со скоростью 64 кбит/с с WMA «очень далеко от истины». [52] На ранних этапах разработки WMA представитель RealNetworks утверждал, что WMA был «явной и тщетной попыткой Microsoft догнать RealAudio 8». [53]
Microsoft иногда заявляла, что качество звука WMA со скоростью 64 кбит/с равно или превосходит качество звука MP3 со скоростью 128 кбит/с ( большинство слушателей считают, что WMA и MP3 почти прозрачны при скорости 192 кбит/с). В исследовании 1999 года, профинансированном Microsoft, Национальная лаборатория тестирования программного обеспечения (NSTL) обнаружила, что слушатели предпочитают WMA со скоростью 64 кбит/с MP3 со скоростью 128 кбит/с (кодируемый MusicMatch Jukebox ). [54]
Кодеры MP3 и WMA активно развиваются и совершенствуются на протяжении многих лет, поэтому их относительное качество может со временем измениться.
Помимо Windows Media Player, большинство форматов сжатия WMA можно воспроизводить с помощью ALLPlayer , VLC media player , [55] Media Player Classic , [56] MPlayer , RealPlayer , Winamp , Zune Software (с некоторыми ограничениями — поддержка плагинов DSP и DirectSound). вывод отключен с помощью плагина WMA по умолчанию), [ нужна ссылка ] и многих других программных медиаплееров. Программное обеспечение для управления мультимедиа Microsoft Zune поддерживает большинство кодеков WMA, но использует вариант Windows Media DRM , который используется PlaysForSure.
Проект FFmpeg перепроектировал и повторно реализовал кодеки WMA, чтобы обеспечить их использование в POSIX -совместимых операционных системах, таких как Linux . Проект Rockbox еще больше расширил этот кодек, сделав его пригодным для встроенных ядер, что позволяет воспроизводить его на портативных MP3-плеерах и мобильных телефонах с программным обеспечением с открытым исходным кодом. RealNetworks объявила о планах поддержки воспроизведения файлов WMA без DRM в RealPlayer для Linux. [57] На платформе Macintosh Microsoft выпустила версию Windows Media Player для PowerPC для Mac OS X в 2003 году, [58] но дальнейшая разработка программного обеспечения прекратилась. В настоящее время Microsoft поддерживает сторонний Flip4Mac WMA, компонент QuickTime , который позволяет пользователям Macintosh воспроизводить файлы WMA в любом проигрывателе, использующем платформу QuickTime. [59] Однако Flip4Mac в настоящее время не поддерживает голосовой кодек Windows Media Audio. [60]
Базовая платформа Android сама по себе не поддерживает WMA, но для устройств Android существует стороннее программное обеспечение WMA. [61]
Формат WMA можно воспроизводить практически на всех устройствах Windows Mobile и более поздних версиях Windows Phone.
Существует множество проприетарных пакетов программного обеспечения и пакетов с открытым исходным кодом , которые могут экспортировать аудио в формате WMA, в том числе, среди многих других, Windows Media Player, Windows Movie Maker , Microsoft Expression Encoder , Sony Sound Forge , GOM Player , RealPlayer , [62] Adobe Premiere Pro , [ 63] Adobe Audition , [64] Adobe Soundbooth и медиаплеер VLC . [65] Microsoft Office OneNote поддерживает кодирование во всех кодеках WMA, [66] а кодировщик Windows Media также поддерживает все доступные параметры скорости передачи данных и разрешения.
Кодеки WMA чаще всего используются с форматом контейнера ASF, который имеет дополнительную функцию DRM. Windows Media DRM, которую можно использовать в сочетании с WMA, поддерживает службы подписки на музыку с ограниченным сроком действия, например, предлагаемые службами неограниченной загрузки, включая URGE MTV , Napster , Rhapsody , Yahoo! Music Unlimited и Virgin Digital . Windows Media DRM, компонент PlaysForSure и Windows Media Connect , поддерживается на многих современных портативных аудиоустройствах и клиентах потокового мультимедиа, таких как Roku , SoundBridge , Xbox 360 и Wii . Проигрыватели, поддерживающие формат WMA, но не поддерживающие Windows Media DRM, не могут воспроизводить файлы, защищенные DRM.
некоторые аудиофилы оспаривают заявления Microsoft относительно качества WMA