stringtranslate.com

Единое кодирование речи и аудио

Unified Speech and Audio Coding (USAC) — это формат и кодек сжатия звука для музыки и речи или любого сочетания речи и звука с использованием очень низких скоростей передачи данных от 12 до 64 кбит/с. [1] Он был разработан Группой экспертов по движущимся изображениям (MPEG) и опубликован как международный стандарт ISO / IEC 23003-3 (также известный как MPEG-D, часть 3) [2] , а также как тип аудиообъекта MPEG-4 в ISO. /IEC 14496-3:2009/Изм. 3 в 2012 г. [3]

Он использует инструменты линейного прогнозирования во временной области и остаточного кодирования ( методы типа ACELP ) для сегментов речевого сигнала и инструменты кодирования преобразования ( методы на основе MDCT ) для сегментов музыкального сигнала, а также способен динамически переключаться между наборами инструментов в сигнале. отзывчивая манера. Он разрабатывается с целью создать единый унифицированный кодер с производительностью, которая равна или превосходит производительность специализированных кодеров речи и музыкальных кодеров в широком диапазоне битрейтов. Расширенные варианты инструментов параметрического кодирования MPEG-4 Spectral Band Replication (SBR) и MPEG-D MPEG Surround интегрированы в кодек USAC. [4] [5]

Расширенный HE-AAC

Стандарт MPEG-D USAC (ISO/IEC 23003-3) определяет расширенный высокоэффективный профиль AAC, который содержит все инструменты профиля HE -AAC v2 , а также возможности моно/стерео базового профиля USAC. В результате декодер, созданный в соответствии с профилем Extended High Efficiency AAC, способен также декодировать потоки битов, созданные для предыдущих профилей семейства AAC. Профиль Extended High Efficiency AAC был разработан для приложений, которым требуется стабильная производительность при низких скоростях передачи данных и возможность декодирования всего существующего контента AAC-LC , HE-AAC и HE-AACv2 . [6]

xHE-AAC

Фраунгофер определил кодек xHE-AAC как комбинацию расширенного высокоэффективного профиля AAC и соответствующих частей профиля управления громкостью MPEG-D DRC или профиля управления динамическим диапазоном. [7] xHE-AAC расширяет рабочий диапазон кодека с 12 до 300 кбит/с для стереосигналов и позволяет плавно переключаться между битрейтами в этом диапазоне для адаптивной доставки битрейта ( например, с использованием таких стандартов, как MPEG-DASH или HLS ). xHE-AAC также включает обязательную регулировку громкости MPEG-D DRC для воспроизведения контента на постоянной громкости и предлагает новые профили управления динамическим диапазоном для прослушивания в шумных ситуациях. [8]

Хотя декодеры xHE-AAC смогут декодировать потоки битов, созданные для предыдущих профилей семейства AAC, кодеры xHE-AAC обычно предназначены для кодирования типа аудиообъекта MPEG-D USAC (AOT 42) с метаданными громкости MPEG-D DRC. хотя некоторые из них могут поддерживать кодирование устаревших типов объектов AAC. [7]

xHE-AAC является обязательным аудиокодеком в стандарте Digital Radio Mondiale [9] [10] [11] и является товарным знаком Fraunhofer. [7]

В апреле 2016 года компания Via Licensing объявила о запуске программы лицензирования патентного пула xHE-AAC на 2016 год. [12] В 2018 году xHE-AAC был включен в патентный пул AAC компании Via Licensing без дополнительных затрат. [8] [13]

В январе 2021 года Фраунгофер объявил о программе тестирования услуг и товарных знаков для xHE-AAC и объявил, что этот кодек используется Netflix. [14] [15] Netflix сообщил, что пользователи переключались с динамиков на наушники на 16% реже (из-за плохого качества звука или недостаточной громкости) при воспроизведении контента с высоким динамическим диапазоном при использовании xHE-AAC вместо HE-AAC. Netflix также пояснил, что xHE-AAC позволил им начать потоковую передачу звука с адаптивным битрейтом на устройства Android. [16] Фраунгофер также объявил о лицензиях xHE-AAC компаниям MainConcept, [17] Poikosoft, [18] и LG. [19] xHE-AAC поддерживается упаковщиком Bento4 DASH/HLS. [20] В январе 2022 года компания MainConcept создала службу веб-кодирования для тестирования xHE-AAC. В октябре 2022 года декодирование xHE-AAC было добавлено на устройства Windows 11 и Xbox. [21]

Совместимость

xHE-AAC поддерживается в Android, начиная с Android Pie [8] , и в iOS, начиная с iOS 13 . Было объявлено, что он будет добавлен в watchOS 7 [22] [23] и лицензирован Microsoft . [24] Воспроизведение аудиофайлов xHE-AAC поддерживается в foobar2000 с использованием дополнительного декодера AAC. [25]

Смотрите также

Рекомендации

  1. ^ MPEG. «Единое кодирование речи и аудио». Группа экспертов по движущимся изображениям . Проверено 11 ноября 2016 г.
  2. ^ «ISO/IEC DIS 23003-3. Информационные технологии. Аудиотехнологии MPEG. Часть 3. Унифицированное кодирование речи и звука». 15 февраля 2011 г. Проверено 18 июля 2011 г.
  3. ^ «ISO/IEC 14496-3:2009/PDAM 3 — Транспорт унифицированного кодирования речи и аудио (USAC)» . 30 июня 2011 г. Проверено 18 июля 2011 г.
  4. ^ Нойендорф; и другие. (20 декабря 2013 г.), Унифицированный стандарт кодирования речи и аудио ISO/MPEG — стабильно высокое качество для всех типов контента и при всех скоростях передачи данных , получено 13 июня 2015 г.
  5. ^ Нойендорф; и другие. (26 апреля 2012 г.), Унифицированное кодирование речи и аудио MPEG — стандарт ISO/MPEG для высокоэффективного аудиокодирования всех типов контента , получено 13 июня 2015 г.
  6. ^ Нойендорф, Макс; Мультрус, Маркус; Реттельбах, Николаус; Фукс, Гийом; Робильяр, Жюльен; Леконт, Жереми; Уайльд, Стефан; Байер, Стефан; Диш, Саша; Хельмрих, Кристиан; Лефевр, Рош; Гурне, Филипп; Бессетт, Бруно; Лапьер, Джимми; Кьёрлинг, Кристофер; Пурнхаген, Хайко; Вильмоэс, Ларс; Оомен, Вернер; Шуйерс, Эрик; Кикуири, Кей; Чинен, Тору; Норимацу, Такеши; Чонг, Кок Сенг; О, Ынми; Ким, Миён; Квакенбуш, Шайлер; Гриль, Бернхард (1 декабря 2013 г.). «Унифицированный стандарт кодирования речи и аудио ISO/MPEG — стабильно высокое качество для всех типов контента и при всех скоростях передачи данных». Журнал Общества аудиоинженеров . 61 (12): 956–977. ISSN  0004-7554.
  7. ^ abc «Программа товарных знаков xHE-AAC». Институт интегральных микросхем Фраунгофера IIS . Проверено 11 февраля 2021 г.
  8. ^ abc «Программное обеспечение аудиокодека xHE-AAC от Fraunhofer расширяет встроенную поддержку AAC в Android P для лучшего качества при низких битрейтах» . Институт интегральных микросхем Фраунгофера IIS . Проверено 11 июля 2020 г.
  9. ^ "Техническая информация | Цифровое радио Mondiale" . www.drm.org . Проверено 2 августа 2016 г.
  10. ^ "xHE-AAC". Институт интегральных микросхем Фраунгофера IIS . Проверено 2 августа 2016 г.
  11. ^ xHE-AAC в Digital Radio Mondiale (DRM) (PDF) . Фраунгофера ИИС. 2015.
  12. ^ «Via Licensing объявляет о расширении высокоэффективного патентного пула AAC - Via Corp» . www.via-corp.com . Проверено 2 августа 2016 г.
  13. ^ «Via добавляет MPEG-D DRC в патентный пул усовершенствованного аудиокодирования - ViaCorp» . Проверено 11 июля 2020 г.
  14. ^ «Fraunhofer IIS представляет новую службу тестирования и программу товарных знаков для аудиокодека xHE-AAC» . www.businesswire.com . 12 января 2021 г. Проверено 13 января 2021 г.
  15. ^ «Netflix теперь транслирует музыку с xHE-AAC Audio Фраунгофера на Android Mobile» . www.businesswire.com . 12 января 2021 г. Проверено 13 января 2021 г.
  16. ^ Блог, Netflix Technology (21 января 2021 г.). «Оптимизация звука на устройствах Android с помощью xHE-AAC». Середина . Проверено 26 января 2021 г.
  17. ^ «MainConcept запускает плагин кодирования xHE-AAC FFmpeg на основе программного обеспечения аудиокодека от Fraunhofer - аудиоблог Fraunhofer» . Проверено 6 октября 2021 г.
  18. ^ «Аудио конвертер EZ CD Poikosoft теперь поддерживает аудиокодек xHE-AAC от Fraunhofer IIS - аудиоблог Fraunhofer» . Проверено 6 октября 2021 г.
  19. ^ «LG Electronics лицензирует программное обеспечение аудиокодеков xHE-AAC и AAC-ELD у Fraunhofer IIS - Fraunhofer Audio Blog» . Проверено 6 октября 2021 г.
  20. ^ «Аудиокодек xHE-AAC, поддерживаемый Bento4 DASH/HLS Packager - Аудиоблог Fraunhofer» . Проверено 6 октября 2021 г.
  21. ^ «Аудиокодек xHE-AAC теперь в Windows 11 - Аудиоблог Fraunhofer» . Проверено 20 октября 2022 г.
  22. ^ «Apple рекомендует xHE-AAC для потоковой передачи всех аудиоресурсов - аудиоблог Fraunhofer» . Проверено 11 июля 2020 г.
  23. ^ «Что нового в потоковой передаче аудио для Apple Watch — WWDC 2020 — Видео» . Разработчик Apple . Проверено 11 июля 2020 г.
  24. ^ «Fraunhofer IIS лицензирует программное обеспечение аудиокодека xHE-AAC для Microsoft - блог Fraunhofer Audio» . Проверено 11 июля 2020 г.
  25. ^ код54. «декодер пакетов fdk-aac» . Проверено 14 декабря 2020 г.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )

Внешние ссылки