stringtranslate.com

MPEG-4, часть 3

MPEG-4 Part 3 или MPEG-4 Audio (формально ISO / IEC 14496-3) — третья часть международного стандарта ISO / IEC MPEG-4, разработанная Moving Picture Experts Group . [1] Он определяет методы кодирования звука . Первая версия ISO/IEC 14496-3 была опубликована в 1999 году. [2]

MPEG-4 Part 3 состоит из множества технологий кодирования звука — от кодирования речи с потерями ( HVXC , CELP ), общего кодирования звука ( AAC , TwinVQ , BSAC), сжатия звука без потерь ( MPEG-4 SLS , кодирования звука без потерь , MPEG) . -4 DST ), интерфейс преобразования текста в речь (TTSI), структурированное аудио (с использованием SAOL , SASL, MIDI ) и множество дополнительных методов синтеза и кодирования звука. [3] [4] [5] [6] [7] [8] [9] [10] [11]

MPEG-4 Audio не предназначен для какого-то одного приложения, такого как телефония в реальном времени или сжатие высококачественного звука. Это применимо к любому приложению, требующему использования расширенных методов сжатия, синтеза, манипулирования или воспроизведения звука. MPEG-4 Audio — это новый тип аудиостандарта, который объединяет множество различных типов аудиокодирования: естественный звук и синтетический звук, доставку с низким битрейтом и передачу высокого качества, речь и музыку, сложные и простые звуковые дорожки, традиционный контент и интерактивный контент. . [7]

Версии

Подчасти

MPEG-4 Часть 3 содержит следующие подразделы: [16]

Типы аудиообъектов MPEG-4

MPEG-4 Audio включает систему для единообразной обработки различных групп аудиоформатов. Каждому формату присваивается уникальный тип аудиообъекта для его представления. [18] [19] Тип объекта используется для различения различных методов кодирования. Он напрямую определяет поднабор инструментов MPEG-4, необходимый для декодирования конкретного объекта. Профили MPEG-4 основаны на типах объектов, и каждый профиль поддерживает свой список типов объектов. [19]

Аудио профили

Иерархическая структура профиля AAC, профиля HE-AAC и профиля HE-AAC v2, а также совместимость между ними. Декодер профиля HE-AAC полностью способен декодировать любой поток профиля AAC. Аналогичным образом декодер HE-AAC v2 может обрабатывать все потоки профиля HE-AAC, а также все потоки профиля AAC. На основе технической спецификации MPEG-4 Part 3. [21]

Стандарт MPEG-4 Audio определяет несколько профилей. Эти профили основаны на типах объектов, и каждый профиль поддерживает разные списки типов объектов. Каждый профиль также может иметь несколько уровней, которые ограничивают некоторые параметры инструментов, присутствующих в профиле. Этими параметрами обычно являются частота дискретизации и количество аудиоканалов, декодируемых одновременно.

Хранение и транспортировка аудио

Не существует стандарта для передачи элементарных потоков по каналу, поскольку широкий спектр приложений MPEG-4 предъявляет слишком широкие требования к доставке, чтобы их можно было легко охарактеризовать с помощью одного решения.

Возможности транспортного уровня и связь между функциями транспорта, мультиплексирования и демультиплексирования описаны в структуре интеграции мультимедиа доставки (DMIF) в ISO/IEC 14496-6. [16] Ниже этого интерфейса существует множество механизмов доставки, например, транспортный поток MPEG , транспортный протокол реального времени (RTP) и т. д.

Транспортировка в транспортном протоколе реального времени определена в RFC 3016 (формат полезной нагрузки RTP для аудио/визуальных потоков MPEG-4), RFC 3640 (формат полезной нагрузки RTP для транспортировки элементарных потоков MPEG-4), RFC 4281 (параметр кодеков для " Типы носителей Bucket) и RFC 4337 (регистрация типа MIME для MPEG-4).

LATM и LOAS были определены для приложений естественного звука, которые не требуют сложного объектно-ориентированного кодирования или других функций, предоставляемых системами MPEG-4.

Раздвоение технического стандарта AAC

Расширенное кодирование звука в подразделе 4 MPEG-4 Part 3 (MPEG-4 Audio) было улучшено по сравнению с предыдущим стандартом MPEG-2 Part 7 (Advanced Audio Coding), чтобы обеспечить лучшее качество звука для заданного битрейта кодирования.

Предполагается, что любые различия между Частью 3 и Частью 7 будут устранены органом по стандартизации ISO в ближайшем будущем, чтобы избежать возможности будущей несовместимости битовых потоков. В настоящее время не известно о несовместимости проигрывателей или кодеков из-за новизны стандарта.

Стандарт MPEG-2 Part 7 (Advanced Audio Coding) был впервые опубликован в 1997 году и предлагает три профиля по умолчанию: [49] [50] профиль низкой сложности (LC), основной профиль и профиль масштабируемой частоты дискретизации (SSR).

MPEG-4 Part 3 Subpart 4 (General Audio Coding) объединил профили из MPEG-2 Part 7 с перцептивной шумовой заменой (PNS) и определил их как типы аудиообъектов (AAC LC, AAC Main, AAC SSR). [4]

HE-AAC

Высокоэффективное усовершенствованное аудиокодирование — это расширение AAC LC с использованием репликации спектральных полос (SBR) и параметрического стерео (PS). Он предназначен для повышения эффективности кодирования при низких скоростях передачи данных за счет использования частичного параметрического представления звука.

ААК-ССР

Масштабируемая частота дискретизации AAC была введена Sony в стандарты MPEG-2 Part 7 и MPEG-4 Part 3. [ нужна ссылка ] Впервые он был опубликован в стандарте ISO/IEC 13818-7, часть 7: Advanced Audio Coding (AAC) в 1997 году. [49] [50] Аудиосигнал сначала разделяется на 4 полосы с использованием 4-полосного многофазного квадратурного фильтра. банк. Затем эти 4 полосы дополнительно разделяются с использованием MDCT с размером k , равным 32 или 256 выборкам. Это похоже на обычный AAC LC, который использует MDCT с размером k 128 или 1024 непосредственно в аудиосигнале.

Преимущество этого метода заключается в том, что переключение коротких блоков может выполняться отдельно для каждого диапазона PQF . Таким образом, высокие частоты можно кодировать с использованием короткого блока для повышения временного разрешения, а низкие частоты по-прежнему можно кодировать с высоким спектральным разрешением. Однако из-за наложения спектров между 4 полосами PQF эффективность кодирования около (1,2,3) * fs/8 хуже, чем у обычного MPEG-4 AAC LC. [ нужна цитата ]

MPEG-4 AAC-SSR очень похож на ATRAC и ATRAC-3 .

Почему был введен AAC-SSR

Идея AAC-SSR заключалась не только в перечисленных выше преимуществах, но и в возможности снизить скорость передачи данных за счет удаления 1, 2 или 3 верхних полос PQF. Очень простой разделитель битового потока может удалить эти полосы и, таким образом, уменьшить битрейт и частоту дискретизации.

Пример:

Примечание: хотя и возможно, но полученное качество намного хуже типичного для этого битрейта. Таким образом, для обычного AAC LC со скоростью 64 кбит / с полоса пропускания 14–16 кГц достигается за счет использования интенсивного стерео и уменьшенного ЯМР. Это ухудшает качество звука меньше, чем передача с полосой пропускания 6 кГц с идеальным качеством.

БСАК

Побитовое арифметическое кодирование — это стандарт MPEG-4 (ISO/IEC 14496-3, подраздел 4) для масштабируемого кодирования звука. BSAC использует альтернативное AAC бесшумное кодирование, при этом остальная часть обработки идентична AAC. Такая поддержка масштабируемости обеспечивает почти прозрачное качество звука на скорости 64 кбит/с и постепенное ухудшение качества на более низких скоростях передачи данных. Кодирование BSAC лучше всего выполняется в диапазоне от 40 до 64 кбит/с, хотя оно работает в диапазоне от 16 до 64 кбит/с. Кодек AAC-BSAC используется в приложениях цифрового мультимедийного вещания (DMB) .

Лицензирование

В 2002 году Комитет по лицензированию аудио MPEG-4 выбрал Via Licensing Corporation в качестве администратора лицензирования патентного пула MPEG-4 Audio . [3] [51] [52]

Смотрите также

Рекомендации

  1. ^ АБ ИСО (2009). «ISO/IEC 14496-3:2009. Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио». ИСО . Проверено 6 октября 2009 г.
  2. ^ АБ ИСО (1999). «ISO/IEC 14496-3:1999. Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио». ИСО . Проверено 6 октября 2009 г.
  3. ^ ab Business Wire (2 декабря 2002 г.). «Комитет по лицензированию звука MPEG-4 выбирает Via Licensing Corporation в качестве администратора; Комитет по лицензированию звука MPEG-4 определяет условия лицензирования профиля аудио». Бесплатная библиотека . Проверено 6 октября 2009 г. {{cite web}}: |author=имеет общее имя ( справка )
  4. ^ abcd Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма (1999). «Естественное аудиокодирование MPEG-4 – профили и уровни звука». chiariglione.org. Архивировано из оригинала 17 июля 2010 г. Проверено 6 октября 2009 г.
  5. ^ Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма. «Кодирование естественного звука MPEG-4 - масштабируемость естественного звука MPEG-4». chiariglione.org. Архивировано из оригинала 28 февраля 2010 г. Проверено 6 октября 2009 г.
  6. ^ Д. Том, Х. Пурнхаген и подгруппа MPEG Audio (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio – MPEG-4». chiariglione.org . Проверено 6 октября 2009 г.{{cite web}}: CS1 maint: несколько имен: список авторов ( ссылка )
  7. ^ abcd ISO / IEC JTC 1/SC 29/WG 11 (июль 1999 г.), ISO/IEC 14496-3:/Amd.1 - Проект итогового комитета - MPEG-4 Audio Version 2 (PDF) , заархивировано из оригинала (PDF) ) 1 августа 2012 г. , получено 7 октября 2009 г.{{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  8. ^ ab Heiko Purnhagen (1999-06-07), Обзор MPEG-4 Audio Version 2 (PDF) , Heiko Purnhagen, заархивировано из оригинала (PDF) 06 июля 2017 г. , получено 7 октября 2009 г.
  9. ^ аб Хейко Пурнхаген (1 июня 2001 г.). «Аудиостандарт MPEG-4: обзор и применение». Хайко Пурнхаген . Проверено 7 октября 2009 г.[ мертвая ссылка ]
  10. ^ Хайко Пурнхаген (7 ноября 2001 г.). «Веб-страница MPEG Audio – MPEG-4 Audio (ISO/IEC 14496-3)» . Проверено 7 октября 2009 г.[ мертвая ссылка ]
  11. ^ Роб Коенен, ISO/IEC JTC1/SC29/WG11 (март 2002 г.). «Обзор стандарта MPEG-4». chiariglione.org . Проверено 6 октября 2009 г.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  12. ^ AB MPEG. «Стандарты MPEG – Полный список стандартов, разработанных или находящихся в стадии разработки». chiariglione.org. Архивировано из оригинала 20 апреля 2010 года . Проверено 31 октября 2009 г.
  13. ^ ИСО (2000). «ISO/IEC 14496-3:1999/Поправка 1:2000 – Расширения аудио». ИСО . Проверено 7 октября 2009 г.
  14. ^ ИСО (2001). «ИСО/МЭК 14496-3:2001. Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио». ИСО . Проверено 14 октября 2009 г.
  15. ^ ИСО (2005). «ИСО/МЭК 14496-3:2005 – Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3: Аудио». ИСО . Проверено 14 октября 2009 г.
  16. ^ abcd ISO / IEC (01 сентября 2009 г.), ISO / IEC 14496-3: 2009 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3: Аудио (PDF) , IEC , получено 7 октября 2009 г.
  17. ^ ISO / IEC (2019-12-01), ISO / IEC 14496-3: 2019 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио, IEC , получено 2 июня 2020 г.
  18. ^ ab MultimediaWiki (2009). «MPEG-4 Аудио». МультимедиаВики . Проверено 9 октября 2009 г.
  19. ^ abc Бернхард Гриль; Стефан Гейерсбергер; Йоханнес Хильперт; Бодо Тейхманн (июль 2004 г.), Реализация аудиокомпонентов MPEG-4 на различных платформах (PDF) , Fraunhofer Gesellschaft, заархивировано из оригинала (PDF) 10 июня 2007 г. , получено 9 октября 2009 г.
  20. ^ ISO/IEC JTC1/SC29/WG11 N2203 (март 1998 г.). «MPEG-4 Audio (проект итогового комитета 14496-3)». Хайко Пурнхаген . Проверено 7 октября 2009 г.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )[ мертвая ссылка ]
  21. ^ abc ISO/IEC JTC1/SC29/WG11/N7016 (11 января 2005 г.), Текст ISO/IEC 14496-3:2001/FPDAM 4, Кодирование без потерь звука (ALS), новые аудиопрофили и расширения BSAC, заархивировано из оригинал (DOC) от 12 мая 2014 г. , получено 9 октября 2009 г.{{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  22. ^ аб Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма (1999). «Кодирование естественного звука MPEG-4 – общее кодирование звука (на основе AAC)». chiariglione.org. Архивировано из оригинала 19 февраля 2010 г. Проверено 6 октября 2009 г.
  23. ^ ИСО (2003). «Расширение полосы пропускания, ISO/IEC 14496-3:2001/Поправка 1:2003». ИСО . Проверено 13 октября 2009 г.
  24. ^ Аб Шайрер, Эрик Д.; Рэй, Ли (1998). «Алгоритмический и волновой синтез в мультимедийном стандарте MPEG-4». Съезд Общества аудиоинженеров № 105, 1998 г. CiteSeerX 10.1.1.35.2773 . 2.2 Синтез волновых таблиц с помощью SASBF: Формат банка волновых таблиц SASBF имел довольно сложную историю развития. Исходная спецификация была предоставлена ​​E-Mu Systems и основана на их формате SoundFont [15]. После завершения интеграции этого компонента в эталонное программное обеспечение MPEG-4 Ассоциация производителей MIDI (MMA) обратилась к MPEG с просьбой обеспечить совместимость MPEG-4 SASBF с их форматом «Загруженные звуки» [13]. E-Mu согласился, что такая совместимость желательна, и поэтому новый формат был согласован и разработан совместно всеми сторонами. 
  25. ^ ИСО (2004). «Параметрическое кодирование для высококачественного звука, ISO/IEC 14496-3:2001/Amd 2:2004». ИСО . Проверено 13 октября 2009 г.
  26. ^ ISO/IEC JTC1/SC29/WG11 (25 июля 2003 г.). «Текст ISO/IEC 14496-3:2001/FPDAM2 (параметрическое аудио) – N5713». Архивировано из оригинала (DOC) 12 мая 2014 г. Проверено 13 октября 2009 г.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  27. ^ 3GPP (30 сентября 2004 г.). «3GPP TS 26.401 V6.0.0 (2004-09), Функции обработки звука общего аудиокодека; Общее описание расширенного общего аудиокодека aacPlus (выпуск 6)» (DOC) . 3ГПП . Проверено 13 октября 2009 г.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  28. ^ 3GPP (04 января 2005 г.). «ETSI TS 126 401 V6.1.0 (2004-12) - Универсальная система мобильной связи (UMTS) Общие функции обработки звука аудиокодеком; Улучшенный общий аудиокодек aacPlus Общее описание (3GPP TS 26.401 версия 6.1.0 Выпуск 6)». 3ГПП . Проверено 13 октября 2009 г.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  29. ^ АБ ИСО (2006). «Кодирование без потерь звука (ALS), новые аудиопрофили и расширения BSAC, ISO / IEC 14496-3: 2005 / Amd 2: 2006». ИСО . Проверено 13 октября 2009 г.
  30. ^ ИСО (2007). «Расширения BSAC и транспортировка MPEG Surround, ISO/IEC 14496-3:2005/Amd 5:2007». ИСО . Проверено 13 октября 2009 г.
  31. ^ ISO/IEC JTC1/SC29/WG11 (июль 2005 г.). «Учебное пособие по кодированию объемного звука MPEG». Архивировано из оригинала 30 апреля 2010 г. Проверено 9 февраля 2010 г.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  32. ^ ISO/IEC JTC1/SC29/WG11 (июль 2005 г.). «Учебное пособие по кодированию объемного звука MPEG». Архивировано из оригинала 24 марта 2008 г. Проверено 9 февраля 2010 г.{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  33. ^ ИСО (29 января 2007 г.). «ISO/IEC 23003-1:2007. Информационные технологии. Аудиотехнологии MPEG. Часть 1. MPEG Surround». ИСО . Проверено 24 октября 2009 г.
  34. ^ abc ISO (2005). «Аудио MPEG-1/2 в MPEG-4, ISO/IEC 14496-3:2001/Amd 3:2005». ИСО . Проверено 13 октября 2009 г.
  35. ^ ИСО (2005). «Кодирование без потерь звука с передискретизацией, ISO / IEC 14496-3: 2001 / Поправка 6: 2005». ИСО . Проверено 13 октября 2009 г.
  36. ^ ИСО (2006). «Масштабируемое кодирование без потерь (SLS), ISO / IEC 14496-3: 2005 / Поправка 3: 2006». ИСО . Проверено 13 октября 2009 г.
  37. ^ ИСО (2008). «Усовершенствованный AAC с малой задержкой, ISO / IEC 14496-3: 2005 / Поправка 9: 2008». ИСО . Проверено 13 октября 2009 г.
  38. ^ ИСО (2008). «ИСО/МЭК 14496-23:2008, Информационные технологии. Кодирование аудиовизуальных объектов. Часть 23. Символическое представление музыки». ИСО . Проверено 13 октября 2009 г.
  39. ^ ИСО (2008). «Соответствие символическому представлению музыки, ISO / IEC 14496-4: 2004 / Поправка 29: 2008». ИСО . Проверено 13 октября 2009 г.
  40. ^ ИСО (2012). «ISO/IEC 23003-3:2012. Информационные технологии. Аудиотехнологии MPEG. Часть 3. Унифицированное кодирование речи и звука». ИСО . Проверено 07.11.2019 .
  41. ^ ИСО (2009). «ISO/IEC 14496-3:2009/Поправка 2:2010, Простой профиль ALS и транспортировка SAOC». ИСО . Проверено 13 октября 2009 г.
  42. ^ ab ISO/IEC JTC1/SC29/WG11 (03 июля 2009 г.), ISO/IEC 14496-3:200X/PDAM 2 - Простой профиль ALS и транспортировка SAOC, N10826, заархивировано из оригинала (DOC) в 2014 г. - 29 июля , получено 13 октября 2009 г.{{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  43. ^ АБ ИСО (2010). «ISO/IEC 23003-2:2010. Информационные технологии. Аудиотехнологии MPEG. Часть 2. Пространственное кодирование аудиообъектов (SAOC)». ИСО . Проверено 27 декабря 2010 г.
  44. ^ Документ конвенции AES 8099 - Новое параметрическое стерео и многоканальное расширение для MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF) , получено 7 ноября 2019 г.
  45. ^ ISO/IEC JTC1/SC29/WG11 (17 октября 2008 г.), ISO/IEC 14496-3:2005/PDAM 10:200X профиль HD-AAC, MPEG2008/N10188, заархивировано из оригинала (DOC) 2014-05 г. -12 , получено 19 октября 2009 г.{{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  46. ^ ИСО (11 сентября 2009 г.). «ISO/IEC 14496-3:2009/Поправка 1:2009 — Профиль HD-AAC и сигнализация MPEG Surround». ИСО . Проверено 15 октября 2009 г.
  47. ^ ИСО (08 октября 2009 г.). «ISO/IEC 14496-3:2009/Поправка 2:2010 – Простой профиль ALS и транспортировка SAOC». ИСО . Проверено 15 октября 2009 г.
  48. ^ ISO (15 ноября 2004 г.), ISO / IEC 14496-1, третье издание 15 ноября 2004 г., Часть 1: Системы (PDF) , ISO, заархивировано из оригинала (PDF) 14 июня 2011 г. , получено в 2009 г. -10-14
  49. ^ ab ISO (15 октября 2004 г.), ISO/IEC 13818-7, Третье издание, Часть 7 – Расширенное кодирование звука (AAC) (PDF) , стр. 32, заархивировано из оригинала (PDF) 13 июля 2011 г. , получено 19 октября 2009 г.
  50. ^ АБ ИСО (1997). «ИСО/МЭК 13818-7:1997, Информационные технологии. Общее кодирование движущихся изображений и связанной с ними аудиоинформации. Часть 7. Усовершенствованное кодирование звука (AAC)» . Проверено 19 октября 2009 г.
  51. ^ Business Wire (05 января 2009 г.). «Через лицензирование объявляется о выдаче лицензии на патентный пул MPEG-4 SLS». Рейтер. Архивировано из оригинала 4 января 2013 г. Проверено 9 октября 2009 г. {{cite web}}: |author=имеет общее имя ( справка )
  52. ^ Через Лицензионную корпорацию (12 мая 2009 г.). «Через лицензирование объявляет о доступности совместной программы патентного лицензирования MPEG-4 SLS». Деловой провод . Проверено 9 октября 2009 г.

Внешние ссылки