stringtranslate.com

MPEG-4 Часть 3

MPEG-4 Part 3 или MPEG-4 Audio (официально ISO / IEC 14496-3) — третья часть международного стандарта ISO / IEC MPEG-4, разработанная Moving Picture Experts Group . [1] Он определяет методы кодирования звука . Первая версия ISO/IEC 14496-3 была опубликована в 1999 году. [2]

MPEG-4 Часть 3 состоит из различных технологий аудиокодирования — от кодирования речи с потерями ( HVXC , CELP ), общего аудиокодирования ( AAC , TwinVQ , BSAC), сжатия звука без потерь ( MPEG-4 SLS , Audio Lossless Coding , MPEG-4 DST ), интерфейса преобразования текста в речь (TTSI), структурированного звука (с использованием SAOL , SASL, MIDI ) и многих дополнительных методов аудиосинтеза и кодирования. [3] [4] [5] [6] [7] [8] [9] [10] [11]

MPEG-4 Audio не нацелен на одно приложение, например, телефонию в реальном времени или высококачественное сжатие звука. Он применяется к каждому приложению, которое требует использования расширенного сжатия звука, синтеза, обработки или воспроизведения. MPEG-4 Audio — это новый тип аудиостандарта, который объединяет множество различных типов аудиокодирования: естественный звук и синтетический звук, доставку с низким битрейтом и высококачественную доставку, речь и музыку, сложные звуковые дорожки и простые, традиционный контент и интерактивный контент. [7]

Версии

Подчасти

MPEG-4 Часть 3 содержит следующие подразделы: [16]

Типы аудиообъектов MPEG-4

MPEG-4 Audio включает в себя систему для обработки разнообразной группы аудиоформатов унифицированным образом. Каждому формату назначается уникальный тип аудиообъекта для его представления. [18] [19] Тип объекта используется для различения различных методов кодирования. Он напрямую определяет подмножество инструментов MPEG-4, необходимое для декодирования определенного объекта. Профили MPEG-4 основаны на типах объектов, и каждый профиль поддерживает различный список типов объектов. [19]

Аудио профили

Иерархическая структура профилей AAC, HE-AAC и HE-AAC v2 и совместимость между ними. Декодер HE-AAC Profile полностью способен декодировать любой поток AAC Profile. Аналогично декодер HE-AAC v2 может обрабатывать все потоки HE-AAC Profile, а также все потоки AAC Profile. На основе технической спецификации MPEG-4 Part 3. [21]

Стандарт MPEG-4 Audio определяет несколько профилей. Эти профили основаны на типах объектов, и каждый профиль поддерживает разный список типов объектов. Каждый профиль может также иметь несколько уровней, которые ограничивают некоторые параметры инструментов, представленных в профиле. Этими параметрами обычно являются частота дискретизации и количество аудиоканалов, декодируемых одновременно.

Хранение и транспортировка аудио

Стандарта для передачи элементарных потоков по каналу не существует , поскольку широкий спектр приложений MPEG-4 предъявляет слишком широкие требования к доставке, чтобы их можно было легко охарактеризовать с помощью одного решения.

Возможности транспортного уровня и связь между функциями транспорта, мультиплексирования и демультиплексирования описаны в инфраструктуре интеграции мультимедиа доставки (DMIF) в ISO/IEC 14496-6. [16] Ниже этого интерфейса существует широкий спектр механизмов доставки, например, транспортный поток MPEG , транспортный протокол реального времени (RTP) и т. д.

Транспорт в реальном времени Транспортный протокол определен в RFC 3016 (Формат полезной нагрузки RTP для аудио/видеопотоков MPEG-4), RFC 3640 (Формат полезной нагрузки RTP для транспортировки элементарных потоков MPEG-4), RFC 4281 (Параметр кодеков для типов носителей «Bucket») и RFC 4337 (Регистрация типа MIME для MPEG-4).

LATM и LOAS были определены для приложений с естественным звуком, которые не требуют сложного объектно-ориентированного кодирования или других функций, предоставляемых системами MPEG-4.

Бифуркация в техническом стандарте AAC

Расширенное аудиокодирование в MPEG-4 Часть 3 (MPEG-4 Audio), Подчасть 4, было улучшено по сравнению с предыдущим стандартом MPEG-2 Часть 7 (Расширенное аудиокодирование) с целью обеспечения лучшего качества звука для заданного битрейта кодирования.

Предполагается, что любые различия между Частью 3 и Частью 7 будут устранены организацией по стандартизации ISO в ближайшем будущем, чтобы избежать возможности будущих несовместимостей битовых потоков. В настоящее время нет известных несовместимостей проигрывателей или кодеков из-за новизны стандарта.

Стандарт MPEG-2 Часть 7 (Расширенное аудиокодирование) был впервые опубликован в 1997 году и предлагает три профиля по умолчанию: [49] [50] Профиль низкой сложности (LC), Основной профиль и Профиль масштабируемой частоты дискретизации (SSR).

Подраздел 4 части 3 стандарта MPEG-4 (общее аудиокодирование) объединил профили из части 7 стандарта MPEG-2 с заменой воспринимаемого шума (PNS) и определил их как типы аудиообъектов (AAC LC, AAC Main, AAC SSR). [4]

HE-AAC

High-Efficiency Advanced Audio Coding — это расширение AAC LC с использованием спектральной репликации полосы (SBR) и параметрического стерео (PS). Он предназначен для повышения эффективности кодирования при низких битрейтах за счет использования частично параметрического представления звука.

ААК-ССР

Масштабируемая частота дискретизации AAC была введена Sony в стандарты MPEG-2 Часть 7 и MPEG-4 Часть 3. [ требуется ссылка ] Впервые она была опубликована в ISO/IEC 13818-7, Часть 7: Расширенное аудиокодирование (AAC) в 1997 году. [49] [50] Сначала аудиосигнал разделяется на 4 полосы с использованием 4-полосного полифазного квадратурного банка фильтров. Затем эти 4 полосы дополнительно разделяются с использованием MDCT с размером k 32 или 256 выборок. Это похоже на обычный AAC LC, который использует MDCT с размером k 128 или 1024 непосредственно в аудиосигнале.

Преимущество этого метода в том, что переключение коротких блоков может быть выполнено отдельно для каждой полосы PQF . Таким образом, высокие частоты могут быть закодированы с использованием короткого блока для улучшения временного разрешения, низкие частоты могут быть по-прежнему закодированы с высоким спектральным разрешением. Однако из-за наложения между 4 полосами PQF эффективность кодирования около (1,2,3) * fs/8 хуже, чем с обычным MPEG-4 AAC LC. [ необходима цитата ]

MPEG-4 AAC-SSR очень похож на ATRAC и ATRAC-3 .

Почему был введен AAC-SSR

Идея AAC-SSR заключалась не только в перечисленных выше преимуществах, но и в возможности снижения скорости передачи данных путем удаления 1, 2 или 3 верхних полос PQF. Очень простой разделитель битового потока может удалить эти полосы и, таким образом, снизить битрейт и частоту дискретизации.

Пример:

Примечание: хотя это и возможно, полученное качество намного хуже типичного для этого битрейта. Так, для обычного 64 кбит/с AAC LC полоса пропускания 14–16 кГц достигается с использованием интенсивности стерео и уменьшенных NMR. Это ухудшает качество слышимости меньше, чем передача полосы пропускания 6 кГц с идеальным качеством.

БСАК

Bit Sliced ​​Arithmetic Coding — стандарт MPEG-4 (ISO/IEC 14496-3, подраздел 4) для масштабируемого аудиокодирования. BSAC использует альтернативное бесшумное кодирование AAC, при этом остальная обработка идентична AAC. Эта поддержка масштабируемости обеспечивает почти прозрачное качество звука при 64 кбит/с и плавное ухудшение при более низких скоростях передачи данных. Кодирование BSAC лучше всего выполняется в диапазоне от 40 кбит/с до 64 кбит/с, хотя оно работает в диапазоне от 16 кбит/с до 64 кбит/с. Кодек AAC-BSAC используется в приложениях цифрового мультимедийного вещания (DMB) .

Лицензирование

В 2002 году Комитет по лицензированию аудио MPEG-4 выбрал Via Licensing Corporation в качестве администратора лицензирования для патентного пула аудио MPEG-4 . [3] [51] [52]

Смотрите также

Ссылки

  1. ^ ab ISO (2009). "ISO/IEC 14496-3:2009 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3: Аудио". ISO . Получено 2009-10-06 .
  2. ^ ab ISO (1999). "ISO/IEC 14496-3:1999 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3: Аудио". ISO . Получено 2009-10-06 .
  3. ^ ab Business Wire (2002-12-02). "Комитет по лицензированию аудио MPEG-4 выбирает Via Licensing Corporation в качестве администратора; Комитет по лицензированию аудио MPEG-4 завершает работу над условиями лицензирования аудиопрофилей". Бесплатная библиотека . Получено 2009-10-06 . {{cite web}}: |author=имеет общее название ( помощь )
  4. ^ abcd Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма (1999). "MPEG-4 Natural Audio Coding – Audio profiles and levels". chiariglione.org. Архивировано из оригинала 2010-07-17 . Получено 2009-10-06 .
  5. ^ Карлхайнц Бранденбург; Оливер Кунц; Акихико Сугияма. «MPEG-4 Natural Audio Coding – масштабируемость в MPEG-4 natural audio». chiariglione.org. Архивировано из оригинала 28.02.2010 . Получено 06.10.2009 .
  6. ^ D. Thom, H. Purnhagen и MPEG Audio Subgroup (октябрь 1998 г.). "Часто задаваемые вопросы по MPEG Audio – MPEG-4". chiariglione.org . Получено 06.10.2009 .{{cite web}}: CS1 maint: несколько имен: список авторов ( ссылка )
  7. ^ abcd ISO / IEC JTC 1/SC 29/WG 11 (июль 1999 г.), ISO/IEC 14496-3:/Amd.1 – Final Committee Draft – MPEG-4 Audio Version 2 (PDF) , заархивировано из оригинала (PDF) 2012-08-01 , извлечено 2009-10-07{{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  8. ^ ab Heiko Purnhagen (1999-06-07), Обзор MPEG-4 Audio Version 2 (PDF) , Heiko Purnhagen, заархивировано из оригинала (PDF) 2017-07-06 , извлечено 2009-10-07
  9. ^ ab Heiko Purnhagen (2001-06-01). "Стандарт аудио MPEG-4: обзор и применение". Heiko Purnhagen . Получено 2009-10-07 . [ мертвая ссылка ]
  10. ^ Хайко Пурнхаген (2001-11-07). "Веб-страница MPEG Audio – MPEG-4 Audio (ISO/IEC 14496-3)" . Получено 2009-10-07 . [ мертвая ссылка ]
  11. ^ Роб Коенен, ISO/IEC JTC1/SC29/WG11 (март 2002 г.). «Обзор стандарта MPEG-4». chiariglione.org . Получено 06.10.2009 .{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  12. ^ ab MPEG. "Стандарты MPEG – Полный список стандартов, разработанных или находящихся в стадии разработки". chiariglione.org. Архивировано из оригинала 20 апреля 2010 г. Получено 2009-10-31 .
  13. ^ ISO (2000). "ISO/IEC 14496-3:1999/Amd 1:2000 - Аудиорасширения". ISO . Получено 2009-10-07 .
  14. ^ ISO (2001). "ISO/IEC 14496-3:2001 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3: Аудио". ISO . Получено 14 октября 2009 г.
  15. ^ ISO (2005). "ISO/IEC 14496-3:2005 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3: Аудио". ISO . Получено 14 октября 2009 г.
  16. ^ abcd ISO / IEC (2009-09-01), ISO/IEC 14496-3:2009 - Информационные технологии -- Кодирование аудиовизуальных объектов -- Часть 3: Аудио (PDF) , IEC , получено 2009-10-07
  17. ^ ISO / IEC (2019-12-01), ISO/IEC 14496-3:2019 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио, IEC , получено 2020-06-02
  18. ^ ab MultimediaWiki (2009). "MPEG-4 Audio". MultimediaWiki . Получено 2009-10-09 .
  19. ^ abc Бернхард Грилл; Стефан Гейерсбергер; Йоханнес Хильперт; Бодо Тайхманн (июль 2004 г.), Реализация аудиокомпонентов MPEG-4 на различных платформах (PDF) , Fraunhofer Gesellschaft, архивировано из оригинала (PDF) 2007-06-10 , извлечено 2009-10-09
  20. ^ ISO/IEC JTC1/SC29/WG11 N2203 (март 1998 г.). "MPEG-4 Audio (Final Committee Draft 14496-3)". Хайко Пурнхаген . Получено 2009-10-07 .{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )[ мертвая ссылка ]
  21. ^ abc ISO/IEC JTC1/SC29/WG11/N7016 (2005-01-11), Текст ISO/IEC 14496-3:2001/FPDAM 4, Кодирование звука без потерь (ALS), новые аудиопрофили и расширения BSAC, заархивировано из оригинала (DOC) 2014-05-12 , извлечено 2009-10-09{{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  22. ^ ab Karlheinz Brandenburg; Oliver Kunz; Akihiko Sugiyama (1999). "MPEG-4 Natural Audio Coding – General Audio Coding (на основе AAC)". chiariglione.org. Архивировано из оригинала 2010-02-19 . Получено 2009-10-06 .
  23. ^ ISO (2003). "Расширение полосы пропускания, ISO/IEC 14496-3:2001/Amd 1:2003". ISO . Получено 2009-10-13 .
  24. ^ ab Scheirer, Eric D.; Ray, Lee (1998). "Алгоритмический и таблично-волновой синтез в стандарте мультимедиа MPEG-4". Audio Engineering Society Convention 105, 1998. CiteSeerX 10.1.1.35.2773 . 2.2 Таблично-волновой синтез с SASBF: Формат таблично-волнового банка SASBF имел довольно сложную историю разработки. Первоначальная спецификация была предоставлена ​​E-Mu Systems и была основана на их формате "SoundFont" [15]. После завершения интеграции этого компонента в справочное программное обеспечение MPEG-4 Ассоциация производителей MIDI (MMA) обратилась к MPEG с просьбой о совместимости MPEG-4 SASBF с их форматом "Downloaded Sounds" [13]. E-Mu согласилась, что такая совместимость желательна, и поэтому новый формат был согласован и разработан совместно всеми сторонами. 
  25. ^ ISO (2004). "Параметрическое кодирование для высококачественного звука, ISO/IEC 14496-3:2001/Amd 2:2004". ISO . Получено 2009-10-13 .
  26. ^ ISO/IEC JTC1/SC29/WG11 (2003-07-25). "Текст ISO/IEC 14496-3:2001/FPDAM2 (Параметрический звук) - N5713". Архивировано из оригинала (DOC) 2014-05-12 . Получено 2009-10-13 .{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  27. ^ 3GPP (2004-09-30). "3GPP TS 26.401 V6.0.0 (2004-09), Функции обработки звука общего аудиокодека; Улучшенное общее описание общего аудиокодека aacPlus (выпуск 6)" (DOC) . 3GPP . Получено 2009-10-13 .{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  28. ^ 3GPP (2005-01-04). "ETSI TS 126 401 V6.1.0 (2004-12) - Универсальная система мобильной связи (UMTS)Общие функции обработки звука аудиокодека; Улучшенный общий аудиокодек aacPlusОбщее описание (3GPP TS 26.401 версия 6.1.0 выпуск 6)". 3GPP . Получено 2009-10-13 .{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  29. ^ ab ISO (2006). "Кодирование звука без потерь (ALS), новые аудиопрофили и расширения BSAC, ISO/IEC 14496-3:2005/Amd 2:2006". ISO . Получено 13 октября 2009 г. .
  30. ^ ISO (2007). "BSAC-расширения и транспорт MPEG Surround, ISO/IEC 14496-3:2005/Amd 5:2007". ISO . Получено 13 октября 2009 г.
  31. ^ ISO/IEC JTC1/SC29/WG11 (июль 2005 г.). "Учебное пособие по кодированию объемного звука MPEG". Архивировано из оригинала 2010-04-30 . Получено 2010-02-09 .{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  32. ^ ISO/IEC JTC1/SC29/WG11 (июль 2005 г.). "Учебное пособие по кодированию объемного звука MPEG". Архивировано из оригинала 2008-03-24 . Получено 2010-02-09 .{{cite web}}: CS1 maint: числовые имена: список авторов ( ссылка )
  33. ^ ISO (29.01.2007). "ISO/IEC 23003-1:2007 - Информационные технологии -- Аудиотехнологии MPEG -- Часть 1: MPEG Surround". ISO . Получено 24.10.2009 .
  34. ^ abc ISO (2005). "MPEG-1/2 audio in MPEG-4, ISO/IEC 14496-3:2001/Amd 3:2005". ISO . Получено 2009-10-13 .
  35. ^ ISO (2005). "Кодирование без потерь передискретизированного звука, ISO/IEC 14496-3:2001/Amd 6:2005". ISO . Получено 13 октября 2009 г.
  36. ^ ISO (2006). "Масштабируемое кодирование без потерь (SLS), ISO/IEC 14496-3:2005/Amd 3:2006". ISO . Получено 13 октября 2009 г.
  37. ^ ISO (2008). "Улучшенный AAC с малой задержкой, ISO/IEC 14496-3:2005/Amd 9:2008". ISO . Получено 13 октября 2009 г. .
  38. ^ ISO (2008). "ISO/IEC 14496-23:2008, Информационные технологии — Кодирование аудиовизуальных объектов — Часть 23: Символическое представление музыки". ISO . Получено 13 октября 2009 г.
  39. ^ ISO (2008). "Соответствие символическому представлению музыки, ISO/IEC 14496-4:2004/Amd 29:2008". ISO . Получено 13 октября 2009 г.
  40. ^ ISO (2012). "ISO/IEC 23003-3:2012 - Информационные технологии - Аудиотехнологии MPEG - Часть 3: Унифицированное кодирование речи и звука". ISO . Получено 2019-11-07 .
  41. ^ ISO (2009). "ISO/IEC 14496-3:2009/Amd 2:2010, Простой профиль ALS и транспортировка SAOC". ISO . Получено 2009-10-13 .
  42. ^ ab ISO/IEC JTC1/SC29/WG11 (2009-07-03), ISO/IEC 14496-3:200X/PDAM 2 – Простой профиль ALS и транспорт SAOC, N10826, заархивировано из оригинала (DOC) 2014-07-29 , извлечено 2009-10-13{{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  43. ^ ab ISO (2010). "ISO/IEC 23003-2:2010 - Информационные технологии -- Аудиотехнологии MPEG -- Часть 2: Кодирование пространственных аудиообъектов (SAOC)". ISO . Получено 27.12.2010 .
  44. ^ Документ конвенции AES 8099 – Новое параметрическое стерео и многоканальное расширение для MPEG-4 Enhanced Low Delay AAC (AAC-ELD) (PDF) , получено 07.11.2019
  45. ^ ISO/IEC JTC1/SC29/WG11 (2008-10-17), профиль ISO/IEC 14496-3:2005/PDAM 10:200X HD-AAC, MPEG2008/N10188, заархивировано из оригинала (DOC) 2014-05-12 , извлечено 2009-10-19{{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
  46. ^ ISO (2009-09-11). "ISO/IEC 14496-3:2009/Amd 1:2009 - Профиль HD-AAC и сигнализация MPEG Surround". ISO . Получено 2009-10-15 .
  47. ^ ISO (2009-10-08). "ISO/IEC 14496-3:2009/Amd 2:2010 - Простой профиль ALS и транспортировка SAOC". ISO . Получено 2009-10-15 .
  48. ^ ISO (2004-11-15), ISO/IEC 14496-1, Третье издание 2004-11-15, Часть 1: Системы (PDF) , ISO, заархивировано из оригинала (PDF) 14 июня 2011 г. , извлечено 2009-10-14
  49. ^ ab ISO (2004-10-15), ISO/IEC 13818-7, Третье издание, Часть 7 – Расширенное аудиокодирование (AAC) (PDF) , стр. 32, заархивировано из оригинала (PDF) 2011-07-13 , извлечено 2009-10-19
  50. ^ ab ISO (1997). "ISO/IEC 13818-7:1997, Информационные технологии. Общее кодирование движущихся изображений и связанной с ними аудиоинформации. Часть 7: Расширенное аудиокодирование (AAC)" . Получено 19 октября 2009 г.
  51. ^ Business Wire (2009-01-05). "Via Licensing объявляет о лицензии MPEG-4 SLS Patent Pool". Reuters. Архивировано из оригинала 2013-01-04 . Получено 2009-10-09 . {{cite web}}: |author=имеет общее название ( помощь )
  52. ^ Via Licensing Corporation (2009-05-12). "Via Licensing объявляет о доступности совместной программы лицензирования патентов MPEG-4 SLS". Business Wire . Получено 2009-10-09 .

Внешние ссылки