stringtranslate.com

Расширенное аудиокодирование

Advanced Audio Coding ( AAC ) — стандарт аудиокодирования для сжатия цифрового звука с потерями . Он был разработан как преемник формата MP3 и, как правило, обеспечивает более высокое качество звука, чем MP3 при той же скорости передачи данных . [4]

AAC был стандартизирован ISO и IEC как часть спецификаций MPEG-2 и MPEG-4 . [5] [6] Часть AAC, HE-AAC («AAC+»), является частью MPEG-4 Audio и принята в стандартах цифрового радио DAB+ и Digital Radio Mondiale , а также в стандартах мобильного телевидения DVB-H и ATSC-M/H .

AAC поддерживает включение 48 полнополосных ( до 96 кГц) аудиоканалов в один поток плюс 16 каналов низкочастотных эффектов ( LFE , ограниченных 120 Гц), до 16 каналов «сцепления» или диалоговых каналов и до 16 потоков данных. Качество для стерео удовлетворительно для скромных требований при 96 кбит/с в режиме совместного стерео ; однако, прозрачность hi-fi требует скорости передачи данных не менее 128 кбит/с ( VBR ). Тесты [ какие? ] аудио MPEG-4 показали, что AAC соответствует требованиям, называемым «прозрачными» для ITU при 128 кбит/с для стерео и 384 кбит/с для аудио 5.1 . [7] AAC использует только модифицированный алгоритм дискретного косинусного преобразования (MDCT), что обеспечивает ему более высокую эффективность сжатия, чем MP3, который использует гибридный алгоритм кодирования, который является частью MDCT и частью FFT . [4]

AAC — это формат аудио по умолчанию или стандартный формат для iPhone , iPod , iPad , Nintendo DSi , Nintendo 3DS , Apple Music , [a] iTunes , DivX Plus Web Player , PlayStation 4 и различных телефонов Nokia Series 40. Он поддерживается широким спектром устройств и программного обеспечения, таких как PlayStation Vita , Wii , цифровые аудиоплееры, такие как Sony Walkman или SanDisk Clip , устройства Android и BlackBerry , различные автомобильные аудиосистемы, встроенные в приборную панель, [ когда? ] [ неопределенно ] и также является одним из аудиоформатов, используемых в веб-плеере Spotify . [8]

История

Фон

Дискретное косинусное преобразование (DCT), тип кодирования преобразования для сжатия с потерями , было предложено Насиром Ахмедом в 1972 году и разработано Ахмедом совместно с Т. Натараджаном и К. Р. Рао в 1973 году, а их результаты были опубликованы в 1974 году. [9] [10] [11] Это привело к разработке модифицированного дискретного косинусного преобразования (MDCT), предложенного Дж. П. Принсеном, А. В. Джонсоном и А. Б. Брэдли в 1987 году, [12] после более ранней работы Принсена и Брэдли в 1986 году. [13] Стандарт кодирования звука MP3 , представленный в 1992 году, использовал гибридный алгоритм кодирования, который является частью MDCT и частью FFT . [14] AAC использует чистый алгоритм MDCT, что обеспечивает ему более высокую эффективность сжатия, чем MP3. [4] Разработка продвинулась дальше, когда Ларс Лильерид представил метод, который радикально сократил объем информации, необходимой для хранения оцифрованной формы песни или речи. [15]

AAC был разработан при сотрудничестве и участии таких компаний, как Bell Labs , Fraunhofer IIS , Dolby Laboratories , LG Electronics , NEC , Panasonic , Sony Corporation , [1] ETRI , JVC Kenwood , Philips , Microsoft и NTT . [16] Он был официально объявлен международным стандартом Группой экспертов по движущимся изображениям в апреле 1997 года. Он указан как Часть 7 стандарта MPEG-2 и Подчасть 4 в Части 3 стандарта MPEG-4 . [17]

Стандартизация

В 1997 году AAC был впервые представлен как MPEG-2 Часть 7 , официально известный как ISO / IEC 13818-7:1997 . Эта часть MPEG-2 была новой частью, поскольку MPEG-2 уже включал MPEG-2 Часть 3 , официально известный как ISO/IEC 13818-3: MPEG-2 BC (обратно совместимый). [18] [19] Поэтому MPEG-2 Часть 7 также известен как MPEG-2 NBC (необратно совместимый), поскольку он несовместим с аудиоформатами MPEG-1 ( MP1 , MP2 и MP3 ). [18] [20] [21] [22]

MPEG-2 Часть 7 определяет три профиля: профиль низкой сложности (AAC-LC / LC-AAC), основной профиль (AAC Main) и профиль масштабируемой частоты дискретизации (AAC-SSR). Профиль AAC-LC состоит из базового формата, очень похожего на формат кодирования Perceptual Audio Coding (PAC) от AT&T, [23] [24] [25] с добавлением временного формирования шума (TNS), [26] окна Кайзера (описанного ниже), неравномерного квантизатора и переработки формата битового потока для обработки до 16 стереоканалов, 16 моноканалов, 16 каналов низкочастотных эффектов (LFE) и 16 каналов комментариев в одном битовом потоке. Основной профиль добавляет набор рекурсивных предикторов, которые вычисляются на каждом этапе банка фильтров. SSR использует 4-полосный набор фильтров PQMF с четырьмя более короткими наборами фильтров, что позволяет масштабировать частоты дискретизации.

В 1999 году MPEG-2 Часть 7 был обновлен и включен в семейство стандартов MPEG-4 и стал известен как MPEG-4 Часть 3 , MPEG-4 Аудио или ISO/IEC 14496-3:1999 . Это обновление включало несколько улучшений. Одним из этих улучшений было добавление Типов Аудиообъектов , которые используются для обеспечения взаимодействия с разнообразным спектром других аудиоформатов, таких как TwinVQ , CELP , HVXC , синтез речи и MPEG-4 Структурированное Аудио . Еще одним заметным дополнением в этой версии стандарта AAC является Замена Воспринимаемого Шума (PNS). В этой связи профили AAC (профили AAC-LC, AAC Main и AAC-SSR) объединены с заменой воспринимаемого шума и определены в стандарте аудио MPEG-4 как Типы Аудиообъектов. [27] Типы аудиообъектов MPEG-4 объединены в четыре профиля MPEG-4 Audio: основной (который включает в себя большинство типов аудиообъектов MPEG-4), масштабируемый (AAC LC, AAC LTP, CELP, HVXC, TwinVQ, Wavetable Synthesis, TTSI), речевой (CELP, HVXC, TTSI) и низкоскоростной синтез (Wavetable Synthesis, TTSI). [27] [28]

Справочное программное обеспечение для MPEG-4 Часть 3 указано в MPEG-4 Часть 5, а потоки битов соответствия указаны в MPEG-4 Часть 4. MPEG-4 Аудио остается обратно совместимым с MPEG-2 Часть 7. [29]

MPEG-4 Audio Version 2 (ISO/IEC 14496-3:1999/Amd 1:2000) определил новые типы аудиообъектов: тип объекта с малой задержкой AAC ( AAC-LD ), тип объекта с побитовым арифметическим кодированием (BSAC), параметрическое аудиокодирование с использованием гармонических и индивидуальных линейных, а также устойчивых к шумам и ошибкам (ER) версий типов объектов. [30] [31] [32] Он также определил четыре новых аудиопрофиля: профиль высококачественного аудио, профиль аудио с малой задержкой, профиль естественного аудио и профиль межсетевого взаимодействия мобильного аудио. [33]

Профиль HE-AAC (AAC LC с SBR ) и профиль AAC (AAC LC) были впервые стандартизированы в ISO/IEC 14496-3:2001/Amd 1:2003. [34] Профиль HE-AAC v2 (AAC LC с SBR и параметрическим стерео) был впервые указан в ISO/IEC 14496-3:2005/Amd 2:2006. [35] [36] [37] Тип аудиообъекта Parametric Stereo, используемый в HE-AAC v2, был впервые определен в ISO/IEC 14496-3:2001/Amd 2:2004. [38] [39] [40]

Текущая версия стандарта AAC определена в ISO/IEC 14496-3:2009. [41]

AAC+ v2 также стандартизирован ETSI ( Европейским институтом телекоммуникационных стандартов ) как TS 102005. [38]

Стандарт MPEG-4 Part 3 также содержит другие способы сжатия звука. К ним относятся форматы сжатия без потерь, синтетическое аудио и форматы сжатия с низким битрейтом, обычно используемые для речи.

Улучшения AAC по сравнению с MP3

Advanced Audio Coding призван стать преемником формата MPEG-1 Audio Layer 3 , известного как формат MP3, который был определен ISO / IEC в стандартах 11172-3 ( MPEG-1 Audio) и 13818-3 ( MPEG-2 Audio).

Улучшения включают в себя:

В целом, формат AAC предоставляет разработчикам большую гибкость в проектировании кодеков, чем MP3, и исправляет многие из решений по проектированию, принятых в оригинальной спецификации аудио MPEG-1. Эта повышенная гибкость часто приводит к большему количеству параллельных стратегий кодирования и, как следствие, к более эффективному сжатию. Это особенно верно при очень низких скоростях передачи данных, когда превосходное стереокодирование, чистый MDCT и лучшие размеры окна преобразования не позволяют MP3 конкурировать.

В то время как формат MP3 имеет почти универсальную аппаратную и программную поддержку, в первую очередь потому, что MP3 был форматом выбора в течение первых нескольких решающих лет широкого распространения музыкальных файлов /распространения через Интернет, AAC является сильным претендентом из-за некоторой непоколебимой поддержки отрасли. [42]

Функциональность

AAC — это алгоритм кодирования широкополосного звука , который использует две основные стратегии кодирования для значительного сокращения объема данных, необходимых для представления высококачественного цифрового звука:

Фактический процесс кодирования состоит из следующих этапов:

Стандарт аудио MPEG-4 определяет не один или небольшой набор высокоэффективных схем сжатия, а скорее сложный набор инструментов для выполнения широкого спектра операций: от кодирования речи с низкой скоростью передачи данных до высококачественного кодирования звука и синтеза музыки.

Кодеры AAC могут динамически переключаться между одним блоком MDCT длиной 1024 точки или 8 блоками по 128 точек (или между 960 точками и 120 точками соответственно).

Модульное кодирование

AAC использует модульный подход к кодированию. В зависимости от сложности кодируемого битового потока, желаемой производительности и приемлемого вывода разработчики могут создавать профили, чтобы определить, какой из конкретных наборов инструментов они хотят использовать для конкретного приложения.

Стандарт MPEG-2 Часть 7 (Расширенное аудиокодирование) был впервые опубликован в 1997 году и предлагает три профиля по умолчанию: [2] [44]

Стандарт MPEG-4 Часть 3 (MPEG-4 Аудио) определил различные новые инструменты сжатия (также известные как Типы аудиообъектов ) и их использование в совершенно новых профилях. AAC не используется в некоторых профилях MPEG-4 Аудио. Профиль MPEG-2 Часть 7 AAC LC, профиль AAC Main и профиль AAC SSR объединены с Perceptual Noise Substitution и определены в стандарте MPEG-4 Аудио как Типы аудиообъектов (под названием AAC LC, AAC Main и AAC SSR). Они объединены с другими Типами объектов в профилях MPEG-4 Аудио. [27] Вот список некоторых аудиопрофилей, определенных в стандарте MPEG-4: [35] [45]

Одним из многих усовершенствований в MPEG-4 Audio является тип объекта, называемый долгосрочным прогнозированием (LTP), который является улучшением основного профиля с использованием прямого предиктора с меньшей вычислительной сложностью. [29]

Набор инструментов для защиты от ошибок AAC

Применение защиты от ошибок позволяет исправлять ошибки до определенной степени. Коды исправления ошибок обычно применяются одинаково ко всей полезной нагрузке. Однако, поскольку разные части полезной нагрузки AAC демонстрируют разную чувствительность к ошибкам передачи, это не будет очень эффективным подходом.

Полезную нагрузку AAC можно разделить на части с различной чувствительностью к ошибкам.

Устойчивый к ошибкам (ER) AAC

Методы устойчивости к ошибкам (ER) можно использовать для повышения устойчивости самой схемы кодирования к ошибкам.

Для AAC были разработаны и определены три индивидуальных метода в MPEG-4 Audio.

Низкая задержка AAC

Стандарты кодирования звука MPEG-4 Low Delay ( AAC-LD ), Enhanced Low Delay (AAC-ELD) и Enhanced Low Delay v2 (AAC-ELDv2), определенные в ISO/IEC 14496-3:2009 и ISO/IEC 14496-3:2009/Amd 3, разработаны для объединения преимуществ перцептивного кодирования звука с низкой задержкой, необходимой для двусторонней связи. Они тесно связаны с форматом MPEG-2 Advanced Audio Coding (AAC). [47] [48] [49] AAC-ELD рекомендуется GSMA как сверхширокополосный голосовой кодек в профиле IMS для службы видеоконференций высокой четкости (HDVC). [50]

Лицензирование и патенты

Для потоковой передачи или распространения аудио в формате AAC пользователю не требуются никакие лицензии или платежи. [51] Одна только эта причина могла бы сделать AAC более привлекательным форматом для распространения аудио, чем его предшественник MP3, особенно для потоковой передачи аудио (например, интернет-радио) в зависимости от варианта использования.

Однако патентная лицензия требуется для всех производителей или разработчиков кодеков AAC "конечного пользователя" . [52] Условия (как раскрыто SEC) используют цену за единицу. В случае программного обеспечения каждый компьютер, на котором запущено программное обеспечение, должен считаться отдельной "единицей". [53]

Раньше было обычным делом для бесплатных и открытых реализаций программного обеспечения, таких как FFmpeg и FAAC , распространять только в виде исходного кода , чтобы «иначе не поставлять» кодек AAC. Однако с тех пор FFmpeg стал более снисходительным в вопросах патентов: сборки «gyan.dev», рекомендуемые официальным сайтом, теперь содержат его кодек AAC, а на юридической странице FFmpeg указано, что соблюдение патентного законодательства является ответственностью пользователя. [54] (См. ниже в разделах Продукты, поддерживающие AAC, Программное обеспечение.) Проект Fedora , сообщество, поддерживаемое Red Hat , импортировало «Стороннюю модифицированную версию библиотеки кодеков Fraunhofer FDK AAC для Android» в свои репозитории 25 сентября 2018 года [55] и включило собственный кодер и декодер AAC FFmpeg для своего пакета ffmpeg-free 31 января 2023 года [56]

Владельцами патентов AAC являются Bell Labs , Dolby , ETRI , Fraunhofer , JVC Kenwood , LG Electronics , Microsoft , NEC , NTT (и ее дочерняя компания NTT Docomo ), Panasonic , Philips и Sony Corporation . [16] [1] Согласно списку патентов из условий SEC, последний базовый патент AAC истекает в 2028 году, а последний патент на все упомянутые расширения AAC истекает в 2031 году. [57]

Расширения и улучшения

В первый стандарт AAC (определенный в MPEG-2 Часть 7 в 1997 году) были добавлены некоторые расширения:

Форматы контейнеров

В дополнение к MP4 , 3GP и другим форматам контейнеров, основанным на базовом формате медиафайлов ISO для хранения файлов, аудиоданные AAC были впервые упакованы в файл для стандарта MPEG-2 с использованием формата обмена аудиоданными (ADIF), [62] состоящий из одного заголовка, за которым следуют необработанные блоки аудиоданных AAC. [63] Однако, если данные должны передаваться в транспортном потоке MPEG-2, используется самосинхронизирующийся формат, называемый транспортным потоком аудиоданных ( ADTS ), состоящий из серии кадров, каждый кадр имеет заголовок, за которым следуют аудиоданные AAC. [62] Этот файл и потоковый формат определены в MPEG-2 Часть 7 , но считаются информативными только MPEG-4, поэтому декодер MPEG-4 не должен поддерживать ни один из форматов. [62] Эти контейнеры, а также необработанный поток AAC могут иметь расширение файла .aac. MPEG-4 Часть 3 также определяет свой собственный самосинхронизирующийся формат, называемый Low Overhead Audio Stream (LOAS), который инкапсулирует не только AAC, но и любую схему сжатия звука MPEG-4, такую ​​как TwinVQ и ALS . Этот формат был определен для использования в транспортных потоках DVB, когда кодеры используют либо SBR , либо параметрические стерео расширения AAC. Однако он ограничен только одним немультиплексированным потоком AAC. Этот формат также называется Low Overhead Audio Transport Multiplex (LATM), который является просто чередующейся многопоточной версией LOAS. [62]

Продукты, поддерживающие AAC

Стандарты HDTV

Японский ISDB-T

В декабре 2003 года Япония начала вещание наземного стандарта DTV ISDB-T , который реализует видео MPEG-2 и аудио MPEG-2 AAC. В апреле 2006 года Япония начала вещание мобильной подпрограммы ISDB-T, называемой 1seg, которая стала первой реализацией видео H.264/AVC со звуком HE-AAC в наземной службе вещания HDTV на планете.

Международный ISDB-Tb

В декабре 2007 года Бразилия начала вещание наземного цифрового телевидения по стандарту International ISDB-Tb , который реализует кодирование видео H.264/AVC со звуком AAC-LC в основной программе (одиночной или многоканальной) и видео H.264/AVC со звуком HE-AACv2 в мобильной подпрограмме 1seg.

ДВБ

ETSI , орган, регулирующий стандарты для пакета DVB , поддерживает кодирование звука AAC, HE-AAC и HE-AAC v2 в приложениях DVB по крайней мере с 2004 года. [64] DVB-вещание, использующее сжатие H.264 для видео, обычно использует HE-AAC для звука. [ требуется ссылка ]

Аппаратное обеспечение

iTunes и iPod

В апреле 2003 года Apple привлекла внимание публики к AAC, объявив, что ее продукты iTunes и iPod будут поддерживать песни в формате MPEG-4 AAC (через обновление прошивки для старых iPod). Клиенты могли загружать музыку в форме 128 кбит/с AAC с закрытым исходным кодом, ограниченной цифровыми правами управления (DRM) (см. FairPlay ) через iTunes Store или создавать файлы без DRM со своих собственных компакт-дисков с помощью iTunes. В последующие годы Apple начала предлагать музыкальные видеоклипы и фильмы, которые также использовали AAC для кодирования звука.

29 мая 2007 года Apple начала продавать песни и музыкальные видеоклипы от участвующих звукозаписывающих лейблов с более высоким битрейтом (256 кбит/с cVBR) и без DRM, формат, названный «iTunes Plus». Эти файлы в основном соответствуют стандарту AAC и воспроизводятся на многих продуктах сторонних производителей, но они включают в себя пользовательскую информацию iTunes, такую ​​как обложка альбома и чек о покупке, чтобы идентифицировать покупателя в случае утечки файла в одноранговые сети. Однако возможно удалить эти пользовательские теги, чтобы восстановить совместимость с проигрывателями, которые строго соответствуют спецификации AAC. По состоянию на 6 января 2009 года почти вся музыка в iTunes Store в США стала свободной от DRM, а оставшаяся часть станет свободной от DRM к концу марта 2009 года. [65]

iTunes предлагает опцию кодирования «Переменный битрейт», которая кодирует дорожки AAC по схеме ограниченного переменного битрейта (менее строгий вариант кодирования ABR); однако базовый API QuickTime предлагает настоящий профиль кодирования VBR. [66]

По состоянию на сентябрь 2009 года Apple добавила поддержку HE-AAC (который полностью является частью стандарта MP4) только для радиопотоков, но не для воспроизведения файлов, а iTunes по-прежнему не поддерживает настоящее кодирование VBR.

Другие портативные плееры

Мобильные телефоны

В течение ряда лет многие мобильные телефоны таких производителей, как Nokia , Motorola , Samsung , Sony Ericsson , BenQ-Siemens и Philips, поддерживали воспроизведение AAC. Первым таким телефоном был Nokia 5510, выпущенный в 2002 году, который также воспроизводил MP3. Однако этот телефон оказался коммерческим провалом [ необходима цитата ] , и такие телефоны со встроенными музыкальными плеерами не получали широкой популярности до 2005 года, когда тенденция поддержки AAC и MP3 продолжилась. Большинство новых смартфонов и телефонов с музыкальной тематикой поддерживают воспроизведение этих форматов.

Другие устройства

Программное обеспечение

Почти все современные компьютерные медиаплееры включают встроенные декодеры для AAC или могут использовать библиотеку для его декодирования. В Microsoft Windows DirectShow может использоваться таким образом с соответствующими фильтрами для включения воспроизведения AAC в любом проигрывателе на базе DirectShow . Mac OS X поддерживает AAC через библиотеки QuickTime .

Adobe Flash Player , начиная с версии 9, обновления 3, также может воспроизводить потоки AAC. [72] [73] Поскольку Flash Player также является плагином для браузера, он также может воспроизводить файлы AAC через браузер.

Прошивка Rockbox с открытым исходным кодом ( доступная для многих портативных плееров) также предлагает поддержку AAC в разной степени, в зависимости от модели плеера и профиля AAC.

Дополнительная поддержка iPod (воспроизведение незащищенных файлов AAC) для Xbox 360 доступна для бесплатной загрузки из Xbox Live . [74]

Ниже приведен неполный список других приложений-плееров:

Некоторые из этих проигрывателей (например, foobar2000, Winamp и VLC) также поддерживают декодирование ADTS (Audio Data Transport Stream) с использованием протокола SHOUTcast . Плагины для Winamp и foobar2000 позволяют создавать такие потоки.

Nero Цифровое Аудио

В мае 2006 года Nero AG выпустила бесплатный инструмент кодирования AAC, Nero Digital Audio (часть кодека AAC стала Nero AAC Codec ), [75] который способен кодировать потоки LC-AAC, HE-AAC и HE-AAC v2. Инструмент представляет собой инструмент только с интерфейсом командной строки. Также включена отдельная утилита для декодирования в PCM WAV .

Различные инструменты, включая аудиоплеер foobar2000 и MediaCoder, могут предоставить графический интерфейс для этого кодировщика.

FAAC и FAAD2

FAAC и FAAD2 обозначают Freeware Advanced Audio Coder и Decoder 2 соответственно. FAAC поддерживает типы аудиообъектов LC, Main и LTP. [76] FAAD2 поддерживает типы аудиообъектов LC, Main, LTP, SBR и PS. [77] Хотя FAAD2 является свободным программным обеспечением , FAAC не является свободным программным обеспечением.

Фраунгофер FDK AAC

Кодировщик/декодер с открытым исходным кодом, созданный Fraunhofer, включенный в Android , был перенесен на другие платформы. Собственный кодировщик AAC FFmpeg не поддерживает HE-AAC и HE-AACv2, но GPL 2.0+ ffmpeg несовместим с FDK AAC, поэтому ffmpeg с libfdk-aac не подлежит распространению. Кодировщик QAAC, использующий Core Media Audio от Apple, по-прежнему имеет более высокое качество, чем FDK.

FFmpeg и Libav

Собственный кодировщик AAC, созданный в libavcodec FFmpeg и ответвленный Libav , считался экспериментальным и плохим. Значительная часть работы была проделана для выпуска 3.0 FFmpeg (февраль 2016 г.), чтобы сделать его версию пригодной к использованию и конкурентоспособной с остальными кодировщиками AAC. [78] Libav не объединил эту работу и продолжает использовать старую версию кодировщика AAC. Эти кодировщики имеют открытую лицензию LGPL и могут быть построены для любой платформы, на которой могут быть построены фреймворки FFmpeg или Libav.

И FFmpeg, и Libav могут использовать библиотеку Fraunhofer FDK AAC через libfdk-aac, и хотя собственный кодировщик FFmpeg стал стабильным и достаточно хорошим для общего использования, FDK по-прежнему считается кодировщиком самого высокого качества, доступным для использования с FFmpeg. [79] Libav также рекомендует использовать FDK AAC, если он доступен. [80] FFmpeg 4.4 и выше также могут использовать кодировщик Apple audiotoolbox. [79]

Хотя собственный кодер AAC создает только AAC-LC, собственный декодер ffmpeg способен работать с широким спектром входных форматов.

Смотрите также

Примечания

  1. ^ используется только в веб-плеере, Google Home , Amazon Alexa и приложении Microsoft Windows .

Ссылки

  1. ^ abc "Via Licensing объявляет об обновлении совместной патентной лицензии AAC". Business Wire . 5 января 2009 г. Получено 18 июня 2019 г.
  2. ^ ab ISO (1997). "ISO/IEC 13818-7:1997, Информационные технологии — Общее кодирование движущихся изображений и связанной с ними аудиоинформации — Часть 7: Расширенное аудиокодирование (AAC)". Архивировано из оригинала 2012-09-25 . Получено 2010-07-18 .
  3. ^ Advanced Audio Coding (MPEG-4) (полный черновик). Устойчивость цифровых форматов. Вашингтон, округ Колумбия: Библиотека Конгресса. 22 июня 2010 г. Получено 1 декабря 2021 г.
  4. ^ abc Brandenburg, Karlheinz (1999). "MP3 и AAC Explained" (PDF) . Архивировано из оригинала (PDF) 2017-02-13.
  5. ^ ISO (2006) ISO/IEC 13818-7:2006 – Информационные технологии. Общее кодирование движущихся изображений и связанной с ними аудиоинформации. Часть 7. Расширенное аудиокодирование (AAC). Архивировано 03.03.2016 на Wayback Machine , получено 06.08.2009
  6. ^ ISO (2006) ISO/IEC 14496-3:2005 – Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио. Архивировано 13 апреля 2016 г. на Wayback Machine . Получено 06 августа 2009 г.
  7. ^ "Семейство кодирования звука AAC для вещательного и кабельного телевидения" (PDF) . 2013. стр. 6. Архивировано из оригинала (PDF) 2023-09-28 . Получено 2024-01-29 .
  8. ^ "Форматы аудиофайлов для Spotify". Spotify . Получено 20 сентября 2021 г. .
  9. ^ Ахмед, Насир (январь 1991 г.). «Как я придумал дискретное косинусное преобразование». Цифровая обработка сигналов . 1 (1): 4–5. Bibcode : 1991DSP.....1....4A. doi : 10.1016/1051-2004(91)90086-Z.
  10. ^ Ахмед, Насир ; Натараджан, Т.; Рао, КР (январь 1974 г.), «Дискретное косинусное преобразование», IEEE Transactions on Computers , C-23 (1): 90–93, doi :10.1109/TC.1974.223784, S2CID  149806273
  11. ^ Рао, К. Р.; Йип, П. (1990), Дискретное косинусное преобразование: алгоритмы, преимущества, приложения , Бостон: Academic Press, ISBN 978-0-12-580203-1
  12. ^ JP Princen, AW Johnson и AB Bradley: Кодирование подполос/преобразований с использованием конструкций банка фильтров на основе устранения наложения спектров во временной области , IEEE Proc. Международная конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987
  13. ^ Джон П. Принсен, Алан Б. Брэдли: Анализ/синтез банка фильтров на основе устранения наложения спектров во временной области , IEEE Trans. Acoust. Speech Signal Processing, ASSP-34 (5), 1153–1161, 1986
  14. ^ Гукерт, Джон (весна 2012 г.). «Использование FFT и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Получено 14 июля 2019 г. .
  15. ^ Борланд, Джон (18 марта 2004 г.). «Звук науки». CNET . Получено 21 апреля 2023 г.
  16. ^ ab "AAC Licensors". Через Corp. Получено 15 января 2020 г.
  17. ^ ISO/IEC 14496-3:2009 - Информационные технологии - Кодирование аудиовизуальных объектов - Часть 3: Аудио (PDF) (Технический отчет). ISO / IEC . 1 сентября 2009 г. Архивировано (PDF) из оригинала 14 июня 2011 г. Получено 2009-10-07 .
  18. ^ ab "AAC". MPEG.ORG . Архивировано из оригинала 3 октября 2009 . Получено 28 октября 2009 .
  19. ^ "ISO/IEC 13818-7, Четвертое издание, Часть 7 - Расширенное аудиокодирование (AAC)" (PDF) . ISO . 15 января 2006 г. Архивировано (PDF) из оригинала 6 марта 2009 г. Получено 28 октября 2009 г.
  20. ^ Бувин, Габриэль (2003). "MPEG-2/MPEG-4 - AAC". MP3'Tech. Архивировано из оригинала 2010-01-05 . Получено 2009-10-28 .
  21. ^ "MPEG Audio FAQ Version 9 - MPEG-1 and MPEG-2 BC". ISO . Октябрь 1998. Архивировано из оригинала 2010-02-18 . Получено 2009-10-28 .
  22. ^ "Florence Press Release". ISO . Март 1996. Архивировано из оригинала 2010-04-08 . Получено 2009-10-28 .
  23. ^ Джонстон, Дж. Д. и Феррейра, А. Дж., «Кодирование стереопреобразования суммы и разности», ICASSP '92, март 1992 г., стр. II-569-572.
  24. ^ Синха, Д. и Джонстон, Дж. Д., «Сжатие звука при низких скоростях передачи данных с использованием адаптивного к сигналу переключаемого банка фильтров», IEEE ASSP, 1996, стр. 1053-1057.
  25. ^ Джонстон, Дж. Д., Синха, Д., Дорвард, С. и Квакенбуш, С., «AT&T perceptual audio coder (PAC)» в сборнике статей по снижению скорости цифрового аудио, Гилкрист, Н. и Гревин, К. (ред.), Audio Engineering Society, 1996.
  26. ^ Херре, Дж. и Джонстон, Дж. Д., «Улучшение производительности перцептивных аудиокодеров с помощью временного формирования шума», AES 101st Convention, № препринт 4384, 1996 г.
  27. ^ abc Brandenburg, Karlheinz; Kunz, Oliver; Sugiyama, Akihiko. "MPEG-4 Natural Audio Coding - Audio profiles and levels". chiariglione.org . Архивировано из оригинала 2010-07-17 . Получено 2009-10-06 .
  28. ^ "ISO/IEC FCD 14496-3 Подраздел 1 - Проект - N2203" (PDF) . ISO / IEC JTC 1/SC 29/WG 11. 15 мая 1998 г. Получено 2009-10-07 .
  29. ^ abc Brandenburg, Karlheinz; Kunz, Oliver; Sugiyama, Akihiko (1999). "MPEG-4 Natural Audio Coding - General Audio Coding (на основе AAC)". chiariglione.org . Архивировано из оригинала 2010-02-19 . Получено 2009-10-06 .
  30. ^ "ISO/IEC 14496-3:1999/Amd 1:2000 - Аудиорасширения". ISO . 2000. Архивировано из оригинала 2011-06-06 . Получено 2009-10-07 .
  31. ^ "ISO/IEC 14496-3:/Amd.1 - Final Committee Draft - MPEG-4 Audio Version 2" (PDF) . ISO / IEC JTC 1/SC 29/WG 11. Июль 1999 г. Архивировано из оригинала (PDF) 2012-08-01 . Получено 2009-10-07 .
  32. ^ Purnhagen, Heiko (19 февраля 2000 г.). "MPEG-4 Version 2 Audio Workshop: HILN - Parametric Audio Coding" (PDF) . Париж. AES 108th Convention: MPEG-4 Version 2 Audio О чем это? . Получено 2009-10-07 .
  33. ^ Перейра, Фернандо (октябрь 2001 г.). «Уровни для аудиопрофилей». Форум MPEG Industry. Архивировано из оригинала 2010-01-08 . Получено 2009-10-15 .
  34. ^ "ISO/IEC 14496-3:2001/Amd 1:2003 - Расширение полосы пропускания". ISO . 2003. Архивировано из оригинала 2011-06-06 . Получено 2009-10-07 .
  35. ^ ab "Текст ISO/IEC 14496-3:2001/FPDAM 4, Кодирование аудио без потерь (ALS), новые аудиопрофили и расширения BSAC". ISO / IEC JTC1/SC29/WG11/N7016. 11 января 2005 г. Архивировано из оригинала (DOC) 12 мая 2014 г. Получено 2009-10-09 .
  36. ^ "Audio Lossless Coding (ALS), новые аудиопрофили и расширения BSAC, ISO/IEC 14496-3:2005/Amd 2:2006". ISO . 2006. Архивировано из оригинала 2012-01-04 . Получено 2009-10-13 .
  37. ^ Mody, Mihir (6 июня 2005 г.). «Сжатие звука становится лучше и сложнее». Embedded.com . Архивировано из оригинала 8 февраля 2016 г. . Получено 13 октября 2009 г.
  38. ^ ab "MPEG-4 aacPlus - Аудиокодирование для современного мира цифровых медиа" (PDF) . Архивировано из оригинала (PDF) 2006-10-26 . Получено 2007-01-29 .
  39. ^ "Параметрическое кодирование для высококачественного звука, ISO/IEC 14496-3:2001/Amd 2:2004". ISO . 2004. Архивировано из оригинала 2012-01-04 . Получено 2009-10-13 .
  40. ^ "3GPP TS 26.401 V6.0.0 (2004-09), Функции обработки звука общего аудиокодека; Улучшенный общий аудиокодек aacPlus; Общее описание (выпуск 6)" (DOC) . 3GPP. 30 сентября 2004 г. Архивировано из оригинала 19 августа 2006 г. . Получено 13 октября 2009 г.
  41. ^ "ISO/IEC 14496-3:2009 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3: Аудио". ISO . 2009. Архивировано из оригинала 2011-06-06 . Получено 2009-10-07 .
  42. ^ "AAC". Hydrogenaudio. Архивировано из оригинала 2014-07-06 . Получено 2011-01-24 .
  43. ^ Заявка на патент США 20070297624 Цифровое аудиокодирование
  44. ^ "ISO/IEC 13818-7, Третье издание, Часть 7 - Расширенное аудиокодирование (AAC)" (PDF) . ISO . 15 октября 2004 г. стр. 32. Архивировано из оригинала (PDF) 13 июля 2011 г. Получено 2009-10-19 .
  45. ^ Grill, Bernhard; Geyersberger, Stefan; Hilpert, Johannes; Teichmann, Bodo (июль 2004 г.). Реализация аудиокомпонентов MPEG-4 на различных платформах (PDF) . 109-я конференция AES 2000 г., 22–25 сентября, Лос-Анджелес. Fraunhofer Gesellschaft. Архивировано из оригинала (PDF) 10 июня 2007 г. . Получено 09 октября 2009 г.
  46. ^ "ISO/IEC 14496-3:2009/Amd 3:2012 - Транспорт унифицированного кодирования речи и звука (USAC)". ISO . Архивировано из оригинала 2016-03-08 . Получено 2016-08-03 .
  47. ^ "ISO/IEC 14496-3:2009 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3: Аудио". ISO . Архивировано из оригинала 2016-05-20 . Получено 02.08.2016 .
  48. ^ "ISO/IEC 14496-3:2009/Amd 3:2012 - Транспорт унифицированного кодирования речи и звука (USAC)". ISO . Архивировано из оригинала 2016-08-19 . Получено 2016-08-02 .
  49. ^ "Семейство AAC-ELD для высококачественных услуг связи | MPEG". mpeg.chiariglione.org . Архивировано из оригинала 20-08-2016 . Получено 02-08-2016 .
  50. ^ Профиль IMS для службы видеоконференций высокой четкости (HDVC) (PDF) . GSMA. 24 мая 2016 г. стр. 10. Архивировано (PDF) из оригинала 18 августа 2016 г.
  51. ^ "Часто задаваемые вопросы по лицензированию AAC Q5". Через Лицензирование . Получено 2020-01-15 .
  52. ^ "Лицензионные сборы AAC". Через Licensing . Получено 2020-01-15 .
  53. ^ Через Licensing Corporation (5 июня 2018 г.). «AAC PATENT LICENSE AGREEMENT». www.sec.gov . Получено 21 апреля 2023 г. .
  54. ^ «Лицензия FFmpeg и правовые аспекты». ffmpeg.org .
  55. ^ "Коммит - rpms/fdk-aac-free - b27d53fbad872ea0ec103653fddaec83238132d9 - src.fedoraproject.org". src.fedoraproject.org .
  56. ^ "Коммит - rpms/ffmpeg - 45f894ec0e43a37775393c159021a4ac60170a55 - src.fedoraproject.org". src.fedoraproject.org .
  57. ^ "Список патентов, связанных с AAC". hydrogenaud.io .
  58. ^ Том, Д.; Пурнхаген, Х. (октябрь 1998 г.). "Часто задаваемые вопросы по MPEG Audio версии 9 - MPEG-4". chiariglione.org . Подгруппа MPEG Audio. Архивировано из оригинала 2010-02-14 . Получено 2009-10-06 .
  59. ^ "Программа товарных знаков xHE-AAC". Fraunhofer Institute for Integrated Circuits IIS . Получено 2021-02-11 .
  60. ^ "Программное обеспечение аудиокодека Fraunhofer xHE-AAC расширяет встроенную поддержку AAC в Android P для лучшего качества при низких битрейтах". Fraunhofer Institute for Integrated Circuits IIS . Получено 11 июля 2020 г.
  61. ^ "ISO/IEC 14496-3:2019". ISO . Получено 2022-02-19 .
  62. ^ abcd Wolters, Martin; Kjorling, Kristofer; Homm, Daniel; Purnhagen, Heiko. Более пристальный взгляд на MPEG-4 High Efficiency AAC (PDF) . стр. 3. Архивировано из оригинала (PDF) 2003-12-19 . Получено 2008-07-31 .Представлено на 115-м съезде Общества звукорежиссеров, 10–13 октября 2003 г.
  63. ^ "Advanced Audio Coding (MPEG-2), Audio Data Interchange Format". Библиотека Конгресса / Национальная программа цифровой информационной инфраструктуры и сохранения. 7 марта 2007 г. Архивировано из оригинала 30 июля 2008 г. Получено 2008-07-31 .
  64. ^ ETSI TS 101 154 v1.5.1: Спецификация использования видео- и аудиокодирования в вещательных приложениях на основе транспортного потока MPEG
  65. ^ Коэн, Питер (27.05.2010). «iTunes Store становится свободным от DRM». Macworld . Mac Publishing. Архивировано из оригинала 18 февраля 2009 г. Получено 10.02.2009 .
  66. ^ "Apple AAC". Hydrogenaudio . Архивировано из оригинала 2021-11-23 . Получено 2021-11-22 .
  67. ^ "Gingerbread - Android Developers". Android Developers . Архивировано из оригинала 29 декабря 2017 года . Получено 8 мая 2018 года .
  68. ^ "Поддерживаемые форматы мультимедиа - Разработчики Android". Разработчики Android . Архивировано из оригинала 11 марта 2012 года . Получено 8 мая 2018 года .
  69. ^ "Palm Pre Phone / Характеристики, Подробности". Palm USA . Архивировано из оригинала 2011-05-24.
  70. ^ "Nintendo - Customer Service - Wii - Photo Channel". nintendo.com . Архивировано из оригинала 5 мая 2017 года . Получено 8 мая 2018 года .
  71. ^ "Поддерживаемые носители для Google Cast". Архивировано из оригинала 2015-09-23 . Получено 2015-09-22 .| Поддерживаемые носители для Google Cast
  72. ^ "Статистика - Adobe Flash runtimes". www.adobe.com . Архивировано из оригинала 2 октября 2011 г. Получено 8 мая 2018 г.
  73. ^ "Adobe представляет Flash Player 9 с поддержкой видео H.264". Пресс-релиз Adobe . 2007-12-04. Архивировано из оригинала 2014-08-21 . Получено 2014-08-20 .
  74. ^ "Xbox.com | Использование системы - Использование Apple iPod с Xbox 360". Архивировано из оригинала 8 апреля 2007 г.
  75. ^ "Nero Platinum 2018 Suite - отмеченный наградами универсальный продукт". Nero AG . Архивировано из оригинала 14 декабря 2012 года . Получено 8 мая 2018 года .
  76. ^ "FAAC". AudioCoding.com . Архивировано из оригинала 2009-12-11 . Получено 2009-11-03 .
  77. ^ "FAAD2". AudioCoding.com . Архивировано из оригинала 2009-12-11 . Получено 2009-11-03 .
  78. ^ "5 декабря 2015 г. Собственный кодер FFmpeg AAC теперь стабилен!". ffmpeg.org . Архивировано из оригинала 16 июля 2016 г. Получено 26 июня 2016 г.
  79. ^ ab "FFmpeg AAC Encoding Guide". Архивировано из оригинала 17 апреля 2016 г. Получено 11 апреля 2016 г. Какой кодировщик обеспечивает наилучшее качество? ... вероятный ответ: libfdk_aac
  80. ^ "Libav Wiki - Кодирование AAC". Архивировано из оригинала 2016-04-20 . Получено 11 апреля 2016 .

Внешние ссылки