stringtranslate.com

Расширенное аудиокодирование

Advanced Audio Coding ( AAC ) — это стандарт кодирования звука для сжатия цифрового звука с потерями . Он был разработан как преемник формата MP3 и обычно обеспечивает более высокое качество звука, чем MP3, при той же скорости передачи данных . [4]

AAC стандартизирован ISO и IEC как часть спецификаций MPEG-2 и MPEG-4 . [5] [6] Часть AAC, HE-AAC («AAC+»), является частью MPEG-4 Audio и принята в стандартах цифрового радио DAB+ и Digital Radio Mondiale , а также в стандартах мобильного телевидения DVB-H и ATSC-M. /Х .

AAC поддерживает включение 48 полнополосных ( до 96 кГц) аудиоканалов в один поток плюс 16 каналов низкочастотных эффектов ( LFE , с ограничением до 120 Гц), до 16 «связывающих» или диалоговых каналов и до 16 потоков данных. . Качество стерео удовлетворяет скромным требованиям при скорости 96 кбит/с в совместном стереорежиме ; однако прозрачность Hi-Fi требует скорости передачи данных не менее 128 кбит/с ( VBR ). Тесты [ какие? ] аудио MPEG-4 показали, что AAC соответствует требованиям, называемым ITU «прозрачным» при скорости 128 кбит/с для стерео и 384 кбит/с для звука 5.1 . [7] AAC использует только модифицированный алгоритм дискретного косинусного преобразования (MDCT), что обеспечивает более высокую эффективность сжатия, чем MP3, который использует гибридный алгоритм кодирования, который является частью MDCT и частью FFT . [4]

AAC — это аудиоформат по умолчанию или стандартный для iPhone , iPod , iPad , Nintendo DSi , Nintendo 3DS , Apple Music , iTunes , веб-плеера DivX Plus , PlayStation 4 и различных телефонов Nokia Series 40 . Он поддерживается на широком спектре устройств и программного обеспечения, таких как PlayStation Vita , Wii , цифровых аудиоплеерах, таких как Sony Walkman или SanDisk Clip , устройствах Android и BlackBerry , различных встроенных автомобильных аудиосистемах, [ когда? ] [ расплывчато ] и также является одним из аудиоформатов, используемых в веб-плеере Spotify . [8]

История

Фон

Дискретное косинусное преобразование (DCT), тип кодирования преобразования для сжатия с потерями , было предложено Насиром Ахмедом в 1972 году и разработано Ахмедом совместно с Т. Натараджан и К.Р. Рао в 1973 году, опубликовав свои результаты в 1974 году. [9] [10 ] ] [11] Это привело к разработке модифицированного дискретного косинусного преобразования (MDCT), предложенного Дж. П. Принсеном, А. В. Джонсоном и А. Б. Брэдли в 1987 году, [12] после более ранней работы Принсена и Брэдли в 1986 году. [ 13] MP3 Стандарт кодирования звука , представленный в 1994 году, использовал гибридный алгоритм кодирования, который частично состоит из MDCT и частично из FFT . [14] AAC использует чисто алгоритм MDCT, что обеспечивает более высокую эффективность сжатия, чем MP3. [4] Развитие продвинулось дальше, когда Ларс Лильджерид представил метод, который радикально сократил объем информации, необходимой для хранения оцифрованной формы песни или речи. [15]

AAC был разработан при сотрудничестве и участии таких компаний, как Bell Labs , Fraunhofer IIS , Dolby Laboratories , LG Electronics , NEC , Panasonic , Sony Corporation , [1] ETRI , JVC Kenwood , Philips , Microsoft и NTT . [16] Он был официально объявлен международным стандартом Группой экспертов по кинематографии в апреле 1997 года. Он указан как Часть 7 стандарта MPEG-2 , так и Подчасть 4 в Части 3 стандарта MPEG-4 . [17]

Стандартизация

В 1997 году AAC был впервые представлен как MPEG-2 Part 7 , официально известный как ISO / IEC 13818-7:1997 . Эта часть MPEG-2 была новой частью, поскольку MPEG-2 уже включал MPEG-2 Part 3 , официально известную как ISO/IEC 13818-3: MPEG-2 BC (обратная совместимость). [18] [19] Поэтому MPEG-2 Part 7 также известен как MPEG-2 NBC (без обратной совместимости), поскольку он несовместим с аудиоформатами MPEG-1 ( MP1 , MP2 и MP3 ). [18] [20] [21] [22]

В MPEG-2 Part 7 определены три профиля: профиль низкой сложности (AAC-LC / LC-AAC), основной профиль (AAC Main) и профиль масштабируемой частоты дискретизации (AAC-SSR). Профиль AAC-LC состоит из базового формата, очень похожего на формат кодирования Perceptual Audio Coding (PAC) компании AT&T, [23] [24] [25] с добавлением временного формирования шума (TNS), [26] окна Кайзера ( описанного ниже), неоднородный квантователь и переработка формата битового потока для обработки до 16 стереоканалов, 16 моноканалов, 16 каналов низкочастотных эффектов (LFE) и 16 каналов комментариев в одном битовом потоке. Профиль Main добавляет набор рекурсивных предикторов, которые рассчитываются при каждом нажатии набора фильтров. SSR использует 4-полосный набор фильтров PQMF, за которым следуют четыре более коротких набора фильтров, чтобы обеспечить масштабируемую частоту дискретизации.

В 1999 году MPEG-2 Part 7 был обновлен и включен в семейство стандартов MPEG-4 и стал известен как MPEG-4 Part 3 , MPEG-4 Audio или ISO/IEC 14496-3:1999 . Это обновление включало в себя несколько улучшений. Одним из этих улучшений стало добавление типов аудиообъектов , которые используются для обеспечения совместимости с множеством других аудиоформатов, таких как TwinVQ , CELP , HVXC , интерфейс преобразования текста в речь и структурированное аудио MPEG-4 . Еще одним заметным дополнением в этой версии стандарта AAC является замена перцептивного шума (PNS). В этом отношении профили AAC (AAC-LC, AAC Main и AAC-SSR) сочетаются с замещением воспринимаемого шума и определяются в аудиостандарте MPEG-4 как типы аудиообъектов. [27] Типы аудиообъектов MPEG-4 объединены в четыре профиля аудио MPEG-4: основной (который включает большинство типов аудиообъектов MPEG-4), масштабируемый (AAC LC, AAC LTP, CELP, HVXC, TwinVQ, синтез волновых таблиц). , TTSI), речь (CELP, HVXC, TTSI) и низкоскоростной синтез (Wavetable Synthesis, TTSI). [27] [28]

Эталонное программное обеспечение для MPEG-4 Part 3 указано в MPEG-4 Part 5, а соответствующие битовые потоки указаны в MPEG-4 Part 4. MPEG-4 Audio остается обратно совместимым с MPEG-2 Part 7. [29]

В версии 2 MPEG-4 Audio (ISO/IEC 14496-3:1999/Amd 1:2000) определены новые типы аудиообъектов: тип объекта AAC с малой задержкой ( AAC-LD ), тип объекта побитового арифметического кодирования (BSAC). , параметрическое аудиокодирование с использованием гармонических и отдельных линий, а также устойчивых к шуму и ошибкам (ER) версий типов объектов. [30] [31] [32] Он также определил четыре новых аудиопрофиля: профиль высокого качества звука, профиль звука с низкой задержкой, профиль естественного звука и профиль межсетевого взаимодействия мобильного аудио. [33]

Профиль HE -AAC (AAC LC с SBR ) и профиль AAC (AAC LC) были впервые стандартизированы в ISO/IEC 14496-3:2001/Amd 1:2003. [34] Профиль HE-AAC v2 (AAC LC с SBR и параметрическим стерео) впервые был указан в стандарте ISO/IEC 14496-3:2005/Amd 2:2006. [35] [36] [37] Тип аудиообъекта параметрического стерео, используемый в HE-AAC v2, был впервые определен в ISO/IEC 14496-3:2001/Amd 2:2004. [38] [39] [40]

Текущая версия стандарта AAC определена в ISO/IEC 14496-3:2009. [41]

AAC+ v2 также стандартизирован ETSI ( Европейским институтом телекоммуникационных стандартов ) как TS 102005. [38]

Стандарт MPEG-4 Part 3 также содержит другие способы сжатия звука. К ним относятся форматы сжатия без потерь, синтетический звук и форматы сжатия с низкой скоростью передачи данных, обычно используемые для речи.

Улучшения AAC по сравнению с MP3

Advanced Audio Coding разработан как преемник MPEG-1 Audio Layer 3 , известного как формат MP3, который был указан ISO / IEC в стандартах 11172-3 ( MPEG-1 Audio) и 13818-3 ( MPEG-2 Audio). .

Слепые тесты в конце 1990-х годов показали, что AAC продемонстрировал лучшее качество звука и прозрачность, чем MP3, для файлов, закодированных с той же скоростью передачи данных. [4]

Улучшения включают в себя:

В целом, формат AAC дает разработчикам больше гибкости при разработке кодеков, чем MP3, и исправляет многие конструктивные решения, сделанные в исходной аудиоспецификации MPEG-1. Эта повышенная гибкость часто приводит к использованию более параллельных стратегий кодирования и, как следствие, к более эффективному сжатию. Это особенно актуально при очень низких скоростях передачи данных, где превосходное стереокодирование, чистый MDCT и лучшие размеры окна преобразования не позволяют MP3 конкурировать.

Хотя формат MP3 имеет почти универсальную аппаратную и программную поддержку, в первую очередь потому, что MP3 был выбранным форматом в течение решающих первых нескольких лет широкого распространения / обмена музыкальными файлами через Интернет, AAC является сильным соперником из-за некоторой непоколебимой поддержки со стороны отрасли. . [42]

Функциональность

AAC — это алгоритм кодирования широкополосного звука , который использует две основные стратегии кодирования для значительного уменьшения объема данных, необходимых для представления высококачественного цифрового звука:

Фактический процесс кодирования состоит из следующих шагов:

Аудиостандарт MPEG-4 не определяет один или небольшой набор высокоэффективных схем сжатия, а скорее сложный набор инструментов для выполнения широкого спектра операций от кодирования речи с низкой скоростью передачи данных до высококачественного аудиокодирования и синтеза музыки.

Кодеры AAC могут динамически переключаться между одним блоком MDCT длиной 1024 точки или 8 блоками по 128 точек (или между 960 и 120 точками соответственно).

Модульное кодирование

AAC использует модульный подход к кодированию. В зависимости от сложности кодируемого потока битов, желаемой производительности и приемлемого результата разработчики могут создавать профили, чтобы определить, какой из определенного набора инструментов они хотят использовать для конкретного приложения.

Стандарт MPEG-2 Part 7 (Advanced Audio Coding) был впервые опубликован в 1997 году и предлагает три профиля по умолчанию: [2] [44]

Стандарт MPEG-4 Part 3 (MPEG-4 Audio) определил различные новые инструменты сжатия (также известные как типы аудиообъектов ) и их использование в совершенно новых профилях. AAC не используется в некоторых профилях аудио MPEG-4. Профиль AAC LC MPEG-2 Part 7, основной профиль AAC и профиль AAC SSR объединены с замещением перцептивного шума и определены в стандарте аудио MPEG-4 как типы аудиообъектов (под названиями AAC LC, AAC Main и AAC SSR). Они комбинируются с другими типами объектов в профилях MPEG-4 Audio. [27] Вот список некоторых аудиопрофилей, определенных в стандарте MPEG-4: [35] [45]

Одним из многих улучшений в MPEG-4 Audio является тип объекта, называемый долгосрочным прогнозированием (LTP), который представляет собой усовершенствование основного профиля с использованием прямого предсказателя с меньшей вычислительной сложностью. [29]

Набор инструментов для защиты от ошибок AAC

Применение защиты от ошибок позволяет в определенной степени исправлять ошибки. Коды исправления ошибок обычно применяются одинаково ко всей полезной нагрузке. Однако, поскольку разные части полезной нагрузки AAC демонстрируют разную чувствительность к ошибкам передачи, такой подход будет не очень эффективным.

Полезную нагрузку AAC можно разделить на части с различной чувствительностью к ошибкам.

Устойчивый к ошибкам (ER) AAC

Методы устойчивости к ошибкам (ER) можно использовать, чтобы сделать саму схему кодирования более устойчивой к ошибкам.

Для AAC были разработаны и определены в MPEG-4 Audio три индивидуальных метода.

AAC низкая задержка

Стандарты аудиокодирования MPEG-4 с низкой задержкой ( AAC-LD ), Enhanced Low Delay (AAC-ELD) и Enhanced Low Delay v2 (AAC-ELDv2), как определено в ISO/IEC 14496-3:2009 и ISO/IEC 14496. -3:2009/Amd 3 предназначены для объединения преимуществ перцептивного кодирования звука с малой задержкой, необходимой для двусторонней связи. Они тесно связаны с форматом MPEG-2 Advanced Audio Coding (AAC). [47] [48] [49] AAC-ELD рекомендован GSMA в качестве сверхширокополосного голосового кодека в профиле IMS для службы видеоконференций высокой четкости (HDVC). [50]

Лицензирование и патенты

Пользователю для потоковой передачи или распространения контента в формате AAC не требуется никаких лицензий или платежей. [51] Одна только эта причина могла бы сделать AAC более привлекательным форматом для распространения контента, чем его предшественник MP3, особенно для потоковой передачи контента (например, интернет-радио) в зависимости от варианта использования.

Однако патентная лицензия требуется для всех производителей или разработчиков кодеков AAC для «конечных пользователей» . [52] В условиях (согласно информации SEC) используется цена за единицу товара. В случае программного обеспечения каждый компьютер, на котором установлено программное обеспечение, следует рассматривать как отдельную «единицу». [53]

Раньше для реализации бесплатного программного обеспечения с открытым исходным кодом, такого как FFmpeg и FAAC, было обычным явлением распространяться только в форме исходного кода , чтобы «иным образом не поставлять» кодек AAC. Однако с тех пор FFmpeg стал более снисходительным в вопросах патентов: сборки «gyan.dev», рекомендованные официальным сайтом, теперь содержат кодек AAC, а на юридической странице FFmpeg указано, что соблюдение патентного законодательства является обязанностью пользователя. [54] (См. ниже в разделе «Продукты, поддерживающие AAC, Программное обеспечение».) К счастью, проект Fedora , сообщество, поддерживаемое Red Hat , импортировал «Стороннюю модифицированную версию библиотеки кодеков Fraunhofer FDK AAC для Android» в свою репозитории 25 сентября 2018 г., [55] и включил собственный кодер и декодер AAC FFmpeg для своего пакета без ffmpeg 31 января 2023 г. [56]

В число владельцев патентов AAC входят Bell Labs , Dolby , ETRI , Fraunhofer , JVC Kenwood , LG Electronics , Microsoft , NEC , NTT (и ее дочерняя компания NTT Docomo ), Panasonic , Philips и Sony Corporation . [16] [1] Согласно списку патентов, указанных в условиях SEC, срок действия последнего базового патента AAC истекает в 2028 году, а срок действия последнего патента на все упомянутые расширения AAC истекает в 2031 году. [57]

Расширения и улучшения

К первому стандарту AAC (определенному в MPEG-2 Part 7 в 1997 г.) были добавлены некоторые расширения:

Форматы контейнеров

В дополнение к форматам MP4 , 3GP и другим контейнерным форматам, основанным на базовом формате медиафайлов ISO для хранения файлов, аудиоданные AAC были сначала упакованы в файл для стандарта MPEG-2 с использованием формата обмена аудиоданными (ADIF), [60] состоящего из одного заголовка, за которым следуют необработанные блоки аудиоданных AAC. [61] Однако, если данные должны передаваться в транспортном потоке MPEG-2, используется самосинхронизирующийся формат, называемый транспортным потоком аудиоданных ( ADTS ), состоящий из серии кадров, каждый из которых имеет заголовок. аудиоданными AAC. [60] Этот файловый и потоковый формат определены в MPEG-2 Part 7 , но считаются информативными только в MPEG-4, поэтому декодер MPEG-4 не обязан поддерживать ни один из форматов. [60] Эти контейнеры, а также необработанный поток AAC могут иметь расширение файла .aac. MPEG-4 Part 3 также определяет собственный самосинхронизирующийся формат, называемый аудиопотоком с низкими служебными данными (LOAS), который инкапсулирует не только AAC, но и любую схему сжатия звука MPEG-4, такую ​​как TwinVQ и ALS . Этот формат был определен для использования в транспортных потоках DVB, когда кодеры используют расширения SBR или параметрического стерео AAC. Однако он ограничен только одним немультиплексированным потоком AAC. Этот формат также называется транспортным мультиплексированием аудио с низкими накладными расходами (LATM), который представляет собой просто версию LOAS с несколькими потоками с чередованием. [60]

Продукты, поддерживающие AAC

Стандарты HDTV

Японский ISDB-T

В декабре 2003 года Япония начала наземное вещание стандарта DTV ISDB-T , который реализует видео MPEG-2 и аудио MPEG-2 AAC. В апреле 2006 года Япония начала вещание мобильной подпрограммы ISDB-T под названием 1seg, которая стала первой на планете реализацией видео H.264/AVC со звуком HE-AAC в службе наземного вещания HDTV.

Международный ISDB-Tb

В декабре 2007 года Бразилия начала вещание стандарта наземного цифрового телевидения под названием International ISDB-Tb , который реализует кодирование видео H.264/AVC со звуком AAC-LC в основной программе (одной или нескольких) и видео H.264/AVC со звуком HE-AACv2 в мобильная подпрограмма 1seg.

ДВБ

ETSI , руководящий орган по стандартизации набора DVB , поддерживает кодирование аудио AAC, HE-AAC и HE-AAC v2 в приложениях DVB, по крайней мере, с 2004 года. [62] Вещания DVB, в которых для видео используется сжатие H.264 , обычно используют HE. -AAC для аудио. [ нужна цитата ]

Аппаратное обеспечение

iTunes и iPod

В апреле 2003 года Apple привлекла внимание к AAC, объявив, что ее продукты iTunes и iPod будут поддерживать песни в формате MPEG-4 AAC (через обновление прошивки для старых iPod). Клиенты могли загружать музыку в формате AAC с закрытым исходным кодом и ограничением по управлению цифровыми правами (DRM) со скоростью 128 кбит/с (см. FairPlay ) через iTunes Store или создавать файлы без DRM со своих собственных компакт-дисков с помощью iTunes. В последующие годы Apple начала предлагать музыкальные клипы и фильмы, в которых для кодирования звука также используется AAC.

29 мая 2007 года Apple начала продавать песни и музыкальные клипы от участвующих звукозаписывающих компаний с более высоким битрейтом (cVBR 256 кбит/с) и без DRM, в формате, получившем название «iTunes Plus». Эти файлы в основном соответствуют стандарту AAC и воспроизводятся на многих продуктах сторонних производителей, но они включают в себя специальную информацию iTunes, такую ​​​​как обложка альбома и квитанция о покупке, чтобы идентифицировать клиента в случае утечки файла в одноранговую сеть. -одноранговые сети. Однако можно удалить эти пользовательские теги, чтобы восстановить совместимость с проигрывателями, которые строго соответствуют спецификации AAC. По состоянию на 6 января 2009 года почти вся музыка в iTunes Store, расположенном в США, стала свободной от DRM, а остальная часть стала свободной от DRM к концу марта 2009 года. [63]

iTunes предлагает опцию кодирования «Переменная скорость передачи данных», которая кодирует дорожки AAC по схеме с ограниченным переменным битрейтом (менее строгий вариант кодирования ABR); Однако базовый API QuickTime предлагает настоящий профиль кодирования VBR. [64]

По состоянию на сентябрь 2009 года Apple добавила поддержку HE-AAC (который является полной частью стандарта MP4) только для радиопотоков, а не для воспроизведения файлов, а в iTunes по-прежнему отсутствует поддержка истинного кодирования VBR.

Другие портативные плееры

Мобильные телефоны

В течение ряда лет многие мобильные телефоны таких производителей, как Nokia , Motorola , Samsung , Sony Ericsson , BenQ-Siemens и Philips , поддерживают воспроизведение AAC. Первым таким телефоном стал Nokia 5510, выпущенный в 2002 году, который также воспроизводит MP3. Однако этот телефон потерпел неудачу с коммерческой точки зрения [ нужна ссылка ] , и такие телефоны со встроенными музыкальными проигрывателями не получили массовой популярности до 2005 года, когда тенденция использования AAC, а также поддержки MP3 продолжилась. Большинство новых смартфонов и телефонов с музыкальной тематикой поддерживают воспроизведение этих форматов.

Другие устройства

Программное обеспечение

Почти все современные компьютерные медиаплееры имеют встроенные декодеры AAC или могут использовать библиотеки для его декодирования. В Microsoft Windows DirectShow можно использовать таким образом с соответствующими фильтрами, чтобы включить воспроизведение AAC в любом проигрывателе на основе DirectShow . Mac OS X поддерживает AAC через библиотеки QuickTime .

Adobe Flash Player , начиная с версии 9 и обновления 3, также может воспроизводить потоки AAC. [70] [71] Поскольку Flash Player также является плагином для браузера, он также может воспроизводить файлы AAC через браузер.

Прошивка Rockbox с открытым исходным кодом ( доступна для нескольких портативных плееров) также предлагает поддержку AAC в различной степени, в зависимости от модели плеера и профиля AAC.

Дополнительная поддержка iPod (воспроизведение незащищенных файлов AAC) для Xbox 360 доступна для бесплатной загрузки из Xbox Live . [72]

Ниже приведен неполный список других приложений программного проигрывателя:

Некоторые из этих проигрывателей (например, foobar2000, Winamp и VLC) также поддерживают декодирование ADTS (транспортного потока аудиоданных) с использованием протокола SHOUTcast . Плагины для Winamp и foobar2000 позволяют создавать такие потоки.

Неро Цифровое Аудио

В мае 2006 года Nero AG бесплатно выпустила инструмент кодирования AAC, Nero Digital Audio (часть кодека AAC стала Nero AAC Codec ), [73] который способен кодировать LC-AAC, HE-AAC и HE-AAC v2. потоки. Этот инструмент представляет собой только инструмент с интерфейсом командной строки. Также включена отдельная утилита для декодирования в PCM WAV .

Различные инструменты, включая аудиоплеер foobar2000 и MediaCoder , могут предоставить графический интерфейс для этого кодировщика.

FAAC и FAAD2

FAAC и FAAD2 обозначают Freeware Advanced Audio Coder и Decoder 2 соответственно. FAAC поддерживает типы аудиообъектов LC, Main и LTP. [74] FAAD2 поддерживает типы аудиообъектов LC, Main, LTP, SBR и PS. [75] Хотя FAAD2 является свободным программным обеспечением , FAAC не является свободным программным обеспечением.

Фраунгофера ФДК ААС

Кодировщик /декодер с открытым исходным кодом, созданный Фраунгофером , включенный в Android , был портирован на другие платформы. Собственный кодировщик AAC FFmpeg не поддерживает HE-AAC и HE-AACv2, но GPL 2.0+ ffmpeg не совместим с FDK AAC, поэтому ffmpeg с libfdk-aac не подлежит распространению. Кодер QAAC, использующий Apple Core Media Audio, по-прежнему имеет более высокое качество, чем FDK.

FFmpeg и Либав

Родной кодер AAC, созданный в libavcodec FFmpeg и разветвленный с помощью Libav , считался экспериментальным и плохим. Значительный объем работы был проделан для версии FFmpeg 3.0 (февраль 2016 г.), чтобы сделать ее версию пригодной для использования и конкурентоспособной с остальными кодировщиками AAC. [76] Libav не объединила эту работу и продолжает использовать старую версию кодировщика AAC. Эти кодировщики имеют открытый исходный код по лицензии LGPL и могут быть созданы для любой платформы, на которой могут быть созданы платформы FFmpeg или Libav.

И FFmpeg, и Libav могут использовать библиотеку AAC Fraunhofer FDK через libfdk-aac, и хотя собственный кодировщик FFmpeg стал стабильным и достаточно хорошим для общего использования, FDK по-прежнему считается кодировщиком высочайшего качества, доступным для использования с FFmpeg. [77] Libav также рекомендует использовать FDK AAC, если он доступен. [78] FFmpeg 4.4 и выше также могут использовать кодировщик Apple audiotoolbox. [77]

Хотя собственный кодер AAC создает только AAC-LC, собственный декодер ffmpeg способен обрабатывать широкий спектр входных форматов.

Смотрите также

Примечания

  1. ^ используется только в веб-плеере, Google Home , Amazon Alexa и приложении Microsoft Windows .

Рекомендации

  1. ^ abc «Через лицензирование объявляет об обновлении совместной патентной лицензии AAC» . Деловой провод . 5 января 2009 года . Проверено 18 июня 2019 г.
  2. ^ АБ ИСО (1997). «ИСО/МЭК 13818-7:1997, Информационные технологии. Общее кодирование движущихся изображений и связанной с ними аудиоинформации. Часть 7. Усовершенствованное кодирование звука (AAC)». Архивировано из оригинала 25 сентября 2012 г. Проверено 18 июля 2010 г.
  3. ^ Расширенное кодирование звука (MPEG-4) (Полный проект). Устойчивость цифровых форматов. Вашингтон, округ Колумбия: Библиотека Конгресса. 22 июня 2010 г. Проверено 1 декабря 2021 г.
  4. ^ abcd Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC» (PDF) . Архивировано из оригинала (PDF) 13 февраля 2017 г.
  5. ^ ISO (2006) ISO / IEC 13818-7: 2006 - Информационные технологии. Общее кодирование движущихся изображений и связанной с ними аудиоинформации. Часть 7. Расширенное кодирование звука (AAC). Архивировано 3 марта 2016 г. на Wayback Machine , Проверено в 2009 г. -08-06
  6. ^ ISO (2006) ISO / IEC 14496-3: 2005 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3: Аудио. Архивировано 13 апреля 2016 г. на Wayback Machine , Проверено 6 августа 2009 г.
  7. ^ «Семейство кодирования звука AAC для вещания и кабельного телевидения» (PDF) . 2013. с. 6. Архивировано из оригинала (PDF) 28 сентября 2023 г. Проверено 29 января 2024 г.
  8. ^ «Форматы аудиофайлов для Spotify» . Спотифай . Проверено 20 сентября 2021 г.
  9. ^ Ахмед, Насир (январь 1991 г.). «Как я придумал дискретное косинусное преобразование». Цифровая обработка сигналов . 1 (1): 4–5. дои : 10.1016/1051-2004(91)90086-Z.
  10. ^ Ахмед, Насир ; Натараджан, Т.; Рао, КР (январь 1974 г.), «Дискретное косинусное преобразование», Транзакции IEEE на компьютерах , C-23 (1): 90–93, doi : 10.1109/TC.1974.223784, S2CID  149806273
  11. ^ Рао, КР ; Йип, П. (1990), Дискретное косинусное преобразование: алгоритмы, преимущества, приложения , Бостон: Academic Press, ISBN 978-0-12-580203-1
  12. ^ Дж. П. Принсен, А. В. Джонсон и А. Б. Брэдли: Кодирование поддиапазонов/преобразований с использованием конструкций банка фильтров на основе отмены наложения псевдонимов во временной области , IEEE Proc. Международный Конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987 г.
  13. ^ Джон П. Принсен, Алан Б. Брэдли: Проект банка фильтров анализа/синтеза на основе отмены наложения псевдонимов во временной области , IEEE Trans. Акуст. Обработка речевых сигналов, ASSP-34 (5), 1153–1161, 1986 г.
  14. ^ Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Проверено 14 июля 2019 г.
  15. Борланд, Джон (18 марта 2004 г.). «Звуки науки». CNET . Проверено 21 апреля 2023 г.
  16. ^ ab «Лицензиары AAC». Через Корп . Проверено 15 января 2020 г. .
  17. ^ ISO / IEC 14496-3: 2009 - Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3: Аудио (PDF) (Технический отчет). ИСО / МЭК . 1 сентября 2009 г. Архивировано (PDF) из оригинала 14 июня 2011 г. . Проверено 7 октября 2009 г.
  18. ^ аб "AAC". MPEG.ORG . Архивировано из оригинала 3 октября 2009 года . Проверено 28 октября 2009 г.
  19. ^ «ISO/IEC 13818-7, Четвертое издание, Часть 7 — Расширенное кодирование звука (AAC)» (PDF) . ИСО . 15 января 2006 г. Архивировано (PDF) из оригинала 6 марта 2009 г. . Проверено 28 октября 2009 г.
  20. ^ Бувинь, Габриэль (2003). «MPEG-2/MPEG-4 — AAC». MP3'Техн. Архивировано из оригинала 5 января 2010 г. Проверено 28 октября 2009 г.
  21. ^ «Часто задаваемые вопросы по MPEG Audio, версия 9 — MPEG-1 и MPEG-2 BC» . ИСО . Октябрь 1998 г. Архивировано из оригинала 18 февраля 2010 г. Проверено 28 октября 2009 г.
  22. ^ "Пресс-релиз Флоренции". ИСО . Март 1996 г. Архивировано из оригинала 8 апреля 2010 г. Проверено 28 октября 2009 г.
  23. ^ Джонстон, Дж. Д. и Феррейра, А. Дж., «Кодирование стереопреобразования с разностью сумм», ICASSP '92, март 1992 г., стр. II-569-572.
  24. ^ Синха, Д. и Джонстон, Дж. Д., «Сжатие звука при низких скоростях передачи данных с использованием набора фильтров с адаптивным переключением сигналов», IEEE ASSP, 1996, стр. 1053-1057.
  25. ^ Джонстон, Дж. Д., Синха, Д., Дорвард, С. и Квакенбуш, С., «Кодер восприятия звука AT&T (PAC)» в Сборнике статей по снижению скорости передачи данных в цифровом аудио, Гилкрист, Н. и Гревин, К. ( Ред.), Общество аудиоинженеров, 1996.
  26. ^ Херре Дж. и Джонстон Д.Д., «Повышение производительности перцептивных аудиокодеров за счет использования временного формирования шума», 101-я конвенция AES, вып. препринт 4384, 1996 г.
  27. ^ abc Бранденбург, Карлхайнц; Кунц, Оливер; Сугияма, Акихико. «Кодирование естественного звука MPEG-4 — профили и уровни звука». chiariglione.org . Архивировано из оригинала 17 июля 2010 г. Проверено 6 октября 2009 г.
  28. ^ «ISO/IEC FCD 14496-3, подраздел 1 — Проект — N2203» (PDF) . ISO / IEC JTC 1/SC 29/WG 11. 15 мая 1998 г. Проверено 7 октября 2009 г.
  29. ^ abc Бранденбург, Карлхайнц; Кунц, Оливер; Сугияма, Акихико (1999). «Кодирование естественного звука MPEG-4 — общее кодирование звука (на основе AAC)». chiariglione.org . Архивировано из оригинала 19 февраля 2010 г. Проверено 6 октября 2009 г.
  30. ^ «ISO/IEC 14496-3:1999/Поправка 1:2000 — Расширения аудио» . ИСО . 2000. Архивировано из оригинала 6 июня 2011 г. Проверено 7 октября 2009 г.
  31. ^ «ISO/IEC 14496-3:/Amd.1 — Проект итогового комитета — MPEG-4 Audio Version 2» (PDF) . ISO / IEC JTC 1/SC 29/WG 11. Июль 1999 г. Архивировано из оригинала (PDF) 1 августа 2012 г. Проверено 7 октября 2009 г.
  32. Пурнхаген, Хейко (19 февраля 2000 г.). «Мастерская по аудио MPEG-4 версии 2: HILN — параметрическое кодирование звука» (PDF) . Париж. 108-я конвенция AES: аудио MPEG-4 версии 2. О чем идет речь? . Проверено 7 октября 2009 г.
  33. ^ Перейра, Фернандо (октябрь 2001 г.). «Уровни для аудиопрофилей». Отраслевой форум MPEG. Архивировано из оригинала 8 января 2010 г. Проверено 15 октября 2009 г.
  34. ^ «ISO/IEC 14496-3:2001/Поправка 1:2003 — Расширение полосы пропускания» . ИСО . 2003. Архивировано из оригинала 6 июня 2011 г. Проверено 7 октября 2009 г.
  35. ^ ab «Текст ISO/IEC 14496-3:2001/FPDAM 4, Кодирование без потерь звука (ALS), новые аудиопрофили и расширения BSAC». ИСО / МЭК JTC1/SC29/WG11/N7016. 11 января 2005 г. Архивировано из оригинала (DOC) 12 мая 2014 г. . Проверено 9 октября 2009 г.
  36. ^ «Кодирование без потерь звука (ALS), новые аудиопрофили и расширения BSAC, ISO / IEC 14496-3: 2005 / Amd 2: 2006» . ИСО . 2006. Архивировано из оригинала 4 января 2012 г. Проверено 13 октября 2009 г.
  37. Моди, Михир (6 июня 2005 г.). «Сжатие звука становится лучше и сложнее». Встроенный.com . Архивировано из оригинала 8 февраля 2016 года . Проверено 13 октября 2009 г.
  38. ^ ab «MPEG-4 aacPlus — кодирование звука для современного мира цифровых медиа» (PDF) . Архивировано из оригинала (PDF) 26 октября 2006 г. Проверено 29 января 2007 г.
  39. ^ «Параметрическое кодирование для высококачественного звука, ISO/IEC 14496-3:2001/Amd 2:2004». ИСО . 2004. Архивировано из оригинала 4 января 2012 г. Проверено 13 октября 2009 г.
  40. ^ «3GPP TS 26.401 V6.0.0 (2004-09), Функции обработки звука общего аудиокодека; Улучшенный общий аудиокодек aacPlus; Общее описание (выпуск 6)» (DOC) . 3ГПП. 30 сентября 2004 г. Архивировано из оригинала 19 августа 2006 г. Проверено 13 октября 2009 г.
  41. ^ «ISO/IEC 14496-3:2009. Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио». ИСО . 2009. Архивировано из оригинала 6 июня 2011 г. Проверено 7 октября 2009 г.
  42. Ссылки _ Водородаудио. Архивировано из оригинала 6 июля 2014 г. Проверено 24 января 2011 г.
  43. ^ Заявка на патент США 20070297624 Кодирование цифрового звука.
  44. ^ «ISO/IEC 13818-7, Третье издание, Часть 7 — Расширенное кодирование звука (AAC)» (PDF) . ИСО . 15 октября 2004 г. с. 32. Архивировано из оригинала (PDF) 13 июля 2011 года . Проверено 19 октября 2009 г.
  45. ^ Гриль, Бернхард; Гейерсбергер, Стефан; Хильперт, Йоханнес; Тейхманн, Бодо (июль 2004 г.). Реализация аудиокомпонентов MPEG-4 на различных платформах (PDF) . 109-я конвенция AES 2000 г., 22–25 сентября, Лос-Анджелес. Общество Фраунгофера. Архивировано из оригинала (PDF) 10 июня 2007 г. Проверено 9 октября 2009 г.
  46. ^ «ISO/IEC 14496-3:2009/Amd 3:2012 – Транспортировка унифицированного кодирования речи и звука (USAC)» . ИСО . Архивировано из оригинала 8 марта 2016 г. Проверено 3 августа 2016 г.
  47. ^ «ISO/IEC 14496-3:2009. Информационные технологии. Кодирование аудиовизуальных объектов. Часть 3. Аудио». ИСО . Архивировано из оригинала 20 мая 2016 г. Проверено 2 августа 2016 г.
  48. ^ «ISO/IEC 14496-3:2009/Amd 3:2012 – Транспортировка унифицированного кодирования речи и звука (USAC)» . ИСО . Архивировано из оригинала 19 августа 2016 г. Проверено 2 августа 2016 г.
  49. ^ «Семейство AAC-ELD для высококачественных коммуникационных услуг | MPEG» . mpeg.chiariglione.org . Архивировано из оригинала 20 августа 2016 г. Проверено 2 августа 2016 г.
  50. ^ Профиль IMS для службы видеоконференций высокой четкости (HDVC) (PDF) . GSMA. 24 мая 2016. с. 10. Архивировано (PDF) из оригинала 18 августа 2016 г.
  51. ^ «Часто задаваемые вопросы по лицензированию AAC, вопрос 5» . Через лицензирование . Проверено 15 января 2020 г.
  52. ^ «Лицензионные сборы AAC» . Через лицензирование . Проверено 15 января 2020 г.
  53. ^ Через Лицензионную корпорацию (5 июня 2018 г.). «ПАТЕНТНО-ЛИЦЕНЗИОННЫЙ СОГЛАШЕНИЕ ААС». www.sec.gov . Проверено 21 апреля 2023 г.
  54. ^ «Лицензия FFmpeg и юридические аспекты» . ffmpeg.org .
  55. ^ «Коммит — rpms/fdk-aac-free — b27d53fbad872ea0ec103653fddaec83238132d9 — src.fedoraproject.org». src.fedoraproject.org .
  56. ^ «Коммит — rpms/ffmpeg — 45f894ec0e43a37775393c159021a4ac60170a55 — src.fedoraproject.org». src.fedoraproject.org .
  57. ^ «Список патентов, связанных с AAC» . Hydrogenaudio.io .
  58. ^ Том, Д.; Пурнхаген, Х. (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio, версия 9 — MPEG-4». chiariglione.org . Подгруппа аудио MPEG. Архивировано из оригинала 14 февраля 2010 г. Проверено 6 октября 2009 г.
  59. ^ «ISO/IEC 14496-3:2019». ИСО . Проверено 19 февраля 2022 г.
  60. ^ abcd Уолтерс, Мартин; Кьорлинг, Кристофер; Хомм, Дэниел; Пурнхаген, Хайко. Более подробный обзор высокоэффективного AAC MPEG-4 (PDF) . п. 3. Архивировано из оригинала (PDF) 19 декабря 2003 г. Проверено 31 июля 2008 г.Представлено на 115-м съезде Общества аудиоинженеров, 10–13 октября 2003 г.
  61. ^ «Расширенное кодирование звука (MPEG-2), формат обмена аудиоданными» . Библиотека Конгресса / Национальная программа инфраструктуры и сохранения цифровой информации. 7 марта 2007 г. Архивировано из оригинала 30 июля 2008 г. Проверено 31 июля 2008 г.
  62. ^ ETSI TS 101 154 v1.5.1: Спецификация использования кодирования видео и аудио в приложениях вещания на основе транспортного потока MPEG.
  63. ^ Коэн, Питер (27 мая 2010 г.). «iTunes Store становится без DRM» . Макмир . Мак Паблишинг. Архивировано из оригинала 18 февраля 2009 года . Проверено 10 февраля 2009 г.
  64. ^ "Яблоко AAC". Водородаудио . Архивировано из оригинала 23 ноября 2021 г. Проверено 22 ноября 2021 г.
  65. ^ "Пряники - Разработчики Android" . Android-разработчики . Архивировано из оригинала 29 декабря 2017 года . Проверено 8 мая 2018 г.
  66. ^ «Поддерживаемые форматы мультимедиа — разработчики Android» . Android-разработчики . Архивировано из оригинала 11 марта 2012 года . Проверено 8 мая 2018 г.
  67. ^ «Телефон Palm Pre / Функции, подробности» . Пальма США . Архивировано из оригинала 24 мая 2011 г.
  68. ^ «Nintendo — Служба поддержки клиентов — Wii — Фотоканал» . nintendo.com . Архивировано из оригинала 5 мая 2017 года . Проверено 8 мая 2018 г.
  69. ^ «Поддерживаемые носители для Google Cast» . Архивировано из оригинала 23 сентября 2015 г. Проверено 22 сентября 2015 г.| Поддерживаемые медиафайлы для Google Cast
  70. ^ «Статистика — среда выполнения Adobe Flash» . www.adobe.com . Архивировано из оригинала 2 октября 2011 года . Проверено 8 мая 2018 г.
  71. ^ «Adobe представляет Flash Player 9 с поддержкой видео H.264» . Пресс-релиз Adobe . 04.12.2007. Архивировано из оригинала 21 августа 2014 г. Проверено 20 августа 2014 г.
  72. ^ «Xbox.com | Использование системы — используйте Apple iPod с Xbox 360» . Архивировано из оригинала 8 апреля 2007 года.
  73. ^ «Nero Platinum 2018 Suite — универсал, отмеченный наградами» . Неро АГ . Архивировано из оригинала 14 декабря 2012 года . Проверено 8 мая 2018 г.
  74. Ссылки _ AudioCoding.com . Архивировано из оригинала 11 декабря 2009 г. Проверено 3 ноября 2009 г.
  75. ^ "ФААД2". AudioCoding.com . Архивировано из оригинала 11 декабря 2009 г. Проверено 3 ноября 2009 г.
  76. ^ «5 декабря 2015 г. Собственный кодер FFmpeg AAC теперь стабилен!». ffmpeg.org . Архивировано из оригинала 16 июля 2016 года . Проверено 26 июня 2016 г.
  77. ^ ab «Руководство по кодированию FFmpeg AAC». Архивировано из оригинала 17 апреля 2016 года . Проверено 11 апреля 2016 г. Какой кодировщик обеспечивает лучшее качество? ... вероятный ответ: libfdk_aac
  78. ^ "Libav Wiki — Кодировка AAC" . Архивировано из оригинала 20 апреля 2016 г. Проверено 11 апреля 2016 г.

Внешние ссылки