stringtranslate.com

МП3

MP3 (формально MPEG-1 Audio Layer III или MPEG-2 Audio Layer III ) [4] — это формат кодирования цифрового звука , разработанный в основном Обществом Фраунгофера в Германии под руководством Карлхайнца Бранденбурга , [11] [12] при поддержке от других ученых в области цифровых технологий из других стран. Первоначально определенный как третий аудиоформат стандарта MPEG-1 , он был сохранен и расширен - определяя дополнительные скорости передачи данных и поддержку большего количества аудиоканалов - как третий аудиоформат последующего стандарта MPEG-2 . Третья версия, известная как MPEG-2.5, расширенная для лучшей поддержки более низких скоростей передачи данных , обычно реализуется, но не является признанным стандартом.

MP3 (или mp3 ) как формат файла обычно обозначает файлы, содержащие элементарный поток данных, закодированных в формате MPEG-1 Audio или MPEG-2 Audio, без других сложностей стандарта MP3.

Что касается сжатия звука (аспект стандарта, наиболее очевидный для конечных пользователей и благодаря которому он наиболее известен), MP3 использует сжатие данных с потерями для кодирования данных с использованием неточных приближений и частичного отбрасывания данных. Это позволяет значительно уменьшить размеры файлов по сравнению с несжатым аудио. Сочетание небольшого размера и приемлемой точности привело к буму распространения музыки через Интернет в середине-конце 1990-х годов, когда MP3 служил передовой технологией в то время, когда пропускная способность и объем памяти все еще были на высоте. Формат MP3 вскоре стал ассоциироваться с противоречиями, связанными с нарушением авторских прав , музыкальным пиратством , а также службами копирования и обмена файлами MP3.com и Napster , среди других. С появлением портативных медиаплееров (в эту категорию продуктов также входят смартфоны ) поддержка MP3 остается практически универсальной.

Сжатие MP3 работает за счет уменьшения (или аппроксимации) точности определенных компонентов звука, которые, как считается (психоакустический анализ), находятся за пределами слухового восприятия большинства людей. Этот метод обычно называют перцептивным кодированием или психоакустическим моделированием. [13] Оставшаяся аудиоинформация затем записывается экономным способом с использованием алгоритмов MDCT и FFT . По сравнению с цифровым звуком CD-качества , сжатие MP3 обычно позволяет уменьшить размер на 75–95%. Например, MP3, закодированный с постоянной скоростью передачи данных 128 кбит/с, приведет к созданию файла размером примерно 9% от размера исходного аудио компакт-диска. [14] В начале 2000-х годов проигрыватели компакт-дисков все чаще стали поддерживать воспроизведение файлов MP3 на компакт-дисках с данными.

Группа экспертов по кинематографии (MPEG) разработала MP3 как часть своих стандартов MPEG-1 , а затем и MPEG-2 . MPEG-1 Audio (MPEG-1 Part 3), который включал MPEG-1 Audio Layer I, II и III, был одобрен в качестве проекта комитета по стандарту ISO / IEC в 1991 году, [15] [16] завершен в 1992 году. [17] и опубликован в 1993 году как ISO/IEC 11172-3:1993. [7] Расширение MPEG-2 Audio (MPEG-2 Part 3) с более низкой частотой дискретизации и битрейтом было опубликовано в 1995 году как ISO/IEC 13818-3:1995. [8] [18] Он требует лишь минимальных модификаций существующих декодеров MPEG-1 (распознавание бита MPEG-2 в заголовке и добавление новых более низких скоростей дискретизации и битрейта).

История

Фон

Алгоритм сжатия аудиоданных MP3 с потерями использует преимущество восприятия ограничения человеческого слуха, называемое слуховой маскировкой . В 1894 году американский физик Альфред М. Майер сообщил, что тон можно сделать неслышимым с помощью другого тона более низкой частоты. [19] В 1959 году Ричард Эмер описал полный набор слуховых кривых, касающихся этого явления. [20] Между 1967 и 1974 годами Эберхард Цвикер работал в области настройки и маскировки критических частотных диапазонов, [21] [22] что, в свою очередь, основывалось на фундаментальных исследованиях в этой области, проведенных Харви Флетчером и его сотрудниками из Bell . Лаборатории . [23]

Перцептивное кодирование было впервые использовано для сжатия речевого кодирования с помощью кодирования с линейным предсказанием (LPC), [24] которое берет свое начало в работе Фумитады Итакура ( Университет Нагои ) и Сюдзо Сайто ( Nippon Telegraph and Telephone ) в 1966 году. [25] В 1978 году. Бишну С. Атал и Манфред Р. Шредер из Bell Labs предложили речевой кодек LPC , называемый адаптивным прогнозирующим кодированием , который использовал психоакустический алгоритм кодирования, использующий маскирующие свойства человеческого уха. [24] [26] О дальнейшей оптимизации Шредера и Атала с Дж. Л. Холлом позже сообщалось в статье 1979 года. [27] В том же году кодек психоакустической маскировки был также предложен М.А. Краснером, [28] который опубликовал и произвел аппаратное обеспечение для речи (не пригодное для сжатия музыкальных битов), но публикация его результатов в относительно малоизвестной лаборатории Линкольна Технический отчет [29] не оказал непосредственного влияния на основное направление развития психоакустических кодеков.

Дискретное косинусное преобразование (DCT), тип кодирования преобразования для сжатия с потерями , предложенное Насиром Ахмедом в 1972 году, было разработано Ахмедом совместно с Т. Натараджан и К. Р. Рао в 1973 году; они опубликовали свои результаты в 1974 году. [30] [31] [32] Это привело к разработке модифицированного дискретного косинусного преобразования (MDCT), предложенного Дж. П. Принсеном, А. В. Джонсоном и А. Б. Брэдли в 1987 году, [33] после более ранних работ. Принсеном и Брэдли в 1986 году. [34] Позже MDCT стал основной частью алгоритма MP3. [35]

Эрнст Терхардт и другие сотрудники разработали алгоритм, описывающий слуховую маскировку с высокой точностью в 1982 году. [36] Эта работа дополнила множество отчетов авторов, относящихся еще к Флетчеру, а также к работе, которая первоначально определила критические отношения и критическую полосу пропускания.

В 1985 году Атал и Шредер представили линейное предсказание с кодовым возбуждением (CELP), алгоритм перцептивного кодирования речи на основе LPC со слуховой маскировкой, который достиг значительной для своего времени степени сжатия данных . [24] В 1988 году в рецензируемом журнале IEEE Journal on Selected Areas in Communications сообщалось о широком разнообразии (в основном перцептивных) алгоритмов сжатия звука. [37] В выпуске «Voice Coding for Communications», опубликованном в феврале 1988 года, сообщалось о широком спектре алгоритмов сжатия звука. созданы и работают технологии сжатия аудиобитов, [37] некоторые из них используют маскирование слуха как часть своей фундаментальной конструкции, а некоторые демонстрируют аппаратные реализации в реальном времени.

Разработка

Происхождение технологии MP3 полностью описано в статье профессора Ханса Мусмана [38] , который в течение нескольких лет возглавлял группу ISO MPEG Audio. В декабре 1988 года MPEG призвал к созданию стандарта кодирования звука. В июне 1989 года было представлено 14 алгоритмов кодирования звука. Из-за определенного сходства между этими предложениями по кодированию они были объединены в четыре группы разработки. Первой группой была ASPEC, созданная Fraunhofer Gesellschaft , AT&T , France Telecom , Deutsche и Thomson-Brandt . Второй группой была MUSICAM от Matsushita , CCETT , ITT и Philips . Третьей группой стал ATAC (ATRAC Coding) от Fujitsu , JVC , NEC и Sony . И четвертой группой была SB-ADPCM от NTT и BTRL. [38]

Непосредственными предшественниками MP3 были «Оптимальное кодирование в частотной области» (OCF) [39] и кодирование с перцептивным преобразованием (PXFM). [40] Эти два кодека вместе с разработками Thomson-Brandt в области коммутации блоков были объединены в кодек под названием ASPEC, который был представлен MPEG и выиграл конкурс качества, но был ошибочно отклонен как слишком сложный для реализации. Первой практической реализацией кодера восприятия звука (OCF) в аппаратном обеспечении (аппаратное обеспечение Краснера было слишком громоздким и медленным для практического использования) стала реализация кодера психоакустического преобразования на базе микросхем DSP Motorola 56000 .

Еще одним предшественником формата и технологии MP3 является перцепционный кодек MUSICAM, основанный на банке фильтров целочисленной арифметики с 32 поддиапазонами, управляемый психоакустической моделью. Он был в первую очередь разработан для цифрового аудиовещания (цифрового радио) и цифрового телевидения, а его основные принципы были раскрыты научному сообществу CCETT (Франция) и IRT (Германия) в Атланте во время конференции IEEE- ICASSP в 1991 году [41]. после работы над MUSICAM с Matsushita и Philips с 1989 года. [38]

Этот кодек, включенный в систему вещания с использованием модуляции COFDM, был продемонстрирован в эфире и в полевых условиях [42] совместно с Radio Canada и CRC Canada во время шоу NAB (Лас-Вегас) в 1991 году. Реализация аудиочасти этой системы вещания была основана на на двухчиповом кодере (один для преобразования поддиапазонов, другой для психоакустической модели, разработанной командой Г. Столла (IRT Германия), позже известной как психоакустическая модель I) и декодере реального времени, использующем один чип Motorola 56001 DSP использование программного обеспечения для целочисленной арифметики, разработанного командой YF Dehery (CCETT, Франция). Простота соответствующего декодера вместе с высоким качеством звука этого кодека, впервые использующего частоту дискретизации 48 кГц и входной формат 20 бит/выборка (наивысший доступный стандарт дискретизации в 1991 году, совместимый с профессиональным цифровым стандартом AES/EBU). входной студийный стандарт) стали основными причинами, по которым позже характеристики MUSICAM были приняты в качестве основных функций для усовершенствованного кодека сжатия цифровой музыки.

Во время разработки программного обеспечения для кодирования MUSICAM команда Столла и Дехери тщательно использовала набор высококачественных материалов для оценки звука [43] , отобранных группой профессионалов в области аудио из Европейского вещательного союза и позже использованных в качестве справочного материала для оценка кодеков сжатия музыки. Методика поддиапазонного кодирования оказалась эффективной не только для перцепционного кодирования высококачественных звуковых материалов, но особенно для кодирования важных перкуссионных звуковых материалов (барабаны, треугольник и т. д.) благодаря специфическому эффекту временной маскировки набор фильтров поддиапазонов MUSICAM (это преимущество является специфической особенностью методов кодирования с коротким преобразованием).

Будучи докторантом немецкого университета Эрланген-Нюрнберг , Карлхайнц Бранденбург начал работать над сжатием цифровой музыки в начале 1980-х годов, уделяя особое внимание тому, как люди воспринимают музыку. Он завершил докторскую работу в 1989 году. [44] MP3 является прямым потомком OCF и PXFM и представляет собой результат сотрудничества Бранденбурга — работы в качестве постдокторанта в AT&T-Bell Labs с Джеймсом Д. Джонстоном («Джей-Джей») из AT&T-Bell Labs — совместно с Институтом интегральных схем Фраунгофера , Эрланген (где он работал с Бернхардом Грилем и четырьмя другими исследователями — «Оригинальная шестерка» [45] ), с относительно небольшим вкладом со стороны отделения MP2 кодировщиков психоакустических поддиапазонов. . В 1990 году Бранденбург стал доцентом Эрланген-Нюрнберга. Находясь там, он продолжал работать над сжатием музыки с учёными из Института Генриха Герца Общества Фраунгофера . В 1993 году он присоединился к коллективу Fraunhofer HHI. [44] Песня Сюзанны Вега « Tom's Diner » была первой песней, использованной Карлхайнцем Бранденбургом для разработки формата MP3. Бранденбург взял песню для тестирования, прослушивая ее снова и снова каждый раз, когда уточнял схему, проверяя, чтобы она не влияла отрицательно на тонкость голоса Веги. [46] Соответственно, он окрестил Вегу «Матерью MP3». [47]

Стандартизация

В 1991 году были рассмотрены два доступных предложения по аудиостандарту MPEG: MUSICAM ( универсальное интегрированное кодирование и мультиплексирование поддиапазонов , адаптированное к шаблону запроса ) и ASPEC ( адаптивное спектральное перцептивно - энтропийное кодирование ) . Метод MUSICAM, предложенный Philips (Нидерланды), CCETT (Франция), Институтом радиовещательных технологий (Германия) и Matsushita (Япония) [48] , был выбран из-за его простоты и устойчивости к ошибкам, а также из-за его высокой уровень вычислительной эффективности. [49] Формат MUSICAM, основанный на поддиапазонном кодировании , стал основой для формата сжатия MPEG Audio, включив, например, его структуру кадра, формат заголовка, частоту дискретизации и т. д.

Хотя большая часть технологий и идей MUSICAM была включена в определение MPEG Audio Layer I и Layer II, сам по себе банк фильтров и структура данных, основанная на кадрировании 1152 сэмплов (формат файла и байт-ориентированный поток) MUSICAM, остались на уровне III. (MP3) как часть вычислительно неэффективного банка гибридных фильтров . Под председательством профессора Мусмана из Ганноверского университета Лейбница редактирование стандарта было поручено Леону ван де Керкхофу (Нидерланды), Герхарду Столлю (Германия) и Иву-Франсуа Деэри (Франция), которые работали над Layer I и Layer. II. ASPEC был совместным предложением AT&T Bell Laboratories, Thomson Consumer Electronics, Общества Фраунгофера и CNET . [50] Это обеспечило высочайшую эффективность кодирования.

Рабочая группа , состоящая из ван де Керкхофа, Столла, Леонардо Кьярильоне ( вице-президент CSELT по СМИ), Ива-Франсуа Деэри, Карлхайнца Бранденбурга (Германия) и Джеймса Д. Джонстона (США), взяла идеи ASPEC, интегрировала банк фильтров Layer II, добавили некоторые из своих идей, таких как совместное стереокодирование MUSICAM, и создали формат MP3, который был разработан для достижения того же качества при скорости 128  кбит/с , что и MP2 при скорости 192 кбит/с.

Алгоритмы MPEG-1 Audio Layer I, II и III были одобрены в 1991 году [15] [16] и окончательно доработаны в 1992 году [17] как часть MPEG-1 , первого стандартного набора MPEG , в результате которого появился международный стандарт. ISO / IEC 11172-3 (также известный как MPEG-1 Audio или MPEG-1 Part 3 ), опубликованный в 1993 году. [7] Файлы или потоки данных, соответствующие этому стандарту, должны поддерживать частоты дискретизации 48k, 44100 и 32k и продолжать поддерживается современными MP3-плеерами и декодерами. Таким образом, первое поколение MP3 определяло 14 × 3 = 42 интерпретации структур данных кадров MP3 и макетов размеров.

Эффективность сжатия кодеров обычно определяется скоростью передачи данных, поскольку степень сжатия зависит от разрядности и частоты дискретизации входного сигнала. Тем не менее, степени сжатия часто публикуются. Они могут использовать параметры компакт-диска (CD) в качестве эталона (44,1 кГц , 2 канала по 16 бит на канал или 2 × 16 бит) или иногда параметры SP цифровой аудиоленты (DAT) (48 кГц, 2 × 16 бит). . Коэффициенты сжатия в последнем случае выше, что демонстрирует проблему использования термина « коэффициент сжатия» для кодеров с потерями.

Карлхайнц Бранденбург использовал запись на компакт-диске песни Сюзанны Веги « Tom's Diner » для оценки и усовершенствования алгоритма сжатия MP3 . [51] Эта песня была выбрана из-за ее почти монофонической природы и широкого спектрального содержания, что позволяет легче услышать недостатки формата сжатия во время воспроизведения. Этот конкретный трек обладает интересным свойством: два канала почти, но не полностью, одинаковы, что приводит к случаю, когда снижение уровня бинауральной маскировки вызывает пространственную демаскировку шумовых артефактов, если только кодер не распознает ситуацию должным образом и не применит исправления, аналогичные тем, которые подробно описано в психоакустической модели MPEG-2 AAC. Некоторые более критические аудиофрагменты ( глокеншпиль , треугольник, аккордеон и т. д.) были взяты с эталонного компакт-диска EBU V3/SQAM и использовались профессиональными звукорежиссерами для оценки субъективного качества форматов MPEG Audio. [ нужна цитата ]

Публикация

Эталонная реализация программного обеспечения для моделирования, написанная на языке C и позже известная как ISO 11172-5 , была разработана (в 1991–1996 годах) членами комитета ISO MPEG Audio для создания побитово-совместимых аудиофайлов MPEG (уровень 1, уровень 2, слой 3). Он был одобрен комитетом как проект технического отчета ISO/IEC в марте 1994 г. и напечатан как документ CD 11172-5 в апреле 1994 г. [52] Он был одобрен как проект технического отчета (DTR/DIS) в ноябре 1994 г. [ 53] был завершен в 1996 году и опубликован как международный стандарт ISO/IEC TR 11172-5:1998 в 1998 году. [54] Справочное программное обеспечение на языке C было позже опубликовано как свободно доступный стандарт ISO. [55] Работая не в реальном времени в нескольких операционных системах, компания смогла продемонстрировать первое аппаратное декодирование в реальном времени (на основе DSP) сжатого звука. Некоторые другие реализации кодеров и декодеров MPEG Audio в реальном времени [56] были доступны для цифрового вещания (радио DAB , телевидение DVB ) на потребительские приемники и телеприставки.

7 июля 1994 года Общество Фраунгофера выпустило первый программный кодировщик MP3 под названием l3enc . [57] Расширение имени файла .mp3 было выбрано командой Фраунгофера 14 июля 1995 года (ранее файлы назывались .bit ). [1] Благодаря первому программному MP3-плееру реального времени WinPlay3 (выпущенному 9 сентября 1995 г.) многие люди получили возможность кодировать и воспроизводить файлы MP3 на своих компьютерах. Из-за относительно небольших жестких дисков той эпохи (≈500–1000 МБ ) сжатие с потерями было необходимо для хранения музыки из нескольких альбомов на домашнем компьютере в виде полных записей (в отличие от нотации MIDI или файлов трекера , которые сочетали нотацию с короткие записи инструментов, играющих отдельные ноты).

Пример реализации Фраунгофера

Хакер по имени SoloH обнаружил исходный код эталонной реализации MPEG «dist10» вскоре после релиза на серверах Эрлангенского университета . Он разработал более качественную версию и распространил ее в Интернете. Этот код положил начало широкому копированию компакт-дисков и распространению цифровой музыки в формате MP3 через Интернет. [58] [59] [60] [61]

Дальнейшие версии

Дальнейшая работа над звуком MPEG [62] была завершена в 1994 году как часть второго набора стандартов MPEG, MPEG-2 , более формально известного как международный стандарт ISO/IEC 13818-3 (также известный как MPEG-2 Part 3 или MPEG -2 с обратной совместимостью). 2 Audio или MPEG-2 Audio BC [18] ), первоначально опубликованный в 1995 году. [8] [63] MPEG-2 Part 3 (ISO/IEC 13818-3) определил 42 дополнительные скорости передачи данных и частоты дискретизации для MPEG-1 Audio. Слой I, II и III. Новые частоты дискретизации составляют ровно половину тех, которые изначально были определены в MPEG-1 Audio. Такое снижение частоты дискретизации снижает доступную точность частоты вдвое, одновременно сокращая скорость передачи данных на 50%. MPEG-2 Part 3 также улучшил звук MPEG-1, позволив кодировать аудиопрограммы с более чем двумя каналами, вплоть до многоканального 5.1. [62] MP3, закодированный с помощью MPEG-2, обеспечивает воспроизведение половины полосы пропускания MPEG-1, подходящей для фортепиано и пения.

Третье поколение потоков данных (файлов) в стиле «MP3» расширило идеи и реализацию MPEG-2 , но было названо аудио MPEG-2.5, поскольку MPEG-3 уже имел другое значение. Это расширение было разработано в Fraunhofer IIS, зарегистрированном держателе патента MP3, путем уменьшения поля синхронизации кадров в заголовке MP3 с 12 до 11 бит. Как и при переходе от MPEG-1 к MPEG-2, в MPEG-2.5 добавляются дополнительные частоты дискретизации, ровно половина от тех, которые доступны при использовании MPEG-2. Таким образом, он расширяет возможности MP3, включая человеческую речь и другие приложения, но требует только 25% полосы пропускания (воспроизведения частоты), возможной при использовании частот дискретизации MPEG-1. Несмотря на то, что MPEG-2.5 не является стандартом, признанным ISO, он широко поддерживается как недорогими китайскими, так и фирменными цифровыми аудиоплеерами, а также компьютерными программными кодировщиками MP3 ( LAME ), декодерами (FFmpeg) и проигрывателями (MPC), добавляющими 3 × 8 = 24 дополнительных типа кадров MP3. Таким образом, каждое поколение MP3 поддерживает 3 частоты дискретизации, ровно вдвое меньше, чем в предыдущем поколении, всего 9 разновидностей файлов формата MP3. Таблица сравнения частоты дискретизации между MPEG-1, 2 и 2.5 приведена далее в статье. [64] [65] MPEG-2.5 поддерживается LAME (с 2000 года), Media Player Classic (MPC), iTunes и FFmpeg.

MPEG-2.5 не был разработан MPEG (см. выше) и никогда не был утвержден в качестве международного стандарта. Таким образом, MPEG-2.5 является неофициальным или проприетарным расширением формата MP3. Тем не менее, он широко распространен и особенно выгоден для приложений человеческой речи с низкой скоростью передачи данных.

* Стандарт ISO/IEC 11172-3 (также известный как MPEG-1 Audio) определяет три формата: MPEG-1 Audio Layer I, Layer II и Layer III. Стандарт ISO/IEC 13818-3 (также известный как MPEG-2 Audio) определяет расширенную версию MPEG-1 Audio: MPEG-2 Audio Layer I, Layer II и Layer III. MPEG-2 Audio (MPEG-2 часть 3) не следует путать с MPEG-2 AAC (MPEG-2 часть 7 – ISO/IEC 13818-7). [18]

LAME — самый продвинутый кодер MP3. [ нужна цитация ] LAME включает кодирование с переменной скоростью передачи данных (VBR), которое использует параметр качества, а не целевую скорость передачи данных. Более поздние версии (2008+) поддерживают цель качества n.nnn , которая автоматически выбирает частоту дискретизации MPEG-2 или MPEG-2.5 в зависимости от записей человеческой речи, для которых требуется разрешение полосы пропускания только 5512 Гц.

Интернет-распределение

Во второй половине 1990-х годов файлы MP3 начали распространяться в Интернете , часто через подпольные сети пиратских песен. Первый известный эксперимент по распространению через Интернет был организован в начале 1990-х годов Интернет-андеграундным музыкальным архивом , более известным под аббревиатурой IUMA. После некоторых экспериментов [67] с использованием несжатых аудиофайлов этот архив начал доставлять по локальному всемирному низкоскоростному Интернету некоторые сжатые аудиофайлы MPEG в формате MP2 (Layer II), а затем, когда стандарт был полностью завершен, использовались файлы MP3. Популярность MP3 начала быстро расти с появлением аудиоплеера Winamp от Nullsoft , выпущенного в 1997 году, сообщество которого в 2023 году все еще насчитывало 80 миллионов активных пользователей. [68] В 1998 году был выпущен первый портативный твердотельный цифровой аудиоплеер MPMan , разработанный компанией SaeHan Information Systems со штаб-квартирой в Сеуле , Южная Корея , а Rio PMP300 был продан впоследствии в 1998 году, несмотря на попытки юридического подавления со стороны РИАА . [69]

В ноябре 1997 года сайт mp3.com бесплатно предлагал тысячи MP3-файлов, созданных независимыми исполнителями. [69] Небольшой размер файлов MP3 позволил широко распространить одноранговый обмен файлами музыки, скопированной с компакт-дисков, что раньше было практически невозможно. Первая крупная одноранговая сеть обмена файлами Napster была запущена в 1999 году. Простота создания и обмена файлами MP3 привела к повсеместному нарушению авторских прав . Крупнейшие звукозаписывающие компании утверждали, что такое бесплатное распространение музыки снижает продажи, и называли это « музыкальным пиратством ». В ответ они подали иски против Napster , который в конечном итоге был закрыт, а затем продан, а также против отдельных пользователей, занимавшихся обменом файлами. [70]

Несанкционированный обмен файлами MP3 продолжается в одноранговых сетях следующего поколения . Некоторые авторизованные сервисы, такие как Beatport , Bleep , Juno Records , eMusic , Zune Marketplace , Walmart.com , Rhapsody , звукозаписывающая индустрия одобрила реинкарнацию Napster , а Amazon.com продают неограниченную музыку в формате MP3.

Дизайн

Структура файла

Схема структуры файла MP3
Схема структуры файла MP3 (версия MPEG 2.5, не описанная здесь, меняет последний бит слова синхронизации на «0» в качестве индикации, фактически перемещая один бит в поле версии [65] ).

Файл MP3 состоит из кадров MP3, которые состоят из заголовка и блока данных. Эта последовательность кадров называется элементарным потоком . Из-за «битового резервуара» кадры не являются независимыми элементами и обычно не могут быть извлечены на произвольных границах кадра. Блоки данных MP3 содержат (сжатую) аудиоинформацию в виде частот и амплитуд. На диаграмме показано, что заголовок MP3 состоит из слова синхронизации , которое используется для идентификации начала действительного кадра. За ним следует бит, указывающий, что это стандарт MPEG , и два бита, указывающие, что используется уровень 3; следовательно, MPEG-1 Audio Layer 3 или MP3. После этого значения будут различаться в зависимости от файла MP3. ISO / IEC 11172-3 определяет диапазон значений для каждого раздела заголовка вместе со спецификацией заголовка. Сегодня большинство файлов MP3 содержат метаданные ID3 , которые предшествуют кадрам MP3 или следуют за ними, как показано на схеме. Поток данных может содержать необязательную контрольную сумму .

Совместное стерео делается только покадрово. [71]

Кодирование и декодирование

Алгоритм кодирования MP3 обычно делится на четыре части. Часть 1 делит аудиосигнал на более мелкие части, называемые кадрами, а затем на выходе применяется фильтр MDCT. Часть 2 передает образец в 1024-точечное быстрое преобразование Фурье (БПФ), затем применяется психоакустическая модель и на выходе применяется еще один фильтр MDCT. Часть 3 количественно оценивает и кодирует каждый семпл, известный как распределение шума, которое настраивается в соответствии с требованиями к скорости передачи данных и маскировке звука . Часть 4 форматирует битовый поток , называемый аудиокадром, который состоит из 4 частей: заголовка , проверки ошибок , аудиоданных и вспомогательных данных. [35]

Стандарт MPEG-1 не включает точную спецификацию кодера MP3, но предоставляет примеры психоакустических моделей, циклов скорости и т.п. в ненормативной части исходного стандарта. [72] MPEG-2 удваивает количество поддерживаемых частот дискретизации, а MPEG-2.5 добавляет еще 3. На момент написания предложенные реализации были весьма устаревшими. Реализаторы стандарта должны были разработать алгоритмы, пригодные для удаления частей информации из аудиовхода. В результате стало доступно множество различных кодеров MP3, каждый из которых создает файлы разного качества. Сравнения были широко доступны, поэтому потенциальному пользователю кодировщика было легко найти лучший выбор. Некоторые кодеры, которые умели кодировать на более высоких скоростях передачи данных (например, LAME ), не обязательно были так же хороши на более низких скоростях передачи данных. Со временем LAME развивался на веб-сайте SourceForge, пока не стал де-факто кодировщиком MP3 CBR. Позже был добавлен режим ABR. Работа продолжалась над истинно переменной скоростью передачи данных с использованием целевого показателя качества от 0 до 10. В конце концов, числа (такие как -V 9.600) могли генерировать превосходное качество кодирования голоса с низкой скоростью передачи данных со скоростью всего 41 кбит / с с использованием расширений MPEG-2.5.

MP3 использует перекрывающуюся структуру MDCT. Каждый кадр MPEG-1 MP3 состоит из 1152 выборок, разделенных на две гранулы по 576 выборок. Эти выборки, первоначально во временной области, преобразуются в одном блоке в 576 выборок в частотной области с помощью MDCT. [73] MP3 также позволяет использовать более короткие блоки в гранулах, вплоть до размера 192 образцов; эта функция используется при обнаружении переходного процесса . Это ограничивает временное распространение шума квантования, сопровождающего переходный процесс (см. Психоакустика ). Разрешение по частоте ограничено небольшим размером окна длинного блока, что снижает эффективность кодирования. [71] Временное разрешение может быть слишком низким для сильно переходных сигналов и может привести к размытию перкуссионных звуков. [71]

Из-за древовидной структуры набора фильтров проблемы предэха усугубляются, поскольку комбинированная импульсная характеристика двух наборов фильтров не обеспечивает и не может обеспечить оптимальное решение по временному/частотному разрешению. [71] Кроме того, объединение выходных сигналов двух наборов фильтров создает проблемы наложения спектров, которые необходимо частично решать на этапе «компенсации наложения частот»; однако это создает избыточную энергию для кодирования в частотной области, тем самым снижая эффективность кодирования. [74]

С другой стороны, декодирование тщательно определено в стандарте. Большинство декодеров « совместимы с битовым потоком », что означает, что распакованный вывод, который они производят из данного файла MP3, будет таким же, с определенной степенью допуска округления , как вывод, математически определенный в документе высоких стандартов ISO / IEC (ISO). /МЭК 11172-3). Поэтому сравнение декодеров обычно основано на том, насколько они эффективны в вычислительном отношении (т. е. сколько памяти или процессорного времени они используют в процессе декодирования). Со временем эта проблема стала менее серьезной, поскольку тактовая частота процессора перешла с МГц на ГГц. Общая задержка кодера/декодера не определена, что означает отсутствие официального положения о воспроизведении без пауз . Однако некоторые кодировщики, такие как LAME, могут прикреплять дополнительные метаданные, которые позволят проигрывателям, которые могут их обработать, обеспечить плавное воспроизведение.

Качество

При выполнении кодирования звука с потерями, например при создании потока данных MP3, существует компромисс между объемом генерируемых данных и качеством звука результатов. Человек, генерирующий MP3, выбирает скорость передачи данных, которая определяет, сколько килобит в секунду требуется для звука. Чем выше скорость передачи данных, тем больше будет поток данных MP3 и, как правило, тем ближе он будет звучать к исходной записи. При слишком низкой скорости передачи данных при воспроизведении могут быть слышны артефакты сжатия (т. е. звуки, которых не было в исходной записи). Некоторый звук трудно сжать из-за его хаотичности и резких атак. Когда этот тип звука сжимается, обычно слышны такие артефакты, как звон или предварительное эхо . Образец аплодисментов или треугольный инструмент с относительно низкой скоростью передачи данных являются хорошими примерами артефактов сжатия. Большинство субъективных испытаний перцептивных кодеков, как правило, избегают использования этих типов звуковых материалов, однако артефакты, создаваемые перкуссионными звуками, едва заметны из-за специфической временной маскировки 32-поддиапазонного банка фильтров уровня II, на котором основан формат. .

Помимо скорости передачи данных закодированного фрагмента звука, качество звука, закодированного в формате MP3, также зависит от качества алгоритма кодирования, а также от сложности кодируемого сигнала. Поскольку стандарт MP3 допускает некоторую свободу в алгоритмах кодирования, разные кодеры обеспечивают совершенно разное качество даже при одинаковой скорости передачи данных. Например, в тесте публичного прослушивания с участием двух ранних кодеров MP3, настроенных на скорость около 128 кбит/с, [75] один набрал 3,66 по шкале от 1 до 5, а другой — только 2,22. Качество зависит от выбора кодера и параметров кодирования. [76]

Это наблюдение вызвало революцию в кодировании звука. Вначале скорость передачи данных была главным и единственным фактором. В то время файлы MP3 были самого простого типа: они использовали одинаковую скорость передачи данных для всего файла: этот процесс известен как кодирование с постоянной скоростью передачи данных (CBR). Использование постоянной скорости передачи данных упрощает кодирование и снижает нагрузку на процессор. Однако также возможно оптимизировать размер файла, создавая файлы, в которых скорость передачи данных меняется по всему файлу. Они известны как переменная скорость передачи данных. Битовый резервуар и кодирование VBR были частью исходного стандарта MPEG-1. Идея, лежащая в их основе, заключается в том, что в любом фрагменте аудио некоторые фрагменты сжимать легче, например тишину или музыку, содержащую всего несколько тонов, тогда как другие сжимать труднее. Таким образом, общее качество файла можно повысить, используя более низкую скорость передачи данных для менее сложных фрагментов и более высокую для более сложных частей. В некоторых продвинутых кодировщиках MP3 можно указать заданное качество, и кодер соответствующим образом отрегулирует скорость передачи данных. Пользователи, которым нужна определенная «настройка качества», прозрачная для их ушей, могут использовать это значение при кодировании всей своей музыки, и, вообще говоря, им не нужно беспокоиться о проведении индивидуальных тестов прослушивания каждого музыкального фрагмента для определения правильной скорости передачи данных.

На воспринимаемое качество могут влиять условия прослушивания (окружающий шум), внимание слушателя, его подготовка и, в большинстве случаев, аудиооборудование слушателя (например, звуковые карты, динамики и наушники). Кроме того, достаточное качество может быть достигнуто за счет более низких настроек качества для лекций и приложений, использующих человеческую речь, и сокращает время и сложность кодирования. Тест, проведенный профессором музыки Стэнфордского университета Джонатаном Бергером для новых студентов, показал, что предпочтение студентов музыке в формате MP3 растет с каждым годом. Бергер сказал, что студенты, похоже, предпочитают шипящие звуки, которые привносят в музыку MP3. [77]

Углубленное исследование качества звука MP3, проект звукорежиссера и композитора Райана Магуайра «Призрак в MP3» изолирует звуки, потерянные при сжатии MP3. В 2015 году он выпустил трек «moDernisT» (анаграмма «Tom's Diner»), составленный исключительно из звуков, удаленных во время сжатия MP3 песни «Tom's Diner», [78] [79] [80] трек изначально использовался в разработке стандарта MP3. Подробный отчет о методах, используемых для изоляции звуков, удаленных во время сжатия MP3, а также концептуальная мотивация проекта была опубликована в материалах Международной компьютерной музыкальной конференции 2014 года. [81]

Битрейт

Скорость передачи данных — это произведение частоты дискретизации и количества битов на выборку, используемых для кодирования музыки. Звук компакт-диска составляет 44100 сэмплов в секунду. Количество битов на выборку также зависит от количества аудиоканалов. Компакт-диск стереофонический, 16 бит на канал. Таким образом, умножение 44100 на 32 дает 1411200 — битрейт несжатого цифрового звука компакт-диска. MP3 был разработан для кодирования данных со скоростью 1411 кбит/с со скоростью 320 кбит/с или меньше. Поскольку алгоритмы MP3 обнаруживают менее сложные фрагменты, можно использовать более низкие скорости передачи данных. При использовании MPEG-2 вместо MPEG-1 MP3 поддерживает только более низкие частоты дискретизации (16 000, 22 050 или 24 000 выборок в секунду) и предлагает выбор скорости передачи данных от 8 кбит/с, но не выше 160 кбит/с. Понижая частоту дискретизации, уровень III MPEG-2 удаляет все частоты выше половины новой частоты дискретизации, которые могли присутствовать в исходном аудио.

Как показано в этих двух таблицах, в стандарте MPEG-1 Audio Layer III разрешены 14 выбранных скоростей передачи данных: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 и 320 кбит. /с, а также три самые высокие доступные частоты дискретизации: 32, 44,1 и 48  кГц . [65] MPEG-2 Audio Layer III также допускает 14 несколько разных (и в основном более низких) скоростей передачи данных: 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160 кбит. /с с частотой дискретизации 16, 22,05 и 24  кГц , что ровно вдвое меньше, чем у MPEG-1. [65] Кадры MPEG-2.5 Audio Layer III ограничены только 8 битовыми скоростями: 8, 16, 24, 32, 40, 48, 56 и 64 кбит/с и тремя еще более низкими частотами дискретизации: 8, 11,025 и 12 кГц. . [ нужна цитата ] В более ранних системах, которые поддерживают только стандарт MPEG-1 Audio Layer III, файлы MP3 со скоростью передачи данных ниже 32 кбит/с могут воспроизводиться с ускорением и повышением тональности.

В более ранних системах также отсутствуют элементы управления быстрой перемоткой вперед и назад для воспроизведения MP3. [83] [84]

Кадры MPEG-1 содержат наибольшую детализацию в режиме 320 кбит/с, максимально допустимом значении скорости передачи данных, [85] при этом тишина и простые тональные сигналы по-прежнему требуют скорости 32 кбит/с. Кадры MPEG-2 могут захватывать воспроизведение звука с частотой до 12 кГц, необходимое для скорости до 160 кбит/с. Файлы MP3, созданные с помощью MPEG-2, не имеют полосы пропускания 20 кГц из-за теоремы выборки Найквиста-Шеннона . Воспроизведение частоты всегда строго меньше половины частоты дискретизации, а несовершенные фильтры требуют большего запаса на погрешность (уровень шума в зависимости от резкости фильтра), поэтому частота дискретизации 8 кГц ограничивает максимальную частоту до 4 кГц, а частота дискретизации 48 кГц Скорость ограничивает воспроизведение звука в формате MP3 до 24 кГц. MPEG-2 использует половину, а MPEG-2.5 — только четверть частоты дискретизации MPEG-1.

Для общей области воспроизведения человеческой речи полосы пропускания 5 512 Гц достаточно для получения отличных результатов (для голоса) с использованием частоты дискретизации 11 025 и кодирования VBR из 44 100 (стандартных) WAV-файлов. Для носителей английского языка средняя скорость составляет 41–42 кбит/с с настройкой -V 9,6, но это может варьироваться в зависимости от количества записанной тишины или скорости доставки (слов в минуту). Повторная выборка до 12 000 (полоса пропускания 6K) выбирается параметром LAME -V 9.4. Аналогично -V 9.2 выбирает частоту дискретизации 16 000 и результирующую фильтрацию нижних частот 8K. Более старые версии LAME и FFmpeg поддерживают только целочисленные аргументы для параметра выбора качества с переменной скоростью передачи данных. Параметр качества n.nnn (-V) документирован на сайте lame.sourceforge.net, но поддерживается только в LAME с новым селектором качества переменной скорости передачи данных VBR, а не средней скоростью передачи данных (ABR).

Частота дискретизации 44,1 кГц обычно используется для воспроизведения музыки, поскольку она также используется для аудио компакт-дисков , основного источника, используемого для создания файлов MP3. В Интернете используется большое разнообразие скоростей передачи данных. Обычно используется скорость передачи данных 128 кбит/с [86] при коэффициенте сжатия 11:1, что обеспечивает адекватное качество звука в относительно небольшом пространстве. Поскольку доступность полосы пропускания Интернета и размеры жестких дисков увеличились, широкое распространение получили более высокие скорости передачи данных до 320 кбит/с. Несжатый звук, хранящийся на аудио-CD, имеет скорость передачи данных 1411,2 кбит/с (16 бит/выборку × 44 100 выборок в секунду × 2 канала / 1000 бит/килобит), поэтому скорость передачи данных составляет 128, 160 и 192 кбит. /s представляют степени сжатия примерно 11:1, 9:1 и 7:1 соответственно.

Нестандартная скорость передачи данных до 640 кбит/с может быть достигнута с помощью кодера LAME и опции свободного формата, хотя немногие MP3-плееры могут воспроизводить эти файлы. Согласно стандарту ISO, декодеры должны иметь возможность декодировать только потоки со скоростью до 320 кбит/с. [87] [88] [89] Ранние кодеры MPEG Layer III использовали то, что сейчас называется постоянной скоростью передачи данных (CBR). Программное обеспечение могло использовать только одинаковую скорость передачи данных для всех кадров в файле MP3. Позже более сложные кодеры MP3 смогли использовать битовый резервуар для определения средней скорости передачи данных , выбирая скорость кодирования для каждого кадра в зависимости от сложности звука в этой части записи.

Более сложный кодер MP3 может воспроизводить звук с переменной скоростью передачи данных. Звук MPEG может использовать переключение скорости передачи данных для каждого кадра, но его должны поддерживать только декодеры уровня III. [65] [90] [91] [92] VBR используется, когда целью является достижение фиксированного уровня качества. Конечный размер файла при кодировании VBR менее предсказуем, чем при постоянной скорости передачи данных. Средняя скорость передачи данных — это тип VBR, реализованный как компромисс между ними: скорость передачи данных может варьироваться для более стабильного качества, но контролируется так, чтобы оставаться близкой к среднему значению, выбранному пользователем, для предсказуемых размеров файлов. Хотя декодер MP3 должен поддерживать VBR, чтобы соответствовать стандартам, исторически некоторые декодеры имели ошибки с декодированием VBR, особенно до того, как кодеры VBR получили широкое распространение. Самый совершенный MP3-кодер LAME поддерживает создание MP3-форматов VBR, ABR и даже более старых форматов CBR.

Аудио уровня III также может использовать «битовый резервуар», способность частично полного кадра хранить часть аудиоданных следующего кадра, что позволяет временно изменять эффективную скорость передачи данных даже в потоке с постоянной скоростью передачи данных. [65] [90] Внутренняя обработка битового резервуара увеличивает задержку кодирования. [ нужна ссылка ] Для частот выше приблизительно 16 кГц не существует коэффициента масштабирования в полосе 21 (sfb21)  , что вынуждает кодер выбирать между менее точным представлением в полосе 21 или менее эффективным хранением во всех полосах ниже полосы 21, что приводит к потере бита. скорость в кодировке VBR. [93]

Вспомогательные данные

Поле вспомогательных данных можно использовать для хранения пользовательских данных. Вспомогательные данные являются необязательными, и количество доступных бит явно не указывается. Вспомогательные данные располагаются после битов кода Хаффмана и находятся в диапазоне, на который указывает main_data_begin следующего кадра. Кодер mp3PRO использовал вспомогательные данные для кодирования дополнительной информации, которая могла улучшить качество звука при декодировании с помощью его алгоритма.

Метаданные

«Тег» в аудиофайле — это раздел файла, содержащий метаданные, такие как название, исполнитель, альбом, номер трека или другую информацию о содержимом файла. Стандарты MP3 не определяют форматы тегов для файлов MP3, а также не существует стандартного формата контейнера , который поддерживал бы метаданные и устранял бы необходимость в тегах. Однако де-факто существует несколько стандартов форматов тегов. По состоянию на 2010 год наиболее распространенными являются ID3v1 и ID3v2 , а совсем недавно представленный APEv2 . Эти теги обычно встраиваются в начало или конец файлов MP3 отдельно от фактических данных кадра MP3. Декодеры MP3 либо извлекают информацию из тегов, либо просто обрабатывают их как игнорируемые ненужные данные, не относящиеся к MP3.

Программное обеспечение для воспроизведения и редактирования часто содержит функции редактирования тегов, но существуют также приложения для редактирования тегов , предназначенные для этой цели. Помимо метаданных об аудиоконтенте, для DRM также могут использоваться теги . [94] ReplayGain — это стандарт измерения и сохранения громкости MP3-файла ( нормализация звука ) в его теге метаданных, позволяющий проигрывателю, совместимому с ReplayGain, автоматически регулировать общую громкость воспроизведения для каждого файла. MP3Gain можно использовать для обратимого изменения файлов на основе измерений ReplayGain, чтобы обеспечить корректное воспроизведение на проигрывателях без функции ReplayGain.

Лицензирование, право собственности и законодательство

Базовая технология декодирования и кодирования MP3 не имеет патентов в Европейском Союзе, срок действия всех патентов там истек не позднее 2012 года. В США 16 апреля 2017 года технология стала практически безпатентной (см. ниже). Срок действия патентов на MP3 истек в США в период с 2007 по 2017 год. В прошлом многие организации заявляли о своих правах на патенты , связанные с декодированием или кодированием MP3. Эти претензии привели к нескольким юридическим угрозам и действиям из различных источников. В результате в странах, где разрешены патенты на программное обеспечение , неопределенность относительно того, какие патенты должны быть лицензированы для создания продуктов MP3 без нарушения патентных прав, была обычным явлением на ранних этапах внедрения технологии.

Первоначальный почти полный стандарт MPEG-1 (части 1, 2 и 3) был общедоступен 6 декабря 1991 года как ISO CD 11172. [95] [96] В большинстве стран патенты не могут быть поданы после того, как был создан предшествующий уровень техники . Срок действия патентов истекает через 20 лет после первоначальной даты подачи заявки, а для заявок в других странах срок действия патентов может составлять до 12 месяцев. В результате срок действия патентов, необходимых для реализации MP3, истек в большинстве стран к декабрю 2012 года, через 21 год после публикации ISO CD 11172.

Исключением являются Соединенные Штаты, где патенты, действующие, но поданные до 8 июня 1995 г., истекают по истечении 17 лет с даты выдачи или 20 лет с даты приоритета. Длительный процесс выдачи патента может привести к тому, что патент будет выдан намного позже, чем обычно ожидается (см. Патенты на подводные лодки ). Срок действия различных патентов, связанных с MP3, истек в США в период с 2007 по 2017 год. [97] Патенты на что-либо, раскрытое в ISO CD 11172, поданные через год или более после его публикации, сомнительны. Если рассматривать только известные патенты на MP3, поданные к декабрю 1992 года, то декодирование MP3 является в США безпатентным с 22 сентября 2015 года, когда истек срок действия патента США 5 812 672 , поданный по процедуре PCT в октябре 1992 года. [98] [99] [100] Если принять за меру самый продолжительный патент, упомянутый в вышеупомянутых ссылках, то технология MP3 стала безпатентной в Соединенных Штатах 16 апреля 2017 года, когда патент США № 6,009,399 вступил в силу [98] [99 ] [100] 101] и администрируемый Technicolor , срок действия [102] истек. В результате многие проекты бесплатного программного обеспечения с открытым исходным кодом , такие как операционная система Fedora , решили начать поддержку MP3 по умолчанию, и пользователям больше не придется прибегать к установке неофициальных пакетов, поддерживаемых сторонними репозиториями программного обеспечения для MP3. воспроизведение или кодирование. [103]

Компания Technicolor (ранее называвшаяся Thomson Consumer Electronics) утверждала, что контролирует лицензирование MP3 по патентам уровня 3 во многих странах, включая США, Японию, Канаду и страны ЕС. [104] Technicolor активно защищала эти патенты. [105] Доходы от лицензий на MP3 от администрации Technicolor принесли Обществу Фраунгофера в 2005 году около 100 миллионов евро. [106] В сентябре 1998 года Институт Фраунгофера разослал письмо нескольким разработчикам программного обеспечения для MP3, в котором говорилось, что лицензия необходима для «распространения и /или продать декодеры и/или кодеры». В письме утверждалось, что нелицензионные продукты «нарушают патентные права Фраунгофера и Томсона. Чтобы производить, продавать или распространять продукты с использованием стандарта [MPEG Layer-3] и, следовательно, наших патентов, вам необходимо получить у нас лицензию по этим патентам». [107] Это привело к ситуации, когда проект кодировщика MP3 LAME не мог предложить своим пользователям официальные двоичные файлы, которые могли бы работать на их компьютерах. Позиция проекта заключалась в том, что в качестве исходного кода LAME был просто описанием того, как можно реализовать кодировщик MP3. Неофициально скомпилированные двоичные файлы были доступны из других источников.

Sisvel SpA, компания со штаб-квартирой в Люксембурге, управляет лицензиями на патенты, применимые к MPEG Audio. [108] Они вместе со своей дочерней компанией в США Audio MPEG, Inc. ранее подали в суд на Thomson за нарушение патентных прав на технологию MP3, [109] но эти споры были разрешены в ноябре 2005 года, когда Sisvel предоставила Thomson лицензию на свои патенты. Вскоре за этим последовала компания Motorola, которая подписала с Sisvel соглашение о лицензировании патентов, связанных с MP3, в декабре 2005 года . срок действия истек в феврале 2017 г.; Патент США № 5 850 456 , срок действия которого истек в феврале 2017 г.; и патент США № 5 960 037 , срок действия которого истек 9 апреля 2017 г. Примерно с первого квартала 2023 г. программа лицензирования Sisvel стала унаследованной. [112]

В сентябре 2006 года немецкие чиновники конфисковали MP3-плееры со стенда SanDisk на выставке IFA в Берлине после того, как итальянская патентная фирма выиграла судебный запрет от имени Sisvel против SanDisk в споре о лицензионных правах. Позднее судебный запрет был отменен берлинским судьей, [113] но эта отмена, в свою очередь, была заблокирована в тот же день другим судьей того же суда, что, по словам одного комментатора, «принесло в Германию Патентный Дикий Запад». [114] В феврале 2007 года компания Texas MP3 Technologies подала в суд на Apple, Samsung Electronics и Sandisk в федеральном суде восточного Техаса , заявив о нарушении патента на портативный MP3-плеер, который, по словам Texas MP3, был передан ему. Apple, Samsung и Sandisk урегулировали иски против них в январе 2009 года. [115] [116]

Alcatel-Lucent заявила в своих собственных судебных процессах несколько патентов на кодирование и сжатие MP3, предположительно унаследованных от AT&T-Bell Labs. В ноябре 2006 года, еще до слияния компаний, Alcatel подала в суд на Microsoft за нарушение семи патентов. 23 февраля 2007 года суд присяжных Сан-Диего присудил Alcatel-Lucent компенсацию в размере 1,52 миллиарда долларов США за нарушение двух из них. [117] Однако впоследствии суд отменил решение, установив, что один патент не был нарушен, а другой не принадлежал Alcatel-Lucent; Судья постановил, что совладельцами компании были AT&T и Фраунгофер, которые передали лицензию Microsoft . [118] Это решение защиты было оставлено без изменения в апелляционном порядке в 2008 году. [119]

Альтернативные технологии

Существуют и другие форматы с потерями. Среди них наиболее широко используется Advanced Audio Coding (AAC), который был разработан как преемник MP3. Существуют также другие форматы с потерями, такие как mp3PRO и MP2 . Они являются членами того же технологического семейства, что и MP3, и зависят от примерно аналогичных психоакустических моделей и алгоритмов MDCT. В то время как MP3 использует гибридный подход кодирования, который частично состоит из MDCT и частично из FFT , AAC представляет собой чисто MDCT, что значительно повышает эффективность сжатия. [120] Многие из основных патентов , лежащих в основе этих форматов, принадлежат Fraunhofer Society, Alcatel-Lucent, Thomson Consumer Electronics , [120] Bell , Dolby , LG Electronics , NEC , NTT Docomo , Panasonic , Sony Corporation , [121] ETRI , JVC Kenwood , Philips , Microsoft и NTT . [122]

Когда рынок цифровых аудиоплееров развивался, MP3 получил широкое распространение в качестве стандарта, отсюда и популярное название «MP3-плеер». Sony была исключением и использовала собственный кодек ATRAC, взятый из формата MiniDisc , который, по утверждению Sony, был лучше. [123] После критики и более низких, чем ожидалось, продаж Walkman , в 2004 году Sony впервые представила встроенную поддержку MP3 в своих плеерах Walkman. [124]

Существуют также открытые форматы сжатия, такие как Opus и Vorbis , которые доступны бесплатно и без каких-либо известных патентных ограничений. Некоторые из новых форматов сжатия звука, такие как AAC, WMA Pro, Vorbis и Opus, свободны от некоторых ограничений, присущих формату MP3, которые не может преодолеть ни один кодировщик MP3. [97] [125]

Помимо методов сжатия с потерями, форматы без потерь являются существенной альтернативой MP3, поскольку они обеспечивают неизмененный аудиоконтент, хотя и с увеличенным размером файла по сравнению со сжатием с потерями. К форматам без потерь относятся FLAC (бесплатный аудиокодек без потерь), Apple Lossless и многие другие.

Смотрите также

Рекомендации

  1. ^ ab «С Днем Рождения, MP3!». Фраунгофера ИИС. 12 июля 2005 г. Проверено 18 июля 2010 г.
  2. ^ Нильссон, М. (ноябрь 2000 г.). «Тип носителя audio/mpeg — RFC 3003». IETF. дои : 10.17487/RFC3003 . Проверено 7 декабря 2009 г. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  3. ^ Каснер, С.; Хошка, П. (июль 2003 г.). «Регистрация типа MIME форматов полезной нагрузки RTP — RFC 3555». IETF. дои : 10.17487/RFC3555 . Проверено 7 декабря 2009 г. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  4. ^ аб Финлейсон, Р. (февраль 2008 г.). «Более устойчивый к потерям формат полезной нагрузки RTP для аудио MP3 — RFC 5219». IETF. дои : 10.17487/RFC5219 . Проверено 4 декабря 2014 г. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  5. ^ "Команда mp3" . Фраунгофера ИИС . Проверено 12 июня 2020 г.
  6. ^ Патель К., Смит, Британская Колумбия, Роу, Лос-Анджелес (1 сентября 1993 г.). «Производительность программного видеодекодера MPEG». Материалы первой международной конференции ACM по мультимедиа-МУЛЬТИМЕДИА'93 . АКМ Мультимедиа. Нью-Йорк: Ассоциация вычислительной техники. стр. 75–82. дои : 10.1145/166266.166274. ISBN 978-0-89791-596-0. S2CID  3773268.Ссылка 3 в документе относится к проекту комитета стандарта ISO/IEC 11172 от 6 декабря 1991 г.
  7. ^ abcd «ISO/IEC 11172-3:1993 – Информационные технологии. Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с. Часть 3: Аудио». ИСО. 1993 год . Проверено 14 июля 2010 г.
  8. ^ abcd «ISO/IEC 13818-3:1995 – Информационные технологии. Общее кодирование движущихся изображений и связанной с ними аудиоинформации. Часть 3: Аудио». ИСО. 1995 . Проверено 14 июля 2010 г.
  9. ^ "Технология MP3 в Fraunhofer IIS" . Фраунгофера ИИС . Архивировано из оригинала 15 августа 2021 года . Проверено 12 июня 2020 г.
  10. ^ MP3 (кодирование звука MPEG Layer III) (Полный проект). Устойчивость цифровых форматов. Вашингтон, округ Колумбия: Библиотека Конгресса. 3 мая 2017 года . Проверено 1 декабря 2021 г.
  11. ^ «73. «Отец» MP3, Карлхайнц Бранденбург» - через www.youtube.com.
  12. ^ «К 20-летию MP3, интервью с «отцом» MP3, Карлхайнцем Бранденбургом» .
  13. ^ Джаянт, Никил ; Джонстон, Джеймс; Сафранек, Роберт (октябрь 1993 г.). «Сжатие сигналов на основе моделей человеческого восприятия». Труды IEEE . 81 (10): 1385–1422. дои : 10.1109/5.241504.
  14. ^ «MP3 (кодирование звука MPEG Layer III)» . Библиотека Конгресса. 27 июля 2017 года . Проверено 9 ноября 2017 г.
  15. ^ ab ISO (ноябрь 1991 г.). «Пресс-релиз MPEG, Курихама, ноябрь 1991 г.». ИСО. Архивировано из оригинала 3 мая 2011 года . Проверено 17 июля 2010 г.
  16. ^ abcde ISO (ноябрь 1991 г.). «CD 11172-3 – КОДИРОВАНИЕ ДВИЖУЩИХСЯ ИЗОБРАЖЕНИЙ И СООТВЕТСТВУЮЩЕГО АУДИО ДЛЯ ЦИФРОВЫХ НОСИТЕЛЕЙ СО СКОРОСТЬЮ ДО 1,5 МБИТ/С, ЧАСТЬ 3 АУДИО» (PDF) . Архивировано из оригинала (PDF) 30 декабря 2013 года . Проверено 17 июля 2010 г.
  17. ^ ab ISO (6 ноября 1992 г.). «Пресс-релиз MPEG, Лондон, 6 ноября 1992 г.». Кьярильоне. Архивировано из оригинала 12 августа 2010 года . Проверено 17 июля 2010 г.
  18. ^ abc ISO (октябрь 1998 г.). «Часто задаваемые вопросы по MPEG Audio, версия 9 – MPEG-1 и MPEG-2 BC». ИСО . Проверено 28 октября 2009 г.
  19. ^ Майер, Альфред Маршалл (1894). «Исследования по акустике». Философский журнал Лондона, Эдинбурга и Дублина . 37 (226): 259–288. дои : 10.1080/14786449408620544.
  20. ^ Эмер, Ричард Х. (1959). «Маскировка тонами и полосами шума». Журнал Акустического общества Америки . 31 (9): 1253. Бибкод : 1959ASAJ...31.1253E. дои : 10.1121/1.1907853.
  21. ^ Цвикер, Эберхард (1974). «О психоакустическом эквиваленте кривых настройки». Факты и модели в слушании. Связь и кибернетика. Том. 8. стр. 132–141. дои : 10.1007/978-3-642-65902-7_19. ISBN 978-3-642-65904-1.
  22. ^ Цвикер, Эберхард; Фельдткеллер, Ричард (1999) [1967]. Das Ohr als Nachrichtenempfänger [ Ухо как приемник сообщения ]. Пер. Ханнес Мюш, Сёрен Буус и Мэри Флорентайн. Архивировано из оригинала 14 сентября 2000 года . Проверено 29 июня 2008 г.
  23. ^ Флетчер, Харви (1995). Речь и слух в общении . Акустическое общество Америки. ISBN 978-1-56396-393-3.
  24. ^ abc Шредер, Манфред Р. (2014). «Лаборатории Белла». Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера . Спрингер. п. 388. ИСБН 978-3-319-05660-9.
  25. ^ Грей, Роберт М. (2010). «История цифровой речи в реальном времени в пакетных сетях: Часть II линейного прогнозирующего кодирования и интернет-протокола» (PDF) . Найденный. Процесс сигналов трендов . 3 (4): 203–303. дои : 10.1561/2000000036 . ISSN  1932-8346.
  26. ^ Атал, Б.; Шредер, М. (1978). «Прогнозирующее кодирование речевых сигналов и субъективные критерии ошибок». ИКАССП '78. Международная конференция IEEE по акустике, речи и обработке сигналов . Том. 3. С. 573–576. дои : 10.1109/ICASSP.1978.1170564.
  27. ^ Шредер, MR ; Атал, Б.С. ; Холл, Дж. Л. (декабрь 1979 г.). «Оптимизация цифровых кодеров речи путем использования маскирующих свойств человеческого уха». Журнал Акустического общества Америки . 66 (6): 1647. Бибкод : 1979ASAJ...66.1647S. дои : 10.1121/1.383662.
  28. ^ Краснер, Массачусетс (18 июня 1979 г.). Цифровое кодирование речи и аудиосигналов на основе перцептивных потребностей слуховой системы (Диссертация). Массачусетский Институт Технологий. hdl : 1721.1/16011.
  29. ^ Краснер, Массачусетс (18 июня 1979 г.). «Цифровое кодирование речи на основе перцептивных требований слуховой системы (технический отчет 535)» (PDF) . Архивировано (PDF) из оригинала 3 сентября 2017 года.
  30. ^ Ахмед, Насир (январь 1991 г.). «Как я придумал дискретное косинусное преобразование». Цифровая обработка сигналов . 1 (1): 4–5. дои : 10.1016/1051-2004(91)90086-Z.
  31. ^ Ахмед, Насир ; Натараджан, Т.; Рао, КР (январь 1974 г.), «Дискретное косинусное преобразование», Транзакции IEEE на компьютерах , C-23 (1): 90–93, doi : 10.1109/TC.1974.223784, S2CID  149806273
  32. ^ Рао, КР ; Йип, П. (1990), Дискретное косинусное преобразование: алгоритмы, преимущества, приложения , Бостон: Academic Press, ISBN 978-0-12-580203-1
  33. ^ Дж. П. Принсен, А. В. Джонсон и А. Б. Брэдли: Кодирование поддиапазонов/преобразований с использованием конструкций банка фильтров на основе отмены наложения псевдонимов во временной области , IEEE Proc. Международный Конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987 г.
  34. ^ Джон П. Принсен, Алан Б. Брэдли: Разработка банка фильтров анализа/синтеза на основе отмены наложения псевдонимов во временной области , IEEE Trans. Акуст. Обработка речевых сигналов, ASSP-34 (5), 1153–1161, 1986 г.
  35. ^ Аб Гукерт, Джон (весна 2012 г.). «Использование БПФ и MDCT в сжатии аудио MP3» (PDF) . Университет Юты . Проверено 14 июля 2019 г.
  36. ^ Терхардт, Э.; Столл, Г.; Зеванн, М. (март 1982 г.). «Алгоритм извлечения высоты тона и значимости тона из сложных тональных сигналов». Журнал Акустического общества Америки . 71 (3): 679. Бибкод : 1982ASAJ...71..679T. дои : 10.1121/1.387544.
  37. ^ ab «Голосовое кодирование для связи». Журнал IEEE по избранным областям коммуникаций . 6 (2). Февраль 1988 года.
  38. ^ abc Генезис стандарта кодирования аудио MP3 в транзакциях IEEE в бытовой электронике, IEEE, Vol. 52, №. 3, стр. 1043–1049, август 2006 г.
  39. ^ Бранденбург, Карлхайнц; Зейцер, Дитер (3–6 ноября 1988 г.). OCF: кодирование высококачественного звука со скоростью передачи данных 64 кбит/с. 85-й съезд Общества аудиоинженеров.
  40. ^ Джонстон, Джеймс Д. (февраль 1988 г.). «Преобразование кодирования аудиосигналов с использованием критериев перцептивного шума». Журнал IEEE по избранным областям коммуникаций . 6 (2): 314–323. дои : 10.1109/49.608.
  41. ^ Ю. Ф. Дехери и др. (1991) Исходный кодек MUSICAM для цифрового аудиовещания и хранения. Труды IEEE-ICASSP, 91 страница, 3605–3608, май 1991 г.
  42. ^ «Комментарий DAB от Алана Бокса, EZ Communication и председателя оперативной группы NAB DAB» (PDF) .
  43. ^ Компакт-диск EBU SQAM. Оценка качества звука. Записи материалов для субъективных тестов. 7 октября 2008 г.
  44. ^ аб Юинг, Джек (5 марта 2007 г.). «Как родился MP3». Блумберг БизнесУик . Проверено 24 июля 2007 г.
  45. ^ Витт, Стивен (2016). Как музыка стала бесплатной: конец индустрии, начало века и терпеливый ноль пиратства . Соединенные Штаты Америки: Penguin Books. п. 13. ISBN 978-0-14-310934-1. К Бранденбургу и Грилю присоединились еще четыре исследователя Фраунгофера. Хайнц Герхаузер руководил исследовательской группой в области аудио; Харальд Попп был специалистом по аппаратному обеспечению; Эрнст Эберляйн был экспертом по обработке сигналов; Юрген Херре был еще одним аспирантом, чье математическое мастерство не уступало Бранденбургу. В последующие годы эта группа будет называть себя «первоначальной шестеркой».
  46. Джонатан Стерн (17 июля 2012 г.). MP3: значение формата. Издательство Университета Дьюка. п. 178. ИСБН 978-0-8223-5287-7.
  47. ^ "Сюзанна Вега | Биография" . Официальное сообщество Сюзанны Веги . Проверено 17 января 2022 г.
  48. ^ Технология цифрового видео- и аудиовещания: Практическое инженерное руководство (сигналы и коммуникационные технологии) ISBN 3-540-76357-0 стр. 144: «В 1988 году метод MASCAM был разработан в Институте радиовещания (IRT) в Мюнхене в рамках подготовки к системе цифрового аудиовещания (DAB). Из MASCAM произошел MUSICAM (шаблон маскировки, универсальное интегрированное кодирование поддиапазонов и мультиплексирование). Метод был разработан в 1989 году в сотрудничестве с CCETT, Philips и Matsushita». 
  49. ^ «Отчет о состоянии ISO MPEG» (пресс-релиз). Международная Организация Стандартизации . Сентябрь 1990 г. Архивировано из оригинала 14 февраля 2010 г.
  50. ^ «Адаптивное спектрально-энтропийное кодирование Aspec высококачественных музыкальных сигналов». Электронная библиотека AES . 1991 год . Проверено 24 августа 2010 г.
  51. ^ «MP3: история инноваций и предательства». ЭНЕРГЕТИЧЕСКИЙ ЯДЕРНЫЙ РЕАКТОР . 23 марта 2011 года . Проверено 3 августа 2023 г.
  52. ^ MPEG (25 марта 1994 г.). «Утверждено на 26-м заседании (Париж)». Архивировано из оригинала 26 июля 2010 года . Проверено 5 августа 2010 г.
  53. ^ MPEG (11 ноября 1994 г.). «Одобрено на 29-м заседании». Архивировано из оригинала 8 августа 2010 года . Проверено 5 августа 2010 г.
  54. ^ ИСО. «ISO/IEC TR 11172-5:1998 – Информационные технологии. Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с. Часть 5: Программное моделирование» . Проверено 5 августа 2010 г.
  55. ^ «ISO/IEC TR 11172-5:1998 – Информационные технологии – Кодирование движущихся изображений и связанного с ними звука для цифровых носителей информации со скоростью примерно до 1,5 Мбит/с – Часть 5: Программное моделирование (Справочное программное обеспечение)» (ZIP) . Проверено 5 августа 2010 г.
  56. ^ Деери, Ив-Франсуа (1994). Стандарт высококачественного кодирования звука для радиовещательных, телекоммуникационных и мультимедийных систем . Нидерланды: Elsevier Science BV. стр. 53–64. ISBN 978-0-444-81580-4. В этой статье речь идет о рабочей станции сжатого цифрового аудио Musicam (MPEG Audio Layer II), реализованной на микрокомпьютере, используемой не только в качестве профессиональной станции редактирования, но и в качестве сервера в Ethernet для библиотеки сжатого цифрового аудио, что предвосхищает будущее MP3 в Интернете.
  57. ^ «Современные технологии MP3» . Много познавательной информации о музыке . 2005. Архивировано из оригинала 4 июля 2008 года . Проверено 15 сентября 2016 г.
  58. ^ Небесный музыкальный автомат на The Atlantic «Чтобы показать промышленности, как использовать кодек, MPEG собрал бесплатный образец программы, конвертирующей музыку в файлы MP3. Демонстрационное программное обеспечение создавало звук низкого качества, и Фраунгофер не намеревался его использовать. «Исходный код» программного обеспечения — лежащие в его основе инструкции — хранился на легкодоступном компьютере в Университете Эрлангена, с которого он был загружен неким SoloH, хакером из Нидерландов (и, как можно предположить, фанатом «Звездных войн»). SoloH обновил исходный код, чтобы создать программное обеспечение, преобразующее треки компакт-дисков в музыкальные файлы приемлемого качества». (2000)
  59. ^ Поп-идолы и пираты: механизмы потребления и глобальная циркуляция ... доктора Чарльза Фэйрчайлда
  60. ^ Технологии пиратства? - Исследование взаимодействия между коммерциализмом и идеализмом в развитии MP3 и DivX, ХЕНДРИК СТОРШТЕЙН СПИЛКЕР, СВЕЙН ХОЙЕР, стр. 2072
  61. ^ www.euronet.nl/~soloh/mpegEnc/ ( Archive.org )
  62. ^ ab «Принято на 22-м заседании WG11» (пресс-релиз). Международная Организация Стандартизации . 2 апреля 1993 года. Архивировано из оригинала 6 августа 2010 года . Проверено 18 июля 2010 г.
  63. ^ Бранденбург, Карлхайнц; Боси, Марина (февраль 1997 г.). «Обзор MPEG Audio: текущие и будущие стандарты кодирования звука с низкой скоростью передачи данных». Журнал Общества аудиоинженеров . 45 (1/2): 4–21 . Проверено 30 июня 2008 г.
  64. ^ abcd «Технические подробности MP3 (MPEG-2 и MPEG-2.5)» . Фраунгофера ИИС . Сентябрь 2007 г. Архивировано из оригинала 24 января 2008 г.«MPEG-2.5» — это название собственного расширения, разработанного Fraunhofer IIS. Он позволяет MP3 удовлетворительно работать при очень низких битрейтах и ​​вводит дополнительные частоты дискретизации 8 кГц, 11,025 кГц и 12 кГц.
  65. ^ abcdefghi Супурович, Предраг (22 декабря 1999 г.). «Заголовок аудиокадра MPEG» . Проверено 29 мая 2009 г.
  66. ^ abc «ISO/IEC 13818-3:1994(E) – Информационные технологии. Общее кодирование движущихся изображений и связанного с ними звука: аудио» (ZIP) . 11 ноября 1994 года . Проверено 4 августа 2010 г.
  67. ^ «Об архиве андеграундной музыки в Интернете» .
  68. Вайнилавичюс, Юстинас (15 ноября 2023 г.). «Winamp вернулся после обновления; вызывающее ностальгию выглядит нетронутым». киберньюс . Проверено 8 декабря 2023 г.
  69. ^ аб Шуберт, Рут (10 февраля 1999 г.). «Технически подкованные люди получают музыку за песню; индустрия разочарована тем, что Интернет делает бесплатную музыку простой» . Сиэтлский пост-разведчик . Проверено 22 ноября 2008 г.[ постоянная мертвая ссылка ]
  70. ^ Гислер, Маркус (2008). «Конфликт и компромисс: драма в эволюции рынка». Журнал потребительских исследований . 34 (6): 739–753. CiteSeerX 10.1.1.564.7146 . дои : 10.1086/522098. S2CID  145796529. 
  71. ^ abcd Бувинь, Габриэль (2003). «Технология MP3 — ограничения». Архивировано из оригинала 7 января 2011 года.
  72. ^ «ISO/IEC 11172-3:1993/Cor 1:1996». Международная Организация Стандартизации . 2006 год . Проверено 27 августа 2009 г.
  73. ^ Тейлор, Марк (июнь 2000 г.). «Технические часто задаваемые вопросы LAME» . Проверено 9 декабря 2023 г.
  74. ^ Либерман, Сербия. DSP — технология мультимедиа .
  75. Аморим, Роберто (3 августа 2003 г.). «Результаты публичного прослушивания расширения 128 кбит/с» . Проверено 17 марта 2007 г.
  76. ^ Марес, Себастьян (декабрь 2005 г.). «Результаты публичного теста прослушивания мультиформатов @ 128 кбит/с» . Проверено 17 марта 2007 г.
  77. Догерти, Дейл (1 марта 2009 г.). «Шипящие звуки музыки». О'Рейли Радар .
  78. ^ «Знакомьтесь с музыкальным ясновидящим, который находит призраков в ваших MP3-файлах» . ШУМНО . 18 марта 2015 г.
  79. ^ «Призраки в mp3». 15 марта 2015 года. Архивировано из оригинала 14 июня 2017 года . Проверено 25 апреля 2015 г.
  80. ^ «Потерянные и найденные: аспирант Университета Вирджинии обнаруживает призраков в MP3» . УВА сегодня . 23 февраля 2015 г.
  81. ^ Призрак в MP3
  82. ^ «Руководство по параметрам командной строки (в CVS)» . Проверено 4 августа 2010 г.
  83. ^ «Руководство по эксплуатации JVC RC-EX30» (PDF) (на нескольких языках). 2004. с. 14. Архивировано из оригинала (PDF) 20 августа 2020 г. Поиск – поиск нужной позиции на диске (только аудио компакт-диск).( бумбокс 2004 г. )
  84. ^ «Руководство по эксплуатации DV-RW250H, Великобритания» (PDF) . 2004. с. 33. • Перемотка вперед и обзорное воспроизведение не работают с MP3/WMA/JPEG-CD.
  85. ^ «Сравнение качества звука Hi-Res Audio, CD и MP3» . www.sony.com . Сони . Проверено 11 августа 2020 г. .
  86. ^ Вун-Сенг Ган; Сен-Мау Куо (2007). Встроенная обработка сигналов с помощью архитектуры Micro Signal. Wiley-IEEE Press . п. 382. ИСБН 978-0-471-73841-1.
  87. Бувинь, Габриэль (28 ноября 2006 г.). "Freeformat со скоростью 640 кбит/с и foobar2000, возможности?" . Проверено 15 сентября 2016 г.
  88. ^ «lame(1): создавать аудиофайлы в формате mp3 — справочная страница Linux». linux.die.net . Проверено 22 августа 2020 г.
  89. ^ "Онлайн-страницы руководства Linux - страницы руководства man.cx" . man.cx. _ Проверено 22 августа 2020 г.
  90. ^ ab «GPSYCHO – переменная скорость передачи данных». LAME MP3-кодер . Проверено 11 июля 2009 г.
  91. ^ «TwoLAME: MPEG Audio Layer II VBR» . Проверено 11 июля 2009 г.
  92. ^ Подгруппа аудио ISO MPEG. «Часто задаваемые вопросы по MPEG Audio, версия 9: MPEG-1 и MPEG-2 BC» . Проверено 11 июля 2009 г.
  93. ^ "ХРОМОЙ Y-переключатель" . База знаний Hydrogenaudio . Проверено 23 марта 2015 г.
  94. ^ Рэй, Кейси. «Метаданные и вы». Будущее музыкальной коалиции . Архивировано из оригинала 29 июня 2017 года . Проверено 12 декабря 2014 г.
  95. ^ Патель, Кетан; Смит, Брайан С.; Роу, Лоуренс А. Производительность программного декодера видео MPEG (PDF) . Конференция ACM Multimedia 1993.
  96. ^ «Часто задаваемые вопросы по MPEG, версия 3.1» . 14 мая 1994 года. Архивировано из оригинала 23 июля 2009 года.
  97. ^ ab «Большой список патентов на MP3 (и предполагаемые даты истечения срока действия)». мелодияквест . 26 февраля 2007 г.
  98. Коглиати, Джош (20 июля 2008 г.). «Патентный статус MPEG-1, H.261 и MPEG-2». Куро5хин .В этой работе не были рассмотрены разделения и продления патентов.
  99. ^ Патент США № 5812672.
  100. ^ «Срок действия патента США на MP3, MPEG-2, H.264» . OSNews.com.
  101. ^ «Способ и устройство для кодирования цифровых сигналов с использованием распределения битов с использованием комбинаций различных пороговых моделей для достижения желаемой скорости передачи данных».
  102. ^ "mp3licensing.com - Патенты" . mp3licensing.com .
  103. ^ «Полная поддержка MP3 скоро появится в Fedora» . 5 мая 2017 г.
  104. ^ «Сжатие акустических данных - базовый патент MP3» . Фонд свободной информационной инфраструктуры . 15 января 2005 г. Архивировано из оригинала 15 июля 2007 г. Проверено 24 июля 2007 г.
  105. ^ «Интеллектуальная собственность и лицензирование». Техниколор . Архивировано из оригинала 4 мая 2011 года.
  106. ^ Кистенфегер, Muzinée (июль 2007 г.). «Общество Фраунгофера (Fraunhofer-Gesellschaft, FhG)». Генеральное консульство Великобритании в Мюнхене. Архивировано из оригинала 18 августа 2002 года . Проверено 24 июля 2007 г.
  107. ^ «Ранняя защита патентов на MP3» . Информационный центр по леденящим душу эффектам . 1 сентября 1998 года. Архивировано из оригинала 19 августа 2014 года . Проверено 24 июля 2007 г.
  108. ^ «Программа лицензирования MPEG Audio SISVEL» .
  109. ^ «Аудио MPEG и Sisvel: на Thomson подан иск за нарушение патентных прав в Европе и США — MP3-плееры остановлены таможней» . ZDNet Индия . 6 октября 2005 г. Архивировано из оригинала 11 октября 2007 г. Проверено 24 июля 2007 г.
  110. ^ «предоставляет Motorola патентную лицензию на аудио MP3 и MPEG 2» . СИСВЕЛ. 21 декабря 2005 г. Архивировано из оригинала 21 января 2014 г. Проверено 18 января 2014 г.
  111. ^ «Патенты США на MPEG Audio» (PDF) . Сисвел. Архивировано из оригинала (PDF) 27 октября 2016 года . Проверено 7 апреля 2017 г.
  112. ^ «Программы лицензирования — устаревшие программы» . www.sisvel.com . Архивировано из оригинала 19 февраля 2023 года . Проверено 15 сентября 2023 г.
  113. Огг, Эрика (7 сентября 2006 г.). «Приказ об изъятии SanDisk MP3 отменен» . Новости CNET . Архивировано из оригинала 4 ноября 2012 года . Проверено 24 июля 2007 г.
  114. ^ «Sisvel приносит патент Дикого Запада в Германию» . Блог IPEG . 7 сентября 2006 г. Проверено 24 июля 2007 г.
  115. ^ "Apple, SanDisk Settle Texas, патент на MP3" . Закон об интеллектуальной собственности360 . 26 января 2009 года . Проверено 16 августа 2010 г.
  116. ^ «Профессионалы Baker Botts LLP: Лиза Кэтрин Келли — Представительские обязательства» . ТОО «Бейкер Боттс» . Архивировано из оригинала 10 декабря 2014 года . Проверено 15 сентября 2016 г.
  117. ^ «Microsoft грозит выплата MP3 в размере 1,5 миллиарда долларов» . Новости BBC . 22 февраля 2007 года . Проверено 30 июня 2008 г.
  118. ^ «Microsoft выигрывает отмену решения по патенту MP3» . CNET . 6 августа 2007 г. Проверено 17 августа 2010 г.
  119. ^ «Апелляционный суд по решению федерального округа» (PDF) . 25 сентября 2008 г. Архивировано из оригинала (PDF) 29 октября 2008 г.
  120. ^ аб Бранденбург, Карлхайнц (1999). «Объяснение MP3 и AAC». Архивировано из оригинала (PDF) 19 октября 2014 года.
  121. ^ «Через лицензирование объявляет об обновлении совместной патентной лицензии AAC» . Деловой провод . 5 января 2009 года . Проверено 18 июня 2019 г.
  122. ^ «Лицензиары AAC». Через Корп . Архивировано из оригинала 28 июня 2019 года . Проверено 6 июля 2019 г.
  123. Марриотт, Мишель (30 сентября 1999 г.). «NEWS WATCH; Новый плеер от Sony отдаст должное MP3» . Нью-Йорк Таймс .
  124. ^ "Сетевой Walkman Sony NW-E105" .
  125. ^ Жан-Марк Вален; Грегори Максвелл; Тимоти Б. Терриберри; Коэн Вос (октябрь 2013 г.). Высококачественное кодирование музыки с малой задержкой в ​​кодеке Opus . 135-я конференция AES. arXiv : 1602.04845 . Его CBR создает пакеты точно такого размера, который запрашивал кодер, без битового резервуара, который приводит к дополнительным задержкам буферизации, как это происходит в таких кодеках, как MP3 или AAC-LD. [...] [Тональный шум] наиболее заметен в MP3 с низким битрейтом.

дальнейшее чтение

Внешние ссылки