Сжатие данных

В теории информации сжатие данных , кодирование источника ^[1] или снижение скорости передачи данных — это процесс кодирования информации с использованием меньшего количества бит , чем исходное представление. ^[2] Любое конкретное сжатие является либо с потерями , либо без потерь . Сжатие без потерь уменьшает биты за счет выявления и устранения статистической избыточности . При сжатии без потерь информация не теряется. Сжатие с потерями уменьшает биты за счет удаления ненужной или менее важной информации. ^[3] Обычно устройство, которое выполняет сжатие данных, называют кодером, а то, которое выполняет обратный процесс (декомпрессию), — декодером.

Процесс уменьшения размера файла данных часто называют сжатием данных. В контексте передачи данных это называется кодированием источника: кодирование выполняется в источнике данных до того, как они будут сохранены или переданы. ^[4] Кодирование источника не следует путать с канальным кодированием , для обнаружения и исправления ошибок или линейным кодированием , средством отображения данных на сигнал.

Алгоритмы сжатия данных представляют собой компромисс сложности пространства и времени между байтами, необходимыми для хранения или передачи информации, и вычислительными ресурсами, необходимыми для выполнения кодирования и декодирования. Разработка схем сжатия данных включает балансировку степени сжатия, количества вносимых искажений (при использовании сжатия данных с потерями ) и вычислительных ресурсов или времени, необходимых для сжатия и распаковки данных. ^[5]

Без потерь

Алгоритмы сжатия данных без потерь обычно используют статистическую избыточность для представления данных без потери какой-либо информации , так что процесс является обратимым. Сжатие без потерь возможно, поскольку большинство реальных данных демонстрируют статистическую избыточность. Например, изображение может иметь области цвета, которые не меняются на протяжении нескольких пикселей; вместо кодирования «красный пиксель, красный пиксель, ...» данные могут быть закодированы как «279 красных пикселей». Это базовый пример кодирования длин серий ; существует множество схем для уменьшения размера файла путем устранения избыточности.

Методы сжатия Lempel –Ziv (LZ) являются одними из самых популярных алгоритмов для хранения без потерь. ^[6] DEFLATE — это вариация LZ, оптимизированная для скорости распаковки и степени сжатия ^[7] , но сжатие может быть медленным. В середине 1980-х годов, после работы Терри Уэлча , алгоритм Lempel–Ziv–Welch (LZW) быстро стал методом выбора для большинства систем сжатия общего назначения. LZW используется в изображениях GIF , программах, таких как PKZIP , и аппаратных устройствах, таких как модемы. ^[8] Методы LZ используют табличную модель сжатия, в которой записи таблицы заменяются повторяющимися строками данных. Для большинства методов LZ эта таблица генерируется динамически из более ранних данных во входных данных. Сама таблица часто кодируется по методу Хаффмана . Грамматические коды, подобные этому, могут сжимать сильно повторяющиеся входные данные чрезвычайно эффективно, например, биологические данные по одному и тому же или близкородственному виду, огромную коллекцию документов с версиями, интернет-архив и т. д. Основная задача грамматических кодов — построение контекстно-свободной грамматики, выводящей одну строку. Другие практические алгоритмы сжатия грамматики включают Sequitur и Re-Pair .

Самые сильные современные компрессоры без потерь используют вероятностные модели, такие как прогнозирование путем частичного сопоставления . Преобразование Барроуза-Уиллера также можно рассматривать как косвенную форму статистического моделирования. ^[9] В дальнейшем уточнении прямого использования вероятностного моделирования статистические оценки могут быть связаны с алгоритмом, называемым арифметическим кодированием . Арифметическое кодирование — это более современный метод кодирования, который использует математические вычисления конечного автомата для создания строки закодированных битов из серии входных символов данных. Он может достигать лучшего сжатия по сравнению с другими методами, такими как более известный алгоритм Хаффмана. Он использует внутреннее состояние памяти, чтобы избежать необходимости выполнять однозначное отображение отдельных входных символов в различные представления, которые используют целое число бит, и он очищает внутреннюю память только после кодирования всей строки символов данных. Арифметическое кодирование особенно хорошо применимо к задачам адаптивного сжатия данных, где статистика варьируется и зависит от контекста, поскольку его можно легко связать с адаптивной моделью распределения вероятностей входных данных. Ранний пример использования арифметического кодирования был в необязательной (но не широко используемой) функции стандарта кодирования изображений JPEG . ^[10] С тех пор оно применялось в различных других разработках, включая H.263 , H.264/MPEG-4 AVC и HEVC для кодирования видео. ^[11]

Архивное программное обеспечение обычно имеет возможность регулировать «размер словаря», где больший размер требует больше оперативной памяти во время сжатия и распаковки, но сжимает сильнее, особенно при повторяющихся шаблонах в содержимом файлов. ^[12]^[13]

Потерянный

В конце 1980-х годов цифровые изображения стали более распространенными, и появились стандарты сжатия изображений без потерь . В начале 1990-х годов стали широко использоваться методы сжатия с потерями. ^[14] В этих схемах допускается некоторая потеря информации, поскольку отбрасывание несущественных деталей может сэкономить место для хранения. Существует соответствующий компромисс между сохранением информации и уменьшением размера. Схемы сжатия данных с потерями разрабатываются на основе исследований того, как люди воспринимают рассматриваемые данные. Например, человеческий глаз более чувствителен к тонким изменениям яркости, чем к изменениям цвета. Сжатие изображений JPEG частично работает за счет округления несущественных битов информации. ^[15] Ряд популярных форматов сжатия используют эти перцептивные различия, включая психоакустику для звука и психовизуализацию для изображений и видео.

Большинство форм сжатия с потерями основаны на кодировании с преобразованием , особенно на дискретном косинусном преобразовании (DCT). Впервые оно было предложено в 1972 году Насиром Ахмедом , который затем разработал рабочий алгоритм с Т. Натараджаном и К. Р. Рао в 1973 году, прежде чем представить его в январе 1974 года. ^[16]^[17] DCT является наиболее широко используемым методом сжатия с потерями и используется в мультимедийных форматах для изображений (таких как JPEG и HEIF ), ^[18] видео (таких как MPEG , AVC и HEVC) и аудио (таких как MP3 , AAC и Vorbis ).

Сжатие изображений с потерями используется в цифровых камерах для увеличения емкости хранилища. Аналогично, DVD , Blu-ray и потоковое видео используют форматы кодирования видео с потерями . Сжатие с потерями широко используется в видео.

При сжатии звука с потерями методы психоакустики используются для удаления неслышимых (или менее слышимых) компонентов аудиосигнала . Сжатие человеческой речи часто выполняется с помощью еще более специализированных методов; кодирование речи выделяется как отдельная дисциплина из сжатия звука общего назначения. Кодирование речи используется в интернет-телефонии , например, сжатие звука используется для копирования компакт-дисков и декодируется аудиоплеерами. ^[9]

Сжатие с потерями может привести к потере генерации .

Теория

Теоретическая основа сжатия обеспечивается теорией информации и, более конкретно, теоремой Шеннона о кодировании источника ; доменно-специфические теории включают алгоритмическую теорию информации для сжатия без потерь и теорию скорости-искажения для сжатия с потерями. Эти области исследований были по существу созданы Клодом Шенноном , который опубликовал фундаментальные работы по этой теме в конце 1940-х и начале 1950-х годов. Другие темы, связанные со сжатием, включают теорию кодирования и статистический вывод . ^[19]

Машинное обучение

Существует тесная связь между машинным обучением и сжатием. Система, которая предсказывает апостериорные вероятности последовательности, учитывая всю ее историю, может использоваться для оптимального сжатия данных (используя арифметическое кодирование выходного распределения). И наоборот, оптимальный компрессор может использоваться для прогнозирования (находя символ, который сжимает лучше всего, учитывая предыдущую историю). Эта эквивалентность использовалась в качестве обоснования использования сжатия данных в качестве эталона для «общего интеллекта». ^[20]^[21]^[22]

Альтернативный взгляд может показать, что алгоритмы сжатия неявно отображают строки в неявные векторы пространства признаков , а меры подобия на основе сжатия вычисляют подобие в этих пространствах признаков. Для каждого компрессора C(.) мы определяем связанное векторное пространство ℵ, так что C(.) отображает входную строку x, соответствующую векторной норме ||~x||. Исчерпывающее исследование пространств признаков, лежащих в основе всех алгоритмов сжатия, исключается из-за нехватки пространства; вместо этого векторы признаков выбирают для проверки три репрезентативных метода сжатия без потерь: LZW, LZ77 и PPM. ^[23]

Согласно теории AIXI , связь, более прямо объясненная в премии Хуттера , наилучшее возможное сжатие x — это наименьшее возможное программное обеспечение, которое генерирует x. Например, в этой модели сжатый размер zip-файла включает как zip-файл, так и программное обеспечение для распаковки, поскольку вы не можете распаковать его без обоих, но может быть даже меньшая объединенная форма.

Примерами программного обеспечения для сжатия аудио/видео на базе ИИ являются NVIDIA Maxine , AIVC. ^[24] Примерами программного обеспечения, которое может выполнять сжатие изображений на базе ИИ, являются OpenCV , TensorFlow , MATLAB 's Image Processing Toolbox (IPT) и High-Fidelity Generative Image Compression. ^[25]

В неконтролируемом машинном обучении кластеризация k-средних может использоваться для сжатия данных путем группировки схожих точек данных в кластеры. Этот метод упрощает обработку обширных наборов данных, в которых отсутствуют предопределенные метки, и находит широкое применение в таких областях, как сжатие изображений . ^[26]

Сжатие данных направлено на уменьшение размера файлов данных, повышение эффективности хранения и ускорение передачи данных. Кластеризация k-средних, неконтролируемый алгоритм машинного обучения, используется для разбиения набора данных на определенное количество кластеров, k, каждый из которых представлен центроидом своих точек. Этот процесс уплотняет обширные наборы данных в более компактный набор репрезентативных точек. Особенно полезная при обработке изображений и сигналов , кластеризация k-средних помогает в сокращении данных, заменяя группы точек данных их центроидами, тем самым сохраняя основную информацию исходных данных и значительно уменьшая требуемое пространство для хранения. ^[27]

Большие языковые модели (LLM) также способны к сжатию данных без потерь, как продемонстрировано исследованием DeepMind с моделью Chinchilla 70B. Разработанная DeepMind, Chinchilla 70B эффективно сжимает данные, превосходя традиционные методы, такие как Portable Network Graphics (PNG) для изображений и Free Lossless Audio Codec (FLAC) для аудио. Она достигла сжатия данных изображений и аудио до 43,4% и 16,4% от их исходных размеров соответственно. ^[28]

Дифференциация данных

Сжатие данных можно рассматривать как частный случай дифференциации данных . ^[29]^[30] Дифференциация данных заключается в создании разницы при наличии источника и цели, с патчем, воспроизводящим цель при наличии источника и разницы. Поскольку в сжатии данных нет отдельного источника и цели, можно рассматривать сжатие данных как дифференциацию данных с пустыми исходными данными, сжатый файл соответствует разнице от нуля. Это то же самое, что рассматривать абсолютную энтропию (соответствующую сжатию данных) как частный случай относительной энтропии (соответствующей дифференциации данных) без исходных данных.

Термин «дифференциальное сжатие» используется для того, чтобы подчеркнуть связь между разностями данных.

Использует

Изображение

Энтропийное кодирование возникло в 1940-х годах с введением кодирования Шеннона-Фано ^[31] , которое легло в основу кодирования Хаффмана , разработанного в 1950 году . ^[32] Кодирование с преобразованием возникло в конце 1960-х годов с введением кодирования с быстрым преобразованием Фурье (БПФ) в 1968 году и преобразования Адамара в 1969 году. ^[33]

Важным методом сжатия изображений является дискретное косинусное преобразование (DCT), метод, разработанный в начале 1970-х годов. ^[16] DCT является основой для JPEG, формата сжатия с потерями , который был представлен Объединенной группой экспертов по фотографии (JPEG) в 1992 году. ^[34] JPEG значительно сокращает объем данных, необходимых для представления изображения, за счет относительно небольшого снижения качества изображения и стал наиболее широко используемым форматом файлов изображений . ^[35]^[36] Его высокоэффективный алгоритм сжатия на основе DCT в значительной степени способствовал широкому распространению цифровых изображений и цифровых фотографий . ^[37]

Lempel–Ziv–Welch (LZW) — алгоритм сжатия без потерь , разработанный в 1984 году. Он используется в формате GIF , представленном в 1987 году. ^[38] DEFLATE — алгоритм сжатия без потерь, представленный в 1996 году, используется в формате Portable Network Graphics (PNG). ^[39]

Сжатие вейвлетов , использование вейвлетов в сжатии изображений, началось после разработки кодирования DCT. ^[40] Стандарт JPEG 2000 был представлен в 2000 году. ^[41] В отличие от алгоритма DCT, используемого исходным форматом JPEG, JPEG 2000 вместо этого использует алгоритмы дискретного вейвлет-преобразования (DWT). ^[42]^[43]^[44] Технология JPEG 2000, которая включает расширение Motion JPEG 2000 , была выбрана в качестве стандарта кодирования видео для цифрового кино в 2004 году. ^[45]

Аудио

Сжатие аудиоданных, не путать с динамическим сжатием диапазона , имеет потенциал для снижения пропускной способности передачи и требований к хранению аудиоданных. Форматы сжатия аудио алгоритмы сжатия реализованы в программном обеспечении как аудиокодеки . Как при сжатии с потерями, так и без потерь избыточность информации снижается с использованием таких методов, как кодирование , квантование , DCT и линейное предсказание для уменьшения объема информации, используемой для представления несжатых данных.

Алгоритмы сжатия звука с потерями обеспечивают более высокую степень сжатия и используются в многочисленных аудиоприложениях, включая Vorbis и MP3 . Эти алгоритмы почти все полагаются на психоакустику для устранения или снижения точности менее слышимых звуков, тем самым уменьшая пространство, необходимое для их хранения или передачи. ^[2]^[46]

Приемлемый компромисс между потерей качества звука и размером передачи или хранения зависит от приложения. Например, один компакт-диск (CD) объемом 640 МБ вмещает приблизительно один час несжатой высококачественной музыки, менее 2 часов музыки, сжатой без потерь, или 7 часов музыки, сжатой в формате MP3 со средней скоростью передачи данных . Цифровой диктофон обычно может хранить около 200 часов ясной речи в 640 МБ. ^[47]

Сжатие звука без потерь создает представление цифровых данных, которое может быть декодировано в точную цифровую копию оригинала. Коэффициенты сжатия составляют около 50–60% от исходного размера, ^[48] что аналогично коэффициентам для общего сжатия данных без потерь. Кодеки без потерь используют подгонку кривой или линейное предсказание в качестве основы для оценки сигнала. Параметры, описывающие оценку и разницу между оценкой и фактическим сигналом, кодируются отдельно. ^[49]

Существует ряд форматов сжатия звука без потерь. См. список кодеков без потерь для получения списка. Некоторые форматы связаны с отдельной системой, например, Direct Stream Transfer , используемый в Super Audio CD и Meridian Lossless Packing , используемый в DVD-Audio , Dolby TrueHD , Blu-ray и HD DVD .

Некоторые форматы аудиофайлов представляют собой комбинацию формата с потерями и коррекции без потерь; это позволяет убрать коррекцию, чтобы легко получить файл с потерями. Такие форматы включают MPEG-4 SLS (Scalable to Lossless), WavPack и OptimFROG DualStream .

Когда аудиофайлы должны быть обработаны, либо путем дальнейшего сжатия, либо для редактирования , желательно работать с неизмененным оригиналом (несжатым или сжатым без потерь). Обработка файла, сжатого с потерями, для какой-либо цели обычно дает конечный результат, уступающий созданию того же сжатого файла из несжатого оригинала. Помимо редактирования или микширования звука, сжатие звука без потерь часто используется для архивного хранения или в качестве мастер-копий.

Сжатие звука с потерями

Сравнение спектрограмм аудио в несжатом формате и нескольких форматах с потерями. Спектрограммы с потерями показывают ограничение полосы более высоких частот, распространенный метод, связанный со сжатием аудио с потерями.

Сжатие звука с потерями используется в широком спектре приложений. В дополнение к автономным аудиоприложениям воспроизведения файлов в MP3-плеерах или компьютерах, цифровые сжатые аудиопотоки используются в большинстве видео DVD, цифровом телевидении, потоковом мультимедиа в Интернете , спутниковом и кабельном радио и все чаще в наземных радиопередачах. Сжатие с потерями обычно достигает гораздо большего сжатия, чем сжатие без потерь, отбрасывая менее важные данные на основе психоакустических оптимизаций. ^[50]

Психоакустика признает, что не все данные в аудиопотоке могут быть восприняты слуховой системой человека . Большинство сжатий с потерями уменьшают избыточность, сначала идентифицируя перцептивно нерелевантные звуки, то есть звуки, которые очень трудно услышать. Типичные примеры включают высокие частоты или звуки, которые возникают одновременно с более громкими звуками. Эти нерелевантные звуки кодируются с пониженной точностью или не кодируются вообще.

Из-за природы алгоритмов с потерями качество звука страдает от потери цифровой генерации при распаковке и повторном сжатии файла. Это делает сжатие с потерями непригодным для хранения промежуточных результатов в профессиональных приложениях аудиоинженерии, таких как редактирование звука и многодорожечная запись. Однако форматы с потерями, такие как MP3, очень популярны среди конечных пользователей, поскольку размер файла уменьшается до 5-20% от исходного размера, а мегабайт может хранить около минуты музыки с приемлемым качеством.

Было разработано несколько собственных алгоритмов сжатия с потерями, которые обеспечивают более высокое качество звука, используя комбинацию алгоритмов без потерь и с потерями с адаптивными битрейтами и более низкими коэффициентами сжатия. Примерами являются aptX , LDAC , LHDC , MQA и SCL6.

Методы кодирования

Чтобы определить, какая информация в аудиосигнале является перцептивно нерелевантной, большинство алгоритмов сжатия с потерями используют преобразования, такие как модифицированное дискретное косинусное преобразование (MDCT) для преобразования временной области выборочных форм волн в область преобразования, как правило, частотную область . После преобразования частоты компонентов могут быть расставлены по приоритетам в соответствии с тем, насколько они слышимы. Слышимость спектральных компонентов оценивается с использованием абсолютного порога слышимости и принципов одновременной маскировки — явления, при котором сигнал маскируется другим сигналом, разделенным частотой, — и, в некоторых случаях, временной маскировки — когда сигнал маскируется другим сигналом, разделенным временем. Контуры равной громкости также могут использоваться для взвешивания перцептивной важности компонентов. Модели комбинации человеческого уха и мозга, включающие такие эффекты, часто называются психоакустическими моделями . ^[51]

Другие типы компрессоров с потерями, такие как линейное предиктивное кодирование (LPC), используемое с речью, являются кодерами на основе источника. LPC использует модель человеческого голосового тракта для анализа звуков речи и выведения параметров, используемых моделью для их воспроизведения от момента к моменту. Эти изменяющиеся параметры передаются или сохраняются и используются для управления другой моделью в декодере, который воспроизводит звук.

Форматы с потерями часто используются для распространения потокового аудио или интерактивного общения (например, в сетях сотовой связи). В таких приложениях данные должны быть распакованы по мере их поступления, а не после передачи всего потока данных. Не все аудиокодеки могут использоваться для потоковых приложений. ^[50]

Задержка вводится методами, используемыми для кодирования и декодирования данных. Некоторые кодеки анализируют более длинный сегмент данных, называемый кадром , для оптимизации эффективности, а затем кодируют его таким образом, что для декодирования требуется больший сегмент данных за один раз. Внутренняя задержка алгоритма кодирования может быть критической; например, когда происходит двусторонняя передача данных, такая как телефонный разговор, значительные задержки могут серьезно ухудшить воспринимаемое качество.

В отличие от скорости сжатия, которая пропорциональна количеству операций, требуемых алгоритмом, здесь задержка относится к количеству сэмплов, которые должны быть проанализированы до обработки блока аудио. В минимальном случае задержка равна нулю сэмплов (например, если кодер/декодер просто уменьшает количество битов, используемых для квантования сигнала). Алгоритмы временной области, такие как LPC, также часто имеют низкие задержки, отсюда их популярность в кодировании речи для телефонии. Однако в таких алгоритмах, как MP3, для реализации психоакустической модели в частотной области необходимо проанализировать большое количество сэмплов, а задержка составляет порядка 23 мс.

Кодирование речи

Кодирование речи — важная категория сжатия аудиоданных. Перцептивные модели, используемые для оценки того, какие аспекты речи может слышать человеческое ухо, обычно несколько отличаются от тех, которые используются для музыки. Диапазон частот, необходимый для передачи звуков человеческого голоса, обычно гораздо уже, чем тот, который необходим для музыки, а звук обычно менее сложен. В результате речь может быть закодирована с высоким качеством, используя относительно низкую скорость передачи данных.

В общем случае это достигается путем сочетания двух подходов:

Кодирование только звуков, которые может воспроизвести один человеческий голос.
Отбрасывание большей части данных в сигнале — сохранение лишь того, что необходимо для восстановления «разборчивого» голоса, а не полного диапазона частот человеческого слуха .

Самыми ранними алгоритмами, использовавшимися при кодировании речи (и сжатии аудиоданных в целом), были алгоритм A-law и алгоритм μ-law .

История

Solidyne 922: первая в мире коммерческая звуковая карта с компрессией аудиоданных для ПК, 1990 г.

Ранние аудиоисследования проводились в Bell Labs . Там в 1950 году C. Chapin Cutler подал патент на дифференциальную импульсно-кодовую модуляцию (DPCM). ^[52] В 1973 году P. Cummiskey, Nikil S. Jayant и James L. Flanagan представили Adaptive DPCM (ADPCM) . ^[53]^[54]

Перцептивное кодирование впервые было использовано для сжатия кодирования речи с линейным предсказательным кодированием (LPC). ^[55] Первоначальные концепции LPC восходят к работе Фумитады Итакуры ( Университет Нагои ) и Шузо Сайто ( Nippon Telegraph and Telephone ) в 1966 году. ^[56] В 1970-х годах Бишну С. Атал и Манфред Р. Шредер в Bell Labs разработали форму LPC, называемую адаптивным предсказательным кодированием (APC), алгоритм перцептивного кодирования, который использовал маскирующие свойства человеческого уха, за которым в начале 1980-х годов последовал алгоритм линейного предсказания с кодовым возбуждением (CELP), который достиг значительной степени сжатия для своего времени. ^[55] Перцептивное кодирование используется современными форматами сжатия звука, такими как MP3 ^[55] и AAC .

Дискретное косинусное преобразование (DCT), разработанное Насиром Ахмедом , Т. Натараджаном и К. Р. Рао в 1974 году, ^[17] легло в основу модифицированного дискретного косинусного преобразования (MDCT), используемого в современных форматах сжатия звука, таких как MP3, ^[57] Dolby Digital , ^[58]^[59] и AAC. ^[60] MDCT было предложено Дж. П. Принсеном, А. В. Джонсоном и А. Б. Брэдли в 1987 году, ^[61] после более ранней работы Принсена и Брэдли в 1986 году. ^[62]

Первая в мире коммерческая система автоматизации вещания аудиокомпрессии была разработана Оскаром Бонелло, профессором инженерии в Университете Буэнос-Айреса . ^[63] В 1983 году, используя психоакустический принцип маскировки критических полос, впервые опубликованный в 1967 году, ^[64] он начал разрабатывать практическое приложение на основе недавно разработанного компьютера IBM PC , и система автоматизации вещания была запущена в 1987 году под названием Audicom . ^[65] 35 лет спустя почти все радиостанции в мире использовали эту технологию, произведенную рядом компаний, потому что изобретатель отказывается получать патенты на изобретения для своей работы. Он предпочитает объявить ее общедоступной и опубликовать ее ^[66]

В феврале 1988 года в журнале IEEE Journal on Selected Areas in Communications ( JSAC ) был опубликован сборник литературы по большому количеству систем аудиокодирования . Хотя в нем были и некоторые статьи, опубликованные до этого времени, в этом сборнике было задокументировано все многообразие готовых рабочих аудиокодеров, почти все из которых использовали перцепционные методы, а также какой-либо вид частотного анализа и бесшумного кодирования на заднем плане. ^[67]

Видео

Несжатое видео требует очень высокой скорости передачи данных . Хотя кодеки сжатия видео без потерь работают с коэффициентом сжатия от 5 до 12, типичное сжатое видео H.264 с потерями имеет коэффициент сжатия от 20 до 200. ^[68]

Два ключевых метода сжатия видео, используемых в стандартах видеокодирования, — это DCT и компенсация движения (MC). Большинство стандартов видеокодирования, таких как форматы H.26x и MPEG , обычно используют кодирование видео DCT с компенсацией движения (блочная компенсация движения). ^[69]^[70]

Большинство видеокодеков используются вместе с методами сжатия звука для хранения отдельных, но дополнительных потоков данных в виде одного объединенного пакета с использованием так называемых контейнерных форматов . ^[71]

Теория кодирования

Видеоданные могут быть представлены в виде серии неподвижных кадров изображения. Такие данные обычно содержат большое количество пространственной и временной избыточности . Алгоритмы сжатия видео пытаются уменьшить избыточность и хранить информацию более компактно.

Большинство форматов и кодеков сжатия видео используют как пространственную, так и временную избыточность (например, посредством кодирования различий с компенсацией движения ). Сходства могут быть закодированы только путем сохранения различий между, например, временно смежными кадрами (межкадровое кодирование) или пространственно смежными пикселями (внутрикадровое кодирование). Межкадровое сжатие (временное дельта-кодирование ) (повторно) использует данные из одного или нескольких более ранних или более поздних кадров в последовательности для описания текущего кадра. Внутрикадровое кодирование , с другой стороны, использует только данные из текущего кадра, фактически являясь сжатием неподвижного изображения. ^[51]

Форматы внутрикадрового видеокодирования, используемые в камкордерах и видеомонтаже, используют более простое сжатие, которое использует только внутрикадровое предсказание. Это упрощает программное обеспечение для видеомонтажа, поскольку предотвращает ситуацию, когда сжатый кадр ссылается на данные, которые редактор удалил.

Обычно сжатие видео дополнительно использует методы сжатия с потерями, такие как квантование , которые уменьшают аспекты исходных данных, которые (более или менее) не имеют отношения к человеческому визуальному восприятию, используя перцептивные особенности человеческого зрения. Например, небольшие различия в цвете воспринимаются сложнее, чем изменения яркости. Алгоритмы сжатия могут усреднять цвет по этим схожим областям способом, аналогичным тем, которые используются при сжатии изображений JPEG. ^[10] Как и при любом сжатии с потерями, существует компромисс между качеством видео и скоростью передачи данных , стоимостью обработки сжатия и декомпрессии и системными требованиями. Сильно сжатое видео может иметь видимые или отвлекающие артефакты .

Другие методы, отличные от распространенных форматов преобразования на основе DCT, такие как фрактальное сжатие , сопоставление преследования и использование дискретного вейвлет-преобразования (DWT), были предметом некоторых исследований, но обычно не используются в практических продуктах. Вейвлет-сжатие используется в кодерах неподвижных изображений и видеокодерах без компенсации движения. Интерес к фрактальному сжатию, похоже, ослабевает из-за недавнего теоретического анализа, показывающего сравнительную неэффективность таких методов. ^[51]

Межкадровое кодирование

При межкадровом кодировании отдельные кадры видеопоследовательности сравниваются от одного кадра к другому, и кодек сжатия видео записывает различия в опорный кадр. Если кадр содержит области, где ничего не перемещалось, система может просто выдать короткую команду, которая копирует эту часть предыдущего кадра в следующий. Если разделы кадра перемещаются простым образом, компрессор может выдать (немного более длинную) команду, которая сообщает декомпрессору о необходимости сдвига, поворота, осветления или затемнения копии. Эта более длинная команда все равно остается намного короче данных, сгенерированных внутрикадровым сжатием. Обычно кодер также передает остаточный сигнал, который описывает оставшиеся более тонкие различия в опорном изображении. При использовании энтропийного кодирования эти остаточные сигналы имеют более компактное представление, чем полный сигнал. В областях видео с большим движением сжатие должно кодировать больше данных, чтобы успевать за большим количеством пикселей, которые изменяются. Обычно во время взрывов, пламени, стай животных и в некоторых панорамных кадрах высокочастотная детализация приводит к снижению качества или увеличению переменного битрейта .

Гибридные форматы преобразования на основе блоков

Многие широко используемые методы сжатия видео (например, те, что в стандартах, одобренных ITU-T или ISO ) имеют одну и ту же базовую архитектуру, которая восходит к H.261 , стандартизированному ITU-T в 1988 году. Они в основном полагаются на DCT, применяемое к прямоугольным блокам соседних пикселей, и временное предсказание с использованием векторов движения , а также в настоящее время также на этап фильтрации в цикле.

На этапе прогнозирования применяются различные методы дедупликации и разностного кодирования, которые помогают декоррелировать данные и описывать новые данные на основе уже переданных данных.

Затем прямоугольные блоки оставшихся пиксельных данных преобразуются в частотную область. На основном этапе обработки с потерями данные частотной области квантуются, чтобы уменьшить информацию, которая не имеет отношения к человеческому визуальному восприятию.

На последнем этапе статистическая избыточность в значительной степени устраняется с помощью энтропийного кодера , который часто применяет ту или иную форму арифметического кодирования.

На дополнительном этапе фильтрации в цикле к реконструированному сигналу изображения могут быть применены различные фильтры. Вычисляя эти фильтры также внутри цикла кодирования, они могут помочь сжатию, поскольку их можно применять к эталонному материалу до того, как он будет использован в процессе предсказания, и ими можно управлять с использованием исходного сигнала. Наиболее популярным примером являются фильтры деблокирования , которые размывают артефакты блокирования из-за разрывов квантования на границах блоков преобразования.

История

В 1967 году А. Х. Робинсон и К. Черри предложили схему сжатия полосы пропускания с кодированием длины серии для передачи аналоговых телевизионных сигналов. ^[72] DCT, являющееся основополагающим для современного сжатия видео, ^[73] было введено Насиром Ахмедом , Т. Натараджаном и К. Р. Рао в 1974 году. ^[17]^[74]

H.261 , дебютировавший в 1988 году, коммерчески представил распространенную базовую архитектуру технологии сжатия видео. ^[75] Это был первый формат кодирования видео , основанный на сжатии DCT. ^[73] H.261 был разработан рядом компаний, включая Hitachi , PictureTel , NTT , BT и Toshiba . ^[76]

Самыми популярными стандартами кодирования видео, используемыми для кодеков, были стандарты MPEG . MPEG-1 был разработан Motion Picture Experts Group (MPEG) в 1991 году и был предназначен для сжатия видео с качеством VHS . В 1994 году ему на смену пришел MPEG-2 / H.262 , ^[75] который был разработан рядом компаний, в первую очередь Sony , Thomson и Mitsubishi Electric . ^[77] MPEG-2 стал стандартным видеоформатом для DVD и цифрового телевидения SD . ^[75] В 1999 году за ним последовал MPEG-4 / H.263 . ^[75] Он также был разработан рядом компаний, в первую очередь Mitsubishi Electric, Hitachi и Panasonic . ^[78]

H.264/MPEG-4 AVC был разработан в 2003 году рядом организаций, в первую очередь Panasonic, Godo Kaisha IP Bridge и LG Electronics . ^[79] AVC коммерчески представил современные контекстно-адаптивные алгоритмы двоичного арифметического кодирования (CABAC) и контекстно-адаптивного кодирования переменной длины (CAVLC). AVC является основным стандартом кодирования видео для дисков Blu-ray и широко используется веб-сайтами обмена видео и потоковыми интернет-сервисами, такими как YouTube , Netflix , Vimeo и iTunes Store , веб-программным обеспечением, таким как Adobe Flash Player и Microsoft Silverlight , а также различными трансляциями HDTV по наземному и спутниковому телевидению.

Генетика

Алгоритмы сжатия генетики — это последнее поколение алгоритмов без потерь, которые сжимают данные (обычно последовательности нуклеотидов) с использованием как обычных алгоритмов сжатия, так и генетических алгоритмов, адаптированных к определенному типу данных. В 2012 году группа ученых из Университета Джонса Хопкинса опубликовала алгоритм генетического сжатия, который не использует для сжатия референсный геном. HAPZIPPER был адаптирован для данных HapMap и достигает более чем 20-кратного сжатия (уменьшение размера файла на 95%), обеспечивая в 2–4 раза лучшее сжатие и требуя меньше вычислительных ресурсов, чем ведущие утилиты сжатия общего назначения. Для этого Чанда, Элхаик и Бадер представили кодирование на основе MAF (MAFE), которое снижает неоднородность набора данных путем сортировки SNP по частоте их минорных аллелей, тем самым гомогенизируя набор данных. ^[80] Другие алгоритмы, разработанные в 2009 и 2013 годах (DNAZip и GenomeZip), имеют коэффициент сжатия до 1200 раз, что позволяет хранить 6 миллиардов пар оснований диплоидных геномов человека в 2,5 мегабайтах (относительно эталонного генома или усредненного по многим геномам). ^[81]^[82] Для сравнения в компрессорах данных генетики/геномики см. ^[83]

Перспективы и неиспользованный в настоящее время потенциал

Подсчитано, что общий объем данных, хранящихся на мировых устройствах хранения, может быть дополнительно сжат с помощью существующих алгоритмов сжатия с оставшимся средним коэффициентом 4,5:1. ^[84] Подсчитано, что совокупный технологический потенциал мира по хранению информации обеспечивает 1300 эксабайт аппаратных цифр в 2007 году, но когда соответствующий контент оптимально сжимается, это составляет всего 295 эксабайт информации Шеннона . ^[85]

Смотрите также

Ссылки

^ Уэйд, Грэм (1994). Кодирование и обработка сигналов (2-е изд.). Cambridge University Press. стр. 34. ISBN 978-0-521-42336-6. Получено 22.12.2011 . Общая цель кодирования источника — использовать или устранить «неэффективную» избыточность в источнике PCM и тем самым добиться снижения общей скорости источника R.
^ ab Mahdi, OA; Mohammed, MA; Mohamed, AJ (ноябрь 2012 г.). «Реализация нового подхода к преобразованию сжатия звука в кодирование текста с помощью гибридной техники» (PDF) . International Journal of Computer Science Issues . 9 (6, No. 3): 53–59. Архивировано (PDF) из оригинала 20.03.2013 . Получено 6 марта 2013 г. .
^ Pujar, JH; Kadlaskar, LM (май 2010). "Новый метод сжатия и декомпрессии изображений без потерь с использованием методов кодирования Хаффмана" (PDF) . Журнал теоретических и прикладных информационных технологий . 15 (1): 18–23. Архивировано (PDF) из оригинала 24.05.2010.
^ Саломон, Дэвид (2008). Краткое введение в сжатие данных . Берлин: Springer. ISBN 9781848000728.
^ Танк, МК (2011). «Реализация алгоритма Лемпеля-ZIV для сжатия без потерь с использованием VHDL». Thinkquest 2010: Труды Первой международной конференции по контурам вычислительной техники . Берлин: Springer. стр. 275–283. doi :10.1007/978-81-8489-989-4_51. ISBN 978-81-8489-988-7.
^ Navqi, Saud; Naqvi, R.; Riaz, RA; Siddiqui, F. (апрель 2011 г.). «Оптимизированная конструкция RTL и реализация алгоритма LZW для приложений с высокой пропускной способностью» (PDF) . Electrical Review . 2011 (4): 279–285. Архивировано (PDF) из оригинала 2013-05-20.
^ Управление документами — Переносимый формат документов — Часть 1: PDF1.7 (1-е изд.). Adobe Systems Incorporated. 1 июля 2008 г.{{cite book}}: CS1 maint: дата и год ( ссылка )
^ Стивен, Вольфрам (2002). Новый вид науки. Шампейн, Иллинойс. С. 1069. ISBN 1-57955-008-8.{{cite book}}: CS1 maint: отсутствует местоположение издателя ( ссылка )
^ ab Mahmud, Salauddin (март 2012 г.). "Улучшенный метод сжатия данных для общих данных" (PDF) . International Journal of Scientific & Engineering Research . 3 (3): 2. Архивировано (PDF) из оригинала 2013-11-02 . Получено 6 марта 2013 г.
^ ab Lane, Tom. "Часто задаваемые вопросы по сжатию изображений JPEG, часть 1". Архивы часто задаваемых вопросов в Интернете . Independent JPEG Group . Получено 6 марта 2013 г.
^ GJ Sullivan ; J.-R. Ohm; W.-J. Han; T. Wiegand (декабрь 2012 г.). «Обзор стандарта высокоэффективного видеокодирования (HEVC)». Труды IEEE по схемам и системам для видеотехнологий . 22 (12). IEEE : 1649–1668. doi :10.1109/TCSVT.2012.2221191. S2CID 64404.
^ «Как выбрать оптимальные настройки архивации – WinRAR».
^ "(Установить метод сжатия) переключатель – 7zip". Архивировано из оригинала 2022-04-09 . Получено 2021-11-07 .
^ Вольфрам, Стивен (2002). Новый вид науки . Wolfram Media, Inc. стр. 1069. ISBN 978-1-57955-008-0.
^ Arcangel, Cory. "On Compression" (PDF) . Архивировано (PDF) из оригинала 2013-07-28 . Получено 6 марта 2013 .
^ ab Ahmed, Nasir (январь 1991). «Как я придумал дискретное косинусное преобразование». Цифровая обработка сигналов . 1 (1): 4–5. Bibcode : 1991DSP.....1....4A. doi : 10.1016/1051-2004(91)90086-Z.
^ abc Насир Ахмед ; Т. Натараджан; Камисетти Рамамохан Рао (январь 1974 г.). «Дискретное косинусное преобразование» (PDF) . IEEE Transactions on Computers . C-23 (1): 90–93. doi :10.1109/TC.1974.223784. S2CID 149806273. Архивировано (PDF) из оригинала 2016-12-08.
^ CCITT Study Group VIII и Joint Photographic Experts Group (JPEG) из ISO/IEC Joint Technical Committee 1/Subcommittee 29/Working Group 10 (1993), "Annex D – Arithmetic coding", Recommendation T.81: Digital Compression and Coding of Continuous-tone Still images – Requirements and guidelines (PDF) , стр. 54 и далее , дата обращения 07.11.2009{{citation}}: CS1 maint: числовые имена: список авторов ( ссылка )
^ Марак, Ласло. "О сжатии изображений" (PDF) . Университет Марн-ла-Валле. Архивировано из оригинала (PDF) 28 мая 2015 г. . Получено 6 марта 2013 г. .
^ Махони, Мэтт. «Обоснование для эталонного теста сжатия большого текста». Флоридский технологический институт . Получено 5 марта 2013 г.
^ Shmilovici A.; Kahiri Y.; Ben-Gal I.; Hauser S. (2009). «Измерение эффективности внутридневного рынка Forex с помощью универсального алгоритма сжатия данных» (PDF) . Computational Economics . 33 (2): 131–154. CiteSeerX 10.1.1.627.3751 . doi :10.1007/s10614-008-9153-3. S2CID 17234503. Архивировано (PDF) из оригинала 2009-07-09.
^ I. Ben-Gal (2008). «Об использовании мер сжатия данных для анализа надежных конструкций» (PDF) . IEEE Transactions on Reliability . 54 (3): 381–388. doi :10.1109/TR.2005.853280. S2CID 9376086.
^ D. Scully; Carla E. Brodley (2006). "Сжатие и машинное обучение: новый взгляд на векторы пространства признаков". Конференция по сжатию данных (DCC'06) . стр. 332. doi :10.1109/DCC.2006.13. ISBN 0-7695-2545-8. S2CID 12311412.
^ Гэри Эдкок (5 января 2023 г.). «Что такое сжатие видео с помощью ИИ?». massive.io . Получено 6 апреля 2023 г. .
^ Ментцер, Фабиан; Тодеричи, Джордж; Тшаннен, Майкл; Агустссон, Эйрикур (2020). «Высокоточная генеративная компрессия изображений». arXiv : 2006.09965 [eess.IV].
^ "Что такое неконтролируемое обучение? | IBM". www.ibm.com . 23 сентября 2021 г. . Получено 2024-02-05 .
^ "Дифференциально частная кластеризация для крупномасштабных наборов данных". blog.research.google . 2023-05-25 . Получено 2024-03-16 .
^ Эдвардс, Бендж (28.09.2023). «Модели языка ИИ могут превзойти PNG и FLAC по сжатию без потерь, говорится в исследовании». Ars Technica . Получено 07.03.2024 .
^ Корн, Д.; и др. (Июль 2002 г.). "RFC 3284: VCDIFF Generic Differencing and Compression Data Format". Internet Engineering Task Force . Получено 5 марта 2013 г.
^ Korn, DG; Vo, KP (1995). B. Krishnamurthy (ред.). Vdelta: Differencing and Compression . Practical Reusable Unix Software. Нью-Йорк: John Wiley & Sons, Inc.
^ Клод Элвуд Шеннон (1948). Alcatel-Lucent (ред.). "Математическая теория связи" (PDF) . Bell System Technical Journal . 27 (3–4): 379–423, 623–656. doi :10.1002/j.1538-7305.1948.tb01338.x. hdl : 11858/00-001M-0000-002C-4314-2 . Архивировано (PDF) из оригинала 24.05.2011 . Получено 21.04.2019 .
^ Дэвид Альберт Хаффман (сентябрь 1952 г.), «Метод построения кодов с минимальной избыточностью» (PDF) , Труды IRE , т. 40, № 9, стр. 1098–1101, doi :10.1109/JRPROC.1952.273898, архивировано (PDF) из оригинала 08.10.2005 г.
^ Pratt, WK; Kane, J.; Andrews, HC (1969). «Кодирование изображений с преобразованием Адамара». Труды IEEE . 57 : 58–68. doi :10.1109/PROC.1969.6869.
^ "T.81 – ЦИФРОВОЕ СЖАТИЕ И КОДИРОВАНИЕ НЕПРЕРЫВНЫХ ТОНАЛЬНЫХ ИЗОБРАЖЕНИЙ – ТРЕБОВАНИЯ И РУКОВОДСТВО" (PDF) . CCITT . Сентябрь 1992 . Получено 12 июля 2019 .
^ "Объяснение формата изображения JPEG". BT.com . BT Group . 31 мая 2018 г. Архивировано из оригинала 5 августа 2019 г. Получено 5 августа 2019 г.
^ Баранюк, Крис (15 октября 2015 г.). «Защита от копирования может появиться в JPEG». BBC News . BBC . Получено 13 сентября 2019 г. .
^ «Что такое JPEG? Невидимый объект, который вы видите каждый день». The Atlantic . 24 сентября 2013 г. Получено 13 сентября 2019 г.
^ "Противоречие GIF: точка зрения разработчика программного обеспечения". 27 января 1995 г. Получено 26 мая 2015 г.
^ L. Peter Deutsch (май 1996 г.). DEFLATE Compressed Data Format Specification версии 1.3. IETF . стр. 1. раздел. Аннотация. doi : 10.17487/RFC1951 . RFC 1951. Получено 23.04.2014 .
^ Хоффман, Рой (2012). Сжатие данных в цифровых системах. Springer Science & Business Media . стр. 124. ISBN 9781461560319. По сути, вейвлет-кодирование представляет собой вариант кодирования с преобразованием на основе DCT, который уменьшает или устраняет некоторые из его ограничений. (...) Еще одним преимуществом является то, что вместо работы с блоками пикселей 8 × 8, как это делают JPEG и другие блочные методы DCT, вейвлет-кодирование может одновременно сжимать все изображение.
^ Таубман, Дэвид; Марселлин, Майкл (2012). Основы, стандарты и практика сжатия изображений JPEG2000: Основы, стандарты и практика сжатия изображений. Springer Science & Business Media . ISBN 9781461507994.
^ Unser, M.; Blu, T. (2003). «Математические свойства вейвлет-фильтров JPEG2000». IEEE Transactions on Image Processing . 12 (9): 1080–1090. Bibcode : 2003ITIP...12.1080U. doi : 10.1109/TIP.2003.812329. PMID 18237979. S2CID 2765169.
^ Салливан, Гэри (8–12 декабря 2003 г.). «Общие характеристики и соображения по проектированию для временного поддиапазонного видеокодирования». ITU-T . Группа экспертов по кодированию видео . Получено 13 сентября 2019 г. .
^ Бовик, Алан С. (2009). Основное руководство по обработке видео. Academic Press . стр. 355. ISBN 9780080922508.
^ Шварц, Чарльз С. (2005). Понимание цифрового кино: профессиональный справочник. Тейлор и Фрэнсис . стр. 147. ISBN 9780240806174.
^ Каннингем, Стюарт; МакГрегор, Иэн (2019). «Субъективная оценка музыки, сжатой с помощью кодека ACER, по сравнению с AAC, MP3 и несжатой PCM». Международный журнал цифрового мультимедийного вещания . 2019 : 1–16. doi : 10.1155/2019/8265301 .
^ Цифровой речевой диктофон Olympus WS-120, согласно его руководству, может хранить около 178 часов аудиозаписи речевого качества в формате .WMA на флэш-памяти объемом 500 МБ.
^ Коулсон, Джош. "Сравнение FLAC" . Получено 23 августа 2020 г.
^ "Обзор формата" . Получено 2020-08-23 .
^ аб Джайсвал, RC (2009). Аудио-Видеотехника . Пуна, Махараштра: Нирали Пракашан. п. 3.41. ISBN 9788190639675.
^ abc Faxin Yu; Hao Luo; Zheming Lu (2010). Анализ и обработка трехмерных моделей . Берлин: Springer. стр. 47. ISBN 9783642126512.
^ Патент США 2605361, C. Chapin Cutler, «Дифференциальное квантование сигналов связи», выдан 29 июля 1952 г.
^ Каммиски, П.; Джайант, Н.С.; Фланаган, Дж.Л. (1973). «Адаптивное квантование в дифференциальном кодировании речи PCM». Bell System Technical Journal . 52 (7): 1105–1118. doi :10.1002/j.1538-7305.1973.tb02007.x.
^ Cummiskey, P.; Jayant, Nikil S.; Flanagan, JL (1973). «Адаптивное квантование в дифференциальном кодировании PCM речи». The Bell System Technical Journal . 52 (7): 1105–1118. doi :10.1002/j.1538-7305.1973.tb02007.x. ISSN 0005-8580.
^ abc Шредер, Манфред Р. (2014). "Bell Laboratories". Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера . Springer. стр. 388. ISBN 9783319056609.
^ Грей, Роберт М. (2010). «История цифровой речи в реальном времени в пакетных сетях: часть II линейного предиктивного кодирования и интернет-протокола» (PDF) . Найдено. Trends Signal Process . 3 (4): 203–303. doi : 10.1561/2000000036 . ISSN 1932-8346. Архивировано (PDF) из оригинала 2010-07-04.
^ Guckert, John (весна 2012 г.). «Использование FFT и MDCT в сжатии аудио MP3» (PDF) . University of Utah . Архивировано (PDF) из оригинала 2014-01-24 . Получено 14 июля 2019 г. .
^ Луо, Фа-Лонг (2008). Стандарты мобильного мультимедийного вещания: технология и практика. Springer Science & Business Media . стр. 590. ISBN 9780387782638.
^ Британак, В. (2011). «О свойствах, отношениях и упрощенной реализации банков фильтров в стандартах аудиокодирования Dolby Digital (Plus) AC-3». Труды IEEE по обработке звука, речи и языка . 19 (5): 1231–1241. doi :10.1109/TASL.2010.2087755. S2CID 897622.
^ Бранденбург, Карлхайнц (1999). "MP3 и AAC Explained" (PDF) . Архивировано (PDF) из оригинала 2017-02-13.
^ Princen, J.; Johnson, A.; Bradley, A. (1987). «Кодирование подполос/преобразований с использованием конструкций банка фильтров на основе отмены наложения спектров во временной области». ICASSP '87. Международная конференция IEEE по акустике, речи и обработке сигналов . Том 12. С. 2161–2164. doi :10.1109/ICASSP.1987.1169405. S2CID 58446992.
^ Принсен, Дж.; Брэдли, А. (1986). «Проект банка фильтров анализа/синтеза на основе отмены наложения спектров во временной области». Труды IEEE по акустике, речи и обработке сигналов . 34 (5): 1153–1161. doi :10.1109/TASSP.1986.1164954.
^ "Рикардо Саметбанд, газета La Nación "Historia de un pionero en audio digital"" (на испанском языке).
^ Цвикер, Эберхард и др. (1967). Ухо как приемник связи. Мелвилл, Нью-Йорк: Акустическое общество Америки. Архивировано из оригинала 2000-09-14 . Получено 2011-11-11 .
^ "Summary of some of Solidyne's experiences to Broadcast Engineering". Краткая история Solidyne . Буэнос-Айрес: Solidyne. Архивировано из оригинала 8 марта 2013 года . Получено 6 марта 2013 года .
^ "Anuncio del Audicom, AES Journal, июль-август 1992 г., том 40, № 7/8, стр. 647" .
^ "Возможности сжатия файлов". Краткое руководство по сжатию файла четырьмя различными способами . 17 февраля 2017 г.
^ Дмитрий Ватолин и др. (Graphics & Media Lab Video Group) (март 2007 г.). Lossless Video Codecs Comparison '2007 (PDF) (Отчет). Московский государственный университет. Архивировано (PDF) из оригинала 2008-05-15.
^ Чен, Цзе; Кок, Ут-Ва; Лю, К. Дж. Рэй (2001). Проектирование систем цифрового кодирования видео: комплексный подход к сжатым доменам. CRC Press . стр. 71. ISBN 9780203904183.
^ Ли, Цзянь Пин (2006). Труды Международной компьютерной конференции 2006 года по технологии вейвлет-активных медиа и обработке информации: Чунцин, Китай, 29-31 августа 2006 г. World Scientific . стр. 847. ISBN 9789812709998.
^ "Video Coding". Сайт CSIP . Центр обработки сигналов и информации, Технологический институт Джорджии. Архивировано из оригинала 23 мая 2013 года . Получено 6 марта 2013 года .
^ Робинсон, AH; Черри, C. (1967). "Результаты прототипа схемы сжатия полосы пропускания телевидения". Труды IEEE . 55 (3). IEEE : 356–364. doi :10.1109/PROC.1967.5493.
^ ab Ghanbari, Mohammed (2003). Стандартные кодеки: сжатие изображений для усовершенствованного кодирования видео. Институт инженерии и технологий . стр. 1–2. ISBN 9780852967102.
^ Ридер, Клифф (2016-08-31). "Патентный ландшафт для кодирования видео без уплаты роялти". В Tescher, Andrew G (ред.). Applications of Digital Image Processing XXXIX . Applications of Digital Image Processing XXXIX. Vol. 9971. Сан-Диего, Калифорния: Общество инженеров фотооптической аппаратуры. стр. 99711B. Bibcode : 2016SPIE.9971E..1BR. doi : 10.1117/12.2239493. Архивировано из оригинала 2016-12-08.Запись лекции, с 3:05:10.
^ abcd «Инфографика истории форматов видеофайлов — RealPlayer». 22 апреля 2012 г.
^ "Декларация о патентном заявлении зарегистрирована как H261-07". ITU . Получено 11 июля 2019 г. .
^ "MPEG-2 Patent List" (PDF) . MPEG LA . Архивировано (PDF) из оригинала 2019-05-29 . Получено 7 июля 2019 .
^ "MPEG-4 Visual - Список патентов" (PDF) . MPEG LA . Архивировано (PDF) из оригинала 2019-07-06 . Получено 6 июля 2019 .
^ "AVC/H.264 – Список патентов" (PDF) . MPEG LA . Получено 6 июля 2019 г. .
^ Чанда П., Бадер Дж. С., Элхаик Э. (27 июля 2012 г.). «HapZipper: обмен популяциями HapMap стал проще». Nucleic Acids Research . 40 (20): e159. doi :10.1093/nar/gks709. PMC 3488212. PMID 22844100 .
^ Christley S, Lu Y, Li C, Xie X (15 января 2009 г.). «Человеческие геномы как вложения электронной почты». Биоинформатика . 25 (2): 274–5. doi : 10.1093/bioinformatics/btn582 . PMID 18996942.
^ Павличин Д.С., Вайсман Т., Йона Г. (сентябрь 2013 г.). «Геном человека снова сокращается». Биоинформатика . 29 (17): 2199–202. doi : 10.1093/bioinformatics/btt362 . PMID 23793748.
^ Хоссейни, Мортеза; Пратас, Диого; Пиньо, Армандо (2016). «Обзор методов сжатия данных для биологических последовательностей». Информация . 7 (4): 56. doi : 10.3390/info7040056 .
^ «Сжатие данных посредством логического синтеза» (PDF) .
^ Хильберт, Мартин; Лопес, Присцила (1 апреля 2011 г.). «Технологические возможности мира по хранению, передаче и вычислению информации». Science . 332 (6025): 60–65. Bibcode :2011Sci...332...60H. doi : 10.1126/science.1200970 . PMID 21310967. S2CID 206531385.

Внешние ссылки

«Часть 3: Сжатие видео», Основы сжатия данных
Пьер Ларбье, «Использование 10-битного кодирования AVC/H.264 с 4:2:2 для трансляции», Ateme, архивировано с оригинала 2009-09-05
Почему 10-битный формат экономит полосу пропускания (даже если контент 8-битный)? на Wayback Machine (архив 2017-08-30)
Какую технологию сжатия следует использовать? на Wayback Machine (архив 2017-08-30)
Введение в теорию сжатия (PDF) , Wiley, архив (PDF) из оригинала 2007-09-28
Субъективные тесты прослушивания EBU на аудиокодеках с низким битрейтом
Руководство по архивированию аудио: музыкальные форматы (Руководство, помогающее пользователю выбрать правильный кодек)
Введение в сжатие видео MPEG 1&2 (формат PDF) на Wayback Machine (архивировано 28 сентября 2007 г.)
сравнение вики с hydroaudio
Введение в сжатие данных, Гай Э. Блеллок из CMU
Объяснение метода сжатия сигнала без потерь, используемого большинством кодеков
Videsignline – Введение в сжатие видео на Wayback Machine (архив 2010-03-15)
Технология сокращения объема данных в Wayback Machine (архив 2013-05-27)
Что такое кодирование длины серии при сжатии видео?