stringtranslate.com

Сжатие изображения

Сжатие изображений — это тип сжатия данных , применяемый к цифровым изображениям с целью снижения затрат на их хранение или передачу . Алгоритмы могут использовать преимущества визуального восприятия и статистические свойства данных изображения для обеспечения превосходных результатов по сравнению с обычными методами сжатия данных , которые используются для других цифровых данных. [1]

Сравнение изображений JPEG , сохраненных в Adobe Photoshop, с разными уровнями качества, с функцией «Сохранить для Интернета» или без нее.

Сжатие изображений с потерями и без потерь

Сжатие изображений может быть с потерями или без потерь . Сжатие без потерь предпочтительнее для архивных целей и часто для медицинских изображений, технических чертежей, картинок или комиксов. Методы сжатия с потерями, особенно при использовании на низких скоростях передачи данных , приводят к появлению артефактов сжатия . Методы с потерями особенно подходят для естественных изображений, таких как фотографии, в приложениях, где незначительная (иногда незаметная) потеря точности приемлема для достижения существенного снижения скорости передачи данных. Сжатие с потерями, которое дает незначительные различия, можно назвать сжатием без визуальных потерь.

Методы сжатия с потерями :

Методы сжатия без потерь :

Другие объекты недвижимости

Наилучшее качество изображения при заданной степени сжатия (или битрейте ) — основная цель сжатия изображений, однако существуют и другие важные свойства схем сжатия изображений:

Масштабируемость обычно означает снижение качества, достигаемое путем манипулирования битовым потоком или файлом (без распаковки и повторного сжатия). Другие названия масштабируемости — прогрессивное кодирование или встроенные потоки битов . Несмотря на свою противоположную природу, масштабируемость также можно обнаружить в кодеках без потерь, обычно в форме сканирования пикселей от грубого до мелкого. Масштабируемость особенно полезна для предварительного просмотра изображений во время их загрузки (например, в веб-браузере) или для обеспечения доступа с переменным качеством, например, к базам данных. Существует несколько типов масштабируемости:

Кодирование области интереса . Некоторые части изображения кодируются с более высоким качеством, чем другие. Это можно комбинировать с масштабируемостью (сначала кодируйте эти части, а потом другие).

Метаинформация . Сжатые данные могут содержать информацию об изображении, которую можно использовать для категоризации, поиска или просмотра изображений. Такая информация может включать статистику цвета и текстуры, небольшие изображения предварительного просмотра , а также информацию об авторе или авторских правах.

Вычислительная мощность . Алгоритмы сжатия требуют разной вычислительной мощности для кодирования и декодирования. Некоторые алгоритмы высокого сжатия требуют высокой вычислительной мощности.

Качество метода сжатия часто измеряется пиковым отношением сигнал/шум . Он измеряет количество шума, возникающего в результате сжатия изображения с потерями, однако субъективное мнение зрителя также считается важной мерой, возможно, самой важной.

История

Энтропийное кодирование началось в конце 1940-х годов с введением кодирования Шеннона-Фано , [8] основы кодирования Хаффмана , которое было опубликовано в 1952 году . [9] Кодирование с преобразованием восходит к концу 1960-х годов, с введением быстрого преобразования Фурье ( БПФ) кодирование в 1968 году и преобразование Адамара в 1969 году . [10]

Важным достижением в области сжатия данных изображений стало дискретное косинусное преобразование (DCT), метод сжатия с потерями , впервые предложенный Насиром Ахмедом , Т. Натараджаном и К. Р. Рао в 1973 году. [11] JPEG был представлен Объединенной группой экспертов по фотографии (JPEG). в 1992 году. [12] JPEG сжимает изображения до файлов гораздо меньшего размера и стал наиболее широко используемым форматом файлов изображений . [13] JPEG во многом способствовал широкому распространению цифровых изображений и цифровых фотографий : [14] по состоянию на 2015 год ежедневно создавалось несколько миллиардов изображений JPEG. [15]

Lempel-Ziv-Welch (LZW) — алгоритм сжатия без потерь, разработанный Авраамом Лемпелем , Джейкобом Зивом и Терри Уэлчем в 1984 году. Он используется в формате GIF , представленном в 1987 году . [16] DEFLATE — алгоритм сжатия без потерь, разработанный Филом . Кацем и указанным в 1996 году, используется в формате Portable Network Graphics (PNG). [17]

Стандарт JPEG 2000 разрабатывался с 1997 по 2000 год комитетом JPEG под председательством Тураджа Эбрахими (впоследствии президента JPEG). [18] В отличие от алгоритма DCT, используемого в исходном формате JPEG, JPEG 2000 вместо этого использует алгоритмы дискретного вейвлет-преобразования (DWT). Он использует вейвлет-преобразование CDF 9/7 (разработанное Ингрид Добеши в 1992 году) для своего алгоритма сжатия с потерями [19] и вейвлет-преобразование Ле Галля-Табатабай (LGT) 5/3 [20] [21] (разработанное Дидье Ле Галль и Али Дж. Табатабаи в 1988 году) [22] за алгоритм сжатия без потерь. [19] Технология JPEG 2000 , включающая расширение Motion JPEG 2000 , была выбрана в качестве стандарта кодирования видео для цифрового кино в 2004 году. [23]

Примечания и ссылки

  1. ^ «Сжатие данных изображения» .
  2. ^ Ахмед, Н.; Натараджан, Т.; Рао, КР (1974). «Дискретное косинусное преобразование» (PDF) . Транзакции IEEE на компьютерах : 90–93. дои : 10.1109/TC.1974.223784. S2CID  149806273. Архивировано из оригинала (PDF) 25 ноября 2011 г.
  3. Гилад Дэвид Мааян (24 ноября 2021 г.). «Сжатие изображений на основе искусственного интеллекта: современное состояние». На пути к науке о данных . Проверено 6 апреля 2023 г.
  4. ^ «Высокоточное генеративное сжатие изображений» . Проверено 6 апреля 2023 г.
  5. ^ Бюльманн, Матиас (28 сентября 2022 г.). «Стабильное сжатие изображения на основе диффузии». Середина . Проверено 2 ноября 2022 г.
  6. ^ Берт, П.; Адельсон, Э. (1 апреля 1983 г.). «Пирамида Лапласа как компактный код изображения». Транзакции IEEE в области коммуникаций . 31 (4): 532–540. CiteSeerX 10.1.1.54.299 . дои : 10.1109/TCOM.1983.1095851. S2CID  8018433. 
  7. ^ Шао, Дэн; Кропач, Уолтер Г. (3–5 февраля 2010 г.). Шпачек, Либор; Франк, Войтех (ред.). «Неправильная пирамида графа Лапласа» (PDF) . Зимний семинар по компьютерному зрению 2010 . Нове Грады, Чехия: Чешское общество распознавания образов. Архивировано (PDF) из оригинала 27 мая 2013 г.
  8. ^ Клод Элвуд Шеннон (1948). Alcatel-Lucent (ред.). «Математическая теория связи» (PDF) . Технический журнал Bell System . 27 (3–4): 379–423, 623–656. doi :10.1002/j.1538-7305.1948.tb01338.x. hdl : 11858/00-001M-0000-002C-4314-2 . Архивировано (PDF) из оригинала 24 мая 2011 г. Проверено 21 апреля 2019 г.
  9. ^ Дэвид Альберт Хаффман (сентябрь 1952 г.), «Метод построения кодов с минимальной избыточностью» (PDF) , Proceedings of IRE , vol. 40, нет. 9, стр. 1098–1101, doi : 10.1109/JRPROC.1952.273898, заархивировано (PDF) из оригинала 8 октября 2005 г.
  10. ^ Пратт, ВК; Кейн, Дж.; Эндрюс, ХК (1969). «Кодирование изображений с преобразованием Адамара». Труды IEEE . 57 : 58–68. дои : 10.1109/PROC.1969.6869.
  11. ^ Ахмед, Насир (январь 1991 г.). «Как я придумал дискретное косинусное преобразование». Цифровая обработка сигналов . 1 (1): 4–5. дои : 10.1016/1051-2004(91)90086-Z.
  12. ^ «T.81 – ЦИФРОВОЕ СЖАТИЕ И КОДИРОВАНИЕ НЕПРЕРЫВНЫХ ФОТОИЗОБРАЖЕНИЙ – ТРЕБОВАНИЯ И РУКОВОДСТВА» (PDF) . ССИТТ . Сентябрь 1992 г. Архивировано (PDF) из оригинала 18 августа 2000 г. Проверено 12 июля 2019 г.
  13. ^ «Объяснение формата изображения JPEG» . BT.com . Группа БТ . 31 мая 2018 года . Проверено 5 августа 2019 г.
  14. ^ «Что такое JPEG? Невидимый объект, который вы видите каждый день» . Атлантический океан . 24 сентября 2013 года . Проверено 13 сентября 2019 г.
  15. Баранюк, Крис (15 октября 2015 г.). «Защита от копирования может распространяться на файлы JPEG». Новости BBC . Би-би-си . Проверено 13 сентября 2019 г.
  16. ^ «Спор о GIF: взгляд разработчика программного обеспечения» . 27 января 1995 года . Проверено 26 мая 2015 г.
  17. ^ Л. Питер Дойч (май 1996 г.). DEFLATE Спецификация формата сжатых данных версии 1.3. IETF . п. 1 сек. Абстрактный. дои : 10.17487/RFC1951 . РФК 1951 . Проверено 23 апреля 2014 г.
  18. ^ Таубман, Дэвид; Марселлин, Майкл (2012). Основы, стандарты и практика сжатия изображений JPEG2000: Основы, стандарты и практика сжатия изображений. Springer Science & Business Media . ISBN 9781461507994.
  19. ^ аб Унсер, М.; Блю, Т. (2003). «Математические свойства вейвлет-фильтров JPEG2000» (PDF) . Транзакции IEEE при обработке изображений . 12 (9): 1080–1090. Бибкод : 2003ITIP...12.1080U. дои : 10.1109/TIP.2003.812329. PMID  18237979. S2CID  2765169. Архивировано из оригинала (PDF) 13 октября 2019 г.
  20. ^ Салливан, Гэри (8–12 декабря 2003 г.). «Общие характеристики и соображения по проектированию временного поддиапазонного видеокодирования». МСЭ-Т . Группа экспертов по видеокодированию . Проверено 13 сентября 2019 г.
  21. ^ Бовик, Алан С. (2009). Основное руководство по обработке видео. Академическая пресса . п. 355. ИСБН 9780080922508.
  22. ^ Ле Галль, Дидье; Табатабай, Али Дж. (1988). «Поддиапазонное кодирование цифровых изображений с использованием симметричных фильтров с коротким ядром и методов арифметического кодирования». ICASSP-88., Международная конференция по акустике, речи и обработке сигналов . С. 761–764 т.2. дои : 10.1109/ICASSP.1988.196696. S2CID  109186495.
  23. ^ Шварц, Чарльз С. (2005). Понимание цифрового кино: профессиональный справочник. Тейлор и Фрэнсис . п. 147. ИСБН 9780240806174.

Внешние ссылки