Portable Network Graphics ( PNG , официально произносится как / pɪŋ / [ 2] [3] PING , в разговорной речи произносится как / ˌp iːɛnˈdʒiː / [4] PEE -en- JEE ) — формат файла растровой графики , поддерживающий сжатие данных без потерь . [ 5] PNG был разработан как улучшенная, не запатентованная замена формату Graphics Interchange Format ( GIF ) — неофициально аббревиатура PNG расшифровывается как рекурсивная аббревиатура «PNG’s not GIF». [6]
PNG поддерживает изображения на основе палитры (с палитрами 24-битных цветов RGB или 32-битных цветов RGBA ), изображения в градациях серого (с альфа-каналом для прозрачности или без него) и полноцветные изображения RGB или RGBA без палитры. Рабочая группа PNG разработала формат для передачи изображений в Интернете , а не для печатной графики профессионального качества; поэтому не-RGB цветовые пространства, такие как CMYK, не поддерживаются. Файл PNG содержит одно изображение в расширяемой структуре фрагментов , кодируя основные пиксели и другую информацию, такую как текстовые комментарии и проверки целостности, задокументированные в RFC 2083. [7]
Файлы PNG имеют расширение файла ".png" и тип носителя MIME "image/png" . [8] PNG был опубликован как информационный RFC 2083 в марте 1997 года и как стандарт ISO/IEC 15948 в 2004 году. [1]
Мотивацией создания формата PNG стало осознание 28 декабря 1994 года того, что алгоритм сжатия данных Lempel–Ziv–Welch (LZW), используемый в формате Graphics Interchange Format (GIF), был запатентован Unisys . Патент требовал, чтобы все программное обеспечение, поддерживающее GIF, выплачивало лицензионные отчисления, что привело к шквалу критики со стороны пользователей Usenet . Одним из них был Томас Бутелл, который 4 января 1995 года опубликовал предварительную ветку обсуждения в группе новостей Usenet «comp.graphics», в которой он разработал план бесплатной альтернативы GIF. Другие пользователи в этой ветке выдвинули множество предложений, которые позже стали частью окончательного формата файла. Оливер Фромм, автор популярного просмотрщика JPEG QPEG, предложил название PING, в конечном итоге ставшее PNG, рекурсивным акронимом, означающим, что PING не является GIF , [9] а также расширение .png . Другие предложения, реализованные позже, включали алгоритм сжатия deflate и поддержку 24-битного цвета , отсутствие последнего в GIF также мотивировало команду на создание своего формата файла. Группа стала известна как PNG Development Group, и поскольку обсуждение быстро расширялось, она позже использовала список рассылки, связанный с форумом CompuServe . [2] [10]
Полная спецификация PNG была выпущена с одобрения W3C 1 октября 1996 года, а позднее как RFC 2083 15 января 1997 года. Спецификация была пересмотрена 31 декабря 1998 года как версия 1.1, которая решала технические проблемы гамма- и цветовой коррекции . Версия 1.2, выпущенная 11 августа 1999 года, добавила фрагмент iTXt как единственное изменение спецификации, а переформатированная версия 1.2 была выпущена как второе издание стандарта W3C 10 ноября 2003 года [11] и как международный стандарт (ISO/IEC 15948:2004) 3 марта 2004 года. [12] [1]
Хотя GIF допускает анимацию , изначально было решено, что PNG должен быть форматом с одним изображением. [13] В 2001 году разработчики PNG опубликовали формат Multiple-image Network Graphics (MNG) с поддержкой анимации. MNG получил умеренную поддержку приложений, но недостаточную среди основных веб-браузеров и не использовался среди веб-дизайнеров или издателей веб-сайтов. В 2008 году некоторые разработчики Mozilla опубликовали формат Animated Portable Network Graphics (APNG) с аналогичными целями. APNG — это формат, который изначально поддерживается веб-браузерами на базе Gecko и Presto , а также широко используется для миниатюр в системе Sony PlayStation Portable (с использованием обычного расширения файла PNG). В 2017 году браузеры на базе Chromium приняли поддержку APNG. В январе 2020 года Microsoft Edge стал основанным на Chromium , таким образом унаследовав поддержку APNG. Благодаря этому все основные браузеры теперь поддерживают APNG.
Оригинальная спецификация PNG была создана специальной группой экспертов и энтузиастов компьютерной графики . Обсуждения и решения по формату проводились по электронной почте. Первоначальные авторы, перечисленные в RFC 2083: [14]
Файл PNG начинается с восьмибайтовой сигнатуры [ 15] (см. изображение шестнадцатеричного редактора справа):
После заголовка следует ряд фрагментов , [16] каждый из которых передает определенную информацию об изображении. Фрагменты объявляют себя критическими или вспомогательными , и программа, столкнувшаяся со вспомогательным фрагментом, который она не понимает, может спокойно его игнорировать. Эта структура слоя хранения на основе фрагментов, похожая по концепции на формат контейнера или на IFF Amiga , разработана для того, чтобы позволить расширить формат PNG, сохранив совместимость со старыми версиями — она обеспечивает прямую совместимость , и эта же структура файла (с другой сигнатурой и фрагментами) используется в связанных форматах MNG , JNG и APNG .
Кусок состоит из четырех частей: длина (4 байта, [17] big-endian ), тип/имя куска (4 байта [18] ), данные куска (длина байтов) и CRC (циклический избыточный код/контрольная сумма; 4 байта [17] ). CRC представляет собой сетевой порядок байтов CRC-32, вычисляемый по типу куска и данным куска, но не по длине.
Типам фрагментов присваивается четырехбуквенный чувствительный к регистру тип/имя ASCII; сравните FourCC . Регистр различных букв в имени (бит 5 числового значения символа) представляет собой битовое поле , которое предоставляет декодеру некоторую информацию о природе фрагментов, которые он не распознает.
Регистр первой буквы указывает, является ли фрагмент критическим или нет. Если первая буква заглавная, фрагмент критический; если нет, фрагмент вспомогательный. Критические фрагменты содержат информацию, необходимую для чтения файла. Если декодер встречает критический фрагмент, который он не распознает, он должен прервать чтение файла или предоставить пользователю соответствующее предупреждение.
Регистр второй буквы указывает, является ли фрагмент "публичным" (в спецификации или реестре специальных публичных фрагментов) или "частным" (не стандартизированным). Верхний регистр означает публичный, а нижний регистр - частный. Это гарантирует, что имена публичных и частных фрагментов никогда не будут конфликтовать друг с другом (хотя два частных имени фрагмента могут конфликтовать).
Третья буква должна быть заглавной, чтобы соответствовать спецификации PNG. Она зарезервирована для будущего расширения. Декодеры должны обрабатывать фрагмент с третьей буквой в нижнем регистре так же, как и любой другой нераспознанный фрагмент.
Регистр четвертой буквы указывает, безопасно ли копировать фрагмент редакторам, которые его не распознают. Если строчные буквы, фрагмент можно безопасно копировать независимо от степени изменений в файле. Если заглавные буквы, его можно копировать только в том случае, если изменения не коснулись критических фрагментов.
Декодер должен уметь интерпретировать критические фрагменты для чтения и рендеринга PNG-файла.
IHDR
должен быть первым фрагментом; он содержит (в этом порядке) изображениеКак указано в Консорциуме Всемирной паутины , битовая глубина определяется как «количество бит на образец или на индекс палитры (не на пиксель)». [11]
PLTE
содержит палитру : список цветов.IDAT
содержит изображение, которое может быть разделено на несколько фрагментов IDAT. Такое разделение немного увеличивает размер файла, но позволяет генерировать PNG потоковым способом. Фрагмент IDAT содержит фактические данные изображения, которые являются выходным потоком алгоритма сжатия. [19]IEND
отмечает конец изображения; поле данных фрагмента IEND имеет 0 байт/пусто. [20]Этот PLTE
фрагмент необходим для типа цвета 3 (индексированный цвет). Он необязателен для типов цвета два и шесть (truecolor и truecolor с альфа-каналом) и не должен появляться для типов цвета 0 и 4 (оттенки серого и оттенки серого с альфа-каналом).
Другие атрибуты изображения, которые могут храниться в файлах PNG, включают значения гаммы , цвет фона и текстовую метаинформацию . PNG также поддерживает управление цветом посредством включения цветовых профилей ICC . [21]
bKGD
дает цвет фона по умолчанию. Он предназначен для использования, когда нет лучшего выбора, например, в автономных просмотрщиках изображений (но не в веб-браузерах; см. ниже для получения более подробной информации).cHRM
дает координаты цветности основных цветов дисплея и белой точки .cICP
определяет цветовое пространство, передаточную функцию и матричные коэффициенты, как определено в ITU-T H.273 . [22] Он предназначен для использования с изображениями HDR без необходимости в цветовом профиле. [23]dSIG
предназначен для хранения цифровых подписей. [24]eXIf
сохраняет метаданные Exif . [25]gAMA
определяет gamma . Фрагмент gAMA содержит всего 4 байта, а его значение представляет собой значение гаммы, умноженное на 100 000; например, значение гаммы 1/3,4 вычисляется как 29411,7647059 ((1/3,4)*(100 000)) и преобразуется в целое число (29412) для хранения. [26]hIST
может хранить гистограмму или общее количество каждого цвета в изображении.iCCP
представляет собой цветовой профиль ICC .iTXt
содержит ключевое слово и текст UTF-8 с кодировками для возможного сжатия и переводами, отмеченными тегом языка . Расширяемая платформа метаданных (XMP) использует этот фрагмент с ключевым словом 'XML:com.adobe.xmp'pHYs
содержит предполагаемый размер пикселя (или соотношение сторон пикселя); pHYs содержит «Пиксели на единицу измерения, ось X» (4 байта), «Пиксели на единицу измерения, ось Y» (4 байта) и «Определитель единицы измерения» (1 байт), всего 9 байтов. [27]sBIT
(значимые биты) указывают на точность цвета исходных данных; этот фрагмент содержит в общей сложности от 1 до 5 байтов, в зависимости от типа цвета. [28] [29] [30]sPLT
предлагает палитру, которую можно использовать, если полный спектр цветов недоступен.sRGB
указывает на то, что используется стандартное цветовое пространство sRGB ; фрагмент sRGB содержит только 1 байт, который используется для «цели рендеринга» (для цели рендеринга определены 4 значения — 0, 1, 2 и 3). [31]sTER
Индикатор стереоизображения для стереоскопических изображений. [32]tEXt
может хранить текст, который может быть представлен в ISO/IEC 8859-1 , с одной парой ключ-значение для каждого фрагмента. «Ключ» должен быть длиной от одного до 79 символов. Разделитель — нулевой символ. «Значение» может быть любой длины, включая ноль, вплоть до максимально допустимого размера фрагмента за вычетом длины ключевого слова и разделителя. Ни «ключ», ни «значение» не могут содержать нулевой символ. Начальные или конечные пробелы также не допускаются.tIME
сохраняет время последнего изменения изображения.tRNS
содержит информацию о прозрачности. Для индексированных изображений он хранит значения альфа-канала для одной или нескольких записей палитры. Для полноцветных и полутоновых изображений он хранит одно значение пикселя, которое следует считать полностью прозрачным.zTXt
содержит сжатый текст (и маркер метода сжатия) с теми же ограничениями, что и tEXt
.Первая строчная буква в этих фрагментах указывает на то, что они не нужны для спецификации PNG. Последняя строчная буква в некоторых фрагментах указывает на то, что их можно безопасно копировать, даже если соответствующее приложение их не понимает.
Пиксели в изображениях PNG — это числа, которые могут быть либо индексами выборочных данных в палитре , либо самими выборочными данными. Палитра — это отдельная таблица, содержащаяся в фрагменте PLTE. Выборочные данные для одного пикселя состоят из кортежа из одного-четырех чисел. Независимо от того, представляют ли пиксельные данные индексы палитры или явные выборочные значения, числа называются каналами , и каждое число в изображении кодируется в идентичном формате.
Разрешенные форматы кодируют каждое число как беззнаковое целое число, используя фиксированное количество бит, которое в спецификации PNG называется битовой глубиной . Обратите внимание, что это не то же самое, что и цветовая глубина , которая обычно используется для обозначения общего количества бит в каждом пикселе, а не в каждом канале. Разрешенные битовые глубины суммированы в таблице вместе с общим количеством бит, используемых для каждого пикселя.
Количество каналов зависит от того, является ли изображение цветным или в оттенках серого, а также от того, имеет ли оно альфа-канал . PNG допускает следующие комбинации каналов, называемые типом цвета .
Тип цвета указан как 8-битное значение, однако используются только нижние три бита, и даже тогда разрешены только пять комбинаций, перечисленных выше. Пока тип цвета действителен, его можно рассматривать как битовое поле, как показано в соседней таблице:
В индексированных цветных изображениях палитра всегда хранит трихроматические цвета с глубиной 8 бит на канал (24 бита на запись палитры). Кроме того, может быть включен необязательный список 8-битных альфа-значений для записей палитры; если он не включен или короче палитры, то остальные записи палитры считаются непрозрачными. Палитра не должна содержать больше записей, чем позволяет глубина цвета изображения, но может содержать меньше (например, если изображение с 8-битными пикселями использует только 90 цветов, то ему не нужны записи палитры для всех 256 цветов). Палитра должна содержать записи для всех значений пикселей, присутствующих в изображении.
Стандарт позволяет индексированным цветным PNG-файлам иметь 1, 2, 4 или 8 бит на пиксель; изображения в оттенках серого без альфа-канала могут иметь 1, 2, 4, 8 или 16 бит на пиксель. Все остальное использует битовую глубину на канал 8 или 16. Комбинации, которые это допускает, приведены в таблице выше. Стандарт требует, чтобы декодеры могли читать все поддерживаемые цветовые форматы, но многие редакторы изображений могут создавать только небольшое их подмножество.
PNG предлагает множество вариантов прозрачности. Для полноцветных и полутоновых изображений можно либо объявить прозрачным одно пиксельное значение, либо добавить альфа-канал (позволяя использовать любой процент частичной прозрачности). Для палитровых изображений альфа-значения можно добавлять к записям палитры. Количество таких сохраненных значений может быть меньше общего количества записей палитры, в этом случае оставшиеся записи считаются полностью непрозрачными.
Сканирование значений пикселей для бинарной прозрачности должно выполняться до любого снижения цвета, чтобы избежать непреднамеренной прозрачности пикселей. Это, скорее всего, создаст проблему для систем, которые могут декодировать изображения с 16 битами на канал (как требуется для соответствия спецификации), но выводят только 8 бит на канал (норма для всех, кроме самых высокопроизводительных систем).
Альфа- хранилище может быть «ассоциированным» (« предварительно умноженным ») или «неассоциированным», но PNG стандартизировано [33] на «неассоциированном» («непредварительно умноженном») альфа-канале, что означает, что изображение не кодируется альфа-каналом ; выбросы, представленные в RGB, не являются выбросами на уровне пикселей. Это означает, что избыточная операция умножит выбросы RGB на альфа-канал и не сможет правильно представить выбросы и окклюзию.
PNG использует двухэтапный процесс сжатия:
PNG использует DEFLATE , незапатентованный алгоритм сжатия данных без потерь , включающий комбинацию кодирования LZ77 и Хаффмана . Широко доступны разрешенные лицензированные реализации DEFLATE, такие как zlib .
По сравнению с форматами со сжатием с потерями, такими как JPEG, выбор настройки сжатия выше средней задерживает обработку, но часто не приводит к значительному уменьшению размера файла.
Перед применением DEFLATE данные преобразуются с помощью метода прогнозирования: для всего изображения используется один метод фильтрации , в то время как для каждой строки изображения выбирается тип фильтра для преобразования данных с целью повышения эффективности их сжатия. [34] Тип фильтра, используемый для строки сканирования, добавляется к строке сканирования для включения встроенной декомпрессии.
В текущей спецификации PNG существует только один метод фильтрации (обозначенный как метод 0), и, таким образом, на практике единственным выбором является тип фильтра, который следует применить к каждой строке. Для этого метода фильтр предсказывает значение каждого пикселя на основе значений предыдущих соседних пикселей и вычитает предсказанный цвет пикселя из фактического значения, как в DPCM . Линия изображения, отфильтрованная таким образом, часто более сжимаема, чем необработанная линия изображения, особенно если она похожа на линию выше, поскольку отличия от предсказания, как правило, будут сгруппированы вокруг 0, а не распределены по всем возможным значениям изображения. Это особенно важно при связывании отдельных строк, поскольку DEFLATE не понимает, что изображение является двумерной сущностью, и вместо этого просто видит данные изображения как поток байтов.
Существует пять типов фильтров для метода фильтрации 0; каждый тип предсказывает значение каждого байта (данных изображения до фильтрации) на основе соответствующего байта пикселя слева ( A ), пикселя выше ( B ) и пикселя выше и слева ( C ) или некоторой их комбинации, и кодирует разницу между предсказанным значением и фактическим значением. Фильтры применяются к значениям байтов, а не к пикселям; значения пикселей могут быть одним или двумя байтами или несколькими значениями на байт, но никогда не пересекать границы байтов. Типы фильтров: [35]
Фильтр Paeth основан на алгоритме Алана В. Паэта . [36] Сравните с версией DPCM , используемой в JPEG без потерь , и с дискретным вейвлет-преобразованием, использующим окна 1 × 2, 2 × 1 или (для предиктора Paeth) 2 × 2 и вейвлеты Хаара .
Сжатие еще больше улучшается за счет адаптивного выбора типов фильтров на построчной основе. Это улучшение и эвристический метод его реализации, обычно используемый программным обеспечением для записи PNG, были созданы Ли Дэниелом Крокером , который протестировал методы на многих изображениях во время создания формата; [37] выбор фильтра является компонентом оптимизации размера файла, как обсуждается ниже.
Если используется чересстрочная развертка, каждый этап чересстрочной развертки фильтруется отдельно, что позволяет постепенно визуализировать изображение по мере получения каждого этапа; однако чересстрочная развертка, как правило, снижает эффективность сжатия.
PNG предлагает дополнительную 2-мерную 7-проходную схему чересстрочной развертки — алгоритм Adam7 . Это сложнее, чем 1-мерная 4-проходная схема GIF, и позволяет видеть более четкое изображение с низким разрешением на ранних этапах передачи, особенно если используются алгоритмы интерполяции, такие как бикубическая интерполяция . [38]
Однако 7-проходная схема имеет тенденцию снижать сжимаемость данных больше, чем более простые схемы.
Основной формат PNG не поддерживает анимацию. MNG — это расширение PNG, которое поддерживает; оно было разработано членами PNG Group. MNG разделяет базовую структуру и фрагменты PNG, но он значительно сложнее и имеет другую сигнатуру файла, что автоматически делает его несовместимым со стандартными декодерами PNG. Это означает, что большинство веб-браузеров и приложений либо никогда не поддерживали MNG, либо прекратили его поддержку.
Сложность MNG привела к предложению APNG разработчиками из Mozilla Foundation. Он основан на PNG, поддерживает анимацию и проще MNG. APNG предлагает откат к отображению одного изображения для декодеров PNG, которые не поддерживают APNG. Сегодня формат APNG поддерживается всеми основными веб-браузерами. [39] APNG поддерживается в Firefox 3.0 и выше, Pale Moon (все версии) и Safari 8.0 и выше. [40] Поддержка APNG была добавлена в Chromium 59.0, [41] [42] а затем в Google Chrome. Opera поддерживала APNG в версиях 10–12.1, но поддержка прекратилась в версии 15, когда она перешла на движок рендеринга Blink ; поддержка была повторно добавлена в Opera 46 (унаследована от Chromium 59). [43] Microsoft Edge поддерживает APNG с версии 79.0, когда он перешел на движок на основе Chromium.
В апреле 2007 года группа PNG решила не принимать APNG. [44] Обсуждалось несколько альтернатив, включая ANG, aNIM/mPNG, «PNG в GIF» и его подмножество «RGBA в GIF». [45] Однако в настоящее время только APNG имеет широкую поддержку.
С разработкой третьего издания спецификации PNG, которое теперь поддерживается рабочей группой PNG, [46] APNG наконец будет включен в спецификацию в качестве расширения. [47]
Отображается в стиле шестнадцатеричных редакторов , с левой стороны байтовые значения показаны в шестнадцатеричном формате , а с правой стороны их эквивалентные символы из ISO-8859-1 с нераспознанными и управляющими символами, замененными точками. Кроме того, сигнатура PNG и отдельные фрагменты отмечены цветами. Обратите внимание, что их легко идентифицировать из-за их понятных человеку имен типов (в этом примере PNG, IHDR, IDAT и IEND).
Причины использования этого международного стандарта:
Изображения PNG менее широко поддерживаются старыми браузерами. В частности, IE6 имеет ограниченную поддержку PNG. [51]
Формат JPEG (Joint Photographic Experts Group) может создавать файлы меньшего размера, чем PNG, для фотографических (и фотоподобных) изображений, поскольку JPEG использует метод кодирования с потерями, специально разработанный для данных фотографических изображений, в которых обычно преобладают мягкие, малоконтрастные переходы и некоторое количество шума или подобных нерегулярных структур. Использование PNG вместо высококачественного JPEG для таких изображений приведет к значительному увеличению размера файла с незначительным улучшением качества. Для сравнения, при хранении изображений, содержащих текст, штриховые рисунки или графику — изображений с резкими переходами и большими областями сплошного цвета — формат PNG может сжимать данные изображения лучше, чем JPEG. Кроме того, PNG сжимается без потерь, в то время как JPEG создает визуальные артефакты вокруг областей с высоким контрастом. (Такие артефакты зависят от настроек, используемых при сжатии JPG; они могут быть весьма заметны, если используется настройка низкого качества [высокого сжатия].) Если изображение содержит как резкие переходы, так и фотографические части, необходимо сделать выбор между двумя эффектами. JPEG не поддерживает прозрачность.
Сжатие с потерями JPEG также страдает от потери данных при генерации , когда многократное декодирование и повторное кодирование изображения для его повторного сохранения каждый раз приводит к потере информации, что ухудшает качество изображения. Поскольку PNG не имеет потерь, он подходит для хранения изображений, подлежащих редактированию. Хотя PNG достаточно эффективен при сжатии фотографических изображений, существуют форматы сжатия без потерь, разработанные специально для фотографических изображений, например, WebP без потерь и Adobe DNG (цифровой негатив). Однако эти форматы либо не поддерживаются широко, либо являются запатентованными. Изображение можно сохранить без потерь и преобразовать в формат JPEG только для распространения, так что потери данных при генерации не будет.
Хотя спецификация PNG явно не включает стандарт для встраивания данных изображений Exif из таких источников, как цифровые камеры, предпочтительным методом встраивания данных EXIF в PNG является использование некритической вспомогательной метки фрагмента eXIf
. [52]
Ранние веб-браузеры не поддерживали изображения PNG; основными форматами изображений были JPEG и GIF. JPEG обычно использовался при экспорте изображений, содержащих градиенты, для веб-страниц из-за ограниченной глубины цвета GIF. Однако сжатие JPEG приводит к небольшому размыванию градиента. Формат PNG воспроизводит градиент максимально точно для заданной битовой глубины, сохраняя при этом небольшой размер файла. PNG стал оптимальным выбором для небольших градиентных изображений, поскольку поддержка этого формата веб-браузерами улучшилась. Для отображения градиентов в современных браузерах вообще не нужны изображения, поскольку градиенты можно создавать с помощью CSS .
JPEG-LS — это формат изображения, разработанный Joint Photographic Experts Group , хотя он гораздо менее известен и поддерживается, чем другой формат JPEG с потерями, описанный выше. Он напрямую сопоставим с PNG, [ требуется разъяснение ] и имеет стандартный набор тестовых изображений. [53] На Waterloo Repertoire ColorSet, стандартном наборе тестовых изображений (не связанном с набором тестов соответствия JPEG-LS), JPEG-LS обычно работает лучше, чем PNG, на 10–15%, но на некоторых изображениях PNG работает существенно лучше, порядка 50–75%. [54] Таким образом, если оба этих формата являются вариантами, а размер файла является важным критерием, их оба следует рассматривать, в зависимости от изображения.
Tag Image File Format (TIFF) — это формат, который включает в себя чрезвычайно широкий спектр опций. Хотя это делает TIFF полезным в качестве общего формата для обмена между профессиональными приложениями для редактирования изображений, это делает добавление его поддержки в приложения гораздо более сложной задачей, и поэтому он слабо поддерживается в приложениях, не связанных с обработкой изображений (например, веб-браузерах). Высокий уровень расширяемости также означает, что большинство приложений предоставляют только подмножество возможных функций, что потенциально создает путаницу для пользователей и проблемы совместимости.
Наиболее распространенным универсальным алгоритмом сжатия без потерь, используемым с TIFF, является Lempel–Ziv–Welch (LZW). Этот метод сжатия, также используемый в GIF, был защищен патентами до 2003 года. TIFF также поддерживает алгоритм сжатия, используемый PNG (т. е. Compression Tag 0008 16 ' Adobe -style') со средним использованием и поддержкой приложений. TIFF также предлагает специальные алгоритмы сжатия без потерь, такие как CCITT Group IV , которые могут сжимать двухуровневые изображения (например, факсы или черно-белый текст) лучше, чем алгоритм сжатия PNG.
PNG поддерживает только непредумноженную альфа-канал [33], тогда как TIFF также поддерживает «ассоциированную» (предумноженную) альфа-канал.
WebP — это формат, изобретенный Google , который должен был заменить PNG, JPEG и GIF. [55] Файлы WebP допускают как сжатие с потерями, так и без потерь, тогда как PNG допускает только сжатие без потерь. WebP также поддерживает анимацию, которую ранее могли выполнять только файлы GIF . [56]
Однако основные улучшения WebP по сравнению с PNG — это значительное уменьшение размера файла и, следовательно, более быстрая загрузка при встраивании в веб-сайты. Google утверждает, что изображения WebP без потерь на 26% меньше, чем файлы PNG. [57]
WebP подвергся критике за несовместимость с различными программами редактирования изображений и сайтами социальных сетей, в отличие от PNG. [58] WebP также поддерживается не всеми веб-браузерами, что может потребовать от хостинг-провайдеров веб-изображений создания резервного изображения для отображения пользователю, что сводит на нет потенциальную экономию хранилища WebP. [59]
AVIF — это формат изображений, разработанный Alliance for Open Media . AVIF был разработан организацией для устранения недостатков других кодеков изображений, включая PNG, GIF и WebP . [60]
AVIF, как правило, меньше по размеру, чем WebP и PNG. [61] AVIF поддерживает анимацию, в то время как PNG — нет, и имеет более высокое качество изображения по сравнению с PNG. [62]
Однако, как и WebP, AVIF поддерживается меньшим количеством браузеров и приложений, чем PNG. [63] В частности, AVIF поддерживается наиболее используемыми браузерами: Microsoft Edge , Firefox и Google Chrome , [64] [65], но требует дополнительной загрузки для использования с Microsoft Windows . [60]
Официальной эталонной реализацией формата PNG является программная библиотека libpng . [66] Она публикуется как свободное программное обеспечение на условиях разрешительной лицензии свободного программного обеспечения . Поэтому она обычно встречается как важная системная библиотека в свободных операционных системах.
Формат PNG широко поддерживается графическими программами, включая Adobe Photoshop , Corel 's Photo-Paint и Paint Shop Pro , GIMP , GraphicConverter , Helicon Filter , ImageMagick , Inkscape , IrfanView , Pixel image editor, Paint.NET и Xara Photo & Graphic Designer и многими другими (включая онлайн-платформы графического дизайна, такие как Canva ). Некоторые программы, входящие в комплект популярных операционных систем , которые поддерживают PNG, включают Microsoft 's Paint и Apple 's Photos / iPhoto and Preview , а GIMP также часто входит в комплект популярных дистрибутивов Linux .
Adobe Fireworks (ранее Macromedia ) использует PNG в качестве собственного формата файла, что позволяет другим редакторам изображений и утилитам предварительного просмотра просматривать сглаженное изображение. Однако Fireworks по умолчанию также сохраняет метаданные для слоев, анимации, векторных данных, текста и эффектов. Такие файлы не следует распространять напрямую. Вместо этого Fireworks может экспортировать изображение как оптимизированный PNG без дополнительных метаданных для использования на веб-страницах и т. д. [ необходима цитата ]
Поддержка PNG впервые появилась в 1997 году в Internet Explorer 4.0b1 (32-битная версия только для NT) и в Netscape 4.04. [67]
Несмотря на призывы Фонда свободного программного обеспечения [68] и Консорциума Всемирной паутины (W3C), [69] такие инструменты, как gif2png, [70] и такие кампании, как Burn All GIFs, [71] принятие PNG на веб-сайтах происходило довольно медленно из-за поздней и некорректной поддержки в Internet Explorer, особенно в отношении прозрачности. [72]
Совместимые с PNG браузеры включают: Apple Safari , Google Chrome , Mozilla Firefox , Opera , Camino , Internet Explorer , Microsoft Edge и многие другие. Для полного сравнения см. Сравнение веб-браузеров (поддержка форматов изображений) .
В частности, версии Internet Explorer (Windows) ниже 9.0 (выпущенные в 2011 году) имели многочисленные проблемы, которые не позволяли им правильно отображать изображения PNG. [73]
Значки PNG поддерживаются в большинстве дистрибутивов Linux по крайней мере с 1999 года в таких средах рабочего стола, как GNOME . [85] В 2006 году поддержка значков PNG в Microsoft Windows была введена в Windows Vista . [86] Значки PNG поддерживаются также в AmigaOS 4 , AROS , macOS , iOS и MorphOS . Кроме того, Android широко использует PNG.
Размер файла PNG может значительно различаться в зависимости от того, как он закодирован и сжат; это обсуждается и дается ряд советов в PNG: The Definitive Guide. [54]
По сравнению с файлами GIF , файл PNG с той же информацией (256 цветов, без вспомогательных фрагментов/метаданных), сжатый эффективным компрессором, обычно меньше изображения GIF. В зависимости от файла и компрессора PNG может варьироваться от несколько меньшего (10%) до значительно меньшего (50%) и несколько большего (5%), но редко бывает значительно больше [54] для больших изображений. Это объясняется производительностью DEFLATE PNG по сравнению с LZW GIF , а также тем, что добавленный слой предварительного сжатия предиктивных фильтров PNG учитывает двумерную структуру изображения для дальнейшего сжатия файлов; поскольку отфильтрованные данные кодируют различия между пикселями, они будут иметь тенденцию группироваться ближе к 0, а не распределяться по всем возможным значениям, и, таким образом, их будет легче сжимать с помощью DEFLATE. Однако некоторые версии Adobe Photoshop , CorelDRAW и MS Paint обеспечивают плохое сжатие PNG, создавая впечатление, что GIF более эффективен. [54]
Размер файлов PNG различается из-за ряда факторов:
Таким образом, существует компромисс между размером файла между высокой глубиной цвета, максимальными метаданными (включая информацию о цветовом пространстве вместе с информацией, которая не влияет на отображение), чересстрочной разверткой и скоростью сжатия, которые все дают большие файлы с меньшей глубиной цвета, меньшим количеством или отсутствием вспомогательных фрагментов, отсутствием чересстрочной развертки и настроенной, но вычислительно интенсивной фильтрацией и сжатием. Для разных целей выбираются разные компромиссы: максимальный файл может быть лучшим для архивирования и редактирования, в то время как урезанный файл может быть лучшим для использования на веб-сайте, и аналогично быстрое, но плохое сжатие предпочтительно при многократном редактировании и сохранении файла, в то время как медленное, но высокое сжатие предпочтительно, когда файл стабилен: при архивировании или публикации. Чересстрочная развертка является компромиссом: она значительно ускоряет раннюю отрисовку больших файлов (уменьшает задержку), но может увеличить размер файла (уменьшить пропускную способность) при небольшом выигрыше, особенно для небольших файлов. [54]
Хотя PNG — это формат без потерь, кодировщики PNG могут предварительно обрабатывать данные изображения с потерями, чтобы улучшить сжатие PNG. Например, квантование полноцветного PNG до 256 цветов позволяет использовать индексированный тип цвета для вероятного уменьшения размера файла. [87]
Некоторые программы более эффективны при сохранении PNG-файлов, чем другие. Это связано с реализацией сжатия PNG, используемого программой.
Многие графические программы (например, программное обеспечение Preview от Apple ) сохраняют PNG с большим количеством метаданных и данных цветокоррекции, которые обычно не нужны для просмотра в Интернете . Неоптимизированные файлы PNG из Adobe Fireworks также печально известны этим, поскольку они содержат параметры, позволяющие сделать изображение редактируемым в поддерживаемых редакторах. Также CorelDRAW (по крайней мере версии 11) иногда создает PNG, которые не могут быть открыты в Internet Explorer (версии 6–8).
Производительность Adobe Photoshop при работе с файлами PNG в CS Suite улучшилась при использовании функции «Сохранить для Web» (которая также допускает явное использование PNG/8).
Adobe Fireworks по умолчанию сохраняет файлы PNG большего размера, чем многие программы. Это связано с механикой его формата сохранения : изображения, созданные функцией сохранения Fireworks, включают большие, частные фрагменты, содержащие полную информацию о слоях и векторах. Это позволяет осуществлять дальнейшее редактирование без потерь. При сохранении с помощью опции экспорта файлы PNG Fireworks могут конкурировать с файлами, созданными другими редакторами изображений, но их больше нельзя редактировать, кроме как в виде сглаженных растровых изображений. Fireworks не может сохранять оптимизированные по размеру векторные файлы PNG.
Другие известные примеры плохих компрессоров PNG:
Плохое сжатие увеличивает размер PNG-файла, но не влияет на качество изображения или совместимость файла с другими программами.
Когда глубина цвета полноцветного изображения уменьшается до 8-битной палитры (как в GIF), результирующие данные изображения обычно намного меньше. Таким образом, полноцветный PNG обычно больше, чем GIF с уменьшенным количеством цветов, хотя PNG может хранить версию с уменьшенным количеством цветов как палитризированный файл сопоставимого размера. И наоборот, некоторые инструменты при сохранении изображений в формате PNG автоматически сохраняют их как полноцветные, даже если исходные данные используют только 8-битный цвет, тем самым излишне раздувая файл. [54] Оба фактора могут привести к неправильному представлению о том, что файлы PNG больше, чем эквивалентные файлы GIF.
Для оптимизации PNG-файлов доступны различные инструменты. Они делают это следующим образом:
Ниже приведено простое сравнение их характеристик.
До того, как появился zopflipng, хорошим способом на практике выполнить оптимизацию png было последовательное использование комбинации 2 инструментов для оптимального сжатия: один, который оптимизирует фильтры (и удаляет вспомогательные фрагменты), и другой, который оптимизирует DEFLATE. Хотя pngout предлагает оба, только один тип фильтра может быть указан в одном запуске, поэтому его можно использовать с инструментом-оберткой или в сочетании с pngcrush , [примечание 2] действующем как повторный дефлятор, как advdef.
Для удаления вспомогательных фрагментов большинство инструментов оптимизации PNG имеют возможность удалять все данные цветокоррекции из файлов PNG (гамма, баланс белого, цветовой профиль ICC, стандартный цветовой профиль RGB). Это часто приводит к значительному уменьшению размера файла. Например, следующие параметры командной строки позволяют добиться этого с помощью pngcrush:
pngcrush -rem gAMA -rem cHRM -rem iCCP -rem sRGB InputFile.png OutputFile.png
pngcrush, pngout и zopflipng предлагают варианты применения одного из типов фильтров 0–4 глобально (используя один и тот же тип фильтра для всех строк) или с «псевдофильтром» (под номером 5), который для каждой строки выбирает один из типов фильтров 0–4 с помощью адаптивного алгоритма. Zopflipng предлагает 3 различных адаптивных метода, включая поиск методом подбора, который пытается оптимизировать фильтрацию. [примечание 7]
pngout и zopflipng предоставляют возможность сохранять/повторно использовать [примечание 2] [примечание 8] набор построчных фильтров, присутствующих во входном изображении.
pngcrush и zopflipng предоставляют возможность попробовать разные стратегии фильтрации за один запуск и выбрать лучшую. Бесплатная версия командной строки pngout не предлагает этого, но коммерческая версия pngoutwin предлагает. [примечание 9]
Zopfli и LZMA SDK предоставляют реализации DEFLATE , которые могут обеспечить более высокие коэффициенты сжатия , чем эталонная реализация zlib за счет производительности. AdvanceCOMP advpng
и advdef
может использовать любую из этих библиотек для повторного сжатия файлов PNG. Кроме того, PNGOUT содержит собственную фирменную реализацию DEFLATE.
advpng
не имеет возможности применять фильтры и всегда использует фильтр 0 глобально (оставляя данные изображения нефильтрованными); поэтому его не следует использовать там, где изображение значительно выигрывает от фильтрации. Напротив, advdef
из того же пакета не имеет дела со структурой PNG и действует только как повторный дефлятор, сохраняя любые существующие настройки фильтра.
Поскольку иконки, предназначенные для Windows Vista и более поздних версий, могут содержать субизображения PNG, оптимизации могут применяться и к ним. По крайней мере один редактор иконок , Pixelformer, способен выполнять специальный проход оптимизации при сохранении файлов ICO , тем самым уменьшая их размеры. FileOptimizer (упомянутый выше) также может обрабатывать файлы ICO.
Значки для macOS также могут содержать фрагменты изображений в формате PNG, однако такой инструмент недоступен. [ необходима цитата ]
PNG сам по себе является строго одноизображенным форматом. (...) В будущем может быть определен многоизображенный формат на основе PNG. Такой формат будет считаться отдельным форматом файла
Каждый фрагмент состоит из четырех частей: Длина, Тип фрагмента, Данные фрагмента и 32-битный CRC. Длина — это 32-битное целое число без знака, указывающее размер только поля Данные фрагмента
Тип фрагмента — это 32-битный код FourCC, такой как IHDR, IDAT или IEND.