Формат файла изображения Exchangeable (официально Exif , согласно спецификациям JEIDA/JEITA/CIPA) [5] — это стандарт, который определяет форматы для изображений , звука и вспомогательных тегов, используемых цифровыми камерами (включая смартфоны ), сканерами и другими системами, обрабатывающими файлы изображений и звуков, записанные цифровыми камерами. Спецификация использует следующие существующие форматы кодирования с добавлением определенных тегов метаданных : кодирование с потерями JPEG для сжатых файлов изображений, TIFF Rev. 6.0 ( RGB или YCbCr ) для несжатых файлов изображений и RIFF WAV для аудиофайлов (линейная PCM или ITU-T G.711 μ-law PCM для несжатых аудиоданных и IMA - ADPCM для сжатых аудиоданных). [6] Он не поддерживает изображения, закодированные в JPEG 2000 или GIF .
Этот стандарт состоит из спецификации файлов изображений Exif и спецификации аудиофайлов Exif.
Exif поддерживается практически всеми производителями камер.
Теги метаданных, определенные в стандарте Exif, охватывают широкий спектр:
Первоначальное определение Exif было разработано Японской ассоциацией развития электронной промышленности (JEIDA). Версия 2.1 спецификации датирована 12 июня 1998 года. [ необходима ссылка ] JEITA установила версию Exif 2.2 (также известную как « Exif Print »), датированную 20 февраля 2002 года и выпущенную в апреле 2002 года. [7] Версия 2.21 (с поддержкой Adobe RGB ) датирована 11 июля 2003 года, но была выпущена в сентябре 2003 года после выпуска DCF 2.0. Версия 2.3 была выпущена 26 апреля 2010 года и пересмотрена до 2.31 в июле 2013 года и пересмотрена до 2.32 17 мая 2019 года, была совместно сформулирована JEITA и CIPA . Последняя версия, 3.0, была выпущена в мае 2023 года и, среди прочего, обеспечивает поддержку UTF-8, что позволяет использовать текстовые данные в кодировке, отличной от ASCII. [4]
Структура тега Exif заимствована из файлов TIFF. В нескольких свойствах, характерных для изображений, существует большое совпадение между тегами, определенными в стандартах TIFF , Exif, TIFF/EP и DCF . Для описательных метаданных существует совпадение между Exif, моделью обмена информацией IPTC и информацией XMP , которая также может быть встроена в файл JPEG. Рабочая группа по метаданным разработала руководящие принципы сопоставления тегов между этими стандартами. [8]
Когда Exif используется для файлов JPEG , данные Exif хранятся в одном из определенных служебных сегментов приложений JPEG , APP1 (маркер сегмента 0xFFE1), который фактически содержит весь файл TIFF внутри. Когда Exif используется в файлах TIFF (также при использовании в качестве «встроенного файла TIFF», упомянутого ранее), частный тег TIFF 0x8769 определяет суб-каталог файлов изображений (IFD), который содержит указанные Exif теги TIFF. Кроме того, Exif также определяет суб-IFD глобальной системы позиционирования с использованием частного тега TIFF 0x8825, содержащего информацию о местоположении, и «IFD взаимодействия», указанный в суб-IFD Exif, с использованием тега Exif 0xA005.
Форматы, указанные в стандарте Exif, определяются как структуры папок, основанные на Exif-JPEG и форматах записи для памяти. Когда эти форматы используются как файлы Exif/DCF вместе со спецификацией DCF (для лучшей совместимости между устройствами разных типов), их область действия должна охватывать устройства, носители записи и прикладное программное обеспечение, которое ими управляет.
Формат Exif имеет стандартные теги для информации о местоположении. По состоянию на 2014 год [обновлять]многие камеры и мобильные телефоны имеют встроенный GPS-приемник, который сохраняет информацию о местоположении в заголовке Exif при съемке. Некоторые другие камеры имеют отдельный GPS-приемник, который вставляется в разъем вспышки или горячий башмак . Записанные данные GPS также можно добавлять к любой цифровой фотографии на компьютере, либо путем сопоставления временных меток фотографий с записью GPS с ручного GPS-приемника, либо вручную с помощью карты или картографического программного обеспечения. Некоторые камеры можно соединять с мобильными телефонами для предоставления геолокации. Процесс добавления географической информации к фотографии известен как геотегирование . Сообщества по обмену фотографиями, такие как Panoramio , locr или Flickr, в равной степени позволяют своим пользователям загружать геокодированные фотографии или добавлять информацию о геолокации онлайн.
Данные Exif встроены в сам файл изображения. Хотя многие современные программы обработки изображений распознают и сохраняют данные Exif при записи в измененное изображение, для большинства старых программ это не так. Многие программы галерей изображений также распознают данные Exif и опционально отображают их вместе с изображениями.
Библиотеки программного обеспечения, такие как libexif [9] для C и Adobe XMP Toolkit [10] или Exiv2 [11] для C++ , Metadata Extractor [12] для Java , PIL/Pillow для Python , LEADTOOLS или ExifTool [13] для Perl , анализируют данные Exif из файлов и считывают/записывают значения тегов Exif.
Формат Exif имеет ряд недостатков, связанных в основном с использованием устаревших структур файлов.
Поскольку тег Exif содержит метаданные о фотографии, он может представлять проблему конфиденциальности. Например, фотография, сделанная камерой с поддержкой GPS , может раскрыть точное место и время съемки, а также уникальный идентификационный номер устройства — все это делается по умолчанию — часто без ведома пользователя. Многие пользователи могут не знать, что их фотографии по умолчанию помечены таким образом или что для удаления тега Exif перед публикацией может потребоваться специальное программное обеспечение. Например, осведомитель , журналист или политический диссидент, полагающийся на защиту анонимности, чтобы иметь возможность сообщать о должностных преступлениях со стороны юридического лица, преступника или правительства, может обнаружить, что их безопасность поставлена под угрозу этим сбором данных по умолчанию.
В декабре 2012 года антивирусный бизнесмен Джон Макафи был арестован в Гватемале , когда бежал от предполагаемого преследования [22] в соседнем Белизе . Журнал Vice опубликовал на своем сайте эксклюзивное интервью с Макафи «в бегах» [23] , включавшее фотографию Макафи с репортером Vice , сделанную на телефон, который прикрепил геотег к изображению. [24] Метаданные фотографии включали координаты GPS, указывающие на местонахождение Макафи в Гватемале, и он был схвачен два дня спустя. [25] Позже Макафи утверждал, что отредактировал данные Exif со своего телефона, чтобы указать ложное местоположение. [26]
Согласно документам, обнародованным Эдвардом Сноуденом , АНБ нацеливается на информацию Exif в рамках программы XKeyscore . [27]
Проблему конфиденциальности данных Exif можно избежать, удалив данные Exif с помощью инструмента удаления метаданных . [28]
Рабочая группа по метаданным была сформирована консорциумом компаний в 2006 году (согласно их веб-странице) или в 2007 году (как указано в их собственном пресс-релизе). Версия 2.0 спецификации была выпущена в ноябре 2010 года [8], в ней даны рекомендации по использованию метаданных Exif, IPTC и XMP в изображениях.
Extensible Metadata Platform (XMP) — это стандарт ISO , изначально созданный Adobe Systems Inc. для создания, обработки и обмена стандартизированными и пользовательскими метаданными для цифровых документов и наборов данных. IPTC был разработан в начале 1990-х годов Международным советом по прессе и телекоммуникациям (IPTC) для ускорения международного обмена новостями между газетами и информационными агентствами.
Не все устройства используют все доступные поля метаданных в стандарте Exif.
В следующей таблице показаны метаданные Exif для фотографии, сделанной с помощью типичной цифровой камеры. Информация об авторстве и авторских правах обычно не предоставляется в выходных данных камеры, поэтому ее необходимо заполнить на более поздних этапах обработки. Некоторые программы, такие как Canon's Digital Photo Professional , позволяют добавлять имя владельца к самой камере.
В дополнение к основным тегам даты и времени ( DateTime
, DateTimeOriginal
, и DateTimeDigitized
), есть три соответствующих тега "subsecond": SubsecTime
, SubsecTimeOriginal
, и SubsecTimeDigitized
. SubsecTime
Тег определен в версии 2.3 как "тег, используемый для записи долей секунд для тега DateTime;" [6] поля SubsecTimeOriginal
и SubsecTimeDigitized
определяются аналогично. Теги subsecond имеют переменную длину, что означает, что производители могут выбирать количество десятичных цифр в кодировке ASCII для размещения в этих тегах. Для DateTime = 2000:01:01 00:00:00
фактическое время с различными значениями subsecond будет:
SubsecTime = 2
:2000:01:01 00:00:00.2
SubsecTime = 23
:2000:01:01 00:00:00.23
SubsecTime = 234
:2000:01:01 00:00:00.234
SubsecTime = 2345
:2000:01:01 00:00:00.2345
Стандарт не определяет, какое конкретное событие во время «съемки» снимка должны описывать теги времени. Стандарт, по сути, неоднозначен. Тег DateTimeOriginal
определяется как «Дата и время, когда были сгенерированы исходные данные изображения». Для экспозиции, скажем, 30 секунд, длиннее, чем гранулярность временной метки (одна секунда для DateTimeOriginal
тега), время тега может соответствовать началу экспозиции, концу экспозиции или какому-то другому времени. Эта путаница усугубляется для субсекундных тегов, где гранулярность (до 1/10000 секунды в примерах в стандарте) короче, чем многие обычные длительности экспозиции.
Как отмечено выше, теги для указания ранее отсутствовавшей информации о часовом поясе были добавлены в Exif версии 2.31. Это "OffsetTime", "OffsetTimeOriginal" и "OffsetTimeDigitized". Они отформатированы как семь символов ASCII (включая нулевой терминатор), обозначающих часы и минуты смещения, например +01:00
или -01:00
. Смещение - это "от UTC (разница во времени с всемирным координированным временем, включая летнее время) времени" [6] соответствующего тега.
Спецификация Exif также включает описание информации FPXR (FlashPix-ready), которая может храниться в APP2 изображений JPEG с использованием структуры, аналогичной структуре файла FlashPix . [30] Эти расширения FlashPix позволяют сохранять метаинформацию при конвертации между изображениями FPXR JPEG и изображениями FlashPix. Информация FPXR может быть найдена в изображениях с некоторых моделей цифровых камер Kodak и Hewlett-Packard . [31] Ниже приведен пример информации FPXR, найденной в изображении JPEG с цифровой камеры Kodak EasyShare V570 :
Спецификация Exif описывает формат файла RIFF , используемый для аудиофайлов WAV , и определяет ряд тегов для хранения метаинформации, такой как исполнитель, авторские права, дата создания и т. д. в этих файлах. [32] В следующей таблице приведен пример информации Exif, обнаруженной в файле WAV, записанном цифровой камерой Pentax Optio WP :
Тег "MakerNote" обычно содержит информацию об изображении в фирменном двоичном формате. Некоторые из этих форматов, специфичных для производителя, были декодированы:
Фирменные форматы, используемые многими производителями, ломаются, если данные тега MakerNote перемещаются (т. е. вставляются или редактируются предшествующие им теги). Причина редактирования данных Exif может быть такой же простой, как добавление информации об авторских правах, комментария Exif и т. д. Для этой проблемы есть два решения:
Microsoft реализовала последнее решение в Windows 10: в проводнике Windows вы можете изменить данные Exif файла изображения с помощью окна свойств. Здесь вкладка «Подробности» содержит некоторые данные Exif, такие как заголовок, тема, комментарии и т. д., и эти данные Exif также можно изменить и сохранить. При сохранении файла изображения добавляется тег «OffsetSchema» (идентификатор тега = 0xea1d), и этот тег содержит 32-битное число со знаком. С помощью этого числа можно восстановить исходный индекс «MakerNote»:
Исходный индекс "MakerNote" = Текущий индекс "MakerNote" - Значение тега "OffsetSchema"
Однако тег «OffsetSchema» был определен корпорацией Microsoft и не является частью официального стандарта Exif.
В некоторых случаях поставщики камер также хранят важную информацию только в собственных полях makernote, вместо использования доступных стандартных тегов Exif. Примером этого является тег настроек скорости ISO Nikon. [38]
{{cite web}}
: CS1 maint: бот: исходный статус URL неизвестен ( ссылка )