Анализ уровня ошибок ( ELA ) — это анализ артефактов сжатия цифровых данных с потерями , например JPEG .
При использовании сжатия с потерями оно обычно применяется равномерно к набору данных, например, к изображению, что приводит к равномерному уровню артефактов сжатия.
В качестве альтернативы данные могут состоять из частей с разным уровнем артефактов сжатия. Эта разница может возникнуть из-за того, что разные части неоднократно подвергались одному и тому же сжатию с потерями разное количество раз, или разные части подвергались разным видам сжатия с потерями. Поэтому разница в уровне артефактов сжатия в разных частях данных может указывать на то, что данные были отредактированы.
В случае JPEG даже композиция с частями, подвергнутыми одинаковому сжатию, будет иметь разницу в артефактах сжатия. [1]
Для того чтобы сделать обычно слабые артефакты сжатия более заметными, анализируемые данные подвергаются дополнительному раунду сжатия с потерями, на этот раз на известном, равномерном уровне, и результат вычитается из исходных исследуемых данных. Полученное разностное изображение затем проверяется вручную на предмет любых изменений в уровне артефактов сжатия. В 2007 году Н. Кравец обозначил этот метод как «анализ уровня ошибок». [1]
Кроме того, цифровые форматы данных, такие как JPEG, иногда включают метаданные, описывающие конкретное используемое сжатие с потерями. Если в таких данных наблюдаемые артефакты сжатия отличаются от ожидаемых из данного описания метаданных, то метаданные могут не описывать фактические сжатые данные и, таким образом, указывать на то, что данные были отредактированы.
По своей природе данные без сжатия с потерями , такие как изображение PNG , не могут быть подвергнуты анализу уровня ошибок. Следовательно, поскольку редактирование могло быть выполнено на данных без сжатия с потерями, сжатие с потерями применялось равномерно к отредактированным составным данным, наличие однородного уровня артефактов сжатия не исключает редактирование данных.
Кроме того, любые неравномерные артефакты сжатия в композите могут быть удалены путем повторного равномерного сжатия с потерями. [2] Кроме того, если цветовое пространство изображения уменьшено до 256 цветов или меньше, например, путем преобразования в GIF , то анализ уровня ошибок даст бесполезные результаты. [3]
Что еще более важно, фактическая интерпретация уровня артефактов сжатия в определенном сегменте данных является субъективной, и поэтому определение того, произошло ли редактирование, не является надежным. [1]
В мае 2013 года доктор Нил Кравец использовал анализ уровня ошибок в конкурсе World Press Photo of the Year 2012 и пришел к выводу в своем блоге Hacker Factor , что это был «композит» с изменениями, которые «не соответствуют приемлемым стандартам журналистики, используемым Reuters , Associated Press , Getty Images , National Press Photo's Association и другими средствами массовой информации». Организаторы World Press Photo отреагировали, позволив двум независимым экспертам проанализировать файлы изображений победившего фотографа и впоследствии подтвердив целостность файлов. Один из экспертов, Хани Фарид , сказал об анализе уровня ошибок, что «он неправильно маркирует измененные изображения как оригинальные и неправильно маркирует оригинальные изображения как измененные с той же вероятностью». Кравец ответил, уточнив, что «Интерпретация результатов остается на усмотрение пользователя. Любые ошибки в идентификации ложатся исключительно на зрителя». [4]
В мае 2015 года команда гражданской журналистики Bellingcat написала, что анализ уровня ошибок показал, что Министерство обороны России отредактировало спутниковые снимки, связанные с катастрофой рейса 17 Malaysia Airlines . [5] В ответ на это эксперт по криминалистике изображений Йенс Кризе сказал об анализе уровня ошибок: «Этот метод субъективен и не полностью основан на науке», и что это «метод, используемый любителями». [6] В своем блоге Hacker Factor Blog изобретатель анализа уровня ошибок Нил Кравец раскритиковал как использование Bellingcat анализа уровня ошибок как «неправильную интерпретацию результатов», так и «невежество» Йенса Кризе в отношении анализа уровня ошибок по нескольким пунктам. [7]
Иногда мы с трудом можем отличить измененную область от неизмененной просто по человеческому визуальному восприятию шума сжатия JPEG.
Если изображение пересохранено несколько раз, то оно может быть полностью на минимальном уровне ошибок, когда большее количество пересохранений не изменяет изображение. В этом случае ELA вернет черное изображение, и никакие изменения не могут быть идентифицированы с помощью этого алгоритма
Анализ уровня ошибок изображений также показывает, что изображения были отредактированы