Простейшие методы пороговой обработки заменяют каждый пиксель на изображении черным пикселем, если интенсивность изображения меньше фиксированного значения, называемого порогом , или белым пикселем, если интенсивность пикселя больше этого порога. На примере изображения справа это приводит к тому, что темное дерево становится полностью черным, а яркий снег становится полностью белым.
Автоматическое пороговое значение
Хотя в некоторых случаях порог может быть выбран пользователем вручную, во многих случаях пользователь хочет, чтобы порог был автоматически установлен алгоритмом. В таких случаях порог должен быть «лучшим» порогом в том смысле, что разделение пикселей выше и ниже порога должно максимально точно соответствовать фактическому разделению между двумя классами объектов, представленными этими пикселями (например, пиксели ниже порога должны соответствовать фону, а пиксели выше — некоторым интересующим объектам на изображении).
Существует множество типов методов автоматического порогового определения, наиболее известным и широко используемым из которых является метод Оцу . Сезгин и др. (2004) классифицировали методы порогового определения на широкие группы на основе информации, которой оперирует алгоритм. [2] Однако следует отметить, что такая категоризация неизбежно является нечеткой, поскольку некоторые методы могут попадать в несколько категорий (например, метод Оцу можно считать как алгоритмом формирования гистограммы, так и алгоритмом кластеризации).
Методы, основанные на форме гистограммы , где, например, анализируются пики, впадины и кривизны сглаженной гистограммы. [3] Обратите внимание, что эти методы, в большей степени, чем другие, делают определенные предположения о распределении вероятности интенсивности изображения (т. е. форме гистограммы),
Методы, основанные на кластеризации , где образцы серого уровня кластеризуются в две части: фон и передний план, [4] [5]
Методы, основанные на энтропии, приводят к алгоритмам, которые используют энтропию областей переднего плана и фона, перекрестную энтропию между исходным и бинаризированным изображением и т. д. [6]
Методы, основанные на атрибутах объектов, ищут меру сходства между серым изображением и бинаризованными изображениями, например, сходство нечетких форм, совпадение краев и т. д.
Пространственные методы используют распределение вероятностей более высокого порядка и/или корреляцию между пикселями.
Глобальное и локальное пороговое значение
В большинстве методов один и тот же порог применяется ко всем пикселям изображения. Однако в некоторых случаях может быть выгодно применять другой порог к разным частям изображения на основе локального значения пикселей. Эта категория методов называется локальным или адаптивным порогом. Они особенно адаптированы к случаям, когда изображения имеют неоднородное освещение, например, на изображении судоку справа. В этих случаях определяется окрестность и порог вычисляется для каждого пикселя и его окрестности. Многие глобальные методы порога можно адаптировать для работы локальным способом, но существуют также методы, разработанные специально для локального порога, например, алгоритмы Ниблэка [7] или Бернсена.
Такое программное обеспечение, как ImageJ, предлагает широкий спектр методов автоматического определения пороговых значений, как глобальных, так и локальных.
Преимущества локального порогового значения по сравнению с глобальным пороговым значением[8]
Адаптируемость к локальным характеристикам изображения: локальное пороговое значение может адаптироваться к изменениям освещенности, контрастности и текстуры в различных частях изображения. Эта адаптивность помогает при обработке изображений с неравномерными условиями освещения или сложными текстурами.
Сохранение локальных деталей: применяя индивидуальные пороговые значения к различным областям, локальное пороговое значение может сохранять мелкие детали и края, которые могут быть потеряны при глобальном пороговом значении, особенно в областях с различной интенсивностью или градиентами.
Сниженная чувствительность к шуму: локальное пороговое значение может быть менее чувствительным к шуму по сравнению с глобальным пороговым значением, поскольку решение об установлении порогового значения принимается на основе локальной статистики, а не всего изображения.
Примеры алгоритмов локального порогового определения
Метод Ниблэка: [9] Алгоритм Ниблэка вычисляет локальный порог для каждого пикселя на основе среднего и стандартного отклонения соседства пикселя. Он корректирует порог на основе локальных характеристик изображения, что делает его пригодным для обработки изменений в освещении.
Метод Бернсена: [10] Алгоритм Бернсена вычисляет порог для каждого пикселя, учитывая локальный контраст в пределах окрестности. Он использует фиксированный размер окна и устойчив к шуму и изменениям интенсивности фона.
Метод Сауволы: [11] Алгоритм Сауволы расширяет метод Ниблэка, включая динамический фактор, который адаптирует порог на основе локального контраста и средней интенсивности. Этот адаптивный фактор улучшает результаты бинаризации, особенно в областях с изменяющимися контрастами.
Расширения бинарного порогового значения
Многополосные изображения
Цветные изображения также могут быть пороговыми. Один из подходов заключается в назначении отдельного порогового значения для каждого из компонентов RGB изображения, а затем их объединении с помощью операции AND . Это отражает способ работы камеры и способ хранения данных в компьютере, но не соответствует способу, которым люди распознают цвет. Поэтому чаще используются цветовые модели HSL и HSV ; обратите внимание, что поскольку оттенок является круговой величиной, он требует кругового порогового значения . Также можно использовать цветовую модель CMYK . [12]
Несколько порогов
Вместо одного порога, приводящего к бинарному изображению, также можно ввести несколько увеличивающихся порогов . В этом случае реализация порогов приведет к изображению с классами, где пиксели с интенсивностью, такой что будут назначены классу . Большинство методов бинарного автоматического порога имеют естественное расширение для многопорогового определения.
Ограничения
Пороговое значение будет работать лучше всего при определенных условиях:
низкий уровень шума
более высокая внутриклассовая дисперсия, чем межклассовая дисперсия, т. е. пиксели из одной группы имеют более близкую интенсивность друг к другу, чем к пикселям другой группы,
^ Шапиро, Линда Г.; Стокман, Джордж К. (2001). Компьютерное зрение . Prentice Hall. стр. 83. ISBN 978-0-13-030796-5.
^ Санкур, Бюлент (2004). «Обзор методов пороговой обработки изображений и количественная оценка производительности». Журнал электронной визуализации . 13 (1): 146. Bibcode : 2004JEI....13..146S. doi : 10.1117/1.1631315.
^ Zack, GW; Rogers, WE; Latt, SA (июль 1977). «Автоматическое измерение частоты обмена сестринскими хроматидами». Журнал гистохимии и цитохимии . 25 (7): 741–753. doi : 10.1177/25.7.70454 . PMID 70454. S2CID 15339151.
^ "Picture Thresholding Using an Iterative Selection Method". Труды IEEE по системам, человеку и кибернетике . 8 (8): 630–632. 1978. doi :10.1109/TSMC.1978.4310039.
^ Barghout, L.; Sheynin, J. (2013-07-25). "Восприятие реальной сцены и перцептивная организация: уроки компьютерного зрения". Journal of Vision . 13 (9): 709. doi : 10.1167/13.9.709 .
^ Капур, Дж. Н.; Саху, П. К.; Вонг, А. К. Ч. (1985-03-01). «Новый метод пороговой обработки изображений в градациях серого с использованием энтропии гистограммы». Компьютерное зрение, графика и обработка изображений . 29 (3): 273–285. doi :10.1016/0734-189X(85)90125-2.
^ Чаки, Набенду., Шейх, Сохараб Хоссейн., Саид, Халид. Изучение методов бинаризации изображений. Германия: Springer India, 2014. [ нужна страница ]
^ Sauvola, J.; Pietikäinen, M. (февраль 2000 г.). «Адаптивная бинаризация изображений документов». Pattern Recognition . 33 (2): 225–236. Bibcode : 2000PatRe..33..225S. doi : 10.1016/S0031-3203(99)00055-2.
^ Pham, Nhu-An; Morrison, Andrew; Schwock, Joerg; Aviel-Ronen, Sarit; Iakovlev, Vladimir; Tsao, Ming-Sound; Ho, James; Hedley, David W. (2007-02-27). "Количественный анализ изображений иммуногистохимических пятен с использованием цветовой модели CMYK". Diagnostic Pathology . 2 (1): 8. doi : 10.1186/1746-1596-2-8 . PMC 1810239 . PMID 17326824.
Дальнейшее чтение
Гонсалес, Рафаэль С. и Вудс, Ричард Э. (2002). Пороговое определение. В цифровой обработке изображений, стр. 595–611. Pearson Education. ISBN 81-7808-629-8
Эйхман, Марко (2009). «Структура для эффективного оптимального многоуровневого порогового определения изображения». Журнал электронной визуализации . 18 (1): 013004–013004–10. Bibcode : 2009JEI....18a3004L. doi : 10.1117/1.3073891.
Rosin, Paul L. (март 2014 г.). «Эффективное круговое пороговое определение». IEEE Transactions on Image Processing . 23 (3): 992–1001. Bibcode : 2014ITIP...23..992Y. doi : 10.1109/TIP.2013.2297014. PMID 24464614.
Скотт Э. Умбо (2018). Цифровая обработка и анализ изображений, стр. 93–96. CRC Press. ISBN 978-1-4987-6602-9