stringtranslate.com

Фильтр Лог Габора

При обработке сигналов полезно одновременно анализировать пространственные и частотные характеристики сигнала. Хотя преобразование Фурье дает частотную информацию сигнала, оно не локализовано. Это означает, что мы не можем определить, какая часть (возможно, длинного) сигнала произвела определенную частоту. Для этой цели можно использовать кратковременное преобразование Фурье , однако кратковременное преобразование Фурье ограничивает базисные функции синусоидальными. Для обеспечения более гибкого пространственно-частотного разложения сигнала было предложено несколько фильтров (включая вейвлеты). Фильтр Лог-Габора [1] является одним из таких фильтров, который является улучшением исходного фильтра Габора . [2] Преимущество этого фильтра над многими альтернативами заключается в том, что он лучше соответствует статистике естественных изображений по сравнению с фильтрами Габора и другими вейвлет -фильтрами.

Приложения

Фильтр Лог-Габора способен описывать сигнал в терминах локальных частотных характеристик. Поскольку это фундаментальный метод анализа сигналов, он имеет множество применений в обработке сигналов. Действительно, любое приложение, использующее фильтры Габора или другие базисные функции вейвлета, может извлечь выгоду из фильтра Лог-Габора. Однако, в зависимости от особенностей проблемы проектирования, может и не быть никакой выгоды. Тем не менее, было показано, что фильтр Лог-Габора особенно полезен в приложениях обработки изображений, поскольку он, как было показано, лучше захватывает статистику естественных изображений.

В обработке изображений есть несколько низкоуровневых примеров использования фильтров Лог-Габора. Обнаружение краев является одной из таких примитивных операций, где края изображения помечаются. Поскольку края появляются в частотной области как высокие частоты, естественно использовать фильтр, такой как Лог-Габор, чтобы выделить эти края. [3] [4] Эти обнаруженные края могут использоваться в качестве входных данных для алгоритма сегментации или алгоритма распознавания. Связанная проблема — обнаружение углов. Цель обнаружения углов — найти точки на изображении, которые являются углами. Углы полезно находить, поскольку они представляют собой стабильные местоположения, которые можно использовать для задач сопоставления изображений. Угол можно описать в терминах локализованной частотной информации с помощью фильтра Лог-Габора. [5]

При распознавании образов входное изображение должно быть преобразовано в представление признаков, которое алгоритму классификации проще разделять классы. Признаки, сформированные из отклика фильтров Лога-Габора, могут образовывать хороший набор признаков для некоторых приложений, поскольку он может локально представлять частотную информацию. Например, фильтр успешно использовался при классификации выражений лица. [6] Есть некоторые свидетельства того, что человеческая зрительная система обрабатывает визуальную информацию аналогичным образом. [7]

Существует множество других приложений, которым требуется локализованная информация о частоте. Фильтр Лог-Габора использовался в таких приложениях, как улучшение изображений, [8] анализ речи, [9] обнаружение контуров, [10] синтез текстур [11] и шумоподавление изображений [12] среди прочих.

Существующие подходы

Существует несколько существующих подходов для вычисления локализованной частотной информации. Эти подходы выгодны, поскольку в отличие от преобразования Фурье, эти фильтры могут более легко представлять разрывы в сигнале. Например, преобразование Фурье может представлять фронт, но только с использованием бесконечного числа синусоид.

Фильтры Габора

При рассмотрении фильтров, которые извлекают локальную частотную информацию, существует связь между разрешением частоты и разрешением времени/пространства. Когда берется больше образцов, разрешение частотной информации выше, однако разрешение времени/пространства будет ниже. Аналогично, взятие только нескольких образцов означает более высокое пространственное/временное разрешение, но это происходит за счет меньшего разрешения частоты. Хороший фильтр должен иметь возможность получить максимальное разрешение частоты при заданном разрешении времени/пространства, и наоборот. Фильтр Габора достигает этой границы. [2] Из-за этого фильтр Габора является хорошим методом для одновременной локализации пространственной/временной и частотной информации. Фильтр Габора в пространственной (или временной) области формулируется как гауссова огибающая, умноженная на комплексную экспоненту. Было обнаружено, что корковые реакции в зрительной системе человека могут быть смоделированы фильтром Габора. [7] [13] Фильтр Габора был модифицирован Морле для формирования ортонормированного непрерывного вейвлет-преобразования. [14]

Хотя фильтр Габора достигает ощущения оптимальности с точки зрения компромисса между пространством и частотой, в некоторых приложениях он может быть не идеальным фильтром. При определенных полосах пропускания фильтр Габора имеет ненулевую постоянную составляющую. Это означает, что отклик фильтра зависит от среднего значения сигнала. Если выход фильтра должен использоваться для такого приложения, как распознавание образов, эта постоянная составляющая нежелательна, поскольку она дает признак, который изменяется со средним значением. Как мы вскоре увидим, фильтр Лог-Габора не демонстрирует этой проблемы. Кроме того, исходный фильтр Габора имеет импульсную характеристику бесконечной длины. Наконец, исходный фильтр Габора, хотя и является оптимальным в смысле неопределенности, не соответствует должным образом статистике естественных изображений. Как показано в [1], лучше выбрать фильтр с более длинным наклонным хвостом в задаче кодирования изображений.

В некоторых приложениях другие разложения имеют преимущества. Хотя существует множество возможных разложений, здесь мы кратко представляем два популярных метода: вейвлеты мексиканской шляпы и управляемая пирамида.

Мексиканская шляпа вейвлет

Вейвлет Рикера , обычно называемый мексиканской шляпой, — это еще один тип фильтра, который используется для моделирования данных. В нескольких измерениях он становится лапласианом гауссовой функции. По причинам вычислительной сложности лапласиан гауссовой функции часто аппроксимируется с использованием разности гауссианов . Эта разность гауссовой функции нашла применение в нескольких приложениях компьютерного зрения, таких как обнаружение ключевых точек. [15] Недостатком мексиканской шляпы является то, что она демонстрирует некоторую алиасинг и плохо представляет наклонные ориентации.

Управляемая пирамида

Разложение управляемой пирамиды [16] было представлено как альтернатива вейвлетам Морле (Габора) и Рикера. Это разложение игнорирует ограничение ортогональности вейвлет-формулировки и, делая это , способно построить набор фильтров, которые являются независимыми как от трансляции, так и от вращения. Недостатком разложения управляемой пирамиды является то, что оно является сверхполным. Это означает, что для описания сигнала используется больше фильтров, чем действительно необходимо.

Определение

Филд представил фильтр Лог-Габора и показал, что он способен лучше кодировать естественные изображения по сравнению с исходным фильтром Габора. [1] Кроме того, фильтр Лог-Габора не имеет той же проблемы DC, что и исходный фильтр Габора. Одномерная функция Лог-Габора имеет частотную характеристику:

где и - параметры фильтра. даст центральную частоту фильтра. влияет на полосу пропускания фильтра. Полезно поддерживать ту же форму, пока параметр частоты изменяется. Для этого отношение должно оставаться постоянным. На следующем рисунке показана частотная характеристика Габора по сравнению с Лог-Габором:

Разница в частотной области между фильтрами Габора и Лог-Габора. Фильтр Габора имеет ненулевой отклик на частоте постоянного тока, тогда как Лог-Габор всегда равен нулю. Из-за этого фильтр Габора имеет тенденцию переоценивать низкие частоты. Это особенно заметно в логарифмической области.

Другое определение фильтра Лог-Габора заключается в том, чтобы рассматривать его как функцию распределения вероятностей с нормальным распределением , но с учетом логарифма частот. Это имеет смысл в контекстах, где применяется закон Вебера-Фехнера , например, в визуальном или слуховом восприятии. Следуя правилу замены переменной, одномерная функция Лог-Габора имеет, таким образом, измененную частотную характеристику:

Обратите внимание, что это распространяется на начало координат и что у нас все еще есть .

В обоих определениях из-за нуля в значении DC невозможно вывести аналитическое выражение для фильтра в пространственной области. На практике фильтр сначала проектируется в частотной области, а затем обратное преобразование Фурье дает импульсную характеристику во временной области.

Двумерный фильтр Лога-Габора

Многомасштабное разложение естественного изображения с использованием логарифмических фильтров Габора. Для представления краев изображения на разных уровнях была вычислена корреляция логарифмических фильтров Габора в разных масштабах (по часовой стрелке), см. эту страницу для реализации.

Как и фильтр Габора, фильтр логарифмического Габора пользуется большой популярностью в обработке изображений. [4] Из-за этого полезно рассмотреть 2-мерное расширение фильтра логарифмического Габора. С этим дополнительным измерением фильтр не только разработан для определенной частоты, но и разработан для определенной ориентации. Компонент ориентации представляет собой функцию расстояния Гаусса в соответствии с углом в полярных координатах (см. [1] или [2]):

где здесь теперь есть четыре параметра: центральная частота, параметр ширины для частоты, ориентация центра и параметр ширины ориентации. Пример этого фильтра показан ниже.

Построение двумерного фильтра Лог Габора. Двумерный фильтр состоит из компонента, основанного на частоте (a), и компонента, основанного на ориентации (b). Два компонента объединяются для формирования конечного компонента (c).
Разница в пространственной области между фильтрами Габора и Лог-Габора. В пространственной области отклик фильтров Габора и Лог-Габора почти идентичен. Слева — действительная часть, справа — мнимая часть импульсного отклика.

Ширина полосы пропускания по частоте определяется по формуле:

Обратите внимание, что результирующая полоса пропускания измеряется в октавах.

Угловая полоса пропускания определяется по формуле:

Во многих практических приложениях набор фильтров проектируется для формирования банка фильтров . Поскольку фильтры не образуют набор ортогональных базисов, проектирование банка фильтров является своего рода искусством и может зависеть от конкретной поставленной задачи. Необходимые параметры, которые должны быть выбраны: минимальная и максимальная частоты, полоса пропускания фильтра, количество ориентаций, угловая полоса пропускания, масштабирование фильтра и количество масштабов.

Смотрите также

Ссылки

  1. ^ abc DJ Field. Отношения между статистикой естественных изображений и свойствами реакции корковых клеток. J. Opt. Soc. Am. A, 1987, стр. 2379–2394.
  2. ^ ab Д. Габор. Теория связи. J. Inst. Electr. Eng. 93, 1946.
  3. ^ Z. Xiao, C. Guo, Y. Ming и L. Qiang. Исследование логарифмического вейвлета Габора и его применение в обнаружении границ изображения. В International Conference on Signal Processing, том 1, страницы 592–595, август 2002 г.
  4. ^ ab Сильвен Фишер, Филип Срубек, Лоран У. Перрине, Рафаэль Редондо, Габриэль Кристобаль. Самообратимые двумерные логарифмические вейвлеты Габора. Int. Journal of Computational Vision, 2007
  5. ^ X. Gao, F. Sattar и R. Venkateswarlu. Многомасштабное обнаружение углов серых изображений на основе логарифмического вейвлет-преобразования Габора. IEEE Transactions on Circuits and Systems for Video Technology, 17(7):868–875, июль 2007 г.
  6. ^ Н. Роуз. Классификация выражений лица с использованием фильтров Габора и логарифмического фильтра Габора. В сборнике статей Международной конференции по автоматическому распознаванию лиц и жестов (FGR), страницы 346–350, апрель 2006 г.
  7. ^ ab JG Daugman. Соотношение неопределенности для разрешения в пространстве, пространственной частоты и ориентации, оптимизированное двумерными визуальными кортикальными фильтрами. Журнал оптического общества Америки, 1985, стр. 1160–9.
  8. ^ W. Wang, J. Li, F. Huang и H. Feng. Разработка и реализация фильтра логарифма Габора для улучшения изображений отпечатков пальцев. Pattern Recognition Letters, 2008. С. 301–308.
  9. ^ Л. Хе, М. Лех, Н. Мэддадж и Н. Аллен. Распознавание стресса и эмоций с использованием анализа спектрограмм речи с помощью логарифмического фильтра Габора. Аффективные вычисления и интеллектуальное взаимодействие, 2009, стр. 1–6
  10. ^ Сильвен Фишер, Рафаэль Редондо, Лоран Перрине, Габриэль Кристобаль. Разреженная аппроксимация изображений, вдохновленная функциональной архитектурой первичных зрительных областей. Журнал EURASIP об успехах в обработке сигналов, специальный выпуск по восприятию изображений, 2007
  11. ^ Паула С. Леон, Иво Ванцетта, Гийом С. Массон, Лоран У. Перрине. Облака движения: синтез стимулов на основе моделей из случайных текстур, похожих на естественные, для изучения восприятия движения. Журнал нейрофизиологии, 107(11):3217–3226, 2012
  12. ^ П. Ковеси. Сохранение фазы шумоподавления изображений. Конференция Австралийского общества распознавания образов: DICTA'99, 1999, стр. 212–217.
  13. ^ Эндрю Б. Уотсон. Преобразование коры головного мозга: быстрое вычисление моделируемых нейронных изображений. Журнал компьютерного зрения, графики и обработки изображений. 1987. С. 311–327.
  14. ^ А. Гроссман и Дж. Морле. Разложение функций Харди на квадратично-интегрируемые вейвлеты постоянной формы. Журнал SIAM по математическому анализу, 1984, стр. 723–736.
  15. ^ DG Lowe. Отличительные особенности изображения от масштабно-инвариантных ключевых точек. International Journal of Computer Vision, 2004, стр. 91–110.
  16. ^ EP Simoncelli и WT Freeman. Управляемая пирамида: гибкая архитектура для многомасштабных производных вычислений. IEEE Int'l Conf on Image Processing, 1995. стр. 444 - 447

Внешние ссылки