При обработке сигналов полезно одновременно анализировать пространственные и частотные характеристики сигнала. Хотя преобразование Фурье дает частотную информацию сигнала, оно не локализовано. Это означает, что мы не можем определить, какая часть (возможно, длинного) сигнала произвела определенную частоту. Для этой цели можно использовать кратковременное преобразование Фурье , однако кратковременное преобразование Фурье ограничивает базисные функции синусоидальными. Для обеспечения более гибкого пространственно-частотного разложения сигнала было предложено несколько фильтров (включая вейвлеты). Фильтр Лог-Габора [1] является одним из таких фильтров, который является улучшением исходного фильтра Габора . [2] Преимущество этого фильтра над многими альтернативами заключается в том, что он лучше соответствует статистике естественных изображений по сравнению с фильтрами Габора и другими вейвлет -фильтрами.
Фильтр Лог-Габора способен описывать сигнал в терминах локальных частотных характеристик. Поскольку это фундаментальный метод анализа сигналов, он имеет множество применений в обработке сигналов. Действительно, любое приложение, использующее фильтры Габора или другие базисные функции вейвлета, может извлечь выгоду из фильтра Лог-Габора. Однако, в зависимости от особенностей проблемы проектирования, может и не быть никакой выгоды. Тем не менее, было показано, что фильтр Лог-Габора особенно полезен в приложениях обработки изображений, поскольку он, как было показано, лучше захватывает статистику естественных изображений.
В обработке изображений есть несколько низкоуровневых примеров использования фильтров Лог-Габора. Обнаружение краев является одной из таких примитивных операций, где края изображения помечаются. Поскольку края появляются в частотной области как высокие частоты, естественно использовать фильтр, такой как Лог-Габор, чтобы выделить эти края. [3] [4] Эти обнаруженные края могут использоваться в качестве входных данных для алгоритма сегментации или алгоритма распознавания. Связанная проблема — обнаружение углов. Цель обнаружения углов — найти точки на изображении, которые являются углами. Углы полезно находить, поскольку они представляют собой стабильные местоположения, которые можно использовать для задач сопоставления изображений. Угол можно описать в терминах локализованной частотной информации с помощью фильтра Лог-Габора. [5]
При распознавании образов входное изображение должно быть преобразовано в представление признаков, которое алгоритму классификации проще разделять классы. Признаки, сформированные из отклика фильтров Лога-Габора, могут образовывать хороший набор признаков для некоторых приложений, поскольку он может локально представлять частотную информацию. Например, фильтр успешно использовался при классификации выражений лица. [6] Есть некоторые свидетельства того, что человеческая зрительная система обрабатывает визуальную информацию аналогичным образом. [7]
Существует множество других приложений, которым требуется локализованная информация о частоте. Фильтр Лог-Габора использовался в таких приложениях, как улучшение изображений, [8] анализ речи, [9] обнаружение контуров, [10] синтез текстур [11] и шумоподавление изображений [12] среди прочих.
Существует несколько существующих подходов для вычисления локализованной частотной информации. Эти подходы выгодны, поскольку в отличие от преобразования Фурье, эти фильтры могут более легко представлять разрывы в сигнале. Например, преобразование Фурье может представлять фронт, но только с использованием бесконечного числа синусоид.
При рассмотрении фильтров, которые извлекают локальную частотную информацию, существует связь между разрешением частоты и разрешением времени/пространства. Когда берется больше образцов, разрешение частотной информации выше, однако разрешение времени/пространства будет ниже. Аналогично, взятие только нескольких образцов означает более высокое пространственное/временное разрешение, но это происходит за счет меньшего разрешения частоты. Хороший фильтр должен иметь возможность получить максимальное разрешение частоты при заданном разрешении времени/пространства, и наоборот. Фильтр Габора достигает этой границы. [2] Из-за этого фильтр Габора является хорошим методом для одновременной локализации пространственной/временной и частотной информации. Фильтр Габора в пространственной (или временной) области формулируется как гауссова огибающая, умноженная на комплексную экспоненту. Было обнаружено, что корковые реакции в зрительной системе человека могут быть смоделированы фильтром Габора. [7] [13] Фильтр Габора был модифицирован Морле для формирования ортонормированного непрерывного вейвлет-преобразования. [14]
Хотя фильтр Габора достигает ощущения оптимальности с точки зрения компромисса между пространством и частотой, в некоторых приложениях он может быть не идеальным фильтром. При определенных полосах пропускания фильтр Габора имеет ненулевую постоянную составляющую. Это означает, что отклик фильтра зависит от среднего значения сигнала. Если выход фильтра должен использоваться для такого приложения, как распознавание образов, эта постоянная составляющая нежелательна, поскольку она дает признак, который изменяется со средним значением. Как мы вскоре увидим, фильтр Лог-Габора не демонстрирует этой проблемы. Кроме того, исходный фильтр Габора имеет импульсную характеристику бесконечной длины. Наконец, исходный фильтр Габора, хотя и является оптимальным в смысле неопределенности, не соответствует должным образом статистике естественных изображений. Как показано в [1], лучше выбрать фильтр с более длинным наклонным хвостом в задаче кодирования изображений.
В некоторых приложениях другие разложения имеют преимущества. Хотя существует множество возможных разложений, здесь мы кратко представляем два популярных метода: вейвлеты мексиканской шляпы и управляемая пирамида.
Вейвлет Рикера , обычно называемый мексиканской шляпой, — это еще один тип фильтра, который используется для моделирования данных. В нескольких измерениях он становится лапласианом гауссовой функции. По причинам вычислительной сложности лапласиан гауссовой функции часто аппроксимируется с использованием разности гауссианов . Эта разность гауссовой функции нашла применение в нескольких приложениях компьютерного зрения, таких как обнаружение ключевых точек. [15] Недостатком мексиканской шляпы является то, что она демонстрирует некоторую алиасинг и плохо представляет наклонные ориентации.
Разложение управляемой пирамиды [16] было представлено как альтернатива вейвлетам Морле (Габора) и Рикера. Это разложение игнорирует ограничение ортогональности вейвлет-формулировки и, делая это , способно построить набор фильтров, которые являются независимыми как от трансляции, так и от вращения. Недостатком разложения управляемой пирамиды является то, что оно является сверхполным. Это означает, что для описания сигнала используется больше фильтров, чем действительно необходимо.
Филд представил фильтр Лог-Габора и показал, что он способен лучше кодировать естественные изображения по сравнению с исходным фильтром Габора. [1] Кроме того, фильтр Лог-Габора не имеет той же проблемы DC, что и исходный фильтр Габора. Одномерная функция Лог-Габора имеет частотную характеристику:
где и - параметры фильтра. даст центральную частоту фильтра. влияет на полосу пропускания фильтра. Полезно поддерживать ту же форму, пока параметр частоты изменяется. Для этого отношение должно оставаться постоянным. На следующем рисунке показана частотная характеристика Габора по сравнению с Лог-Габором:
Другое определение фильтра Лог-Габора заключается в том, чтобы рассматривать его как функцию распределения вероятностей с нормальным распределением , но с учетом логарифма частот. Это имеет смысл в контекстах, где применяется закон Вебера-Фехнера , например, в визуальном или слуховом восприятии. Следуя правилу замены переменной, одномерная функция Лог-Габора имеет, таким образом, измененную частотную характеристику:
Обратите внимание, что это распространяется на начало координат и что у нас все еще есть .
В обоих определениях из-за нуля в значении DC невозможно вывести аналитическое выражение для фильтра в пространственной области. На практике фильтр сначала проектируется в частотной области, а затем обратное преобразование Фурье дает импульсную характеристику во временной области.
Как и фильтр Габора, фильтр логарифмического Габора пользуется большой популярностью в обработке изображений. [4] Из-за этого полезно рассмотреть 2-мерное расширение фильтра логарифмического Габора. С этим дополнительным измерением фильтр не только разработан для определенной частоты, но и разработан для определенной ориентации. Компонент ориентации представляет собой функцию расстояния Гаусса в соответствии с углом в полярных координатах (см. [1] или [2]):
где здесь теперь есть четыре параметра: центральная частота, параметр ширины для частоты, ориентация центра и параметр ширины ориентации. Пример этого фильтра показан ниже.
Ширина полосы пропускания по частоте определяется по формуле:
Обратите внимание, что результирующая полоса пропускания измеряется в октавах.
Угловая полоса пропускания определяется по формуле:
Во многих практических приложениях набор фильтров проектируется для формирования банка фильтров . Поскольку фильтры не образуют набор ортогональных базисов, проектирование банка фильтров является своего рода искусством и может зависеть от конкретной поставленной задачи. Необходимые параметры, которые должны быть выбраны: минимальная и максимальная частоты, полоса пропускания фильтра, количество ориентаций, угловая полоса пропускания, масштабирование фильтра и количество масштабов.