Поиск информации с использованием цифровых изображений
Система поиска изображений — это компьютерная система, используемая для просмотра, поиска и извлечения изображений из большой базы данных цифровых изображений. Большинство традиционных и распространенных методов поиска изображений используют некоторые методы добавления метаданных, таких как субтитры , ключевые слова , заголовки или описания к изображениям, чтобы поиск можно было выполнять по словам аннотации. Ручное аннотирование изображений занимает много времени, является трудоемким и дорогим; для решения этой проблемы было проведено большое количество исследований по автоматическому аннотированию изображений. Кроме того, рост числа социальных веб-приложений и семантической сети вдохновил на разработку нескольких веб-инструментов для аннотирования изображений.
Первая система поиска баз данных изображений на основе микрокомпьютера была разработана в Массачусетском технологическом институте в 1990-х годах Баниредди Прасадом, Амаром Гуптой , Ху-мином Туном и Стюартом Мадником . [1]
В обзорной статье 2008 года задокументирован прогресс после 2007 года. [2]
Методы поиска
Поиск изображений — это специализированный поиск данных, используемый для поиска изображений. Для поиска изображений пользователь может указать термины запроса, такие как ключевое слово, файл изображения/ссылка или щелкнуть по какому-либо изображению, и система вернет изображения, «похожие» на запрос. Сходство, используемое для критериев поиска, может быть метатегами, распределением цветов в изображениях, атрибутами области/формы и т. д.
- Метапоиск изображений — поиск изображений на основе связанных метаданных, таких как ключевые слова, текст и т. д.
- Поиск изображений на основе содержимого (CBIR) — применение компьютерного зрения для поиска изображений. CBIR стремится избегать использования текстовых описаний и вместо этого извлекает изображения на основе сходства их содержимого (текстуры, цвета, формы и т. д.) с предоставленным пользователем изображением запроса или указанными пользователем особенностями изображения.
- Список поисковых систем CBIR — список поисковых систем, которые ищут изображения на основе визуального контента, такого как цвет, текстура, форма/объект и т. д.
Область действия данных
Крайне важно понимать объем и природу данных изображений, чтобы определить сложность дизайна системы поиска изображений. Дизайн также во многом зависит от таких факторов, как разнообразие пользовательской базы и ожидаемый пользовательский трафик для поисковой системы. По этому измерению данные поиска можно классифицировать по следующим категориям:
- Архивы — обычно содержат большие объемы структурированных или полуструктурированных однородных данных, относящихся к определенным темам.
- Domain-Specific Collection - это однородная коллекция, предоставляющая доступ контролируемым пользователям с очень конкретными целями. Примерами такой коллекции являются биомедицинские и спутниковые базы данных изображений.
- Enterprise Collection — разнородная коллекция изображений, доступная пользователям в интрасети организации. Изображения могут храниться во многих разных местах.
- Личная коллекция — обычно состоит из в значительной степени однородной коллекции, как правило, небольшого размера, доступна в первую очередь ее владельцу и обычно хранится на локальном носителе.
- Web - изображения Всемирной паутины доступны всем, у кого есть подключение к Интернету. Эти коллекции изображений являются полуструктурированными, неоднородными и массивными по объему, и обычно хранятся в больших дисковых массивах.
Оценки
Проводятся семинары по оценке систем поиска изображений, направленные на изучение и улучшение производительности таких систем.
- ImageCLEF — продолжающееся направление Форума по межъязыковой оценке, которое оценивает системы, использующие как текстовые методы поиска, так и методы поиска изображений.
- Контентно-ориентированный доступ к библиотекам изображений и видео — серия семинаров IEEE с 1998 по 2001 год.
Смотрите также
Ссылки
- ^ BE Prasad; A Gupta; HM Toong; SE Madnick (февраль 1987 г.). «Система управления базой данных изображений на базе микрокомпьютера» (PDF) . IEEE Transactions on Industrial Electronics . IE-34 (1): 83–8. doi :10.1109/TIE.1987.350929. S2CID 24543386.
- ^ Датта, Ритендра; Дхирадж Джоши; Цзя Ли ; Джеймс З. Ван (апрель 2008 г.). «Поиск изображений: идеи, влияния и тенденции нового века». ACM Computing Surveys . 40 (2): 1–60. doi :10.1145/1348246.1348248. S2CID 7060187.
- ^ Камарго, Хорхе Э.; Кайседо, Хуан К.; Гонсалес, Фабио А. (2013). «Основанная на ядре структура для исследования коллекции изображений». Журнал визуальных языков и вычислений . 24 (1): 53–57. doi :10.1016/j.jvlc.2012.10.008.
Внешние ссылки
- Image-Net.org
- VGG Image Search Engine (VISE): бесплатное программное обеспечение с открытым исходным кодом для визуального поиска большого количества изображений с использованием изображения в качестве поискового запроса.