Обратный поиск изображений

Обратный поиск изображений — это метод поиска изображений на основе контента (CBIR) , который включает предоставление системе CBIR образца изображения, на котором она затем будет основывать свой поиск; с точки зрения поиска информации образец изображения очень полезен. В частности, обратный поиск изображений характеризуется отсутствием поисковых терминов. Это эффективно устраняет необходимость для пользователя угадывать ключевые слова или термины, которые могут или не могут вернуть правильный результат. Обратный поиск изображений также позволяет пользователям находить контент, связанный с определенным образцом изображения ^[1] или популярностью изображения, а также находить измененные версии и производные работы. ^[2]

Визуальная поисковая система — поисковая система , предназначенная для поиска информации во Всемирной паутине с помощью обратного поиска изображений. Информация может состоять из веб-страниц , местоположений, других изображений и других типов документов. Этот тип поисковых систем в основном используется для поиска в мобильном Интернете с помощью изображения неизвестного объекта (неизвестный поисковый запрос). Примерами являются здания в чужом городе. Эти поисковые системы часто используют методы поиска изображений на основе контента .

Визуальная поисковая система ищет изображения и шаблоны на основе алгоритма , который она может распознать , и выдает относительную информацию на основе выборочного или прикладного метода сопоставления шаблонов.

Использует

Обратный поиск изображений может быть использован для: ^[3]

Найдите источник изображения.
Найдите версии с более высоким разрешением.
Найдите веб-страницы, на которых появляется изображение.
Найдите создателя контента.
Получить информацию об изображении.

Алгоритмы

Обычно используемые алгоритмы обратного поиска изображений включают в себя: ^[4]

Масштабно-инвариантное преобразование признаков — для извлечения локальных признаков изображения ^[5]
Максимально устойчивые экстремальные области
Словарное дерево

Визуальные искатели информации

Поиск изображений

Поисковая система изображений — это поисковая система, предназначенная для поиска изображений. Поиск может быть основан на ключевых словах, изображении или веб- ссылке на изображение. Результаты зависят от критерия поиска, например, метаданных , распределения цвета, формы и т. д., а также от метода поиска, используемого браузером.

Методы поиска изображений

В настоящее время при поиске изображений используются два метода:

Поиск по метаданным: Поиск изображений основан на сравнении метаданных, связанных с изображением, таких как ключевые слова, текст и т. д., и получается путем использования набора изображений, отсортированных по релевантности. Метаданные, связанные с каждым изображением, могут ссылаться на название изображения, формат, цвет и т. д. и могут быть сгенерированы вручную или автоматически. Этот процесс генерации метаданных называется аудиовизуальной индексацией.

Поиск по образцу: В этой технике, также называемой обратным поиском изображений, результаты поиска получаются путем сравнения изображений с использованием методов компьютерного зрения для поиска изображений на основе контента . Во время поиска изучается контент изображения, такой как цвет, форма, текстура или любая визуальная информация, которая может быть извлечена из изображения. Эта система требует более высокой вычислительной сложности , но более эффективна и надежна, чем поиск по метаданным.

Существуют поисковики изображений, которые объединяют оба метода поиска. Например, первый поиск выполняется путем ввода текста. Полученные изображения затем используются для уточнения поиска.

Поиск видео

Поисковая система видео — это поисковая система, предназначенная для поиска видео в сети. Некоторые поисковики видео обрабатывают поиск непосредственно в Интернете, в то время как другие скрывают видео, по которым выполняется поиск. Некоторые поисковики также позволяют использовать в качестве параметров поиска формат или продолжительность видео. Обычно результаты сопровождаются миниатюрным захватом видео.

Методы поиска видео

В настоящее время почти все поисковики видео основаны на ключевых словах (поиск по метаданным) для выполнения поиска. Эти ключевые слова могут быть найдены в названии видео, тексте, сопровождающем видео, или могут быть определены автором. Примером такого типа поиска является YouTube .

Поисковик 3D-моделей

Поисковик 3D-моделей ставит своей целью найти файл объекта 3D-моделирования из базы данных или сети. На первый взгляд реализация этого типа поисковиков может показаться излишней, но из-за непрерывной документальной инфляции Интернета, с каждым днем становится все более необходимой индексация информации.

Методы поиска 3D-моделей

Они использовались с традиционными текстовыми поисковиками (ключевые слова/теги), где авторы индексируемого материала или пользователи Интернета вносили эти теги или ключевые слова. Поскольку это не всегда эффективно, недавно было исследовано внедрение поисковых систем, которые объединяют поиск с использованием текста с поиском по сравнению с 2D-чертежами, 3D-чертежами и 3D-моделями.

Принстонский университет разработал поисковую систему, которая объединяет все эти параметры для выполнения поиска, тем самым повышая эффективность поиска. ^[6] Также портал 3DfindIT.com предоставляет поисковую систему 3D-моделей на основе эскизов, чертежей, текста и т. д. https://www.3dfindit.com/

Мобильный визуальный поиск

Мобильный поисковик изображений — это тип поисковой системы, разработанный исключительно для мобильных телефонов, с помощью которого вы можете найти любую информацию в Интернете , используя изображение, сделанное с помощью собственного мобильного телефона или используя определенные слова ( ключевые слова ). Решения Mobile Visual Search позволяют вам интегрировать возможности программного обеспечения для распознавания изображений в ваши собственные фирменные мобильные приложения. Mobile Visual Search (MVS) устраняет разрыв между онлайн- и офлайн- медиа, позволяя вам связывать ваших клиентов с цифровым контентом .

Введение

Мобильные телефоны превратились в мощные устройства обработки изображений и видео, оснащенные камерами высокого разрешения, цветными дисплеями и аппаратно-ускоренной графикой. Они также все чаще оснащаются глобальной системой позиционирования и подключаются к широкополосным беспроводным сетям. Все это позволяет новому классу приложений, которые используют камеру телефона для инициирования поисковых запросов об объектах, находящихся в визуальной близости от пользователя (рисунок 1). Такие приложения могут использоваться, например, для идентификации продуктов, сравнения покупок, поиска информации о фильмах, компакт-дисках (CD), недвижимости, печатных изданиях или произведениях искусства.

Процесс

Обычно этот тип поисковой системы использует методы запроса по образцу или запроса изображения по образцу , которые используют содержимое, форму, текстуру и цвет изображения для сравнения их в базе данных , а затем выдают приблизительные результаты запроса.

Процесс, используемый при этом поиске на мобильных телефонах, выглядит следующим образом:

Сначала изображение отправляется на серверное приложение. Уже на сервере изображение будет проанализировано различными аналитическими командами, поскольку каждая из них специализируется на различных областях, составляющих изображение. Затем каждая команда решит, содержит ли отправленное изображение области их специализации или нет.

После завершения всей процедуры центральный компьютер проанализирует данные и создаст страницу результатов, отсортированных по эффективности каждой команды, которая в конечном итоге будет отправлена на мобильный телефон .

Применение в популярных поисковых системах

Яндекс

Yandex Images предлагает глобальный обратный поиск изображений и фотографий. Сайт использует стандартную технологию Content Based Image Retrieval (CBIR), используемую многими другими сайтами, но дополнительно использует технологию на основе искусственного интеллекта для поиска дополнительных результатов на основе запроса. ^[7] Пользователи могут перетаскивать изображения на панель инструментов сайта, чтобы выполнить поиск в Интернете на предмет похожих изображений. Yandex Images ищет некоторые малоизвестные сайты социальных сетей в дополнение к более распространенным, предлагая владельцам контента средства отслеживания плагиата интеллектуальной собственности изображений или фотографий.

Google Картинки

Поиск по изображению от Google — это функция, которая использует обратный поиск изображений и позволяет пользователям искать похожие изображения, загружая изображение или копируя URL-адрес изображения. Google выполняет это, анализируя отправленное изображение и создавая его математическую модель. Затем оно сравнивается с другими изображениями в базах данных Google, прежде чем возвращать соответствующие и похожие результаты. Когда это возможно, Google также использует метаданные об изображении, такие как описание. В 2022 году эта функция была заменена Google Lens в качестве метода визуального поиска по умолчанию в Google, а старая функция поиска по изображению остается доступной в Google Lens. ^[8]

TinEye

TinEye — это поисковая система, специализирующаяся на обратном поиске изображений. После отправки изображения TinEye создает «уникальную и компактную цифровую подпись или отпечаток» указанного изображения и сопоставляет его с другими проиндексированными изображениями. ^[9] Эта процедура способна сопоставлять даже очень отредактированные версии отправленного изображения, но обычно не возвращает похожие изображения в результатах. ^[10]

Пикси

Технология обратного поиска изображений Pixsy обнаруживает совпадения изображений ^[11] в общедоступном Интернете для изображений, загруженных на платформу Pixsy. ^[12] Новые совпадения автоматически обнаруживаются, и пользователю отправляются оповещения. В случае несанкционированного использования Pixsy предлагает услугу компенсации ^[13]^[14] за коммерческое использование работ владельцев изображений. Pixsy сотрудничает с более чем 25 юридическими фирмами и адвокатами по всему миру для разрешения проблем с нарушением авторских прав. Pixsy — это стратегический сервис мониторинга изображений для платформы Flickr и пользователей. ^[15]

eBay

eBay ShopBot использует обратный поиск изображений для поиска товаров по загруженной пользователем фотографии. eBay использует сеть ResNet-50 для распознавания категорий, хэши изображений хранятся в Google Bigtable ; задания Apache Spark обрабатываются Google Cloud Dataproc для извлечения хэшей изображений; а служба ранжирования изображений развернута Kubernetes . ^[16]

СК Планета

SK Planet использует обратный поиск изображений для поиска связанных модных товаров на своем сайте электронной коммерции. Он разработал сеть кодировщика зрения на основе TensorFlow inception-v3 со скоростью сходимости и обобщения для использования в производстве. Рекуррентная нейронная сеть используется для многоклассовой классификации, а обнаружение области интереса модного продукта основано на Faster R-CNN . Система обратного поиска изображений SK Planet была создана менее чем за 100 человеко-месяцев. ^[17]

Алибаба

Alibaba выпустила приложение Pailitao в 2014 году. Pailitao ( китайский :拍立淘, буквально означает «покупки через камеру») позволяет пользователям искать товары на платформе электронной коммерции Alibaba, делая фотографию объекта запроса. Приложение Pailitao использует глубокую модель CNN с ветвями для совместного обнаружения и обучения признакам, чтобы обнаружить маску обнаружения и точный дискриминационный признак без фоновых помех. GoogLeNet V1 используется в качестве базовой модели для прогнозирования категорий и обучения признакам. ^[18]^[19]

Пинтерест

Pinterest приобрела стартап VisualGraph в 2014 году и представила визуальный поиск на своей платформе. ^[20] В 2015 году Pinterest опубликовала доклад на конференции ACM Conference on Knowledge Discovery and Data Mining и раскрыла архитектуру системы. Конвейер использует Apache Hadoop , фреймворк сверточной нейронной сети Caffe с открытым исходным кодом , Cascading для пакетной обработки, PinLater для обмена сообщениями и Apache HBase для хранения. Характеристики изображений, включая локальные особенности, глубокие особенности, заметные цветовые подписи и заметные пиксели, извлекаются из пользовательских загрузок. Система управляется Amazon EC2 и требует только кластера из 5 экземпляров GPU для обработки ежедневных загрузок изображений на Pinterest. Используя обратный поиск изображений, Pinterest может извлекать визуальные особенности из модных объектов (например, обувь, платье, очки, сумка, часы, брюки, шорты, бикини, серьги) и предлагать рекомендации по продуктам, которые выглядят похожими. ^[21]^[22]

JD.com

JD.com раскрыла дизайн и реализацию своей системы визуального поиска в реальном времени на конференции Middleware '18 . Рецензируемая статья фокусируется на алгоритмах, используемых распределенной иерархической системой извлечения, индексирования и поиска признаков изображений JD, которая имеет 300 миллионов активных пользователей в день. Система могла поддерживать 80 миллионов обновлений своей базы данных в час, когда она была развернута в производстве в 2018 году. ^[23]

Бинг

Microsoft Bing опубликовал архитектуру своей системы обратного поиска изображений на конференции KDD'18. В статье говорится, что для описания содержимого запроса используются различные функции изображения, отправленного пользователем, включая использование глубоких нейросетевых кодировщиков, функций распознавания категорий, функций распознавания лиц , цветовых функций и функций обнаружения дубликатов. ^[24]

Амазонка

Amazon.com раскрыл архитектуру визуальной поисковой системы для модных и домашних товаров под названием Amazon Shop the Look в статье, опубликованной на конференции KDD'22. В статье описываются уроки, извлеченные Amazon при развертывании в производственной среде, включая дополнения данных на основе синтеза изображений для оптимизации производительности поиска и повышения точности. ^[25]

Системы исследования

Пекинская лаборатория Microsoft Research Asia опубликовала статью в Proceedings of the IEEE о системах Arista-SS (Похожие поиски) и Arista-DS (поиск дубликатов). Arista-DS выполняет только алгоритмы поиска дубликатов, такие как анализ главных компонентов, на глобальных характеристиках изображений, чтобы снизить вычислительные и затраты памяти. Arista-DS способна выполнять поиск дубликатов на 2 миллиардах изображений с 10 серверами, но с компромиссом в виде отсутствия обнаружения близких дубликатов. ^[26]

Реализации с открытым исходным кодом

В 2007 году библиотека Puzzle была выпущена под лицензией ISC . Puzzle разработана для того, чтобы предлагать обратный поиск визуально похожих изображений, даже после того, как изображения были изменены в размере, повторно сжаты, перекрашены и/или слегка изменены. ^[27]

Проект с открытым исходным кодом image-match был выпущен в 2016 году. Проект, лицензированный по лицензии Apache , реализует обратную поисковую систему изображений, написанную на Python . ^[28]

И библиотека головоломок , и проекты сопоставления изображений используют алгоритмы, опубликованные на конференции IEEE ICIP. ^[29]

В 2019 году книга, опубликованная O'Reilly, документирует, как простая система обратного поиска изображений может быть создана за несколько часов. Книга охватывает извлечение признаков изображений и поиск по сходству, а также более сложные темы, включая масштабируемость с использованием графических процессоров и настройку повышения точности поиска. ^[30] Код для системы был предоставлен в свободном доступе на GitHub . ^[31]

Обратный поиск видео

Требования к обработке для выполнения обратного поиска видео были бы поразительно высокими. Не существует простого инструмента, чтобы просто загрузить видео и найти соответствующие результаты. В настоящее время не существует технологии, которая могла бы успешно выполнить обратный поиск видео. ^[32]^[33]

Производство систем обратного поиска изображений

Смотрите также

На Викискладе есть медиафайлы по теме Обратный поиск изображений .

Ссылки

^ "Как искать по изображению" . Получено 2 ноября 2013 г. .
^ "Поиск видео с помощью Frompo". Frompo.com . Получено 2 ноября 2013 г. .
^ «Часто задаваемые вопросы — TinEye — Зачем использовать TinEye?». ТинАй .
^ Объединение функций для крупномасштабного поиска частично дублированных изображений в Интернете Microsoft .
^ Новая поисковая система веб-изображений с использованием алгоритма SIFT computer.org
^ Funkhouser, Thomas; Min, Patrick; Kazhdan, Michael; Chen, Joyce; Halderman, Alex; Dobkin, David; Jacobs, David (2002). «Поисковая система для 3D-моделей» (PDF) . ACM Transactions on Graphics . 22 (1): 83–105. doi :10.1145/588272.588279. S2CID 1178691.
^ Радж, Абишек, ред. (27 февраля 2022 г.). «Как работает обратный поиск изображений Яндекса? Подробное руководство». www.buddinggeek.com . Budding Geek . Получено 5 мая 2022 г. .
^ Ли, Абнер (10 августа 2022 г.). «Google Картинки в Интернете теперь используют Google Lens». 9to5Google . Получено 2 декабря 2022 г. .
^ «Часто задаваемые вопросы — TinEye — Как работает TinEye?». ТинАй .
^ «Часто задаваемые вопросы - TinEye - Может ли TinEye найти похожие изображения??». ТинАй .
^ "Найти украденные изображения - Pixsy". Pixsy . Получено 2017-10-20 .
^ "Обзор Pixsy.com: Поиск и борьба с кражей изображений - Интернет-маркетинг для художников -". Интернет-маркетинг для художников . 2015-07-02 . Получено 2017-10-20 .
^ "Pixsy: Найдите и получите деньги за кражу изображений". artlawjournal.com . 2014-10-18 . Получено 2017-10-20 .
^ "Resolve image theft - Pixsy". Pixsy . Получено 2017-10-20 .
^ «Flickr объединяется с Pixsy, чтобы вы получали деньги за кражу фотографий». petapixel.com . 9 апреля 2019 г. Получено 12 декабря 2019 г.
^ Yang, Fan; Kale, Ajinkya; Bubnov, Yury; Stein, Leon; Wang, Qiaosong; Kiapour, Hadi; Piramuthu, Robinson (2017). «Визуальный поиск на eBay». Труды 23-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных. стр. 2101–2110. arXiv : 1706.03154 . doi :10.1145/3097983.3098162. ISBN 9781450348874. S2CID 22367645. {{cite book}}: |work=проигнорировано ( помощь )
^ Визуальный поиск модных товаров на SK Planet
^ Чжан, Яньхао; Пан, Пан; Чжэн, Юн; Чжао, Кан; Чжан, Инья; Рен, Сяофэн; Джин, Ронг (2018). «Визуальный поиск на Alibaba». Материалы 24-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных. стр. 993–1001. arXiv : 2102.04674 . дои : 10.1145/3219819.3219820. ISBN 9781450355520. S2CID 50776405. {{cite book}}: |work=проигнорировано ( помощь )
^ «Покупки с помощью камеры: визуальный поиск изображений встречается с электронной коммерцией в Alibaba». Alibaba Tech . Сентябрь 2020 г.
^ Джош Констайн (6 января 2014 г.). «Pinterest приобретает стартап VisualGraph, занимающийся распознаванием изображений и визуальным поиском». TechCrunch . AOL.
^ Цзин, Юши; Лю, Дэвид; Кислюк, Дмитрий; Чжай, Эндрю; Сюй, Цзяцзин; Донахью, Джефф; Тавел, Сара (2015). «Визуальный поиск в Pinterest». Труды 21-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных. стр. 1889–1898. doi :10.1145/2783258.2788621. ISBN 9781450336642. S2CID 1153609. {{cite book}}: |work=проигнорировано ( помощь )
^ "Создание масштабируемого конвейера машинного зрения". Pinterest Engineering . Архивировано из оригинала 2015-09-06.
^ Ли, Цзе; Лю, Хайфэн; Гуй, Чуанхуа; Чэнь, Цзяньюй; Ни, Чжэньюань; Ван, Нин; Чэнь, Юань (2018). «Проектирование и реализация системы визуального поиска в реальном времени на платформе электронной коммерции JD». Труды 19-й Международной конференции по промежуточному программному обеспечению. стр. 9–16. arXiv : 1908.07389 . doi :10.1145/3284028.3284030. ISBN 9781450360166. S2CID 53713854. {{cite book}}: |website=проигнорировано ( помощь )
^ Ху, Хоудонг; Ван, Янь; Ян, Линьцзюнь; Комлев, Павел; Хуан, Ли; Чэнь, Си (Стивен); Хуан, Цзяпэй; У, Йе; Мерчант, Миназ; Сачети, Арун (2018). «Веб-масштабируемый адаптивный визуальный поиск в Bing». Труды 24-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных. стр. 359–367. doi :10.1145/3219819.3219843. ISBN 9781450355520. S2CID 3427399. {{cite book}}: |website=проигнорировано ( помощь )
^ Amazon Shop the Look: визуальная поисковая система для моды и дома
^ Аннотирование изображений на основе поиска дубликатов с использованием данных веб-масштаба Microsoft.
^ Библиотека головоломок
^ ProvenanceLabs / сопоставление изображений
^ Подпись изображения для любого вида изображения
^ Коул, Анируд (октябрь 2019 г.). «Глава 4. Создание поисковой системы обратного изображения: понимание вложений». Практическое глубокое обучение для облака, мобильных устройств и периферии. O'Reilly Media . ISBN 9781492034865.
^ Репозиторий исходных текстов Practical-Deep-Learning-Book
^ VКак использовать обратный поиск видео (и почему это полезно). Сентябрь 2022 г. {{cite book}}: |work=проигнорировано ( помощь )
^ «Как найти источник видео с помощью обратного поиска изображений?». Alibaba DigitBin . Октябрь 2020 г.
^ Как выполнить обратный поиск изображений с телефона