stringtranslate.com

Схема распознавания объектов

Распознавание объектов – технология в области компьютерного зрения для поиска и идентификации объектов на изображении или видеоряде. Люди без особых усилий распознают множество объектов на изображениях, несмотря на то, что изображение объектов может несколько различаться при разных точках обзора, при разных размерах и масштабах или даже при их перемещении или повороте. Объекты можно распознать даже тогда, когда они частично закрыты из поля зрения. Эта задача по-прежнему остается сложной задачей для систем компьютерного зрения. Многие подходы к решению этой задачи были реализованы за несколько десятилетий.

Подходы, основанные на CAD-подобных объектных моделях

Распознавание по частям

Методы, основанные на внешнем виде

Соответствие кромок

Поиск по принципу «разделяй и властвуй»

Сопоставление оттенков серого

Соответствие градиента

Гистограммы ответов рецептивных полей

Большие базы моделей

Методы на основе функций

Деревья интерпретации

Выдвигайте гипотезы и проверяйте

Последовательность позы

Кластеризация поз

Инвариантность

Геометрическое хеширование

Масштабно-инвариантное преобразование признаков (SIFT)

Ускоренные надежные функции (SURF)

Мешок слов

Генетический алгоритм

Генетические алгоритмы могут работать без предварительного знания данного набора данных и разрабатывать процедуры распознавания без вмешательства человека. Недавний проект достиг 100-процентной точности эталонных наборов данных изображений мотоциклов, лиц, самолетов и автомобилей из Калифорнийского технологического института и 99,4-процентной точности наборов данных изображений видов рыб. [9] [10]

Другие подходы

Приложения

Методы распознавания объектов имеют следующие применения:

Опросы

Смотрите также

Списки

Примечания

  1. ^ Рахеш Мохан и Ракамант Неватия (1992). «Перцептивная организация сегментации и описания сцен» (PDF) . IEEE Trans Pattern Anal Mach Intell .
  2. ^ Суэйн, Майкл Дж.; Баллард, Дана Х. (1 ноября 1991 г.). «Цветовая индексация». Международный журнал компьютерного зрения . 7 (1): 11–32. дои : 10.1007/BF00130487. ISSN  1573-1405. S2CID  8167136.
  3. ^ Шиле, Бернт; Кроули, Джеймс Л. (1 января 2000 г.). «Распознавание без соответствия с использованием многомерных гистограмм рецептивных полей». Международный журнал компьютерного зрения . 36 (1): 31–50. дои : 10.1023/А: 1008120406972. ISSN  1573-1405. S2CID  2551159.
  4. ^ О. Линде и Т. Линдеберг «Распознавание объектов с использованием составных гистограмм рецептивного поля более высокой размерности», Proc. Международная конференция по распознаванию образов (ICPR'04), Кембридж, Великобритания II: 1-6, 2004 г.
  5. ^ О. Линде; Т. Линдеберг (2012). «Составные гистограммы со сложными сигналами: исследование информационного содержания в дескрипторах изображений на основе рецептивных полей для распознавания объектов». Компьютерное зрение и понимание изображений . 116 (4): 538–560. doi :10.1016/j.cviu.2011.12.003.
  6. ^ Лоу, Д.Г., «Отличительные особенности изображения по ключевым точкам, не зависящим от масштаба», Международный журнал компьютерного зрения, 60, 2, стр. 91–110, 2004.
  7. ^ Линдеберг, Тони (2012). «Преобразование масштабно-инвариантных признаков». Схоларпедия . 7 (5): 10491. Бибкод : 2012SchpJ...710491L. doi : 10.4249/scholarpedia.10491 .
  8. ^ Бэй, Герберт; Эсс, Андреас; Туйтелаарс, Тинне; Ван Гул, Люк (2008). «Ускоренные надежные функции (SURF)». Компьютерное зрение и понимание изображений . 110 (3): 346–359. CiteSeerX 10.1.1.205.738 . doi :10.1016/j.cviu.2007.09.014. S2CID  14777911. 
  9. ^ «Новый алгоритм распознавания объектов обучается на лету» . Gizmag.com. 20 января 2014 года . Проверено 21 января 2014 г.
  10. ^ Лиллиуайт, К.; Ли, диджей; Типпеттс, Б.; Арчибальд, Дж. (2013). «Метод построения признаков для общего распознавания объектов». Распознавание образов . 46 (12): 3300. Бибкод : 2013PatRe..46.3300L. дои : 10.1016/j.patcog.2013.06.002.
  11. ^ Браун, Мэтью и Дэвид Г. Лоу. «Неконтролируемое распознавание и реконструкция 3D-объектов в неупорядоченных наборах данных». 3-D цифровая визуализация и моделирование, 2005. 3DIM 2005. Пятая международная конференция. ИИЭР, 2005.
  12. ^ аб Олива, Ода и Антонио Торральба. «Роль контекста в распознавании объектов». Тенденции в когнитивных науках 11.12 (2007): 520-527.
  13. ^ Аб Ню, Чжэньсин и др. «Контекстно-зависимая тематическая модель для распознавания сцен». Конференция IEEE 2012 г. по компьютерному зрению и распознаванию образов. ИИЭР, 2012.
  14. ^ Штейн, Фритьоф и Жерар Медиони. «Структурная индексация: эффективное распознавание трехмерных объектов». Транзакции IEEE по анализу шаблонов и машинному интеллекту 2 (1992): 125–145.
  15. ^ Чжу, Сон-Чун и Дэвид Мамфорд. «Стохастическая грамматика изображений». Основы и тенденции в компьютерной графике и зрении 2.4 (2007): 259-362.
  16. ^ Наяр, Шри К. и Рууд М. Болле. «Распознавание объектов на основе отражения». Международный журнал компьютерного зрения 17.3 (1996): 219-240.
  17. ^ Уортингтон, Филип Л. и Эдвин Р. Хэнкок. «Распознавание объектов с использованием формы из затенения». Транзакции IEEE по анализу шаблонов и машинному интеллекту 23.5 (2001): 535-542.
  18. ^ Шоттон, Джейми и др. «Textonboost для понимания изображений: распознавание и сегментация объектов нескольких классов путем совместного моделирования текстуры, макета и контекста». Международный журнал компьютерного зрения 81.1 (2009): 2-23.
  19. ^ «Лучшее зрение роботов». КурцвейлАИ . Проверено 9 октября 2013 г.
  20. ^ Донахью, Джеффри и др. «Долгосрочные рекуррентные сверточные сети для визуального распознавания и описания». Материалы конференции IEEE по компьютерному зрению и распознаванию образов. 2015.
  21. ^ Карпаты, Андрей и Ли Фей-Фей. «Глубокое визуально-семантическое выравнивание для создания описаний изображений». Материалы конференции IEEE по компьютерному зрению и распознаванию образов. 2015.
  22. ^ П Дуйгулу; К. Барнард; Н де Фретиас и Д. Форсайт (2002). «Распознавание объектов как машинный перевод: изучение лексики для словаря фиксированных изображений». Материалы Европейской конференции по компьютерному зрению . стр. 97–112. Архивировано из оригинала 5 марта 2005 г.
  23. ^ «Компьютерное зрение Android Eyes» .Марта Дж. Фара «Визуальная агнозия», Когнитивная нейронаука с компьютерным зрением, MIT Press, 01 мая 2011 г., страницы 760–781, ISSN 1468-4233 [1] [ мертвая ссылка ]
  24. ^ Эстева, Андре и др. «Классификация рака кожи на уровне дерматолога с помощью глубоких нейронных сетей». Природа 542.7639 (2017): 115.
  25. ^ Браун, М., и Лоу, Д.Г., «Распознавание панорам, заархивированных 25 декабря 2014 г. в Wayback Machine », ICCV, стр. 1218, Девятая международная конференция IEEE по компьютерному зрению (ICCV'03) - Том 2, Ницца, Франция, 2003 г.
  26. ^ Ли, Л., Го, Б., и Шао, К., «Геометрически надежное нанесение водяных знаков на изображения с использованием масштабно-инвариантного преобразования признаков и моментов Цернике», Chinese Optics Letters, Том 5, Выпуск 6, стр. 332-335, 2007 г. .
  27. ^ С. С., Лоу Д. Г. и Литтл Дж. Дж., «Глобальная локализация и картографирование на основе машинного зрения для мобильных роботов», IEEE Transactions on Robotics, 21, 3 (2005), стр. 364–375.
  28. ^ Томас Серр, Максимилиан Ризенхубер, Дженнифер Луи, Томазо Поджо, «О роли объектно-специфичных функций в распознавании объектов реального мира в биологическом зрении». Лаборатория искусственного интеллекта и кафедра мозговых и когнитивных наук, Массачусетский технологический институт, Центр биологического и вычислительного обучения, Институт исследований мозга Мак-Говерна, Кембридж, Массачусетс, США
  29. ^ Пермалофф, Энн; Графтон, Карл (1992). "Оптическое распознавание символов". PS: Политология и политика . 25 (3): 523–531. дои : 10.2307/419444. ISSN  1049-0965. JSTOR  419444. S2CID  64806776.
  30. ^ Кристиан Демант, Бернд Штрайхер-Абель, Питер Вашкевиц, «Промышленная обработка изображений: визуальный контроль качества на производстве». Схема распознавания объектов в Google Книгах.
  31. ^ Нуно Васконселос «Индексирование изображений с помощью смешанных иерархий». Архивировано 18 января 2011 г. в Wayback Machine Compaq Computer Corporation, Proc. Конференция IEEE по компьютерному зрению и распознаванию образов, Кауаи, Гавайи, 2001 г.
  32. ^ Хейккиля, Янне; Сильвен, Олли (2004). «Система реального времени для мониторинга велосипедистов и пешеходов». Вычисление изображений и зрительных образов . 22 (7): 563–570. doi :10.1016/j.imavis.2003.09.010.
  33. ^ Юнг, Хо Ги; Ким, Дон Сок; Юн, Пал Джу; Ким, Джайхи (2006). «Распознавание маркировки парковочных мест на основе анализа конструкции для полуавтоматической парковочной системы». Ин Юнг, Дит-Ян; Квок, Джеймс Т.; Фред, Ана; Роли, Фабио; де Риддер, Дик (ред.). Структурное, синтаксическое и статистическое распознавание образов . Конспекты лекций по информатике. Том. 4109. Берлин, Гейдельберг: Springer. стр. 384–393. дои : 10.1007/11815921_42 . ISBN 978-3-540-37241-7.
  34. ^ С.К. Наяр, Х. Мурасе и С.А. Нене, «Обучение, позиционирование и отслеживание визуального внешнего вида», Proc. IEEE Intl. Конф. по робототехнике и автоматизации, Сан-Диего, май 1994 г.
  35. ^ Лю, Ф.; Глейхер, М.; Джин, Х.; Агарвала, А. (2009). «Деформация с сохранением контента для стабилизации 3D-видео». Транзакции ACM с графикой . 28 (3): 1. CiteSeerX 10.1.1.678.3088 . дои : 10.1145/1531326.1531350. 

Рекомендации

Внешние ссылки