stringtranslate.com

Схема распознавания объектов

Распознавание объектов – технология в области компьютерного зрения для поиска и идентификации объектов на изображении или видеоряде. Люди распознают множество объектов на изображениях без особых усилий, несмотря на то, что изображение объектов может несколько отличаться в разных точках зрения, во многих разных размерах и масштабах или даже при их перемещении или повороте. Объекты могут быть распознаны даже тогда, когда они частично скрыты от обзора. Эта задача по-прежнему является сложной задачей для систем компьютерного зрения. За несколько десятилетий было реализовано множество подходов к этой задаче.

Подходы, основанные на моделях объектов, подобных САПР

Распознавание по частям

Методы, основанные на внешнем виде

Соответствие кромок

Поиск «Разделяй и властвуй»

Сопоставление оттенков серого

Соответствие градиента

Гистограммы реакций рецептивного поля

Большие базы моделей

Методы, основанные на признаках

Деревья интерпретации

Выдвигать гипотезы и проверять их

Последовательность поз

Кластеризация поз

Инвариантность

Геометрическое хеширование

Масштабно-инвариантное преобразование признаков(ПРОСЕЯТЬ)

Ускоренные надежные функции(СЕРФИНГ)

Мешок слов представления

Генетический алгоритм

Генетические алгоритмы могут работать без предварительного знания заданного набора данных и могут разрабатывать процедуры распознавания без вмешательства человека. Недавний проект достиг 100-процентной точности на эталонных наборах данных изображений мотоциклов, лиц, самолетов и автомобилей из Калтеха и 99,4-процентной точности на наборах данных изображений видов рыб. [9] [10]

Другие подходы

Приложения

Методы распознавания объектов имеют следующие применения:

Опросы

Смотрите также

Списки

Примечания

  1. ^ Рахеш Мохан и Ракамант Неватия (1992). "Организация восприятия для сегментации и описания сцены" (PDF) . IEEE Trans Pattern Anal Mach Intell .
  2. ^ Свейн, Майкл Дж.; Баллард, Дана Х. (1991-11-01). «Цветовая индексация». International Journal of Computer Vision . 7 (1): 11–32. doi :10.1007/BF00130487. ISSN  1573-1405. S2CID  8167136.
  3. ^ Шиле, Бернт; Кроули, Джеймс Л. (2000-01-01). «Распознавание без соответствия с использованием многомерных рецептивных полевых гистограмм». Международный журнал компьютерного зрения . 36 (1): 31–50. doi :10.1023/A:1008120406972. ISSN  1573-1405. S2CID  2551159.
  4. ^ О. Линде и Т. Линдеберг «Распознавание объектов с использованием составных рецептивных полевых гистограмм более высокой размерности», Труды Международной конференции по распознаванию образов (ICPR'04), Кембридж, Великобритания II:1-6, 2004.
  5. ^ О. Линде; Т. Линдеберг (2012). «Составные гистограммы сложных сигналов: исследование информационного содержания в рецептивных полях, основанных на дескрипторах изображений для распознавания объектов». Компьютерное зрение и понимание изображений . 116 (4): 538–560. doi :10.1016/j.cviu.2011.12.003.
  6. ^ Лоу, Д.Г., «Отличительные особенности изображения по масштабно-инвариантным ключевым точкам», Международный журнал компьютерного зрения, 60, 2, стр. 91-110, 2004.
  7. ^ Линдеберг, Тони (2012). "Преобразование признаков, инвариантных к масштабу". Scholarpedia . 7 (5): 10491. Bibcode :2012SchpJ...710491L. doi : 10.4249/scholarpedia.10491 .
  8. ^ Бэй, Герберт; Эсс, Андреас; Туйтелаарс, Тинне; Ван Гул, Люк (2008). «Ускоренные надежные функции (SURF)». Компьютерное зрение и понимание изображений . 110 (3): 346–359. CiteSeerX 10.1.1.205.738 . doi :10.1016/j.cviu.2007.09.014. S2CID  14777911. 
  9. ^ "Новый алгоритм распознавания объектов учится на лету". Gizmag.com. 20 января 2014 г. Получено 21 января 2014 г.
  10. ^ Лиллиуайт, К.; Ли, ДЖ.; Типпеттс, Б.; Арчибальд, Дж. (2013). «Метод построения признаков для общего распознавания объектов». Распознавание образов . 46 (12): 3300. Bibcode : 2013PatRe..46.3300L. doi : 10.1016/j.patcog.2013.06.002.
  11. ^ Браун, Мэтью и Дэвид Г. Лоу. «Неконтролируемое распознавание и реконструкция 3D-объектов в неупорядоченных наборах данных». 3-D Digital Imaging and Modeling, 2005. 3DIM 2005. Пятая международная конференция по IEEE, 2005.
  12. ^ ab Олива, Оде и Антонио Торральба. «Роль контекста в распознавании объектов». Тенденции в когнитивных науках 11.12 (2007): 520-527.
  13. ^ ab Niu, Zhenxing и др. «Контекстно-зависимая тематическая модель для распознавания сцен». Конференция IEEE 2012 года по компьютерному зрению и распознаванию образов. IEEE, 2012.
  14. ^ Штейн, Фритьоф и Жерар Медиони. «Структурная индексация: эффективное распознавание трехмерных объектов». Труды IEEE по анализу образов и машинному интеллекту 2 (1992): 125-145.
  15. ^ Чжу, Сонг-Чун и Дэвид Мамфорд. «Стохастическая грамматика изображений». Основы и тенденции в компьютерной графике и зрении 2.4 (2007): 259-362.
  16. ^ Наяр, Шри К. и Рууд М. Болле. «Распознавание объектов на основе отражения». Международный журнал компьютерного зрения 17.3 (1996): 219-240.
  17. ^ Уортингтон, Филип Л. и Эдвин Р. Хэнкок. «Распознавание объектов с использованием формы по затенению». Труды IEEE по анализу образов и машинному интеллекту 23.5 (2001): 535-542.
  18. ^ Шоттон, Джейми и др. «Textonboost для понимания изображений: распознавание и сегментация многоклассовых объектов путем совместного моделирования текстуры, компоновки и контекста». Международный журнал компьютерного зрения 81.1 (2009): 2-23.
  19. ^ "Лучшее зрение робота". KurzweilAI . Получено 2013-10-09 .
  20. ^ Донахью, Джеффри и др. «Долгосрочные рекуррентные сверточные сети для визуального распознавания и описания». Труды конференции IEEE по компьютерному зрению и распознаванию образов. 2015.
  21. ^ Карпати, Андрей и Ли Фей-Фей. «Глубокие визуально-семантические выравнивания для генерации описаний изображений». Труды конференции IEEE по компьютерному зрению и распознаванию образов. 2015.
  22. ^ P Duygulu; K Barnard; N de Fretias & D Forsyth (2002). «Распознавание объектов как машинный перевод: изучение лексикона для фиксированного словаря изображений». Труды Европейской конференции по компьютерному зрению . стр. 97–112. Архивировано из оригинала 2005-03-05.
  23. ^ «Android Eyes Компьютерное зрение».Марта Дж. Фарах «Визуальная агнозия», Компьютерное зрение, вычислительная когнитивная нейронаука, MIT Press, 2011-05-01, страницы 760-781, ISSN 1468-4233 [1] [ нерабочая ссылка ]
  24. ^ Эстева, Андре и др. «Классификация рака кожи на уровне дерматолога с использованием глубоких нейронных сетей». Nature 542.7639 (2017): 115.
  25. ^ Браун, М. и Лоу, Д.Г., «Распознавание панорам, архивированных 25 декабря 2014 г. на Wayback Machine », ICCV, стр. 1218, Девятая международная конференция IEEE по компьютерному зрению (ICCV'03) — том 2, Ницца, Франция, 2003 г.
  26. ^ Ли, Л., Го, Б. и Шао, К., «Геометрически надежная маркировка изображений водяными знаками с использованием масштабно-инвариантного преобразования признаков и моментов Цернике», Chinese Optics Letters, том 5, выпуск 6, стр. 332-335, 2007.
  27. ^ Se,S., Lowe, DG, и Little, JJ, «Глобальная локализация и картографирование на основе машинного зрения для мобильных роботов», IEEE Transactions on Robotics, 21, 3 (2005), стр. 364-375.
  28. ^ Томас Серр, Максимиллиан Ризенхубер, Дженнифер Луи, Томазо Поджио, «О роли объектно-специфических признаков для распознавания объектов реального мира в биологическом зрении». Лаборатория искусственного интеллекта и кафедра мозга и когнитивных наук, Массачусетский технологический институт, Центр биологического и вычислительного обучения, Институт МакГоверна по исследованию мозга, Кембридж, Массачусетс, США
  29. ^ Пермалофф, Энн; Графтон, Карл (1992). «Оптическое распознавание символов». PS: Политология и политика . 25 (3): 523–531. doi :10.2307/419444. ISSN  1049-0965. JSTOR  419444. S2CID  64806776.
  30. ^ Кристиан Демант, Бернд Штрейхер-Абель, Петер Вашкевиц, «Промышленная обработка изображений: визуальный контроль качества в производстве» Краткое описание распознавания объектов в Google Books
  31. ^ Нуно Васконселос "Индексирование изображений с помощью смешанных иерархий" Архивировано 18 января 2011 г. в Wayback Machine Compaq Computer Corporation, Proc. IEEE Conference in Computer Vision and Pattern Recognition, Кауаи, Гавайи, 2001 г.
  32. ^ Хейккиля, Янне; Сильвен, Олли (2004). «Система реального времени для мониторинга велосипедистов и пешеходов». Image and Vision Computing . 22 (7): 563–570. doi :10.1016/j.imavis.2003.09.010.
  33. ^ Jung, Ho Gi; Kim, Dong Suk; Yoon, Pal Joo; Kim, Jaihie (2006). «Распознавание разметки парковочного места на основе структурного анализа для полуавтоматической системы парковки». В Yeung, Dit-Yan; Kwok, James T.; Fred, Ana; Roli, Fabio; de Ridder, Dick (ред.). Структурное, синтаксическое и статистическое распознавание образов . Конспект лекций по информатике. Том 4109. Берлин, Гейдельберг: Springer. стр. 384–393. doi : 10.1007/11815921_42 . ISBN 978-3-540-37241-7.
  34. ^ SK Nayar, H. Murase и SA Nene, «Обучение, позиционирование и отслеживание визуального образа» Труды Международной конференции IEEE по робототехнике и автоматизации, Сан-Диего, май 1994 г.
  35. ^ Лю, Ф.; Глейхер, М.; Джин, Х.; Агарвала, А. (2009). «Сохраняющие содержимое деформации для стабилизации 3D-видео». ACM Transactions on Graphics . 28 (3): 1. CiteSeerX 10.1.1.678.3088 . doi :10.1145/1531326.1531350. 

Ссылки

Внешние ссылки