Распознавание лиц — это компьютерная технология, используемая в различных приложениях, которая идентифицирует человеческие лица на цифровых изображениях. [1] Распознавание лиц также относится к психологическому процессу, посредством которого люди находят и обращают внимание на лица в визуальной сцене. [2]
Распознавание лиц можно рассматривать как частный случай обнаружения класса объектов . При обнаружении класса объектов задача состоит в том, чтобы найти местоположения и размеры всех объектов на изображении, которые принадлежат заданному классу. Примерами являются верхняя часть туловища, пешеходы и автомобили. Распознавание лиц просто отвечает на два вопроса: 1. есть ли человеческие лица на собранных изображениях или видео? 2. где находится лицо?
Алгоритмы распознавания лиц фокусируются на обнаружении фронтальных человеческих лиц. Это аналогично обнаружению изображений, при котором изображение человека сопоставляется по частям. Изображение сопоставляется с изображением, хранящимся в базе данных. Любые изменения черт лица в базе данных сделают процесс сопоставления недействительным. [3]
Надежный подход к обнаружению лиц, основанный на генетическом алгоритме и методе собственного лица [4] :
Во-первых, возможные области человеческого глаза определяются путем тестирования всех областей долин на изображении в оттенках серого. Затем генетический алгоритм используется для генерации всех возможных областей лица, которые включают брови, радужную оболочку, ноздри и уголки рта. [3]
Каждый возможный кандидат на лицо нормализуется, чтобы уменьшить как эффект освещения, вызванный неравномерным освещением, так и эффект гофрирования, вызванный движением головы. Значение пригодности каждого кандидата измеряется на основе его проекции на собственные лица. После ряда итераций все кандидаты на лицо с высоким значением пригодности отбираются для дальнейшей проверки. На этом этапе измеряется симметрия лица и проверяется наличие различных черт лица для каждого кандидата на лицо. [ необходима цитата ]
Распознавание лиц используется в биометрии , часто как часть (или вместе с) системы распознавания лиц . Оно также используется в видеонаблюдении , интерфейсе человек-компьютер и управлении базами данных изображений.
Некоторые современные цифровые камеры используют функцию распознавания лиц для автофокусировки. [5] Распознавание лиц также полезно для выбора интересующих областей в слайд-шоу из фотографий, использующих эффект панорамирования и масштабирования Кена Бернса .
Современные приборы также используют функцию распознавания улыбки , чтобы сделать фотографию в подходящий момент.
Распознавание лиц привлекает интерес маркетологов. Веб-камера может быть интегрирована в телевизор и распознавать любое проходящее мимо лицо. Затем система вычисляет расу, пол и возрастной диапазон лица. После сбора информации можно воспроизвести серию рекламных объявлений, которые будут соответствовать определенной расе/полу/возрасту.
Примером такой системы является OptimEyes , интегрированная в систему цифровых вывесок Amscreen . [6] [7]
Распознавание лиц может быть использовано как часть программной реализации эмоционального вывода . Эмоциональный вывод может быть использован, чтобы помочь людям с аутизмом понять чувства окружающих их людей. [8]
В последние годы ИИ-поддержка распознавания эмоций на лицах приобрела значительную популярность, используя различные модели для интерпретации эмоциональных состояний человека. Модель CLIP от OpenAI [9] иллюстрирует использование глубокого обучения для связывания изображений и текста, облегчая тонкое понимание эмоционального содержания. Например, в сочетании с сетевым психометрическим подходом модель использовалась для анализа политических речей на основе изменений в выражении лиц политиков. [10] Исследования в целом подчеркивают эффективность этих технологий, отмечая, что ИИ может анализировать выражения лиц (с интонациями голоса и письменным языком или без них), чтобы делать выводы об эмоциях, хотя остаются проблемы с точным различением тесно связанных эмоций и пониманием культурных нюансов. [11]
Распознавание лиц необходимо для процесса вывода языка из визуальных сигналов. Автоматизированное чтение по губам имеет приложения, помогающие компьютерам определять, кто говорит, что необходимо, когда безопасность имеет важное значение.