Face Recognition Grand Challenge ( FRGC ) проводился с мая 2004 года по март 2006 года для продвижения и совершенствования технологии распознавания лиц . [1] База данных FRGC v2, созданная в 2005 году, оказала значительное влияние на развитие 3D-распознавания лиц. [2] Хотя с тех пор было создано много других баз данных лиц, по состоянию на 2022 год FRGC v2 продолжала использоваться в качестве «стандартной справочной базы данных для оценки алгоритмов 3D-распознавания лиц». [2]
Face Recognition Grand Challenge (FRGC) — проект, направленный на продвижение и развитие технологии распознавания лиц для поддержки существующих усилий по распознаванию лиц в правительстве США. Проект длился с мая 2004 года по март 2006 года и был открыт для исследователей и разработчиков распознавания лиц в компаниях, академических кругах и исследовательских институтах. FRGC разработал новые методы распознавания лиц и прототипы систем, которые значительно улучшили производительность.
FRGC состоял из постепенно усложняющихся проблемных задач, каждая из которых включала набор данных изображений лиц и определенный набор экспериментов. Проблемы-задачи были разработаны для преодоления одного из препятствий на пути к разработке улучшенного распознавания лиц, а именно отсутствия данных.
Существует три основных направления для улучшения алгоритмов распознавания лиц: изображения с высоким разрешением, трехмерное (3D) распознавание лиц и новые методы предварительной обработки. Современные системы распознавания лиц предназначены для работы с относительно небольшими статическими изображениями лиц. В FRGC изображения с высоким разрешением состоят из изображений лиц со средним размером 250 пикселей между центрами глаз, что значительно больше, чем 40–60 пикселей в современных изображениях. FRGC стремится содействовать разработке новых алгоритмов, которые используют дополнительную информацию, присутствующую в изображениях с высоким разрешением.
Трехмерные алгоритмы распознавания лиц идентифицируют лица на основе трехмерной формы лица человека. В отличие от современных систем распознавания лиц, на которые влияют изменения освещения и позы, трехмерное распознавание лиц имеет потенциал для улучшения производительности в этих условиях, поскольку форма лица остается неизменной.
В последние годы [ когда? ] достижения в области компьютерной графики и компьютерного зрения позволили моделировать изменения освещения и позы на изображениях лиц. Эти достижения привели к разработке новых алгоритмов, которые могут автоматически корректировать изменения освещения и позы перед обработкой с помощью системы распознавания лиц. Аспект предварительной обработки FRGC направлен на измерение влияния этих новых алгоритмов предварительной обработки на производительность распознавания.
FRGC структурирован вокруг сложных задач, призванных подтолкнуть исследователей к достижению цели FRGC.
В сообществе по распознаванию лиц есть три новых аспекта FRGC. Во-первых, размер FRGC с точки зрения данных заслуживает внимания. Набор данных FRGC содержит 50 000 записей. Во-вторых, сложность FRGC выделяет его. В отличие от предыдущих наборов данных по распознаванию лиц, которые были сосредоточены на неподвижных изображениях, FRGC охватывает три режима:
Третий новый аспект — инфраструктура. Биометрическая экспериментальная среда (BEE) обеспечивает инфраструктуру для FRGC. BEE, фреймворк на основе XML, описывает и документирует вычислительные эксперименты. Он позволяет описывать эксперименты, распространять, записывать необработанные результаты, анализировать, представлять результаты и документировать в общем формате. Это первый случай, когда вычислительно-экспериментальная среда поддержала сложную задачу распознавания лиц или биометрии.
Распределение данных FRGC состоит из трех частей. Первая часть — набор данных FRGC. Вторая часть — FRGC BEE. Распределение BEE включает все наборы данных для выполнения и оценки шести экспериментов. Третья часть состоит из базовых алгоритмов для экспериментов 1–4. Со всеми тремя компонентами можно проводить эксперименты 1–4, от обработки необработанных изображений до получения рабочих характеристик приемника (ROC).
Данные FRGC включают 50 000 записей, разделенных на разделы обучения и проверки. Раздел обучения предназначен для обучения алгоритма, в то время как раздел проверки оценивает эффективность подхода в лабораторных условиях. Раздел проверки включает данные из 4003 сеансов субъектов. Сессия субъектов представляет собой все изображения человека, полученные во время сбора биометрических данных, содержащие четыре контролируемых неподвижных изображения, два неконтролируемых неподвижных изображения и одно трехмерное изображение. Контролируемые изображения были сделаны в студийной обстановке, показывая полные фронтальные изображения лица при двух условиях освещения и двух выражениях лица (улыбка и нейтральное). Неконтролируемые изображения были сделаны в различных условиях освещения, таких как коридоры, атриумы или на открытом воздухе. Каждый набор неконтролируемых изображений содержит два выражения: улыбающееся и нейтральное. 3D-изображение было получено в контролируемых условиях освещения и включает как изображения диапазона, так и изображения текстуры. 3D-изображения были получены с помощью датчика серии Minolta Vivid 900/910.
Распределение FRGC состоит из шести экспериментов. В эксперименте 1 галерея состоит из одного контролируемого неподвижного изображения человека, а каждый зонд состоит из одного контролируемого неподвижного изображения. Эксперимент 1 служит контрольным экспериментом. Эксперимент 2 изучает влияние использования нескольких неподвижных изображений человека на производительность. В эксперименте 2 каждый биометрический образец состоит из четырех контролируемых изображений человека, полученных в ходе сеанса субъекта. Например, галерея состоит из четырех изображений каждого человека, полученных в ходе одного и того же сеанса субъекта. Аналогично, зонд состоит из четырех изображений человека.
Эксперимент 3 измеряет производительность распознавания 3D-лиц. В эксперименте 3 и галерея, и набор зондов состоят из 3D-изображений человека. Эксперимент 4 оценивает производительность распознавания с использованием неконтролируемых изображений. В эксперименте 4 галерея содержит одно контролируемое неподвижное изображение, а набор зондов содержит одно неконтролируемое неподвижное изображение.
Эксперименты 5 и 6 сравнивают 3D- и 2D-изображения. В обоих экспериментах галерея состоит из 3D-изображений. В эксперименте 5 набор зондов состоит из одного контролируемого неподвижного изображения. В эксперименте 6 набор зондов состоит из одного неконтролируемого неподвижного изображения.
В статье использованы общедоступные материалы из NIST Face Recognition Grand Challenge. Национальный институт стандартов и технологий .