Распознавание образов

Распознавание образов — это задача присвоения класса наблюдению на основе образов, извлеченных из данных. Несмотря на схожесть, распознавание образов (PR) не следует путать с машинами по распознаванию образов (PM), которые могут обладать возможностями (PR), но их основная функция — различать и создавать возникающие образы. PR применяется в статистическом анализе данных , обработке сигналов , анализе изображений , поиске информации , биоинформатике , сжатии данных , компьютерной графике и машинном обучении . Распознавание образов берет свое начало в статистике и инженерии; некоторые современные подходы к распознаванию образов включают использование машинного обучения из-за возросшей доступности больших данных и нового изобилия вычислительной мощности .

Системы распознавания образов обычно обучаются на основе помеченных «тренировочных» данных. Когда помеченные данные недоступны, можно использовать другие алгоритмы для обнаружения ранее неизвестных образов. KDD и интеллектуальный анализ данных больше фокусируются на неконтролируемых методах и более тесно связаны с бизнес-использованием. Распознавание образов больше фокусируется на сигнале, а также учитывает сбор и обработку сигнала . Оно возникло в инженерии , и этот термин популярен в контексте компьютерного зрения : ведущая конференция по компьютерному зрению называется Conference on Computer Vision and Pattern Recognition .

В машинном обучении распознавание образов — это назначение метки заданному входному значению. В статистике дискриминантный анализ был введен для этой же цели в 1936 году. Примером распознавания образов является классификация , которая пытается назначить каждое входное значение одному из заданного набора классов (например, определить, является ли заданное электронное письмо «спамом»). Распознавание образов — более общая проблема, которая охватывает и другие типы выходных данных. Другими примерами являются регрессия , которая назначает действительное выходное значение каждому входному значению; ^[1] маркировка последовательностей , которая назначает класс каждому члену последовательности значений ^[2] (например, разметка частей речи , которая назначает часть речи каждому слову во входном предложении); и синтаксический анализ , который назначает дерево синтаксического анализа входному предложению, описывающее синтаксическую структуру предложения. ^[3]

Алгоритмы распознавания образов обычно нацелены на предоставление разумного ответа для всех возможных входных данных и выполнение «наиболее вероятного» сопоставления входных данных с учетом их статистической вариации. Это противоположно алгоритмам сопоставления образов , которые ищут точные совпадения во входных данных с уже существующими образами. Типичным примером алгоритма сопоставления образов является сопоставление регулярных выражений , которое ищет образцы заданного вида в текстовых данных и включено в возможности поиска многих текстовых редакторов и текстовых процессоров .

Обзор

Современное определение распознавания образов:

Область распознавания образов занимается автоматическим обнаружением закономерностей в данных с помощью компьютерных алгоритмов и использованием этих закономерностей для выполнения таких действий, как классификация данных по различным категориям. ^[4]

Распознавание образов обычно классифицируется в соответствии с типом процедуры обучения, используемой для генерации выходного значения. Контролируемое обучение предполагает, что был предоставлен набор обучающих данных ( обучающий набор ), состоящий из набора экземпляров, которые были правильно помечены вручную с правильным выходом. Затем процедура обучения генерирует модель, которая пытается достичь двух иногда противоречивых целей: выполнять как можно лучше на обучающих данных и как можно лучше обобщать на новые данные (обычно это означает быть настолько простым, насколько это возможно, для некоторого технического определения «простого», в соответствии с бритвой Оккама , обсуждаемого ниже). Неконтролируемое обучение , с другой стороны, предполагает обучающие данные, которые не были помечены вручную, и пытается найти присущие им закономерности в данных, которые затем можно использовать для определения правильного выходного значения для новых экземпляров данных. ^[5] Комбинация этих двух методов, которая была изучена, — это полуконтролируемое обучение , которое использует комбинацию маркированных и немаркированных данных (обычно небольшой набор маркированных данных в сочетании с большим количеством немаркированных данных). В случаях неконтролируемого обучения обучающие данные могут вообще отсутствовать.

Иногда для описания соответствующих контролируемых и неконтролируемых процедур обучения для одного и того же типа выходных данных используются разные термины. Неконтролируемый эквивалент классификации обычно известен как кластеризация , основанная на общем восприятии задачи как не включающей в себя обучающие данные, о которых можно было бы говорить, и группировании входных данных в кластеры на основе некоторой присущей меры сходства (например, расстояния между экземплярами, рассматриваемыми как векторы в многомерном векторном пространстве ), а не назначения каждого входного экземпляра одному из набора предопределенных классов. В некоторых областях терминология отличается. В экологии сообществ термин классификация используется для обозначения того, что обычно известно как «кластеризация».

Часть входных данных, для которой генерируется выходное значение, формально называется экземпляром . Экземпляр формально описывается вектором признаков , которые вместе составляют описание всех известных характеристик экземпляра. Эти векторы признаков можно рассматривать как определяющие точки в соответствующем многомерном пространстве , и к ним можно соответствующим образом применять методы манипулирования векторами в векторных пространствах , такие как вычисление скалярного произведения или угла между двумя векторами. Признаки обычно являются либо категориальными (также известными как номинальные , т. е. состоящими из одного из набора неупорядоченных элементов, таких как пол «мужской» или «женский» или группа крови «A», «B», «AB» или «O»), порядковыми (состоящими из одного из набора упорядоченных элементов, например, «большой», «средний» или «маленький»), целочисленными (например, подсчет количества вхождений определенного слова в электронном письме) или вещественными (например, измерение артериального давления). Часто категориальные и порядковые данные группируются вместе, и это также касается целочисленных и действительных данных. Многие алгоритмы работают только с категориальными данными и требуют, чтобы действительные или целочисленные данные были дискретизированы в группы (например, меньше 5, между 5 и 10 или больше 10).

Вероятностные классификаторы

Многие распространенные алгоритмы распознавания образов являются вероятностными по своей природе, поскольку они используют статистический вывод для поиска лучшей метки для данного экземпляра. В отличие от других алгоритмов, которые просто выводят «лучшую» метку, часто вероятностные алгоритмы также выводят вероятность того , что экземпляр будет описан данной меткой. Кроме того, многие вероятностные алгоритмы выводят список N -лучших меток с соответствующими вероятностями для некоторого значения N , а не просто одну лучшую метку. Когда количество возможных меток довольно мало (например, в случае классификации ), N может быть установлено так, чтобы выводить вероятность всех возможных меток. Вероятностные алгоритмы имеют много преимуществ перед невероятностными алгоритмами:

Они выводят значение уверенности, связанное с их выбором. (Обратите внимание, что некоторые другие алгоритмы также могут выводить значения уверенности, но, как правило, только для вероятностных алгоритмов это значение математически обосновано в теории вероятностей . Невероятностным значениям уверенности, как правило, не может быть придано никакого конкретного значения, и они используются только для сравнения с другими значениями уверенности, выведенными тем же алгоритмом.)
Соответственно, они могут воздержаться , когда уверенность в выборе какого-либо конкретного результата слишком мала.
Благодаря выходным вероятностям алгоритмы вероятностного распознавания образов могут быть более эффективно включены в более крупные задачи машинного обучения, таким образом, чтобы частично или полностью избежать проблемы распространения ошибок .

Количество важных переменных характеристик

Алгоритмы выбора признаков пытаются напрямую отсечь избыточные или нерелевантные признаки. Было дано общее введение в выбор признаков , которое суммирует подходы и проблемы. ^[6] Сложность выбора признаков, из-за его немонотонного характера, является проблемой оптимизации , где задано общее количество признаков, powerset, состоящий из всех подмножеств признаков, должен быть исследован. Алгоритм Branch-and-Bound ^[7] действительно уменьшает эту сложность, но является неразрешимым для средних и больших значений количества доступных признаков $n$ $2^{n}-1$ $n$

Методы преобразования необработанных векторов признаков ( извлечение признаков ) иногда используются до применения алгоритма сопоставления с образцом. Алгоритмы извлечения признаков пытаются сократить вектор признаков большой размерности до вектора меньшей размерности, с которым проще работать и который кодирует меньше избыточности, используя математические методы, такие как анализ главных компонент (PCA). Различие между выбором признаков и извлечением признаков заключается в том, что полученные после извлечения признаков признаки отличаются от исходных признаков и могут быть нелегко интерпретируемыми, в то время как признаки, оставшиеся после выбора признаков, являются просто подмножеством исходных признаков.

Постановка проблемы

Проблему распознавания образов можно сформулировать следующим образом: задана неизвестная функция ( истина ), которая сопоставляет входные экземпляры с выходными метками , вместе с обучающими данными, которые, как предполагается, представляют точные примеры сопоставления, создать функцию , которая максимально точно аппроксимирует правильное сопоставление . (Например, если проблема заключается в фильтрации спама, то является некоторым представлением электронной почты и является либо «спамом», либо «не спамом»). Для того чтобы это была четко определенная проблема, необходимо строго определить «максимально точно аппроксимирует». В теории принятия решений это определяется путем указания функции потерь или функции затрат, которая присваивает определенное значение «потерям», возникающим в результате создания неправильной метки. Цель состоит в том, чтобы минимизировать ожидаемые потери, при этом ожидание принимается по распределению вероятностей . На практике ни распределение , ни функция истинности не известны точно, но могут быть вычислены только эмпирически путем сбора большого количества образцов и ручной маркировки их с использованием правильного значения (процесс, требующий много времени, который обычно является ограничивающим фактором в количестве данных такого рода, которые могут быть собраны). Конкретная функция потерь зависит от типа прогнозируемой метки. Например, в случае классификации часто достаточно простой функции потерь «ноль-один» . Это соответствует простому назначению потери 1 любой неправильной маркировке и подразумевает, что оптимальный классификатор минимизирует частоту ошибок на независимых тестовых данных (т. е. подсчитывает долю случаев, которые обученная функция маркирует неправильно, что эквивалентно максимизации числа правильно классифицированных случаев). Цель процедуры обучения тогда состоит в минимизации частоты ошибок (максимизации правильности ) на «типичном» тестовом наборе. $g:{\mathcal {X}}\rightarrow {\mathcal {Y}}$ ${\boldsymbol {x}}\in {\mathcal {X}}$ $y\in {\mathcal {Y}}$ $\mathbf {D} =\{({\boldsymbol {x}}_{1},y_{1}),\dots ,({\boldsymbol {x}}_{n},y_{n})\}$ $h:{\mathcal {X}}\rightarrow {\mathcal {Y}}$ $g$ ${\boldsymbol {x}}_{i}$ $y$ ${\mathcal {X}}$ ${\mathcal {X}}$ $g:{\mathcal {X}}\rightarrow {\mathcal {Y}}$ ${\mathcal {X}}$ ${\mathcal {Y}}$ $h:{\mathcal {X}}\rightarrow {\mathcal {Y}}$

Для вероятностного распознавателя образов проблема заключается в оценке вероятности каждой возможной выходной метки при заданном входном экземпляре, т.е. в оценке функции вида

p({\rm {label}}|{\boldsymbol {x}},{\boldsymbol {\theta }})=f\left({\boldsymbol {x}};{\boldsymbol {\theta }}\right)

где входной вектор признаков равен , а функция f обычно параметризуется некоторыми параметрами . ^[8] В дискриминативном подходе к проблеме f оценивается напрямую. Однако в генеративном подходе вместо этого оценивается обратная вероятность и объединяется с априорной вероятностью с использованием правила Байеса следующим образом: ${\boldsymbol {x}}$ ${\boldsymbol {\theta }}$ $p({{\boldsymbol {x}}|{\rm {label}}})$ $p({\rm {label}}|{\boldsymbol {\theta }})$

p({\rm {label}}|{\boldsymbol {x}},{\boldsymbol {\theta }})={\frac {p({{\boldsymbol {x}}|{\rm {label,{\boldsymbol {\theta }}}}})p({\rm {label|{\boldsymbol {\theta }}}})}{\sum _{L\in {\text{all labels}}}p({\boldsymbol {x}}|L)p(L|{\boldsymbol {\theta }})}}.

Когда метки распределены непрерывно (например, в регрессионном анализе ), знаменатель включает интеграцию , а не суммирование:

p({\rm {label}}|{\boldsymbol {x}},{\boldsymbol {\theta }})={\frac {p({{\boldsymbol {x}}|{\rm {label,{\boldsymbol {\theta }}}}})p({\rm {label|{\boldsymbol {\theta }}}})}{\int _{L\in {\text{all labels}}}p({\boldsymbol {x}}|L)p(L|{\boldsymbol {\theta }})\operatorname {d} L}}.

Значение обычно изучается с использованием оценки максимального апостериорного значения (MAP). Это находит наилучшее значение, которое одновременно удовлетворяет двум конфликтующим целям: максимально эффективно на обучающих данных (наименьшая частота ошибок ) и нахождение максимально простой возможной модели. По сути, это объединяет оценку максимального правдоподобия с процедурой регуляризации , которая отдает предпочтение более простым моделям по сравнению с более сложными. В байесовском контексте процедуру регуляризации можно рассматривать как размещение априорной вероятности на различных значениях . Математически: ${\boldsymbol {\theta }}$ $p({\boldsymbol {\theta }})$ ${\boldsymbol {\theta }}$

{\boldsymbol {\theta }}^{*}=\arg \max _{\boldsymbol {\theta }}p({\boldsymbol {\theta }}|\mathbf {D} )

где — значение, используемое в последующей процедуре оценки, а апостериорная вероятность определяется как ${\boldsymbol {\theta }}^{*}$ ${\boldsymbol {\theta }}$ $p({\boldsymbol {\theta }}|\mathbf {D} )$ ${\boldsymbol {\theta }}$

p({\boldsymbol {\theta }}|\mathbf {D} )=\left[\prod _{i=1}^{n}p(y_{i}|{\boldsymbol {x}}_{i},{\boldsymbol {\theta }})\right]p({\boldsymbol {\theta }}).

В байесовском подходе к этой проблеме вместо выбора одного вектора параметров вероятность заданной метки для нового экземпляра вычисляется путем интегрирования по всем возможным значениям , взвешенным в соответствии с апостериорной вероятностью: ${\boldsymbol {\theta }}^{*}$ ${\boldsymbol {x}}$ ${\boldsymbol {\theta }}$

p({\rm {label}}|{\boldsymbol {x}})=\int p({\rm {label}}|{\boldsymbol {x}},{\boldsymbol {\theta }})p({\boldsymbol {\theta }}|\mathbf {D} )\operatorname {d} {\boldsymbol {\theta }}.

Частотный или байесовский подход к распознаванию образов

Первый классификатор шаблонов — линейный дискриминант, представленный Фишером — был разработан в частотной традиции. Частотный подход подразумевает, что параметры модели считаются неизвестными, но объективными. Затем параметры вычисляются (оцениваются) из собранных данных. Для линейного дискриминанта этими параметрами являются именно средние векторы и ковариационная матрица . Также вероятность каждого класса оценивается из собранного набора данных. Обратите внимание, что использование « правила Байеса » в классификаторе шаблонов не делает подход к классификации байесовским. $p({\rm {label}}|{\boldsymbol {\theta }})$

Байесовская статистика берет свое начало в греческой философии, где уже было сделано различие между знанием « априори » и знанием « апостериори ». Позднее Кант определил свое различие между тем, что известно априори — до наблюдения — и эмпирическим знанием, полученным из наблюдений. В байесовском шаблонном классификаторе вероятности классов могут быть выбраны пользователем, которые затем являются априорными. Более того, опыт, количественно определенный как априорные значения параметров, может быть взвешен с помощью эмпирических наблюдений — с использованием, например, бета- ( сопряженного априорного ) и распределения Дирихле . Байесовский подход способствует бесшовному смешиванию экспертных знаний в форме субъективных вероятностей и объективных наблюдений. $p({\rm {label}}|{\boldsymbol {\theta }})$

Вероятностные классификаторы шаблонов могут использоваться в соответствии с частотным или байесовским подходом.

Использует

В медицинской науке распознавание образов является основой для систем компьютерной диагностики (САПР). САПР описывает процедуру, которая поддерживает интерпретации и выводы врача. Другие типичные применения методов распознавания образов — это автоматическое распознавание речи , идентификация говорящего , классификация текста по нескольким категориям (например, спам или не спам-сообщения электронной почты), автоматическое распознавание рукописного текста на почтовых конвертах, автоматическое распознавание изображений человеческих лиц или извлечение изображений рукописного текста из медицинских форм. ^[9]^[10] Последние два примера образуют подтему анализа изображений распознавания образов, которая имеет дело с цифровыми изображениями в качестве входных данных для систем распознавания образов. ^[11]^[12]

Оптическое распознавание символов является примером применения классификатора шаблонов. Метод подписи имени человека был зафиксирован с помощью стилуса и наложения, начиная с 1990 года. ^{[ необходима цитата ]} Штрихи, скорость, относительный минимум, относительный максимум, ускорение и давление используются для уникальной идентификации и подтверждения личности. Банкам впервые предложили эту технологию, но они были согласны взимать с FDIC за любое банковское мошенничество и не хотели причинять неудобства клиентам. ^{[ необходима цитата ]}

Распознавание образов имеет множество реальных применений в обработке изображений. Вот некоторые примеры:

идентификация и аутентификация: например, распознавание номерных знаков , ^[13] анализ отпечатков пальцев, обнаружение/верификация лиц , ^[14] и аутентификация на основе голоса . ^[15]
медицинская диагностика: например, скрининг на рак шейки матки (Papnet), ^[16] опухоли молочной железы или сердечные шумы;
оборона: различные системы навигации и наведения, системы распознавания целей , технологии распознавания форм и т. д.
мобильность: передовые системы помощи водителю , технологии автономного вождения и т. д. ^[17]^[18]^[19]^[20]^[21]

В психологии распознавание образов используется для понимания и идентификации объектов и тесно связано с восприятием. Это объясняет, как сенсорные входы, которые получают люди, становятся осмысленными. Распознавание образов можно рассматривать двумя разными способами. Первый касается сопоставления шаблонов, а второй касается обнаружения признаков. Шаблон — это шаблон, используемый для создания элементов тех же пропорций. Гипотеза сопоставления шаблонов предполагает, что входящие стимулы сравниваются с шаблонами в долговременной памяти. Если есть совпадение, стимул идентифицируется. Модели обнаружения признаков, такие как система классификации букв Pandemonium (Selfridge, 1959), предполагают, что стимулы разбиваются на составные части для идентификации. Одно наблюдение — заглавная буква E, имеющая три горизонтальные линии и одну вертикальную линию. ^[22]

Алгоритмы

Алгоритмы распознавания образов зависят от типа выходных данных метки, от того, является ли обучение контролируемым или неконтролируемым, и от того, является ли алгоритм статистическим или нестатистическим по своей природе. Статистические алгоритмы могут быть далее классифицированы как генеративные или дискриминационные .

Методы классификации (методы прогнозирования категориальных меток)

Параметрический: ^[23]

Линейный дискриминантный анализ
Квадратичный дискриминантный анализ
Классификатор с максимальной энтропией (он же логистическая регрессия , полиномиальная логистическая регрессия ): Обратите внимание, что логистическая регрессия — это алгоритм классификации, несмотря на свое название. (Название происходит от того факта, что логистическая регрессия использует расширение модели линейной регрессии для моделирования вероятности того, что входные данные относятся к определенному классу.)

Непараметрический: ^[24]

Деревья решений , списки решений
Алгоритмы оценки ядра и K-ближайших соседей
Наивный байесовский классификатор
Нейронные сети (многослойные персептроны)
Персептроны
Машины опорных векторов
Программирование экспрессии генов

Методы кластеризации (методы классификации и прогнозирования категориальных меток)

Модели категориальной смеси
Иерархическая кластеризация (агломеративная или дивизионная)
Кластеризация методом k-средних
Корреляционная кластеризация
Анализ главных компонент ядра (Kernel PCA)

Ансамблевые алгоритмы обучения (контролируемые метаалгоритмы для объединения нескольких алгоритмов обучения)

Общие методы прогнозирования произвольно структурированных (наборов) меток

Алгоритмы обучения мультилинейных подпространств (прогнозирование меток многомерных данных с использованием тензорных представлений)

Без присмотра:

Многолинейный анализ главных компонент (MPCA)

Методы маркировки последовательностей вещественных значений (прогнозирование последовательностей вещественных значений)

Методы регрессии (прогнозирование действительных меток)

Гауссовская регрессия процесса (кригинг)
Линейная регрессия и расширения
Независимый компонентный анализ (ICA)
Анализ главных компонент (PCA)

Методы маркировки последовательностей (прогнозирование последовательностей категориальных меток)

Смотрите также

Ссылки

^ Howard, WR (2007-02-20). «Распознавание образов и машинное обучение». Kybernetes . 36 (2): 275. doi :10.1108/03684920710743466. ISSN 0368-492X.
^ "Sequence Labeling" (PDF) . utah.edu . Архивировано (PDF) из оригинала 2018-11-06 . Получено 2018-11-06 .
^ Ян., Чизвелл (2007). Математическая логика, стр. 34. Oxford University Press. ISBN 9780199215621. OCLC 799802313.
^ Бишоп, Кристофер М. (2006). Распознавание образов и машинное обучение . Springer.
^ Карвалко, Дж. Р., Престон К. (1972). «Определение оптимальных простых преобразований Голея для обработки двоичных изображений». IEEE Transactions on Computers . 21 (12): 1430–33. doi :10.1109/TC.1972.223519. S2CID 21050445.{{cite journal}}: CS1 maint: multiple names: authors list (link).
^ Изабель Гийон Клопине, Андре Элиссефф (2003). Введение в выбор переменных и признаков . Журнал исследований машинного обучения, том 3, 1157-1182. Ссылка Архивировано 04.03.2016 на Wayback Machine
^ Иман Фороутан; Джек Склански (1987). «Выбор признаков для автоматической классификации негауссовских данных». Труды IEEE по системам, человеку и кибернетике . 17 (2): 187–198. doi :10.1109/TSMC.1987.4309029. S2CID 9871395..
^ Для линейного дискриминантного анализа вектор параметров состоит из двух средних векторов и и общей ковариационной матрицы . ${\boldsymbol {\theta }}$ ${\boldsymbol {\mu }}_{1}$ ${\boldsymbol {\mu }}_{2}$ ${\boldsymbol {\Sigma }}$
^ Милевски, Роберт; Говиндараджу, Вену (31 марта 2008 г.). «Бинаризация и очистка рукописного текста из копий изображений медицинских форм». Pattern Recognition . 41 (4): 1308–1315. Bibcode : 2008PatRe..41.1308M. doi : 10.1016/j.patcog.2007.08.018. Архивировано из оригинала 10 сентября 2020 г. Получено 26 октября 2011 г.
^ Саранги, Сусанта; Сахидулла, Мэриленд; Саха, Гаутам (сентябрь 2020 г.). «Оптимизация банка фильтров на основе данных для автоматической проверки говорящего». Цифровая обработка сигналов . 104 : 102795. arXiv : 2007.10729 . Bibcode : 2020DSP...10402795S. doi : 10.1016/j.dsp.2020.102795. S2CID 220665533.
^ Ричард О. Дуда , Питер Э. Харт , Дэвид Г. Сторк (2001). Классификация узоров (2-е изд.). Wiley, Нью-Йорк. ISBN 978-0-471-05669-0. Архивировано из оригинала 2020-08-19 . Получено 2019-11-26 .{{cite book}}: CS1 maint: multiple names: authors list (link)
^ Р. Брунелли, Методы сопоставления шаблонов в компьютерном зрении: теория и практика , Wiley, ISBN 978-0-470-51706-2 , 2009
^ Учебное пособие по автоматическому распознаванию номерных знаков. Архивировано 20 августа 2006 г. на Wayback Machine http://anpr-tutorial.com/
^ Нейронные сети для распознавания лиц. Архивировано 4 марта 2016 г. в Wayback Machine Companion к главе 4 учебника «Машинное обучение».
^ Poddar, Arnab; Sahidullah, Md; Saha, Goutam (март 2018 г.). «Speaker Verification with Short Utterances: A Review of Challenges, Trends and Opportunities». IET Biometrics . 7 (2): 91–101. doi :10.1049/iet-bmt.2017.0065. Архивировано из оригинала 2019-09-03 . Получено 2019-08-27 .
^ PAPNET для скрининга шейки матки. Архивировано 2012-07-08 в archive.today.
^ "Разработка стратегии управления автономным транспортным средством с использованием одной камеры и глубоких нейронных сетей (2018-01-0035 Технический документ) - SAE Mobilus". saemobilus.sae.org . 3 апреля 2018 г. doi :10.4271/2018-01-0035. Архивировано из оригинала 2019-09-06 . Получено 2019-09-06 .
^ Gerdes, J. Christian; Kegelman, John C.; Kapania, Nitin R.; Brown, Matthew; Spielberg, Nathan A. (2019-03-27). "Нейросетевые модели транспортных средств для высокопроизводительного автоматизированного вождения". Science Robotics . 4 (28): eaaw1975. doi : 10.1126/scirobotics.aaw1975 . ISSN 2470-9476. PMID 33137751. S2CID 89616974.
^ Пикеринг, Крис (2017-08-15). «Как ИИ прокладывает путь для полностью автономных автомобилей». The Engineer . Архивировано из оригинала 2019-09-06 . Получено 2019-09-06 .
^ Рэй, Байшакхи; Яна, Суман; Пей, Кэсинь; Тянь, Ючи (28.08.2017). «DeepTest: Автоматизированное тестирование автономных автомобилей, управляемых глубокими нейронными сетями». arXiv : 1708.08559 . Bibcode :2017arXiv170808559T. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
^ Синха, П. К.; Хаджийски, Л. М.; Мутиб, К. (1993-04-01). «Нейронные сети в управлении автономными транспортными средствами». Тома трудов IFAC . 1-й Международный семинар IFAC по интеллектуальным автономным транспортным средствам, Хэмпшир, Великобритания, 18–21 апреля. 26 (1): 335–340. doi :10.1016/S1474-6670(17)49322-0. ISSN 1474-6670.
^ "Психология A-level Attention Revision - Распознавание образов | S-cool, сайт повторения". S-cool.co.uk. Архивировано из оригинала 2013-06-22 . Получено 2012-09-17 .
^ Предположим, что известна форма распределения признаков по классам, например, гауссова форма.
^ Не делается никаких предположений относительно формы распределения признаков по классам.

Дальнейшее чтение

Фукунага, Кейносукэ (1990). Введение в статистическое распознавание образов (2-е изд.). Бостон: Academic Press. ISBN 978-0-12-269851-4.
Хорнеггер, Иоахим; Паулюс, Дитрих В. Р. (1999). Прикладное распознавание образов: практическое введение в обработку изображений и речи на языке C++ (2-е изд.). Сан-Франциско: Morgan Kaufmann Publishers. ISBN 978-3-528-15558-2.
Шуерманн, Юрген (1996). Классификация паттернов: унифицированный взгляд на статистические и нейронные подходы . Нью-Йорк: Wiley. ISBN 978-0-471-13534-0.
Годфрид Т. Туссен, ред. (1988). Вычислительная морфология. Амстердам: North-Holland Publishing Company. ISBN 9781483296722.
Куликовский, Казимир А.; Вайс, Шолом М. (1991). Компьютерные системы, которые учатся: методы классификации и прогнозирования на основе статистики, нейронных сетей, машинного обучения и экспертных систем . Сан-Франциско: Morgan Kaufmann Publishers. ISBN 978-1-55860-065-2.
Дуда, Ричард О.; Харт, Питер Э.; Сторк, Дэвид Г. (2000). Классификация паттернов (2-е изд.). Wiley-Interscience. ISBN 978-0471056690.
Jain, Anil.K.; Duin, Robert.PW; Mao, Jianchang (2000). «Статистическое распознавание образов: обзор». Труды IEEE по анализу образов и машинному интеллекту . 22 (1): 4–37. CiteSeerX 10.1.1.123.8151 . doi :10.1109/34.824819. S2CID 192934.
Вводный курс по классификаторам (знакомство с основными терминами, с числовыми примерами)
Ковалевский, В. А. (1980). Распознавание образов изображений . Нью-Йорк, Нью-Йорк: Springer New York. ISBN 978-1-4612-6033-2. OCLC 852790446.

Внешние ссылки

Международная ассоциация по распознаванию образов
Список веб-сайтов по распознаванию образов
Журнал исследований распознавания образов Архивировано 2008-09-08 в Wayback Machine
Информация о распознавании образов
Распознавание образов (Журнал Общества распознавания образов)
Международный журнал распознавания образов и искусственного интеллекта. Архивировано 11 декабря 2004 г. на Wayback Machine.
Международный журнал прикладного распознавания образов
Проект Open Pattern Recognition, призванный стать платформой с открытым исходным кодом для обмена алгоритмами распознавания образов.
Улучшенное быстрое сопоставление с образцом Улучшенное быстрое сопоставление с образцом