Функция (машинное обучение)

В машинном обучении и распознавании образов признак — это индивидуальное измеримое свойство или характеристика явления. ^[1] Выбор информативных, дискриминирующих и независимых признаков имеет решающее значение для создания эффективных алгоритмов для задач распознавания образов , классификации и регрессии . Признаки обычно являются числовыми, но другие типы, такие как строки и графики, используются в синтаксическом распознавании образов после некоторого этапа предварительной обработки, такого как прямое кодирование . Понятие «признаки» связано с понятием объясняющих переменных, используемых в статистических методах, таких как линейная регрессия .

Типы функций

При проектировании признаков обычно используются два типа признаков: числовые и категориальные.

Числовые характеристики — это непрерывные значения, которые можно измерить на шкале. Примерами числовых характеристик являются возраст, рост, вес и доход. Числовые характеристики можно использовать в алгоритмах машинного обучения напрямую. ^{[ необходима цитата ]}

Категориальные признаки — это дискретные значения, которые можно сгруппировать в категории. Примерами категориальных признаков являются пол, цвет и почтовый индекс. Категориальные признаки обычно необходимо преобразовать в числовые, прежде чем их можно будет использовать в алгоритмах машинного обучения. Это можно сделать с помощью различных методов, таких как прямое кодирование, кодирование меток и порядковое кодирование.

Тип признака, который используется в проектировании признаков, зависит от конкретного алгоритма машинного обучения, который используется. Некоторые алгоритмы машинного обучения, такие как деревья решений, могут обрабатывать как числовые, так и категориальные признаки. Другие алгоритмы машинного обучения, такие как линейная регрессия, могут обрабатывать только числовые признаки.

Классификация

Числовой признак можно удобно описать вектором признаков. Один из способов достижения бинарной классификации — использование линейной предикторной функции (связанной с персептроном ) с вектором признаков в качестве входных данных. Метод состоит в вычислении скалярного произведения между вектором признаков и вектором весов, квалифицируя те наблюдения, результат которых превышает пороговое значение.

Алгоритмы классификации на основе вектора признаков включают классификацию по методу ближайшего соседа , нейронные сети и статистические методы , такие как байесовский подход .

Примеры

При распознавании символов функции могут включать гистограммы, подсчитывающие количество черных пикселей по горизонтали и вертикали, количество внутренних отверстий, обнаружение штрихов и многое другое.

При распознавании речи признаки распознавания фонем могут включать коэффициент шума, длительность звуков, относительную мощность, совпадения фильтров и многое другое.

В алгоритмах обнаружения спама признаки могут включать наличие или отсутствие определенных заголовков электронного письма, структуру электронного письма, язык, частоту использования определенных терминов, грамматическую правильность текста.

В компьютерном зрении существует большое количество возможных признаков , таких как края и объекты.

Векторы признаков

В распознавании образов и машинном обучении вектор признаков — это n-мерный вектор числовых признаков, представляющих некоторый объект. Многие алгоритмы в машинном обучении требуют числового представления объектов, поскольку такие представления облегчают обработку и статистический анализ. При представлении изображений значения признаков могут соответствовать пикселям изображения, тогда как при представлении текстов признаки могут быть частотами появления текстовых терминов. Векторы признаков эквивалентны векторам объясняющих переменных, используемых в статистических процедурах, таких как линейная регрессия . Векторы признаков часто объединяются с весами с использованием скалярного произведения для построения линейной предикторной функции , которая используется для определения оценки для создания прогноза.

Векторные пространства, связанные с этими векторами, часто называют пространством признаков . Чтобы уменьшить размерность пространства признаков, можно использовать ряд методов уменьшения размерности .

Признаки более высокого уровня могут быть получены из уже имеющихся признаков и добавлены к вектору признаков; например, для изучения болезней признак «Возраст» полезен и определяется как Возраст = «Год смерти» минус «Год рождения» . Этот процесс называется построением признаков . ^[2]^[3] Построение признаков — это применение набора конструктивных операторов к набору существующих признаков, приводящее к построению новых признаков. Примерами таких конструктивных операторов являются проверка условий равенства {=, ≠}, арифметические операторы {+,−,×, /}, операторы массива {max(S), min(S), average(S)}, а также другие более сложные операторы, например count(S,C) ^[4] , который подсчитывает количество признаков в векторе признаков S, удовлетворяющих некоторому условию C, или, например, расстояния до других классов распознавания, обобщенных некоторым принимающим устройством. Построение признаков долгое время считалось мощным инструментом для повышения как точности, так и понимания структуры, особенно в многомерных задачах. ^[5] Приложения включают исследования болезней и распознавание эмоций по речи. ^[6]

Отбор и извлечение

Первоначальный набор необработанных признаков может быть избыточным и достаточно большим, что делает оценку и оптимизацию затруднительными или неэффективными. Поэтому предварительный шаг во многих приложениях машинного обучения и распознавания образов состоит из выбора подмножества признаков или построения нового и сокращенного набора признаков для облегчения обучения и улучшения обобщения и интерпретируемости. ^[7]

Извлечение или выбор признаков — это сочетание искусства и науки; разработка систем для этого известна как проектирование признаков . Это требует экспериментирования с несколькими возможностями и сочетания автоматизированных методов с интуицией и знаниями эксперта в данной области . Автоматизация этого процесса — это обучение признакам , когда машина не только использует признаки для обучения, но и сама изучает признаки.

Смотрите также

Ссылки

^ Бишоп, Кристофер (2006). Распознавание образов и машинное обучение . Берлин: Springer. ISBN 0-387-31073-8.
^ Лю, Х., Мотода Х. (1998) Выбор признаков для обнаружения знаний и добычи данных. , Kluwer Academic Publishers. Норвелл, Массачусетс, США. 1998.
^ Пирамуту, С., Сикора Р. Т. Итеративное построение признаков для улучшения индуктивных алгоритмов обучения. В журнале «Экспертные системы с приложениями». Т. 36, Вып. 2 (март 2009 г.), стр. 3401-3406, 2009 г.
^ Блоедорн, Э., Михальски, Р. Конструктивная индукция на основе данных: методология и ее применение. IEEE Intelligent Systems, Специальный выпуск по преобразованию признаков и выбору подмножеств, стр. 30-37, март/апрель 1998 г.
^ Брейман, Л. Фридман, Т., Олшен, Р., Стоун, К. (1984) Деревья классификации и регрессии , Уодсворт
^ Сидорова, Дж., Бадиа Т. Синтаксическое обучение для ESEDA.1, инструмента для улучшенного обнаружения и анализа речевых эмоций. Конференция по технологиям Интернета и защищенным транзакциям 2009 (ICITST-2009), Лондон, 9–12 ноября. IEEE
^ Хасти, Тревор; Тибширани, Роберт; Фридман, Джером Х. (2009). Элементы статистического обучения: добыча данных, вывод и прогнозирование. Springer. ISBN 978-0-387-84884-6.