Индуктивное смещение (также известное как смещение обучения ) обучающего алгоритма — это набор предположений, которые обучающийся использует для прогнозирования выходных данных заданных входных данных, с которыми он не сталкивался. [1] Индуктивное смещение — это все, что заставляет алгоритм изучать один шаблон вместо другого (например, ступенчатые функции в деревьях решений вместо непрерывных функций в моделях линейной регрессии ). Обучение включает в себя поиск в пространстве решений того, которое, как ожидается, даст лучшее объяснение данных. Однако во многих случаях может быть несколько одинаково подходящих решений. [2] Индуктивное смещение позволяет обучающему алгоритму отдавать приоритет одному решению (или интерпретации) над другим, независимо от наблюдаемых данных. [3]
В машинном обучении целью является построение алгоритмов, которые способны научиться предсказывать определенный целевой выход. Для достижения этого обучающему алгоритму представляются некоторые обучающие примеры, которые демонстрируют предполагаемое соотношение входных и выходных значений. Затем обучающийся должен приблизить правильный выход, даже для примеров, которые не были показаны во время обучения. Без каких-либо дополнительных предположений эта проблема не может быть решена, поскольку невидимые ситуации могут иметь произвольное выходное значение. Вид необходимых предположений о природе целевой функции включен в фразу индуктивное смещение . [1] [4]
Классический пример индуктивного смещения — бритва Оккама , предполагающая, что простейшая непротиворечивая гипотеза о целевой функции на самом деле является лучшей. Здесь непротиворечивость означает, что гипотеза обучающегося дает правильные результаты для всех примеров, которые были даны алгоритму.
Подходы к более формальному определению индуктивного смещения основаны на математической логике . Здесь индуктивное смещение — это логическая формула, которая вместе с данными обучения логически влечет за собой гипотезу, сгенерированную обучающимся. Однако этот строгий формализм терпит неудачу во многих практических случаях, когда индуктивное смещение может быть дано только в виде грубого описания (например, в случае искусственных нейронных сетей ) или вообще не дано.
Ниже приведен список распространенных индуктивных искажений в алгоритмах машинного обучения.
Хотя большинство алгоритмов обучения имеют статическое смещение, некоторые алгоритмы разработаны так, чтобы изменять свое смещение по мере получения большего количества данных. [5] Это не позволяет избежать смещения, поскольку сам процесс изменения смещения должен иметь смещение.
{{cite book}}
: CS1 maint: дата и год ( ссылка )