В машинном обучении обучение на основе экземпляров (иногда называемое обучением на основе памяти [1] ) представляет собой семейство алгоритмов обучения, которые вместо выполнения явного обобщения сравнивают новые экземпляры проблем с экземплярами, наблюдаемыми в процессе обучения и хранящимися в памяти. Поскольку вычисления откладываются до тех пор, пока не будет обнаружен новый экземпляр, эти алгоритмы иногда называют «ленивыми». [2]
Он называется основанным на экземплярах, поскольку строит гипотезы непосредственно на основе самих обучающих экземпляров. [3] Это означает, что сложность гипотезы может расти вместе с данными: [3] в худшем случае гипотеза представляет собой список из n обучающих элементов, а вычислительная сложность классификации одного нового экземпляра равна O ( n ). Одним из преимуществ обучения на основе экземпляров по сравнению с другими методами машинного обучения является его способность адаптировать свою модель к ранее неизвестным данным. Обучающиеся, использующие экземпляры, могут просто сохранить новый экземпляр или выбросить старый экземпляр.
Примерами алгоритмов обучения на основе экземпляров являются алгоритм k -ближайших соседей , машины ядра и сети RBF . [2] : гл. 8 Они хранят (подмножество) своего обучающего набора; при прогнозировании значения/класса для нового экземпляра они вычисляют расстояния или сходства между этим экземпляром и обучающими экземплярами, чтобы принять решение.
Чтобы справиться со сложностью памяти при хранении всех обучающих экземпляров, а также с риском переобучения из-за шума в обучающем наборе, были предложены алгоритмы сокращения экземпляров . [4]