Адаптация домена

Адаптация предметной области ^[1]^[2]^[3] — это область, связанная с машинным обучением и трансферным обучением . Этот сценарий возникает, когда мы стремимся изучить модель на основе распределения исходных данных и применить эту модель к другому (но связанному) целевому распределению данных. Например, одна из задач общей задачи фильтрации спама состоит в адаптации модели от одного пользователя (исходная рассылка) к новому пользователю, который получает существенно отличающиеся электронные письма (целевая рассылка). Также было показано, что адаптация предметной области полезна для изучения несвязанных источников. ^[4] Обратите внимание, что когда доступно более одного исходного дистрибутива, проблема называется адаптацией домена с несколькими источниками. ^[5]

Обзор

Адаптация предметной области — это способность применять алгоритм, обученный в одном или нескольких «исходных доменах», к другому (но связанному) «целевому домену». Адаптация предметной области — это подкатегория трансферного обучения. При адаптации предметной области исходный и целевой домены имеют одинаковое пространство объектов (но разные распределения); Напротив, трансферное обучение включает случаи, когда пространство признаков целевого домена отличается от пространства или пространств исходного объекта. ^[6]

Сдвиг домена

Сдвиг домена [ ^7] или сдвиг распределения [ ^8] — это изменение распределения данных между набором обучающих данных алгоритма и набором данных, с которым он сталкивается при развертывании. Эти сдвиги предметной области распространены в практических приложениях искусственного интеллекта. Традиционные алгоритмы машинного обучения часто плохо адаптируются к изменениям в предметной области. Современное сообщество машинного обучения имеет множество различных стратегий, направленных на лучшую адаптацию к предметной области. ^[7]

Примеры

Алгоритму, обученному на новостных лентах, возможно, придется адаптироваться к новому набору данных биомедицинских документов. ^[9]
Спам-фильтр, обученный в ходе обучения на определенной группе пользователей электронной почты, при развертывании должен адаптироваться к новому целевому пользователю. ^[10]
Применение диагностических алгоритмов искусственного интеллекта, обученных на размеченных данных, связанных с предыдущими заболеваниями, к новым неразмеченным данным, связанным с пандемией COVID-19 . ^[11]
Внезапные социальные изменения, такие как вспышка пандемии, могут представлять собой сдвиг в сфере деятельности и привести к сбою алгоритмов машинного обучения, обученных на уже устаревших данных о потребителях, и потребуется вмешательство. ^[12]^[13]

Другие приложения включают обнаружение локализации Wi-Fi и многие аспекты компьютерного зрения . ^[6]

Формализация

Пусть это входное пространство (или пространство описания), и пусть это выходное пространство (или пространство меток). Цель алгоритма машинного обучения — изучить математическую модель (гипотезу), способную прикрепить метку от к примеру из . Эта модель изучается на обучающей выборке . $X$ $Y$ $h:X\to Y$ $Y$ $X$ $S=\{(x_{i},y_{i})\in (X\times Y)\}_{i=1}^{m}$

Обычно при обучении с учителем (без адаптации предметной области) мы предполагаем, что примеры взяты из распределения поддержки (неизвестной и фиксированной). Цель состоит в том, чтобы научиться (из ) так, чтобы совершать как можно меньше ошибок при маркировке новых примеров, поступающих из дистрибутива . $(x_{i},y_{i})\in S$ $D_{S}$ $X\times Y$ $ч$ $S$ $D_{S}$

Основное различие между обучением с учителем и адаптацией предметной области заключается в том, что в последней ситуации мы изучаем два разных (но связанных) распределения и на ^[^{нужна ссылка}^] . Задача адаптации предметной области тогда состоит в переносе знаний из исходной предметной области в целевую . Затем цель состоит в том, чтобы научиться ⁽^{на маркированных или немаркированных образцах , поступающих из двух доменов) так}^, чтобы в целевом домене совершалось как можно меньше ошибок . $D_{S}$ $D_{T}$ $X\times Y$ $D_{S}$ $D_{T}$ $ч$ $D_{T}$

Основная проблема заключается в следующем: если модель изучается из исходной области, какова ее способность правильно маркировать данные, поступающие из целевой области?

Различные типы адаптации домена

Существует несколько контекстов адаптации предметной области. Они различаются информацией, учитываемой для целевой задачи.

Адаптация неконтролируемой области : обучающая выборка содержит набор помеченных исходных примеров, набор неразмеченных исходных примеров и набор неразмеченных целевых примеров.
Адаптация полуконтролируемой области : в этой ситуации мы также рассматриваем «маленький» набор помеченных целевых примеров.
Адаптация контролируемой области : все рассмотренные примеры должны быть помечены.

Четыре алгоритмических принципа

Алгоритмы повторного взвешивания

Цель состоит в том, чтобы повторно взвесить выборку с маркировкой источника так, чтобы она «выглядела» как целевая выборка (с точки зрения рассматриваемой меры ошибки). ^[14]^[15]

Итерационные алгоритмы

Метод адаптации заключается в итеративном «автоматическом присвоении меток» целевым примерам. ^[16] Принцип прост:

модель изучается на размеченных примерах; $ч$
$ч$ автоматически помечает некоторые целевые примеры;
новая модель изучается на основе новых помеченных примеров.

Обратите внимание, что существуют и другие итеративные подходы, но для них обычно нужны примеры с пометкой целей. ^[17]^[18]

Поиск общего пространства представления

Цель состоит в том, чтобы найти или построить общее пространство представления для двух областей. Цель состоит в том, чтобы получить пространство, в котором домены будут расположены близко друг к другу, сохраняя при этом хорошие результаты при выполнении задачи маркировки источника. Этого можно достичь за счет использования методов состязательного машинного обучения , в которых представления функций из образцов в разных областях должны быть неотличимы. ^[19]^[20]

Иерархическая байесовская модель

Цель состоит в том, чтобы построить байесовскую иерархическую модель , которая по сути является моделью факторизации для подсчетов , для получения зависимых от предметной области скрытых представлений, позволяющих использовать как специфичные для предметной области, так и глобально общие скрытые факторы. ^[4] ${\ displaystyle p (n)}$ $п$

Программное обеспечение

За последние десятилетия было реализовано несколько компиляций алгоритмов адаптации предметной области и трансферного обучения:

АДАПТ ^[21] (Python)
TLlib ^[22] (Python)
Панель инструментов адаптации предметной области ^[23] (Matlab)