stringtranslate.com

Активное обучение (машинное обучение)

Активное обучение — это особый случай машинного обучения , в котором алгоритм обучения может в интерактивном режиме запрашивать пользователя-человека (или какой-либо другой источник информации), чтобы пометить новые точки данных желаемыми результатами. Пользователь-человек должен обладать знаниями/опытом в проблемной области, включая возможность консультироваться/исследовать авторитетные источники, когда это необходимо. [1] [2] [3] В статистической литературе его иногда также называют оптимальным планом эксперимента . [4] Источник информации также называют учителем или оракулом .

Бывают ситуации, когда немаркированных данных много, но маркировка вручную обходится дорого. В таком сценарии алгоритмы обучения могут активно запрашивать у пользователя/учителя метки. Этот тип итеративного контролируемого обучения называется активным обучением. Поскольку примеры выбирает учащийся, количество примеров для изучения концепции часто может быть намного меньше, чем количество, необходимое при обычном обучении с учителем. При таком подходе существует риск того, что алгоритм будет перегружен неинформативными примерами. Последние разработки посвящены многоуровневому активному обучению, [5] гибридному активному обучению [6] и активному обучению в однопроходном (онлайн) контексте, [7] сочетающему концепции из области машинного обучения (например, конфликты и невежество) с помощью адаптивной, поэтапной политики обучения в области онлайн-машинного обучения . Использование активного обучения позволяет ускорить разработку алгоритма машинного обучения, когда для сравнительных обновлений потребуется квантовый или суперкомпьютер. [8]

Крупномасштабные проекты активного обучения могут выиграть от краудсорсинговых систем, таких как Amazon Mechanical Turk , которые включают в цикл активного обучения множество людей .

Определения

Пусть T — общий набор всех рассматриваемых данных. Например, в задаче белковой инженерии T будет включать все белки, которые, как известно, обладают определенной интересной активностью, а также все дополнительные белки, которые можно проверить на наличие этой активности.

Во время каждой итерации i , T разбивается на три подмножества

  1. : Точки данных, где метка известна .
  2. : Точки данных, для которых метка неизвестна .
  3. : подмножество TU ,i , выбранное для маркировки.

Большинство текущих исследований в области активного обучения связаны с поиском наилучшего метода выбора точек данных для TC ,i .

Сценарии

Стратегии запросов

Алгоритмы определения того, какие точки данных следует пометить, можно разделить на несколько различных категорий в зависимости от их назначения: [1]

Было изучено множество алгоритмов, попадающих в эти категории. [1] [4] Хотя традиционные стратегии AL могут обеспечить выдающуюся производительность, часто бывает сложно заранее предсказать, какая стратегия является наиболее подходящей в конкретной ситуации. В последние годы алгоритмы метаобучения набирают популярность. Некоторые из них были предложены для решения проблемы изучения стратегий AL вместо того, чтобы полагаться на стратегии, разработанные вручную. Тест, который сравнивает «подходы метаобучения к активному обучению» с «традиционным активным обучением, основанным на эвристике», может дать интуитивное представление о том, находится ли «активное обучение» на перепутье [18]

Минимальная маргинальная гиперплоскость

Некоторые алгоритмы активного обучения построены на машинах опорных векторов (SVM) и используют структуру SVM, чтобы определить, какие точки данных следует пометить. Такие методы обычно вычисляют границу W для каждого немаркированного элемента данных в T U,i и рассматривают W как n -мерное расстояние от этого элемента данных до разделяющей гиперплоскости.

Методы минимальной маргинальной гиперплоскости предполагают, что данные с наименьшим W — это те, в отношении которых SVM наиболее неопределенен, и поэтому их следует поместить в TC ,i для маркировки. Другие подобные методы , такие как «Максимальная маргинальная гиперплоскость», выбирают данные с наибольшим W. Методы компромисса выбирают сочетание наименьшего и наибольшего W .

Смотрите также

Литература

Рекомендации

  1. ^ abc Сеттлс, Берр (2010). «Обзор литературы по активному обучению» (PDF) . Технический отчет по компьютерным наукам 1648. Университет Висконсина-Мэдисона . Проверено 18 ноября 2014 г.
  2. ^ Рубенс, Нил; Элахи, Мехди; Сугияма, Масаси; Каплан, Дейн (2016). «Активное обучение в рекомендательных системах». В Риччи, Франческо; Рокач, Лиор; Шапира, Брача (ред.). Справочник по рекомендательным системам (PDF) (2-е изд.). Спрингер США. дои : 10.1007/978-1-4899-7637-6. hdl : 11311/1006123. ISBN 978-1-4899-7637-6. S2CID  11569603.
  3. ^ Дас, Шубхомой; Вонг, Венг-Кин; Дитерих, Томас; Ферн, Алан; Эммотт, Эндрю (2016). «Учет отзывов экспертов при активном обнаружении аномалий». В Бончи, Франческо; Доминго-Феррер, Хосеп; Баеза-Йейтс, Рикардо; Чжоу, Чжи-Хуа; У, Синьдун (ред.). 16-я Международная конференция IEEE по интеллектуальному анализу данных . IEEE. стр. 853–858. дои : 10.1109/ICDM.2016.0102. ISBN 978-1-5090-5473-2. S2CID  15285595.
  4. ^ Аб Олссон, Фредрик (апрель 2009 г.). «Обзор литературы по активному машинному обучению в контексте обработки естественного языка». Технический отчет SICS T2009:06.
  5. ^ Ян, Бишан; Сунь, Цзянь-Тао; Ван, Тэнцзяо; Чен, Чжэн (2009). «Эффективное активное обучение с несколькими метками для классификации текста» (PDF) . Материалы 15-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных - KDD '09 . п. 917. CiteSeerX 10.1.1.546.9358 . дои : 10.1145/1557019.1557119. ISBN  978-1-60558-495-9. S2CID  1979173.
  6. ^ Лугхофер, Эдвин (февраль 2012 г.). «Гибридное активное обучение для сокращения усилий операторов по аннотированию в системах классификации». Распознавание образов . 45 (2): 884–896. Бибкод : 2012PatRe..45..884L. дои : 10.1016/j.patcog.2011.08.009.
  7. ^ Лугхофер, Эдвин (2012). «Однопроходное активное обучение с конфликтами и незнанием». Развивающиеся системы . 3 (4): 251–271. doi : 10.1007/s12530-012-9060-7. S2CID  43844282.
  8. ^ Новиков, Иван (2021). «Пакет MLIP: моментные тензорные потенциалы с MPI и активным обучением». Издательство ИОП . 2 (2): 3, 4. arXiv : 2007.08555 . doi : 10.1088/2632-2153/abc9fe – через IOP science.
  9. ^ ДатаРобот. «Активное обучение, машинное обучение: что это такое и как оно работает». Блог DataRobot . DataRobot Inc. Проверено 30 января 2024 г.
  10. ^ Ван, Ляньтао; Ху, Сюэлэй; Юань, Бо; Лу, Цзяньфэн (5 января 2015 г.). «Активное обучение посредством синтеза запросов и поиска ближайшего соседа» (PDF) . Нейрокомпьютинг . 147 : 426–434. doi : 10.1016/j.neucom.2014.06.042. S2CID  3027214.
  11. ^ Бунеффуф, Джалель; Ларош, Ромен; Урвой, Танги; Феро, Рафаэль; Аллесиардо, Робин (2014). «Контекстный бандит для активного обучения: Активный Томпсон». В Лоо, СК; Яп, Канзас; Вонг, К.В.; Теох, А.; Хуанг, К. (ред.). Нейронная обработка информации (PDF) . Конспекты лекций по информатике. Том. 8834. стр. 405–412. дои : 10.1007/978-3-319-12637-1_51. ISBN 978-3-319-12636-4. S2CID  1701357. Идентификатор HAL: hal-01069802.
  12. Бунеффуф, Джалель (8 января 2016 г.). «Исследование экспоненциального градиента для активного обучения». Компьютеры . 5 (1): 1. arXiv : 1408.2196 . doi : 10.3390/computers5010001 . S2CID  14313852.
  13. ^ abcd Фариа, Бруно; Пердигао, Дилан; Брас, Жоана; Маседо, Луис (2022). Совместная роль размера пакета и стратегии запроса в прогнозировании на основе активного обучения — пример из области сердечного приступа . Конспекты лекций по информатике. Том. 13566. стр. 464–475. дои : 10.1007/978-3-031-16474-3_38. ISBN 978-3-031-16473-6. {{cite book}}: |journal=игнорируется ( помощь )
  14. ^ "shubhomoydas/ad_examples". Гитхаб . Проверено 4 декабря 2018 г.
  15. ^ Макили, Ласаро Эмилио; Санчес, Хесус А. Вега; Дормидо-Канто, Себастьян (1 октября 2012 г.). «Активное обучение с использованием конформных предикторов: применение к классификации изображений». Наука и технология термоядерного синтеза . 62 (2): 347–355. дои : 10.13182/FST12-A14626. ISSN  1536-1055. S2CID  115384000.
  16. ^ Чжао, Шуян; Хейттола, Тони; Виртанен, Туомас (2020). «Активное обучение обнаружению звуковых событий». Транзакции IEEE/ACM по обработке звука, речи и языка . arXiv : 2002.05033 .
  17. ^ Бернард, Юрген; Цеппельцауэр, Матиас; Леманн, Маркус; Мюллер, Мартин; Седлмайр, Майкл (июнь 2018 г.). «На пути к ориентированным на пользователя алгоритмам активного обучения». Форум компьютерной графики . 37 (3): 121–132. дои : 10.1111/cgf.13406. ISSN  0167-7055. S2CID  51875861.
  18. ^ Десрёмо, Луи; Лемэр, Винсент (2020). «Обучение активному обучению на перепутье? Оценка и обсуждение» (Материалы семинара по интерактивному адаптивному обучению, проведенного совместно с Европейской конференцией по машинному обучению, принципам и практике обнаружения знаний в базах данных {(ECML} {PKDD} 2020), Гент , Бельгия, 2020). S2CID  221794570. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )