stringtranslate.com

Диалоговая система

Автоматизированный онлайн-помощник на сайте – пример, когда диалоговые системы являются основными компонентами

Диалоговая система , или диалоговый агент ( CA ), — это компьютерная система, предназначенная для общения с человеком. Диалоговые системы использовали один или несколько режимов связи как на входном, так и на выходном канале: текст, речь, графика, тактильные ощущения, жесты и другие режимы.

Элементы диалоговой системы не определены, поскольку эта идея находится в стадии исследования, однако они отличаются от чат -бота . [1] Типичный мастер с графическим интерфейсом ведет своего рода диалог, но он включает в себя очень мало общих компонентов диалоговой системы, а состояние диалога тривиально.

Фон

После диалоговых систем, основанных только на обработке письменного текста, начиная с начала шестидесятых годов, [2] первая голосовая диалоговая система была выпущена проектом DARPA в США в 1977 году. [3] После окончания этого пятилетнего проекта некоторые европейские проектов выпустила первую диалоговую систему, способную говорить на многих языках (также французском, немецком и итальянском). [4] Эти первые системы использовались в телекоммуникационной отрасли для предоставления различных телефонных услуг в конкретных областях, например, автоматизированная повестка дня и обслуживание столов для поездов.

Компоненты

Какие наборы компонентов включены в диалоговую систему и то, как эти компоненты распределяют обязанности, различается от системы к системе. Принципиальным элементом любой диалоговой системы является менеджер диалога , который является компонентом, управляющим состоянием диалога и стратегией диалога. Типичный цикл деятельности в диалоговой системе состоит из следующих фаз: [5]

  1. Пользователь говорит, и ввод преобразуется в обычный текст системным распознавателем/декодером ввода , который может включать в себя:
  2. Текст анализируется блоком понимания естественного языка (NLU), который может включать в себя:
  3. Семантическая информация анализируется менеджером диалогов , который сохраняет историю и состояние диалога и управляет общим потоком разговора.
  4. Обычно менеджер диалога связывается с одним или несколькими менеджерами задач , которые знают конкретную область задач.
  5. Менеджер диалогов выдает выходные данные с помощью генератора выходных данных , который может включать в себя:
  6. Наконец, выходные данные визуализируются с помощью средства рендеринга вывода , которое может включать в себя:

Диалоговые системы, основанные на текстовом интерфейсе (например, текстовый чат), содержат только этапы 2–5.

Типы систем

Диалоговые системы делятся на следующие категории, которые перечислены здесь по нескольким параметрам. Многие категории частично совпадают, и различия могут быть недостаточно четко установлены.

Естественные диалоговые системы

«Система естественного диалога — это форма диалоговой системы, которая пытается улучшить удобство использования и удовлетворенность пользователей путем имитации человеческого поведения» [6] (Берг, 2014). Он рассматривает особенности диалога между людьми (например, поддиалоги и смену тем) и стремится интегрировать их в диалоговые системы для взаимодействия человека и машины. Часто (разговорные) диалоговые системы требуют от пользователя адаптации к системе, поскольку система способна понимать лишь очень ограниченный словарный запас, не способна реагировать на изменения темы и не позволяет пользователю влиять на ход диалога. Смешанная инициатива — это способ дать пользователю возможность активно участвовать в диалоге, а не только отвечать на вопросы . Однако самого существования смешанной инициативы недостаточно, чтобы ее можно было отнести к системе естественного диалога. Другие важные аспекты включают: [6]

Хотя большинство этих аспектов являются вопросами множества различных исследовательских проектов, существует недостаток инструментов, поддерживающих разработку диалоговых систем, рассматривающих эти темы. [7] За исключением VoiceXML , который фокусируется на системах интерактивного голосового ответа и является основой для многих систем разговорного диалога в промышленности (приложения поддержки клиентов) и AIML , известного своим чат-ботом ALICE , ни один из них не объединяет лингвистические функции, такие как диалоговые действия или язык. поколение. Таким образом, NADIA (исследовательский прототип) дает представление о том, как восполнить этот пробел, и сочетает в себе некоторые из вышеупомянутых аспектов, таких как генерация естественного языка, адаптивная формулировка и поддиалоги.

Производительность

Некоторые авторы измеряют производительность диалоговой системы по проценту совершенно правильных предложений, сравнивая модели предложений (этот показатель называется « точность концептуального предложения» [8] или «понимание предложения» [4] ).

Приложения

Диалоговые системы могут поддерживать широкий спектр приложений в сфере бизнеса, образования, государственного управления, здравоохранения и развлечений. [9] Например:

В некоторых случаях диалоговые агенты могут взаимодействовать с пользователями, используя искусственных персонажей. Эти агенты тогда называются воплощенными агентами .

Наборы инструментов и архитектуры

Обзор существующих рамок, языков и технологий для определения диалоговых систем.

Смотрите также

Рекомендации

  1. ^ Клювер, Тина. «От чат-ботов к диалоговым системам». Разговорные агенты и взаимодействие на естественном языке: методы и эффективные практики. IGI Global, 2011. 1-22.
  2. ^ Мактир, Майкл, Зораида Каллехас и Дэвид Гриол, Диалоговый интерфейс: общение с интеллектуальными устройствами , Springer, 2016.
  3. ^ Джанкарло Пирани (редактор), Передовые алгоритмы и архитектуры для понимания речи , Vol. 1. Springer Science & Business Media, 2013.
  4. ^ ab Альберто Чиарамелла, Отчет об оценке характеристик прототипа , пакет работ по солнечным часам 8000 (1993).
  5. ^ Джурафски и Мартин (2009), Обработка речи и языка. Pearson International Edition, ISBN  978-0-13-504196-3 , глава 24
  6. ^ ab Берг, Маркус М. (2014), Моделирование естественных диалогов в контексте речевых информационных и управляющих систем, Akademische Verlagsgesellschaft AKA , ISBN 978-3-89838-508-4
  7. ^ Берг, Маркус М. (2015), «NADIA: Упрощенный подход к развитию систем естественного диалога», Системы обработки естественного языка и информационные системы , Конспекты лекций по информатике, том. 9103, стр. 144–150, doi : 10.1007/978-3-319-19581-0_12, ISBN. 978-3-319-19580-3
  8. ^ Бангалор, Шринивас и Майкл Джонстон. «Надежное понимание мультимодальных интерфейсов». Компьютерная лингвистика 35.3 (2009): 345–397.
  9. ^ Лестер, Дж.; Брантинг, К.; Мотт, Б. (2004), «Разговорные агенты» (PDF) , Практическое руководство по интернет-вычислениям , Chapman & Hall
  10. ^ Кровари; Пидо; Пиноли; Бернаскони; Чанакоглу; Гарцотто; Кери (2021), «GeCoAgent: диалоговый агент для расширения возможностей извлечения и анализа геномных данных», ACM Transactions on Computing for Healthcare , 3 , ACM New York, NY: 1–29, doi : 10.1145/3464383, hdl : 11311/1192262 , S2CID  245855725

дальнейшее чтение