Диалоговая система , или диалоговый агент ( CA ), — это компьютерная система, предназначенная для общения с человеком. Диалоговые системы использовали один или несколько режимов связи как на входном, так и на выходном канале: текст, речь, графика, тактильные ощущения, жесты и другие режимы.
Элементы диалоговой системы не определены, поскольку эта идея находится в стадии исследования, однако они отличаются от чат -бота . [1] Типичный мастер с графическим интерфейсом ведет своего рода диалог, но он включает в себя очень мало общих компонентов диалоговой системы, а состояние диалога тривиально.
Фон
После диалоговых систем, основанных только на обработке письменного текста, начиная с начала шестидесятых годов, [2] первая голосовая диалоговая система была выпущена проектом DARPA в США в 1977 году. [3] После окончания этого пятилетнего проекта некоторые европейские проектов выпустила первую диалоговую систему, способную говорить на многих языках (также французском, немецком и итальянском). [4] Эти первые системы использовались в телекоммуникационной отрасли для предоставления различных телефонных услуг в конкретных областях, например, автоматизированная повестка дня и обслуживание столов для поездов.
Компоненты
Какие наборы компонентов включены в диалоговую систему и то, как эти компоненты распределяют обязанности, различается от системы к системе. Принципиальным элементом любой диалоговой системы является менеджер диалога , который является компонентом, управляющим состоянием диалога и стратегией диалога. Типичный цикл деятельности в диалоговой системе состоит из следующих фаз: [5]
Пользователь говорит, и ввод преобразуется в обычный текст системным распознавателем/декодером ввода , который может включать в себя:
Диалоговые системы, основанные на текстовом интерфейсе (например, текстовый чат), содержат только этапы 2–5.
Типы систем
Диалоговые системы делятся на следующие категории, которые перечислены здесь по нескольким параметрам. Многие категории частично совпадают, и различия могут быть недостаточно четко установлены.
«Система естественного диалога — это форма диалоговой системы, которая пытается улучшить удобство использования и удовлетворенность пользователей путем имитации человеческого поведения» [6] (Берг, 2014). Он рассматривает особенности диалога между людьми (например, поддиалоги и смену тем) и стремится интегрировать их в диалоговые системы для взаимодействия человека и машины. Часто (разговорные) диалоговые системы требуют от пользователя адаптации к системе, поскольку система способна понимать лишь очень ограниченный словарный запас, не способна реагировать на изменения темы и не позволяет пользователю влиять на ход диалога. Смешанная инициатива — это способ дать пользователю возможность активно участвовать в диалоге, а не только отвечать на вопросы . Однако самого существования смешанной инициативы недостаточно, чтобы ее можно было отнести к системе естественного диалога. Другие важные аспекты включают: [6]
Адаптивность системы
Поддержка неявного подтверждения
Использование проверочных вопросов
Возможность исправить уже предоставленную информацию.
Чрезмерная информативность (дайте больше информации, чем просили)
Поддержка отрицаний
Понимайте ссылки, анализируя дискурс и анафору
Генерация естественного языка для предотвращения монотонных и повторяющихся подсказок.
Адаптивная и учитывающая ситуацию формулировка
Социальное поведение (приветствия, тот же уровень формальности, что и пользователь, вежливость)
Качество распознавания и синтеза речи
Хотя большинство этих аспектов являются вопросами множества различных исследовательских проектов, существует недостаток инструментов, поддерживающих разработку диалоговых систем, рассматривающих эти темы. [7] За исключением VoiceXML , который фокусируется на системах интерактивного голосового ответа и является основой для многих систем разговорного диалога в промышленности (приложения поддержки клиентов) и AIML , известного своим чат-ботом ALICE , ни один из них не объединяет лингвистические функции, такие как диалоговые действия или язык. поколение. Таким образом, NADIA (исследовательский прототип) дает представление о том, как восполнить этот пробел, и сочетает в себе некоторые из вышеупомянутых аспектов, таких как генерация естественного языка, адаптивная формулировка и поддиалоги.
Производительность
Некоторые авторы измеряют производительность диалоговой системы по проценту совершенно правильных предложений, сравнивая модели предложений (этот показатель называется « точность концептуального предложения» [8] или «понимание предложения» [4] ).
Приложения
Диалоговые системы могут поддерживать широкий спектр приложений в сфере бизнеса, образования, государственного управления, здравоохранения и развлечений. [9] Например:
Ответы на вопросы клиентов о продуктах и услугах через веб-сайт компании или интранет-портал.
База знаний агентов по обслуживанию клиентов : позволяет агентам вводить вопрос клиента и давать им ответ.
Управляемые продажи : упрощение транзакций путем предоставления ответов и рекомендаций в процессе продаж, особенно для сложных продуктов, продаваемых начинающим клиентам.
Справочная служба : ответы на внутренние вопросы сотрудников, например, ответы на вопросы отдела кадров.
Навигация по веб-сайту: направление клиентов к соответствующим частям сложных веб-сайтов — консьерж веб-сайта.
Техническая поддержка: реагирование на технические проблемы, например диагностика проблем с продуктом или устройством.
Персонализированное обслуживание: диалоговые агенты могут использовать внутренние и внешние базы данных для персонализации взаимодействия, например, ответов на вопросы о остатках на счетах, предоставления информации о портфолио, доставки часто летающих пассажиров или информации о членстве.
Обучение или образование: они могут давать советы по решению проблем, пока пользователь учится.
Простые диалоговые системы широко используются для снижения нагрузки на человека в колл-центрах . В этом и других приложениях промышленной телефонии функциональность, предоставляемая диалоговыми системами, известна как интерактивный голосовой ответ или IVR.
Поддерживайте ученого в задачах манипулирования и анализа данных, например, в геномике. [10]
В некоторых случаях диалоговые агенты могут взаимодействовать с пользователями, используя искусственных персонажей. Эти агенты тогда называются воплощенными агентами .
Наборы инструментов и архитектуры
Обзор существующих рамок, языков и технологий для определения диалоговых систем.
^ Клювер, Тина. «От чат-ботов к диалоговым системам». Разговорные агенты и взаимодействие на естественном языке: методы и эффективные практики. IGI Global, 2011. 1-22.
^ Мактир, Майкл, Зораида Каллехас и Дэвид Гриол, Диалоговый интерфейс: общение с интеллектуальными устройствами , Springer, 2016.
^ Джанкарло Пирани (редактор), Передовые алгоритмы и архитектуры для понимания речи , Vol. 1. Springer Science & Business Media, 2013.
^ ab Альберто Чиарамелла, Отчет об оценке характеристик прототипа , пакет работ по солнечным часам 8000 (1993).
^ Берг, Маркус М. (2015), «NADIA: Упрощенный подход к развитию систем естественного диалога», Системы обработки естественного языка и информационные системы , Конспекты лекций по информатике, том. 9103, стр. 144–150, doi : 10.1007/978-3-319-19581-0_12, ISBN.978-3-319-19580-3
^ Бангалор, Шринивас и Майкл Джонстон. «Надежное понимание мультимодальных интерфейсов». Компьютерная лингвистика 35.3 (2009): 345–397.
^ Лестер, Дж.; Брантинг, К.; Мотт, Б. (2004), «Разговорные агенты» (PDF) , Практическое руководство по интернет-вычислениям , Chapman & Hall
^ Кровари; Пидо; Пиноли; Бернаскони; Чанакоглу; Гарцотто; Кери (2021), «GeCoAgent: диалоговый агент для расширения возможностей извлечения и анализа геномных данных», ACM Transactions on Computing for Healthcare , 3 , ACM New York, NY: 1–29, doi : 10.1145/3464383, hdl : 11311/1192262 , S2CID 245855725