Пользовательский интерфейс на естественном языке ( LUI или NLUI ) — это тип компьютерного интерфейса «человек-человек» , в котором языковые явления, такие как глаголы, фразы и предложения, выступают в качестве элементов управления пользовательского интерфейса для создания, выбора и изменения данных в программных приложениях.
В дизайне интерфейсов интерфейсы на естественном языке востребованы из-за их скорости и простоты использования, но большинство из них испытывают трудности с пониманием широкого спектра неоднозначных входных данных . [1]
Интерфейсы на естественном языке являются активной областью изучения в области обработки естественного языка и компьютерной лингвистики . Интуитивно понятный общий интерфейс на естественном языке является одной из активных целей семантической паутины .
Текстовые интерфейсы являются «естественными» в разной степени. Многие формальные (неестественные) языки программирования включают идиомы естественного человеческого языка. Аналогично, традиционная поисковая система ключевых слов может быть описана как «поверхностный» пользовательский интерфейс на естественном языке.
Обзор
Поисковая система на естественном языке теоретически находит целевые ответы на вопросы пользователя (в отличие от поиска по ключевым словам). Например, столкнувшись с вопросом в форме «какой штат США имеет самый высокий подоходный налог ?», обычные поисковые системы игнорируют вопрос и вместо этого ищут по ключевым словам «штат», «доход» и «налог». Поиск на естественном языке, с другой стороны, пытается использовать обработку естественного языка, чтобы понять природу вопроса, а затем выполнить поиск и вернуть подмножество сети, содержащее ответ на вопрос. Если это сработает, результаты будут иметь более высокую релевантность, чем результаты поисковой системы по ключевым словам, из-за включения вопроса. [ необходима цитата ]
История
Прототипы интерфейсов Nl появились уже в конце шестидесятых и начале семидесятых годов. [2]
SHRDLU — интерфейс на естественном языке, который управляет блоками в виртуальном «мире блоков»
Lunar — интерфейс на естественном языке к базе данных, содержащей химические анализы лунных пород миссии «Аполлон-11», созданный Уильямом А. Вудсом.
Chat-80 преобразовал английские вопросы в выражения Prolog , которые были оценены по базе данных Prolog. Код Chat-80 был широко распространен и лег в основу нескольких других экспериментальных интерфейсов Nl. Онлайн-демонстрация доступна на веб-сайте LPA. [3]
ELIZA , написанная в Массачусетском технологическом институте Джозефом Вайценбаумом между 1964 и 1966 годами, имитировала психотерапевта и управлялась обработкой ответов пользователей на сценарии. Не используя почти никакой информации о человеческих мыслях или эмоциях, сценарий DOCTOR иногда обеспечивал поразительно человеческое взаимодействие. Онлайн-демонстрация доступна на сайте LPA. [4]
Janus также является одной из немногих систем, поддерживающих временные вопросы.
Intellect from Trinzic (образована в результате слияния AICorp и Aion).
Система Parlance от BBN создана на основе опыта разработки систем Rus и Irus .
Интерфейсы на естественном языке в прошлом заставляли пользователей антропоморфизировать компьютер или, по крайней мере, приписывать машинам больше интеллекта, чем это оправдано. Со стороны пользователя это привело к нереалистичным ожиданиям относительно возможностей системы. Такие ожидания затруднят изучение ограничений системы, если пользователи приписывают ей слишком много возможностей, и в конечном итоге приведут к разочарованию, когда система не будет работать так, как ожидалось, как это было в случае с ИИ зимой 1970-х и 1980-х годов.
В статье 1995 года под названием «Интерфейсы естественного языка для баз данных – введение» описываются некоторые проблемы: [2]
Модификатор присоединения
Запрос «Перечислите всех сотрудников компании, имеющих водительские права» будет неоднозначным, если только вы не знаете, что компании не могут иметь водительские права.
Конъюнкция и дизъюнкция
«Перечислите всех заявителей, которые живут в Калифорнии и Аризоне» — это двусмысленное утверждение, если только вы не знаете, что человек не может жить в двух местах одновременно.
определить, что пользователь подразумевает под «он», «она» или «оно» в самореферентном запросе.
Другие цели, которые следует учитывать в более общем плане, — это скорость и эффективность интерфейса, во всех алгоритмах эти два пункта являются основными, которые определяют, являются ли некоторые методы лучше других и, следовательно, имеют больший успех на рынке. Кроме того, локализация на многоязычных сайтах требует дополнительного рассмотрения — это основано на различной структуре предложений и вариациях синтаксиса языка между большинством языков.
Наконец, что касается используемых методов, то главная проблема, которую необходимо решить, заключается в создании общего алгоритма, который может распознавать весь спектр различных голосов, не обращая внимания на национальность, пол или возраст. Значительные различия между извлеченными признаками — даже у ораторов, которые говорят одно и то же слово или фразу — должны быть успешно преодолены.
Использование и применение
Интерфейс на естественном языке дает начало технологиям, используемым во многих различных приложениях.
Некоторые из основных применений:
Диктовка — наиболее распространенное применение систем автоматического распознавания речи (ASR) на сегодняшний день. Сюда входят медицинские транскрипции, юридическая и деловая диктовка, а также общая обработка текстов. В некоторых случаях для повышения точности системы используются специальные словари.
Командование и контроль , системы ASR, которые предназначены для выполнения функций и действий в системе, определяются как системы командования и контроля. Высказывания типа «Открыть Netscape» и «Запустить новый xterm» будут делать именно это.
Телефония , некоторые системы АТС/ голосовой почты позволяют звонящим произносить команды вместо нажатия кнопок для отправки определенных тонов.
Носимые устройства . Поскольку возможности носимых устройств ограничены, речь является естественной возможностью.
Медицинские, инвалидность , многие люди испытывают трудности с набором текста из-за физических ограничений, таких как травмы от повторяющихся напряжений (RSI), мышечная дистрофия и многие другие. Например, люди с проблемами слуха могут использовать систему, подключенную к их телефону, для преобразования речи звонящего в текст.
Встроенные приложения , некоторые новые сотовые телефоны включают распознавание речи C&C, что позволяет произносить такие фразы, как «позвони домой». Это может стать важным фактором в будущем автоматического распознавания речи и Linux .
Ниже перечислены и определены некоторые приложения, использующие распознавание естественного языка, а также имеющие интегрированные утилиты, перечисленные выше.
Вездесущность
Ubiquity, дополнение для Mozilla Firefox , представляет собой набор быстрых и простых команд на естественном языке, которые действуют как гибридные веб-сервисы, позволяя пользователям получать информацию и связывать ее с текущей и другими веб-страницами.
Вольфрам Альфа
Wolfram Alpha — это онлайн-сервис, который отвечает на фактические запросы напрямую, вычисляя ответ из структурированных данных, а не предоставляя список документов или веб-страниц, которые могут содержать ответ, как это делает поисковая система . [5] Он был анонсирован в марте 2009 года Стивеном Вольфрамом и был выпущен для публики 15 мая 2009 года. [6]
Маркетинговые заявления Siri включают в себя то, что она со временем адаптируется к индивидуальным предпочтениям пользователя и персонализирует результаты, а также выполняет такие задачи, как бронирование столика в ресторане, одновременно пытаясь поймать такси. [7]
Другие
Ask.com – Первоначальная идея Ask Jeeves (Ask.com) заключалась в традиционном поиске по ключевым словам с возможностью получать ответы на вопросы, заданные на повседневном, естественном языке. Текущий Ask.com все еще поддерживает это, с дополнительной поддержкой математических, словарных и конверсионных вопросов.
Braina [8] – Braina – это интерфейс естественного языка для ОС Windows , который позволяет вводить или произносить предложения на английском языке для выполнения определенного действия или поиска информации.
GNOME Do – позволяет быстро находить различные артефакты среды GNOME (приложения, контакты Evolution и Pidgin, закладки Firefox, исполнители и альбомы Rhythmbox и т. д.) и выполнять с ними основные действия (запуск, открытие, электронная почта, чат, воспроизведение и т. д.). [9]
hakia – hakia была поисковой системой в Интернете. Компания изобрела альтернативную новую инфраструктуру индексации, которая использовала алгоритм SemanticRank, решение, смешанное из дисциплин онтологической семантики, нечеткой логики, вычислительной лингвистики и математики. hakia закрылась в 2014 году.
Lexxe – Lexxe был поисковой системой в Интернете, которая использовала обработку естественного языка для запросов (семантический поиск). Поиск можно было осуществлять с помощью ключевых слов, фраз и вопросов, например, «Сколько лет Википедии?» Lexxe закрыл свои поисковые сервисы в 2015 году.
Pikimal – Pikimal использовал естественный язык, привязанный к предпочтениям пользователя, для создания рекомендаций по поиску по шаблону. Pikimal закрылся в 2015 году.
Powerset – 11 мая 2008 года компания представила инструмент для поиска в фиксированном подмножестве Википедии с использованием разговорных фраз, а не ключевых слов. [10] 1 июля 2008 года он был куплен Microsoft . [11]
Q-go – Технология Q-go предоставляет пользователям релевантные ответы в ответ на запросы на веб-сайте компании или в корпоративной интрасети, сформулированные в виде естественных предложений или ввода ключевых слов. Q-go была приобретена RightNow Technologies в 2011 году.
Yebol – Yebol был вертикальным «решением» поисковой системы, которая разработала основанную на знаниях, семантическую поисковую платформу. Искусственный интеллект Yebol, пропитанный человеческим интеллектом, автоматически кластеризовал и категоризировал результаты поиска, веб-сайты, страницы и контент, которые он представлял в визуально индексированном формате, который больше соответствовал изначальному человеческому намерению. Yebol использовал алгоритмы ассоциации, ранжирования и кластеризации для анализа связанных ключевых слов или веб-страниц. Yebol интегрировал обработку естественного языка, метасинтетически спроектированные открытые сложные системы и машинные алгоритмы с человеческими знаниями для каждого запроса, чтобы создать веб-каталог, который на самом деле «обучается», используя алгоритмы корреляции, кластеризации и классификации для автоматического создания запроса знаний, который сохранялся и регенерировался в дальнейшем. [12]
^ Хилл, И. (1983). «Естественный язык против компьютерного языка». В М. Сайме и М. Кумбсе (ред.) Проектирование для человеко-компьютерной коммуникации. Academic Press.
^ ab Интерфейсы естественного языка к базам данных – Введение, И. Андроутсопулос, Г. Д. Ричи, П. Таниш, Кафедра искусственного интеллекта, Эдинбургский университет
^ "Chat-80 demo". Архивировано из оригинала 11 ноября 2016 года . Получено 29 января 2018 года .
^ "ELIZA demo". Архивировано из оригинала 26 ноября 2016 года . Получено 29 января 2018 года .