Прямой голосовой ввод ( DVI ), иногда называемый управлением голосовым вводом ( VIC ), представляет собой стиль взаимодействия человека с машиной («HMI»), при котором пользователь подает голосовые команды для передачи инструкций машине посредством распознавания речи .
В области военной авиации DVI был внедрен в кабины нескольких современных военных самолетов, таких как Eurofighter Typhoon , Lockheed Martin F-35 Lightning II , Dassault Rafale , KF-21 Boramae и Saab JAS 39 Gripen . Такие системы также использовались для различных других целей, включая системы управления промышленностью и помощь в распознавании речи для людей с ограниченными возможностями.
Системы DVI можно разделить на две основные категории функциональности: «зависимые от пользователя» и «независимые от пользователя». Система, зависящая от пользователя, требует, чтобы для конкретного человека был сгенерирован личный голосовой шаблон; шаблон для этого человека должен быть загружен на его назначенный компьютер до использования системы DVI, чтобы она функционировала должным образом. Напротив, система, не зависящая от пользователя, не требует никакого личного голосового шаблона, поскольку она предназначена для правильного реагирования на голос любого пользователя. [1] Их также можно разделить на категории «дискретное распознавание» и «непрерывное распознавание». Пользователи системы дискретного распознавания должны делать паузу между каждым словом, чтобы система DVI могла идентифицировать разделения между каждым словом, в то время как система непрерывного распознавания речи способна понимать нормальную скорость речи. [2]
В середине 2000-х годов исследователи Национальной аэрокосмической лаборатории в Нидерландах исследовали использование DVI в симуляторе «GRACE»; в последующем эксперименте приняли участие в общей сложности двенадцать пилотов. Проведенные испытания, как сообщается, показали, что, хотя само оборудование функционировало хорошо, было желательно внести несколько улучшений до реального развертывания на самолетах, поскольку операции DVI фактически занимали больше времени по сравнению с традиционными существующими методами. Рекомендации по улучшениям включали принятие более простого синтаксиса , достижение большей скорости распознавания и сокращение времени отклика; все возникшие проблемы были определены как технологические и считались осуществимыми для решения. Исследователи пришли к выводу, что в кабинах, особенно во время чрезвычайных ситуаций, когда пилотам приходится действовать полностью самостоятельно, система DVI может быть весьма уместной, но что она не имеет решающего значения в большинстве других возможных сценариев. [3]
Примерно в то же время в рамках проекта SafeSound, координируемого Европейским союзом , проводились оценки систем DVI для целей гражданской авиации . Он включал наблюдение за рабочей нагрузкой пилотов в реальных кабинах и сравнение ее с деятельностью пилотов в летных тренажерах с использованием как обычных систем, так и помощи DVI. Проект был направлен на повышение безопасности полетов и снижение рабочей нагрузки как в наземных, так и в летных операциях за счет применения расширенных аудиофункций. [4]
До его широкого распространения несколько обычных военных самолетов были переоборудованы в испытательные системы DVI; примерами служат Harrier AV-8B и F-16 VISTA . В другом случае симулятор General Dynamics F-16 Fighting Falcon был модифицирован с помощью DVI для исследования голосового управления, которое было проведено Королевскими ВВС Нидерландов . [5] Испытания DVI также проводились на вертолетах , включая Boeing AH-64 Apache , что показало потенциал для повышения безопасности полетов и эффективности миссий. [6] [7]
Многочисленные современные истребители были оснащены системами DVI, часто в сочетании с различными другими схемами человеко-машинного интерфейса, такими как HOTAS -совместимые элементы управления и другие передовые технологии управления. Сочетание голосовых и HOTAS-схем управления иногда упоминается как концепция «V-TAS». Известным истребителем, который будет оснащен кабиной V-TAS, является Eurofighter Typhoon . [8] Lockheed Martin F-35 Lightning II также оснащен системой DVI, которая была разработана Adacel . [9] Другие примеры включают Dassault Rafale и Saab JAS 39 Gripen . [5]
Многочисленные самолеты были запланированы для использования DVI. На определенном этапе ВВС США пытались интегрировать DVI в Lockheed Martin F-22 Raptor ; однако, в конечном итоге, технология была признана слишком рискованной на тот момент, и поэтому такие попытки были прекращены. [10]
К 1990 году были продемонстрированы рабочие прототипы систем распознавания речи ; они продвигались с целью предоставления эффективного интерфейса человек-машина для людей с нарушениями речи . [11] Применяемые методы включали цифровую речь с временным кодированием и автоматический выбор набора маркеров . Исследования этих ранних систем DVI, как сообщается, включали использование автоматических диагностических процедур и ограниченные по масштабу испытания с использованием добровольцев. [11]
В 2010-х годах различные компании предлагали широкой публике системы распознавания голоса в виде персональных цифровых помощников . [2] Одним из примеров является служба Google Voice , которая позволяет пользователям задавать вопросы через пакет DVI, установленный на персональном компьютере , планшете или мобильном телефоне . Было разработано множество цифровых помощников, таких как Amazon Echo , Siri и Cortana , которые используют DVI для взаимодействия с пользователями. [2]
Технология DVI позволила широко внедрить автоматизированные телефонные системы. Многие компании обычно используют централизованные телефонные системы, которые направляют звонящих в нужный отдел с помощью таких методов. [2] Различные производители автомобилей также оснастили свои дорожные транспортные средства системами DVI; они обычно позволяют водителям управлять информационно-развлекательными системами и взаимодействовать с мобильными телефонами с большим удобством, чем традиционные методы. [2]
В конце 1980-х годов проводились исследования по использованию систем DVI для управления станками с ЧПУ и другим производственным оборудованием. [12] В 2010-х годах такие системы использовались для целей логистики и управления складом. [13]