Прямой голосовой ввод ( DVI ), иногда называемый управлением голосовым вводом ( VIC ), представляет собой стиль взаимодействия человека и машины «HMI», при котором пользователь подает голосовые команды для выдачи инструкций машине посредством распознавания речи .
В области военной авиации DVI был внедрен в кабины нескольких современных военных самолетов, таких как Eurofighter Typhoon , Lockheed Martin F-35 Lightning II , Dassault Rafale , KF-21 Boramae и Saab JAS 39 Gripen. . Такие системы также использовались для различных других целей, включая системы управления промышленностью и помощь в распознавании речи для людей с ограниченными возможностями.
Системы DVI можно разделить на две основные категории функциональности: «зависимые от пользователя» и «независимые от пользователя». Зависимая от пользователя система требует, чтобы для конкретного человека был сгенерирован личный голосовой шаблон; шаблон для этого человека должен быть загружен на назначенный ему компьютер перед использованием системы DVI, чтобы он работал правильно. Напротив, независимая от пользователя система не требует какого-либо личного голосового шаблона, поскольку предназначена для правильного реагирования на голос любого пользователя. [1] Их также можно разделить на «дискретное распознавание» и «непрерывное распознавание». Пользователи дискретной системы распознавания должны делать паузу между каждым словом, чтобы система DVI могла определить различия между каждым словом, в то время как система непрерывного распознавания речи способна понимать нормальную скорость речи. [2]
В середине 2000-х годов исследователи Национальной аэрокосмической лаборатории Нидерландов изучили использование DVI в симуляторе GRACE; Всего в последовавшем эксперименте приняли участие двенадцать пилотов. Сообщается, что проведенные испытания показали, что, хотя само оборудование функционировало хорошо, перед его реальным внедрением на самолетах было желательно внести несколько улучшений, поскольку операции DVI фактически требовали больше времени по сравнению с существующими традиционными методами. Рекомендации по улучшению включали принятие более простого синтаксиса , достижение большей скорости распознавания и сокращение времени ответа; все возникшие проблемы были признаны технологическими и их можно было решить. Исследователи пришли к выводу, что в кабинах, особенно во время чрезвычайных ситуаций, когда пилотам приходится действовать полностью самостоятельно, система DVI может быть весьма актуальной, но в большинстве других мыслимых сценариев она не имеет решающего значения. [3]
Примерно в то же время были проведены оценки систем DVI для целей гражданской авиации в рамках проекта SafeSound, координируемого Европейским Союзом . Он включал наблюдение за рабочей нагрузкой пилотов в реальных кабинах и сопоставление ее с деятельностью пилотов на авиасимуляторах с использованием как традиционных систем, так и помощи DVI. Проект был направлен на повышение авиационной безопасности и снижение рабочей нагрузки как при наземных, так и при летных операциях за счет применения расширенных аудиофункций. [4]
До его широкого распространения несколько обычных военных самолетов были переоборудованы в пробные системы DVI; примеры включают Harrier AV-8B и F-16 VISTA . В другом случае симулятор General Dynamics F-16 Fighting Falcon был модифицирован с помощью DVI для исследования голосового управления, которое было проведено Королевскими ВВС Нидерландов . [5] Испытания DVI также проводились на вертолетах , в том числе на Boeing AH-64 Apache , что показало потенциал повышения безопасности полетов и эффективности миссий. [6] [7]
Многочисленные современные истребители оснащены системами DVI, часто в сочетании с различными другими схемами человеко-машинного интерфейса, такими как элементы управления, соответствующие требованиям HOTAS , и другие передовые технологии управления. Комбинацию схем голосового управления и управления HOTAS иногда называют концепцией «V-TAS». Известным истребителем, который будет оснащен кабиной V-TAS, является Eurofighter Typhoon . [8] Lockheed Martin F-35 Lightning II также оснащен системой DVI, разработанной Adacel . [9] Другие примеры включают Dassault Rafale и Saab JAS 39 Gripen . [5]
Планируется, что множество самолетов будут использовать DVI. На каком-то этапе ВВС США стремились интегрировать DVI в Lockheed Martin F-22 Raptor ; однако в конечном итоге было признано, что эта технология представляет слишком много технических рисков на тот момент, и поэтому от таких усилий отказались. [10]
К 1990 году уже демонстрировались рабочие прототипы систем распознавания речи ; они продвигались с целью обеспечения эффективного человеко-машинного интерфейса для людей с нарушениями речи . [11] Используемые методы включали цифровую речь с временным кодированием и автоматический выбор набора токенов . Сообщается, что исследования этих первых систем DVI включали использование автоматических диагностических процедур и ограниченные испытания с участием добровольцев. [11]
В 2010-х годах различные компании предлагали широкой публике системы распознавания голоса в виде персональных цифровых помощников . [2] Одним из примеров является сервис Google Voice , который позволяет пользователям задавать вопросы через пакет DVI, установленный на персональном компьютере , планшете или мобильном телефоне . Были разработаны многочисленные цифровые помощники, такие как Amazon Echo , Siri и Cortana , которые используют DVI для взаимодействия с пользователями. [2]
Технология DVI позволила широко использовать автоматизированные телефонные системы. Многие компании обычно используют централизованные телефонные системы, которые таким образом направляют звонящих в нужный отдел. [2] Различные производители автомобилей также оснастили свои автомобили системами DVI; они обычно позволяют водителям управлять информационно-развлекательными системами и взаимодействовать с мобильными телефонами с большим удобством, чем устаревшие методы. [2]
В конце 1980-х годов проводились исследования использования систем DVI для управления станками с ЧПУ и другим производственным оборудованием. [12] В 2010-х годах такие системы использовались для целей логистики и управления складами. [13]