stringtranslate.com

Прямой голосовой ввод

Прямой голосовой ввод ( DVI ), иногда называемый управлением голосовым вводом ( VIC ), представляет собой стиль взаимодействия человека и машины «HMI», при котором пользователь подает голосовые команды для выдачи инструкций машине посредством распознавания речи .

В области военной авиации DVI был внедрен в кабины нескольких современных военных самолетов, таких как Eurofighter Typhoon , Lockheed Martin F-35 Lightning II , Dassault Rafale , KF-21 Boramae и Saab JAS 39 Gripen. . Такие системы также использовались для различных других целей, включая системы управления промышленностью и помощь в распознавании речи для людей с ограниченными возможностями.

Обзор

Системы DVI можно разделить на две основные категории функциональности: «зависимые от пользователя» и «независимые от пользователя». Зависимая от пользователя система требует, чтобы для конкретного человека был сгенерирован личный голосовой шаблон; шаблон для этого человека должен быть загружен на назначенный ему компьютер перед использованием системы DVI, чтобы он работал правильно. Напротив, независимая от пользователя система не требует какого-либо личного голосового шаблона, поскольку предназначена для правильного реагирования на голос любого пользователя. [1] Их также можно разделить на «дискретное распознавание» и «непрерывное распознавание». Пользователи дискретной системы распознавания должны делать паузу между каждым словом, чтобы система DVI могла определить различия между каждым словом, в то время как система непрерывного распознавания речи способна понимать нормальную скорость речи. [2]

В середине 2000-х годов исследователи Национальной аэрокосмической лаборатории Нидерландов изучили использование DVI в симуляторе GRACE; Всего в последовавшем эксперименте приняли участие двенадцать пилотов. Сообщается, что проведенные испытания показали, что, хотя само оборудование функционировало хорошо, перед его реальным внедрением на самолетах было желательно внести несколько улучшений, поскольку операции DVI фактически требовали больше времени по сравнению с существующими традиционными методами. Рекомендации по улучшению включали принятие более простого синтаксиса , достижение большей скорости распознавания и сокращение времени ответа; все возникшие проблемы были признаны технологическими и их можно было решить. Исследователи пришли к выводу, что в кабинах, особенно во время чрезвычайных ситуаций, когда пилотам приходится действовать полностью самостоятельно, система DVI может быть весьма актуальной, но в большинстве других мыслимых сценариев она не имеет решающего значения. [3]

Примерно в то же время были проведены оценки систем DVI для целей гражданской авиации в рамках проекта SafeSound, координируемого Европейским Союзом . Он включал наблюдение за рабочей нагрузкой пилотов в реальных кабинах и сопоставление ее с деятельностью пилотов на авиасимуляторах с использованием как традиционных систем, так и помощи DVI. Проект был направлен на повышение авиационной безопасности и снижение рабочей нагрузки как при наземных, так и при летных операциях за счет применения расширенных аудиофункций. [4]

Приложения

Авиация

До его широкого распространения несколько обычных военных самолетов были переоборудованы в пробные системы DVI; примеры включают Harrier AV-8B и F-16 VISTA . В другом случае симулятор General Dynamics F-16 Fighting Falcon был модифицирован с помощью DVI для исследования голосового управления, которое было проведено Королевскими ВВС Нидерландов . [5] Испытания DVI также проводились на вертолетах , в том числе на Boeing AH-64 Apache , что показало потенциал повышения безопасности полетов и эффективности миссий. [6] [7]

Многочисленные современные истребители оснащены системами DVI, часто в сочетании с различными другими схемами человеко-машинного интерфейса, такими как элементы управления, соответствующие требованиям HOTAS , и другие передовые технологии управления. Комбинацию схем голосового управления и управления HOTAS иногда называют концепцией «V-TAS». Известным истребителем, который будет оснащен кабиной V-TAS, является Eurofighter Typhoon . [8] Lockheed Martin F-35 Lightning II также оснащен системой DVI, разработанной Adacel . [9] Другие примеры включают Dassault Rafale и Saab JAS 39 Gripen . [5]

Планируется, что множество самолетов будут использовать DVI. На каком-то этапе ВВС США стремились интегрировать DVI в Lockheed Martin F-22 Raptor ; однако в конечном итоге было признано, что эта технология представляет слишком много технических рисков на тот момент, и поэтому от таких усилий отказались. [10]

Персональный

К 1990 году уже демонстрировались рабочие прототипы систем распознавания речи ; они продвигались с целью обеспечения эффективного человеко-машинного интерфейса для людей с нарушениями речи . [11] Используемые методы включали цифровую речь с временным кодированием и автоматический выбор набора токенов . Сообщается, что исследования этих первых систем DVI включали использование автоматических диагностических процедур и ограниченные испытания с участием добровольцев. [11]

В 2010-х годах различные компании предлагали широкой публике системы распознавания голоса в виде персональных цифровых помощников . [2] Одним из примеров является сервис Google Voice , который позволяет пользователям задавать вопросы через пакет DVI, установленный на персональном компьютере , планшете или мобильном телефоне . Были разработаны многочисленные цифровые помощники, такие как Amazon Echo , Siri и Cortana , которые используют DVI для взаимодействия с пользователями. [2]

Коммерческий

Технология DVI позволила широко использовать автоматизированные телефонные системы. Многие компании обычно используют централизованные телефонные системы, которые таким образом направляют звонящих в нужный отдел. [2] Различные производители автомобилей также оснастили свои автомобили системами DVI; они обычно позволяют водителям управлять информационно-развлекательными системами и взаимодействовать с мобильными телефонами с большим удобством, чем устаревшие методы. [2]

В конце 1980-х годов проводились исследования использования систем DVI для управления станками с ЧПУ и другим производственным оборудованием. [12] В 2010-х годах такие системы использовались для целей логистики и управления складами. [13]

Рекомендации

  1. ^ Джарретт, DN (2005), Проектирование кабины. Олдершот, ISBN Ashgate Publishing Limited  978-0-7546-1751-8 .
  2. ^ abcde «Распознавание голоса». www.computerhope.com. 16 мая 2020 г.
  3. ^ Зон, ГДР и Рёрдинк, Мичиган, (2007), Использование голоса для управления гражданской кабиной экипажа , Отчет NLR-TP-2006-720 (Этот отчет основан на презентации, проведенной в HCI Aero, Сиэтл, США, 20–20). 22 сентября 2006 г.).[1] Архивировано 4 марта 2016 г. в Wayback Machine.
  4. ^ Стин, Вебер; Йетте, Лундтанг Полсен (8–10 мая 2006 г.). «Семинар по будущим конструкциям станций управления и проблемам работоспособности человека на атомных электростанциях». Международное агентство по атомной энергии (МАГАТЭ). стр. 296–320.
  5. ^ Аб Гиббон, Д., Мертинс, И. и Мур, Р.К. (2000) «Справочник по ресурсам, терминологии и оценке продуктов систем мультимодального и разговорного диалога» (Международная серия Springer по инженерным и компьютерным наукам, том 565), Массачусетс , ISBN Kluwer Academic Publishers 978-0-7923-7904-1 
  6. ^ Хантер, Дональд Джеймс (декабрь 2003 г.). «Определение задач летного экипажа по использованию прямого голосового ввода (DVI) для снижения рабочей нагрузки пилота в AH-64D Apache Longbow». Магистерские диссертации . Trace.tennessee.edu.
  7. ^ Хердман, Крис; Йоханнсдоттир, Камилла; Лессард, Линда; Ярмаш, Ежи; Черчилль, Лаура; Фаррелл, Филип (январь 2001 г.). «Внимание, преимущества и затраты, связанные с интеграцией системы прямого голосового ввода (DVI) в среду вертолета с несколькими экипажами».
  8. ^ Оуэн, Пол С. «Кабина еврофайтера». Eurofighter-typhoon.co.uk, 7 декабря 1997 г. Дата обращения: 28 ноября 2009 г. Архивировано 28 августа 2008 г. на Wayback Machine.
  9. Шютте, Джон (10 октября 2007 г.). «Исследователи настраивают речевую систему пилота самолета F-35». аф.мил . ВВС США. Архивировано из оригинала 23 апреля 2016 года.
  10. ^ Гебель, Грег. «Локхид Мартин F-22 Раптор». airvectors.net, 1 июля 2011 г. Дата обращения: 10 ноября 2012 г.
  11. ^ ab AG Warner; Р. Д. Хьюз; Р. А. Кинг (1990). «Стратегия человеко-машинного интерфейса прямого голосового ввода, обеспечивающая голосовой доступ для говорящих с серьезными нарушениями функций». Конференция Великобритании по информационным технологиям 1990 года. стр. 279–285.
  12. ^ JY Чжу; КГ Сюй (7 января 1988 г.). «Исследование системы голосового ввода для станков с ЧПУ». Сирп Анналы . Нанкинский институт аэронавтики. 37 : 477–480. дои : 10.1016/S0007-8506(07)61681-3.
  13. ^ «Приложения с голосовым управлением». lucasware.com . Проверено 9 августа 2020 г.

Внешние ссылки