Виртуальный помощник

Виртуальный помощник ( VA ) — это программный агент , который может выполнять ряд задач или услуг для пользователя на основе ввода данных пользователем, например, команд или вопросов, включая вербальные. Такие технологии часто включают возможности чат-бота для имитации человеческого разговора, например, через онлайн-чат , чтобы облегчить взаимодействие с пользователями. Взаимодействие может осуществляться через текст, графический интерфейс или голос — некоторые виртуальные помощники способны интерпретировать человеческую речь и отвечать с помощью синтезированных голосов.

Во многих случаях пользователи могут задавать вопросы своим виртуальным помощникам, управлять устройствами домашней автоматизации и воспроизведением мультимедиа, а также управлять другими базовыми задачами, такими как электронная почта, списки дел и календари — все это с помощью голосовых команд. ^[1] В последние годы к известным виртуальным помощникам для непосредственного использования потребителями относятся Siri от Apple , Amazon Alexa , Google Assistant и Bixby от Samsung . ^[2] Кроме того, компании в различных отраслях часто включают в себя какую-либо технологию виртуального помощника в свою службу поддержки клиентов. ^[3]

В последнее время появление чат-ботов на основе искусственного интеллекта , таких как ChatGPT , увеличило возможности и интерес к сфере продуктов и услуг виртуальных помощников. ^[4]^[5]^[6]

История

Экспериментальные десятилетия: 1910–1980-е гг.

Радио Рекс было первой игрушкой, активируемой голосом, запатентованной в 1916 году ^[7] и выпущенной в 1922 году ^[8] . Это была деревянная игрушка в форме собаки, которая выходила из своего домика, когда ее звали по имени.

В 1952 году Bell Labs представила «Одри», машину автоматического распознавания цифр. Она занимала релейную стойку высотой в шесть футов, потребляла значительную мощность, имела потоки кабелей и демонстрировала множество проблем обслуживания, связанных со сложной схемой на электронных лампах. Она могла распознавать основные единицы речи, фонемы. Она была ограничена точным распознаванием цифр, произносимых назначенными дикторами. Поэтому ее можно было использовать для голосового набора, но в большинстве случаев набор с помощью кнопок был дешевле и быстрее, чем набор последовательных цифр. ^[9]

Еще одним ранним инструментом, способным выполнять цифровое распознавание речи, был голосовой калькулятор IBM Shoebox , представленный широкой публике на Всемирной выставке в Сиэтле 1962 года после его первоначального запуска на рынок в 1961 году. Этот ранний компьютер, разработанный почти за 20 лет до появления первого персонального компьютера IBM в 1981 году, мог распознавать 16 произнесенных слов и цифры от 0 до 9.

Первая компьютерная программа обработки естественного языка или чатбот ELIZA была разработана профессором Массачусетского технологического института Джозефом Вайценбаумом в 1960-х годах. Она была создана, чтобы «продемонстрировать, что общение между человеком и машиной было поверхностным». ^[10] ELIZA использовала методологию сопоставления шаблонов и подстановки в заскриптованные ответы для имитации разговора, что создавало иллюзию понимания со стороны программы.

Как сообщается, секретарь Вейценбаума попросил Вейценбаума выйти из комнаты, чтобы она и ЭЛИЗА могли по-настоящему поговорить. Вейценбаум был удивлен этим, позже написав: «Я не осознавал... что чрезвычайно короткие воздействия относительно простой компьютерной программы могут вызывать мощное бредовое мышление у вполне нормальных людей. ^[11]

Это дало название эффекту ELIZA — тенденции бессознательно предполагать, что поведение компьютера аналогично поведению человека; то есть антропоморфизации — явлению, присутствующему при взаимодействии человека с виртуальными помощниками.

Следующая веха в развитии технологии распознавания голоса была достигнута в 1970-х годах в Университете Карнеги-Меллона в Питтсбурге , штат Пенсильвания, при существенной поддержке Министерства обороны США и его агентства DARPA , профинансировавшего пять лет программы исследований понимания речи, направленной на достижение минимального словарного запаса в 1000 слов. В программе приняли участие компании и академические круги, включая IBM, Университет Карнеги-Меллона (CMU) и Стэнфордский исследовательский институт.

Результатом стала «Гарпия», она освоила около 1000 слов, словарный запас трехлетнего ребенка, и могла понимать предложения. Она могла обрабатывать речь, которая следовала запрограммированному словарному запасу, произношению и грамматическим структурам, чтобы определить, какие последовательности слов имеют смысл вместе, и таким образом уменьшать ошибки распознавания речи.

В 1986 году Tangora была усовершенствованной версией Shoebox, это была пишущая машинка с голосовым распознаванием. Названная в честь самой быстрой машинистки в мире того времени, она имела словарный запас в 20 000 слов и использовала прогнозирование для определения наиболее вероятного результата на основе того, что было сказано в прошлом. Подход IBM был основан на скрытой модели Маркова , которая добавляет статистику к цифровым методам обработки сигналов. Метод позволяет предсказать наиболее вероятные фонемы, которые последуют за заданной фонемой. Тем не менее, каждому говорящему приходилось индивидуально обучать машинку распознавать его или ее голос и делать паузу между каждым словом.

В 1983 году Гас Сирси изобрел «Дворецкий в коробке» — электронную систему голосового управления домом. ^[12]

Рождение умных виртуальных помощников: 1990-е–2010-е гг.

В 1990-х годах технология цифрового распознавания речи стала особенностью персонального компьютера, за клиентов боролись IBM , Philips и Lernout & Hauspie . Гораздо позже выход на рынок первого смартфона IBM Simon в 1994 году заложил основу для интеллектуальных виртуальных помощников, какими мы их знаем сегодня. ^{[ необходима цитата ]}

В 1997 году программное обеспечение Naturally Speaking компании Dragon могло распознавать и транскрибировать естественную человеческую речь без пауз между словами в документ со скоростью 100 слов в минуту. Версия Naturally Speaking все еще доступна для загрузки и используется сегодня, например, многими врачами в США и Великобритании для документирования своих медицинских записей. ^{[ необходима цитата ]}

В 2001 году Colloquis публично запустил SmarterChild на таких платформах, как AIM и MSN Messenger . Будучи полностью текстовым, SmarterChild мог играть в игры, проверять погоду, искать факты и общаться с пользователями в некоторой степени. ^[13]

Первым современным цифровым виртуальным помощником, установленным на смартфоне, был Siri , который был представлен как функция iPhone 4S 4 октября 2011 года. ^[14] Apple Inc. разработала Siri после приобретения в 2010 году Siri Inc. , ответвления SRI International , который является научно-исследовательским институтом, финансируемым DARPA и Министерством обороны США . ^[15] Его целью было оказание помощи в таких задачах, как отправка текстовых сообщений, совершение телефонных звонков, проверка погоды или установка будильника. Со временем он развился до предоставления рекомендаций ресторанов, поиска в Интернете и указания маршрутов проезда. ^{[ необходима цитата ]}

В ноябре 2014 года Amazon анонсировала Alexa вместе с Echo. ^[16]

В апреле 2017 года Amazon выпустила сервис для создания разговорных интерфейсов для любого типа виртуального помощника или интерфейса.

Искусственный интеллект и языковые модели: 2020-е годы — настоящее время

В 2020-х годах системы искусственного интеллекта (ИИ), такие как ChatGPT, приобрели популярность благодаря своей способности генерировать ответы, подобные человеческим, на текстовые разговоры. В феврале 2020 года Microsoft представила свою модель Turing Natural Language Generation (T-NLG), которая тогда была «крупнейшей языковой моделью, когда-либо опубликованной с 17 миллиардами параметров». ^[17] 30 ноября 2022 года ChatGPT был запущен в качестве прототипа и быстро привлек внимание своими подробными ответами и четкими ответами во многих областях знаний. Появление ChatGPT и его представление широкой публике повысили интерес и конкуренцию в этой области. В феврале 2023 года Google начала внедрять экспериментальную службу под названием «Bard», которая основана на ее программе LaMDA для генерации текстовых ответов на заданные вопросы на основе информации, собранной из Интернета .

Хотя ChatGPT и другие обобщенные чат-боты, основанные на новейшем генеративном ИИ, способны выполнять различные задачи, связанные с виртуальными помощниками, существуют также более специализированные формы такой технологии, которые предназначены для решения более конкретных ситуаций или удовлетворения более конкретных потребностей. ^[18]^[4]

Метод взаимодействия

Виртуальные помощники работают через:

Текст, включая: онлайн-чат (особенно в приложении для обмена мгновенными сообщениями или другом приложении), текстовые сообщения SMS , электронная почта или другой текстовый канал связи, например, интеллектуальные виртуальные помощники Conversica для бизнеса. [ ^19]
Голос: например, с помощью Amazon Alexa ^[20] на устройствах Amazon Echo , Siri на iPhone , Google Assistant на устройствах Android с поддержкой Google или Bixby на устройствах Samsung.
Изображения: некоторые помощники, такие как Google Assistant (включая Google Lens ) и Bixby на устройствах серии Samsung Galaxy , обладают дополнительной возможностью выполнять обработку изображений для распознавания объектов на изображениях.

Многие виртуальные помощники доступны несколькими способами, что обеспечивает гибкость взаимодействия пользователей с ними: через чат, голосовые команды или другие интегрированные технологии.

Виртуальные помощники используют обработку естественного языка (NLP) для сопоставления текста или голосового ввода пользователя с исполняемыми командами. Некоторые из них постоянно обучаются с использованием методов искусственного интеллекта, включая машинное обучение и окружающий интеллект .

Чтобы активировать виртуального помощника с помощью голоса, можно использовать слово пробуждения. Это слово или группы слов, например «Привет, Siri», «OK Google» или «Привет, Google», «Alexa» и «Привет, Microsoft». ^[21] Поскольку виртуальные помощники становятся все более популярными, возрастают и связанные с этим юридические риски. ^[22]^{: 815}

Устройства и предметы

Виртуальные помощники могут быть интегрированы во многие типы платформ или, как Amazon Alexa, в несколько из них:

В такие устройства, как умные колонки, такие как Amazon Echo, Google Home и Apple HomePod
В приложениях для обмена мгновенными сообщениями как на смартфонах, так и через Интернет, например, M (виртуальный помощник) в приложениях Facebook и Facebook Messenger или через Интернет
Встроен в мобильную операционную систему (ОС), как Siri от Apple на устройствах iOS и BlackBerry Assistant на устройствах BlackBerry 10 , или в настольную ОС, например Cortana в ОС Microsoft Windows .
Встроенный в смартфон независимо от ОС, как Bixby в Samsung Galaxy S8 и Note 8. [ ^23]
В платформах обмена мгновенными сообщениями — помощники из определенных организаций, такие как Aerobot компании Aeromexico в Facebook Messenger или секретарь WeChat .
В мобильных приложениях определенных компаний и других организаций, таких как Dom из Domino's Pizza ^[24]
В бытовой технике, ^[25] автомобилях, ^[26] и носимых устройствах . ^[27]
Предыдущие поколения виртуальных помощников часто работали на веб-сайтах, таких как Ask Jenn авиакомпании Alaska Airlines ^[28] или в системах интерактивного голосового ответа (IVR), таких как IVR компании Nuance компании American Airlines ^[29] .

Услуги

Виртуальные помощники могут предоставлять широкий спектр услуг. Они включают в себя: ^[30]

Предоставлять информацию, такую как погода, факты из, например, Википедии или IMDb , устанавливать будильник, составлять списки дел и покупок
Слушайте музыку из потоковых сервисов, таких как Spotify и Pandora ; слушайте радиостанции; читайте аудиокниги
Воспроизводите видео, телепередачи или фильмы на телевизорах, например, с Netflix
Разговорная коммерция (см. ниже)
Содействовать взаимодействию общественности с правительством (см. Искусственный интеллект в правительстве )
Дополнять и/или заменять специалистов по обслуживанию клиентов ^[31] в таких областях, как здравоохранение, продажи и банковское дело. В одном отчете подсчитано, что автоматизированный онлайн-помощник снизил рабочую нагрузку на колл-центр, обслуживаемый человеком, на 30% . ^[32]
Повысьте качество вождения, включив взаимодействие с виртуальными помощниками, такими как Siri и Alexa, прямо в автомобиле.

Разговорная коммерция

Разговорная коммерция — это электронная коммерция с использованием различных средств обмена сообщениями, в том числе с помощью голосовых помощников ^[33] , а также чатов на веб-сайтах электронной коммерции , чатов в приложениях для обмена сообщениями, таких как WeChat , Facebook Messenger и WhatsApp ^[34] , а также чат-ботов в приложениях для обмена сообщениями или на веб-сайтах.

Поддержка клиентов

Виртуальный помощник может работать с командой поддержки клиентов компании, чтобы оказывать поддержку клиентам 24x7 . Он обеспечивает быстрые ответы, что улучшает опыт клиентов.

Сторонние услуги

Amazon поддерживает Alexa «Skills» и Google «Actions», по сути, приложения, работающие на платформах помощников.

Конфиденциальность

Виртуальные помощники имеют ряд проблем с конфиденциальностью, связанных с ними. Такие функции, как активация голосом, представляют угрозу, поскольку такие функции требуют, чтобы устройство всегда было в режиме прослушивания. ^[35] Режимы конфиденциальности, такие как виртуальная кнопка безопасности, были предложены для создания многоуровневой аутентификации для виртуальных помощников. ^[36]

Google Ассистент

Политика конфиденциальности Google Assistant гласит, что он не хранит аудиоданные без разрешения пользователя, но может хранить стенограммы разговоров для персонализации своего опыта. Персонализацию можно отключить в настройках. Если пользователь хочет, чтобы Google Assistant хранил аудиоданные, он может перейти в раздел Voice & Audio Activity (VAA) и включить эту функцию. Аудиофайлы отправляются в облако и используются Google для улучшения производительности Google Assistant, но только если функция VAA включена. ^[37]

Амазон Алекса

Политика конфиденциальности виртуального помощника Amazon, Alexa, гласит, что он слушает разговоры только при использовании его слова пробуждения (например, Alexa, Amazon, Echo). Он начинает записывать разговор после вызова слова пробуждения и останавливает запись после 8 секунд тишины. Он отправляет записанный разговор в облако. Запись из облака можно удалить, посетив «Alexa Privacy» в «Alexa». ^[38]

Siri от Apple

Apple заявляет, что не записывает аудио для улучшения Siri. Вместо этого она утверждает, что использует расшифровки. Данные расшифровки отправляются только в том случае, если они считаются важными для анализа. Пользователи могут отказаться в любое время, если они не хотят, чтобы Siri отправляла расшифровки в облако. ^[39]

Кортана

Cortana — это голосовой виртуальный помощник с единственной аутентификацией ^[40]^[41]^[42] . Это голосовое устройство получает доступ к данным пользователя для выполнения обычных задач, таких как проверка погоды или совершение звонков, что вызывает опасения по поводу конфиденциальности из-за отсутствия вторичной аутентификации. ^[43]^[44]

Потребительский интерес

Предполагаемая добавленная ценность, позволяющая новый способ взаимодействия

Дополнительная ценность виртуальных помощников может заключаться, в частности, в следующем:

Голосовая связь иногда может представлять собой оптимальную коммуникацию между человеком и машиной :

Это удобно: в некоторых сферах голос является единственным возможным способом общения, а в более общем плане это позволяет освободить руки и зрение для параллельного выполнения другой деятельности или даже помогает людям с ограниченными возможностями.
Это быстрее: Голос более эффективен, чем письмо на клавиатуре: мы можем говорить до 200 слов в минуту против 60 в случае письма на клавиатуре. Это также более естественно, поэтому требует меньше усилий (чтение текста, однако, может достигать 700 слов в минуту). ^[45]

Виртуальные помощники экономят много времени за счет автоматизации: они могут принимать встречи или читать новости, пока потребитель занимается чем-то другим. Также можно попросить виртуального помощника запланировать встречи, тем самым помогая организовать время. Разработчики новых цифровых планировщиков объяснили свои амбиции тем, что эти календари планируют жизнь, чтобы потребитель использовал свое время более эффективно, с помощью процессов машинного обучения и полной организации рабочего и свободного времени. Например, когда потребитель выражает желание запланировать перерыв, VA запланирует его на оптимальный момент для этой цели (например, в то время недели, когда он менее продуктивен), с дополнительной долгосрочной целью иметь возможность запланировать и организовать свободное время потребителя, чтобы обеспечить ему оптимальную эффективность работы. ^[46]

Воспринимаемый интерес

Согласно недавнему исследованию (2019), две причины использования виртуальных помощников для потребителей — это воспринимаемая полезность и воспринимаемое удовольствие. Первый результат этого исследования заключается в том, что как воспринимаемая полезность, так и воспринимаемое удовольствие имеют эквивалентное очень сильное влияние на готовность потребителя использовать виртуального помощника.
Вторым результатом данного исследования является то, что:

Качество контента оказывает очень сильное влияние на воспринимаемую полезность и сильное влияние на воспринимаемое удовольствие.
Визуальная привлекательность оказывает очень сильное влияние на воспринимаемое удовольствие.
Автоматизация оказывает сильное влияние на воспринимаемую полезность. ^[47]

Споры

Споры об искусственном интеллекте

Виртуальные помощники подстегивают пузырь фильтров : Что касается социальных сетей , алгоритмы виртуальных помощников обучены показывать соответствующие данные и отбрасывать другие на основе предыдущих действий потребителя: соответствующие данные — это те, которые заинтересуют или понравятся потребителю. В результате они изолируются от данных, которые не соответствуют их точке зрения, эффективно изолируя их в их собственном интеллектуальном пузыре и подкрепляя их мнения. Известно, что это явление усиливает фейковые новости и эхо-камеры. ^[48]
Виртуальных помощников также иногда критикуют за переоценку. В частности, А. Касилли указывает, что ИИ виртуальных помощников не является ни интеллектуальным, ни искусственным по двум причинам:

Не разумны, потому что все, что они делают, это являются помощниками человека, и только выполняя задачи, которые человек мог бы выполнить легко, и в очень ограниченном спектре действий: находить, классифицировать и представлять информацию, предложения или документы. Кроме того, виртуальные помощники не способны ни принимать решения самостоятельно, ни предвидеть события.
И не искусственные, потому что они были бы невозможны без человеческой маркировки посредством микрообработки . ^[49]

Этические последствия

В 2019 году французский социолог Антонио А. Касилли подверг критике искусственный интеллект и виртуальных помощников, в частности, следующим образом:

На первом уровне тот факт, что потребитель предоставляет бесплатные данные для обучения и совершенствования виртуального помощника, часто не зная об этом, является этически неприемлемым.

Но на втором уровне, возможно, было бы еще более тревожно с этической точки зрения узнать, как эти ИИ обучаются с использованием этих данных.

Этот искусственный интеллект обучается с помощью нейронных сетей , которым требуется огромное количество маркированных данных. Однако эти данные должны быть маркированы с помощью человеческого процесса, что объясняет рост микроработы за последнее десятилетие. То есть, удаленное использование некоторых людей по всему миру для выполнения некоторых повторяющихся и очень простых задач за несколько центов, таких как прослушивание речевых данных виртуального помощника и запись того, что было сказано. Микроработа подвергалась критике за неуверенность в работе, которую она вызывает, и за полное отсутствие регулирования: средняя зарплата составляла 1,38 доллара в час в 2010 году ^[50] , и она не обеспечивает ни медицинского обслуживания, ни пенсионных пособий, ни больничных , ни минимальной заработной платы . Следовательно, виртуальные помощники и их разработчики являются спорными из-за того, что подстегивают неуверенность в работе, и предлагаемые ими ИИ по-прежнему являются человеческими в том смысле, что они были бы невозможны без микроработы миллионов людей. ^[49]

Проблемы конфиденциальности возникают из-за того, что голосовые команды доступны поставщикам виртуальных помощников в незашифрованном виде и, таким образом, могут быть переданы третьим лицам и обработаны несанкционированным или неожиданным образом. ^[51] Помимо лингвистического содержания записанной речи, манера выражения и голосовые характеристики пользователя могут неявно содержать информацию о его или ее биометрической личности, чертах личности, форме тела, состоянии физического и психического здоровья, поле, гендере, настроении и эмоциях, социально-экономическом статусе и географическом происхождении. ^[52]

Платформы разработчиков

Известные платформы для разработчиков виртуальных помощников включают в себя:

Amazon Lex был открыт для разработчиков в апреле 2017 года. Он включает в себя технологию понимания естественного языка в сочетании с автоматическим распознаванием речи и был представлен в ноябре 2016 года. ^[53]
Google предоставляет разработчикам платформы Actions on Google и Dialogflow для создания «Действий» для Google Assistant ^[54]
Apple предоставляет разработчикам SiriKit для создания расширений для Siri
Watson от IBM , хотя его иногда называют виртуальным помощником, на самом деле представляет собой целую платформу искусственного интеллекта и сообщество, на основе которого работают некоторые виртуальные помощники, чат-боты и многие другие типы решений. ^[55]^[56]

Предыдущие поколения

В предыдущих поколениях виртуальных помощников на основе текстового чата помощник часто был представлен аватаром ( он же интерактивный онлайн-персонаж или автоматизированный персонаж ) — это было известно как воплощенный агент .

Экономическая значимость

Для частных лиц

Цифровые впечатления, предоставляемые виртуальными помощниками, считаются одними из основных последних технологических достижений и наиболее многообещающих потребительских тенденций. Эксперты утверждают, что цифровые впечатления достигнут статуса, сопоставимого с «реальными» впечатлениями, если не станут более востребованными и ценимыми. ^[57] Тенденция подтверждается большим количеством постоянных пользователей и существенным ростом числа пользователей виртуальных цифровых помощников во всем мире. В середине 2017 года число постоянных пользователей цифровых виртуальных помощников оценивается примерно в 1 млрд человек во всем мире. ^[58] Кроме того, можно заметить, что технология виртуальных цифровых помощников больше не ограничивается приложениями для смартфонов, а присутствует во многих секторах промышленности (включая автомобилестроение , телекоммуникации, розничную торговлю , здравоохранение и образование). ^[59] В ответ на значительные расходы на НИОКР фирм во всех секторах и растущее внедрение мобильных устройств, рынок технологий распознавания речи, как ожидается, будет расти со среднегодовым темпом роста 34,9% в глобальном масштабе в период с 2016 по 2024 год и, таким образом, превзойдет размер мирового рынка в 7,5 млрд долларов США к 2024 году. ^[59] Согласно исследованию Ovum , «база установленных собственных цифровых помощников», как ожидается, превысит население мира к 2021 году, с 7,5 млрд активных голосовых устройств с поддержкой ИИ. ^[60] По данным Ovum, к тому времени «Google Assistant будет доминировать на рынке голосовых устройств с поддержкой ИИ с долей рынка 23,3%, за ним следуют Bixby от Samsung (14,5%), Siri от Apple (13,1%), Alexa от Amazon (3,9%) и Cortana от Microsoft (2,3%)». ^[60]

Принимая во внимание региональное распределение лидеров рынка, ожидается , что североамериканские компании (например, Nuance Communications , IBM , eGain ) будут доминировать в отрасли в течение следующих лет из-за значительного влияния BYOD ( Bring Your Own Device ) и бизнес-моделей корпоративной мобильности. Кроме того, ожидается, что растущий спрос на платформы с поддержкой смартфонов еще больше подстегнет рост североамериканской индустрии интеллектуальных виртуальных помощников (IVA). Несмотря на меньший размер по сравнению с североамериканским рынком, индустрия интеллектуальных виртуальных помощников из Азиатско -Тихоокеанского региона, основные игроки которой находятся в Индии и Китае, по прогнозам, будет расти с годовым темпом роста 40% (выше среднего мирового показателя) в период 2016–2024 годов. ^[59]

Экономические возможности для предприятий

Виртуальные помощники не должны рассматриваться только как гаджет для отдельных лиц, поскольку они могут иметь реальную экономическую полезность для предприятий. Например, виртуальный помощник может взять на себя роль всегда доступного помощника с энциклопедическими знаниями. И который может организовывать встречи, проверять инвентарь, проверять информацию. Виртуальные помощники тем более важны, что их интеграция в малые и средние предприятия часто заключается в простом первом шаге через более глобальную адаптацию и использование Интернета вещей (IoT) . Действительно, технологии IoT сначала воспринимаются малыми и средними предприятиями как технологии критически важного значения, но слишком сложные, рискованные или дорогостоящие для использования. ^[61]

Безопасность

В мае 2018 года исследователи из Калифорнийского университета в Беркли опубликовали статью, в которой было показано, что звуковые команды, не распознаваемые человеческим ухом, могут быть напрямую встроены в музыку или устный текст, тем самым заставляя виртуальных помощников выполнять определенные действия без того, чтобы пользователь их замечал. ^[62] Исследователи внесли небольшие изменения в аудиофайлы, которые отменили звуковые шаблоны, которые должны обнаруживать системы распознавания речи. Они были заменены звуками, которые система интерпретировала бы по-другому и давала бы ей команду набирать телефонные номера, открывать веб-сайты или даже переводить деньги. ^[62] Возможность этого известна с 2016 года ^[62] и затрагивает устройства от Apple, Amazon и Google. ^[63]

Помимо непреднамеренных действий и записи голоса, еще одним риском безопасности и конфиденциальности, связанным с интеллектуальными виртуальными помощниками, являются вредоносные голосовые команды: злоумышленник, который выдает себя за пользователя и отдает вредоносные голосовые команды, например, чтобы разблокировать умную дверь, чтобы получить несанкционированный доступ в дом или гараж или заказать товары онлайн без ведома пользователя. Хотя некоторые IVA предоставляют функцию обучения голосу для предотвращения такого подражания, системе может быть сложно различать похожие голоса. Таким образом, злоумышленник, который может получить доступ к устройству с поддержкой IVA, может обмануть систему, заставив ее думать, что он является настоящим владельцем, и совершить преступные или вредительские действия. ^[64]

Сравнение известных помощников

Смотрите также

Ссылки

^ Хой, Мэтью Б. (2018). «Alexa, Siri, Cortana и многое другое: Введение в голосовые помощники». Medical Reference Services Quarterly . 37 (1): 81–88. doi :10.1080/02763869.2018.1404391. PMID 29327988. S2CID 30809087.
^ «Siri против Alexa против Google Assistant против Bixby: кто из них правит?». Android Authority . 29 января 2024 г.
^ «Магия виртуальных помощников и их влияние на обслуживание клиентов».
^ ab «Единственная вещь, для которой вам определенно следует использовать чат-бота на основе искусственного интеллекта». 7 апреля 2023 г.
^ «ИИ означает, что у каждого будет личный помощник-«белый воротничок», говорит Билл Гейтс».
^ "Chat GPT: Что это?". uca.edu . Получено 8 февраля 2024 г. .
↑ US 1209636, Кристиан Бергер, «Звукоуправляемый контроллер цепей», выдан 1916-12-19, назначен на компанию Submarine Wireless Company
^ Марковиц, Джудит. «Игрушки, у которых есть голос». SpeechTechMag .
^ Москвич, Катя. «Машины, которые научились слушать». BBC . Получено 5 мая 2020 г.
^ Эпштейн, Дж.; Клинкенберг, В. Д. (1 мая 2001 г.). «От Элизы до Интернета: краткая история компьютеризированной оценки». Компьютеры в поведении человека . 17 (3): 295–314. doi :10.1016/S0747-5632(01)00004-8. ISSN 0747-5632.
^ Вайценбаум, Джозеф (1976). Мощность компьютеров и человеческий разум: от суждения к расчету. Библиотека Оливера Уэнделла Холмса, Академия Филлипса. Сан-Франциско: WH Freeman.
^ «Искусственный интеллект за 15 000 долларов из 1983 года». YouTube . 6 марта 2024 г.
^ "Смартфон: ваш новый персональный помощник – Orange Pop". 10 июля 2017 г. Архивировано из оригинала 10 июля 2017 г. Получено 5 мая 2020 г.
↑ Мерф, Даррен (4 октября 2011 г.). «Практическое знакомство с iPhone 4S!». Engadget.com . Проверено 10 декабря 2017 г.
^ «Особенность: Von IBM Shoebox bis Siri: 50 Jahre Spracherkennung – WELT» [От IBM Shoebox до Siri: 50 лет распознавания речи]. Die Welt (на немецком языке). Welt.de. 20 апреля 2012 года . Проверено 10 декабря 2017 г.
^ Кунду, Кишалая (2023). «Amazon расширяет линейку Echo новыми умными колонками, наушниками и многим другим». XDA . Получено 26 мая 2023 г.
^ Стерлинг, Брюс (13 февраля 2020 г.). «Web Semantics: Microsoft Project Turing представляет Turing Natural Language Generation (T-NLG)». Wired . ISSN 1059-1028 . Получено 31 июля 2020 г. .
^ «GPT-4 покоряет мир — Список компаний, интегрировавших чат-бот». 21 марта 2023 г.
^ «Conversica привлекает $31 млн в рамках финансирования серии C для расширения диалогового ИИ для бизнеса». Bloomberg.com . 30 октября 2018 г. Получено 23 октября 2020 г.
^ Эррера, Себастьян (26 сентября 2019 г.). «Amazon расширяет присутствие Alexa в носимых устройствах». The Wall Street Journal . Получено 26 сентября 2019 г.
^ "S7617 – Разработка собственного движка Wake Word, похожего на 'Alexa' и 'OK Google'". Конференция по технологиям GPU . Получено 17 июля 2017 г.
^ Ван Лу, Рори (1 марта 2019 г.). «Совершенство цифрового рынка». Michigan Law Review . 117 (5): 815. doi : 10.36644/mlr.117.5.digital . S2CID 86402702.
^ La, Lynn (27 февраля 2017 г.). «Все, что может сделать Google Assistant на Pixel». CNET . Получено 10 декабря 2017 г. .
^ Моррисон, Морин (5 октября 2014 г.). «Domino's Pitches Voice-Ordering App in Fast-Food First | CMO Strategy». AdAge . Получено 10 декабря 2017 г.
^ О'Ши, Дэн (4 января 2017 г.). «LG представляет умный холодильник с возможностью заказа продуктов питания с помощью Amazon Alexa». Retail Dive . Получено 10 декабря 2017 г.
^ Гиббс, Сэмюэл (7 февраля 2017 г.). «Amazon’s Alexa сбегает от Echo и садится в автомобили | Технологии». The Guardian . Получено 10 декабря 2017 г. .
^ «Что такое Google Assistant, как он работает и на каких устройствах он есть?». Pocket-lint. 6 октября 2017 г. Получено 10 декабря 2017 г.
^ "'Ask Jenn', сайт Alaska Airlines". Alaska Airlines. 2 января 2017 г. Получено 10 декабря 2017 г.
↑ AT&T Tech Channel (26 июня 2013 г.). «American Airlines (US Airways) – Первая авиакомпания США, которая внедрила естественную речь» (видео), Nuance Enterprise на YouTube. Архивировано из оригинала 21 декабря 2021 г. Получено 10 декабря 2017 г. – через YouTube. Название на YouTube: Airline Information System, 1989 – Архивы AT&T – распознавание речи
^ Мартин, Тейлор; Прист, Дэвид (10 сентября 2017 г.). «Полный список команд Alexa на данный момент». CNET . Получено 10 декабря 2017 г. .
^ Kongthon, Alisa; Sangkeettrakarn, Chatchawal; Kongyoung, Sarawoot; Haruechaiyasak, Choochart (1 января 2009 г.). «Внедрение системы онлайн-справки на основе разговорного агента». Труды Международной конференции по управлению новыми цифровыми экосистемами . MEDES '09. Нью-Йорк, штат Нью-Йорк, США: ACM. стр. 69:450–69:451. doi :10.1145/1643823.1643908. ISBN 9781605588292. S2CID 1046438.
^ О'Доннелл, Энтони (3 июня 2010 г.). "Новый "виртуальный онлайн-помощник" компании Aetna". Страхование и технологии. Архивировано из оригинала 7 июня 2010 г.
^ «Как подготовить свои продукты и бренд к диалоговой коммерции». 6 марта 2018 г.
^ Тейлор, Гленн (5 марта 2018 г.). «Большие возможности розничной торговли: 87% потребителей в США осознают силу разговорной коммерции – точки соприкосновения в розничной торговле».
^ Чжан, Гомин; Янь, Чэнь; Цзи, Сяоюй; Чжан, Тяньчэнь; Чжан, Тайминь; Сюй, Вэньюань (2017). «DolphinAttack». Труды конференции ACM SIGSAC 2017 года по компьютерной и коммуникационной безопасности — CCS '17 . С. 103–117. arXiv : 1708.09537 . doi : 10.1145/3133956.3134052. ISBN 9781450349468. S2CID 2419970.
^ Лей, Синьюй; Ту, Гуань-Хуа; Лю, Алекс С.; Ли, Чи-Ю; Сье, Тянь (2017). «Небезопасность домашних цифровых голосовых помощников – Amazon Alexa как пример». arXiv : 1712.03327 [cs.CR].
^ «Больше заботы о защите вашей конфиденциальности с помощью Assistant». Google . 23 сентября 2019 г. . Получено 27 февраля 2020 г. .
^ «Alexa, Echo Devices и ваша конфиденциальность». Amazon.com . Получено 27 февраля 2020 г.
^ «Улучшение защиты конфиденциальности Siri». Apple Newsroom . Получено 27 февраля 2020 г.
^ Сопер, Марк Эдвард (20 августа 2015 г.). Easy Windows 10. Addison-Wesley. ISBN 978-0-13-407753-6.
^ Лопес, Густаво; Кесада, Луис; Герреро, Луис А. (2018). Нунес, Изабель Л. (ред.). «Alexa против Siri против Cortana против Google Assistant: сравнение естественных пользовательских интерфейсов на основе речи». Достижения в области человеческого фактора и системного взаимодействия . Cham: Springer International Publishing: 241–250. doi :10.1007/978-3-319-60366-7_23. ISBN 978-3-319-60366-7.
^ «Обслуживание клиентов с помощью чат-бота на основе искусственного интеллекта». lucidgen.com . 25 апреля 2023 г. Получено 14 октября 2024 г.
^ "Окончание поддержки Cortana - Служба поддержки Microsoft". support.microsoft.com . Получено 14 октября 2024 г. .
^ Форрест, Коннер (4 августа 2015 г.). «Windows 10 по умолчанию нарушает вашу конфиденциальность, вот как вы можете защитить себя». TechRepublic . Получено 14 октября 2024 г. .
^ Минкер, В.; Нил, Ф. (2002). «Развитие вокальных технологий». Le Travail Human . 65 (3): 261. дои : 10.3917/th.653.0261 . ISSN 0041-1868.
^ Вайцман, Джуди (2019). «Цифровая архитектура управления временем» (PDF) . Наука, технологии и человеческие ценности . 44 (2): 315–337. doi :10.1177/0162243918795041. S2CID 149648777.
^ Yang, Heetae; Lee, Hwansoo (26 июня 2018 г.). «Понимание поведения пользователя виртуальных персональных помощников». Информационные системы и управление электронным бизнесом . 17 (1): 65–87. doi :10.1007/s10257-018-0375-1. ISSN 1617-9846. S2CID 56838915.
^ Тиссерон, Серж (2019). «Семейная семья». Школа родителей . № 632 (3): 16–18. дои : 10.3917/epar.632.0016. ISSN 0424-2238. S2CID 199344092. {{cite journal}}: |volume=есть дополнительный текст ( помощь )
^ Аб Касилли, Антонио А. (2019). Сопровождающий роботов. Enquête sur le travail du clic . Издания Seuil. ISBN 978-2-02-140188-2. OCLC 1083583353.
^ Хортон, Джон Джозеф; Чилтон, Лидия Б. (2010). «Трудовая экономика платного краудсорсинга». Труды 11-й конференции ACM по электронной коммерции . EC '10. Нью-Йорк, Нью-Йорк, США: ACM Press. С. 209–218. arXiv : 1001.0627 . doi :10.1145/1807342.1807376. ISBN 978-1-60558-822-3. S2CID 18237602.
^ «Apple, Google и Amazon, возможно, нарушили вашу конфиденциальность, просмотрев команды цифрового помощника». Fortune . 5 августа 2019 г. Получено 13 мая 2020 г.
^ Крёгер, Якоб Леон; Лутц, Отто Ханс-Мартин; Рашке, Филипп (2020). «Последствия анализа голоса и речи для конфиденциальности – раскрытие информации путем вывода». Управление конфиденциальностью и идентификацией. Данные для лучшей жизни: ИИ и конфиденциальность . Достижения IFIP в области информационных и коммуникационных технологий. Том 576. С. 242–258. doi : 10.1007/978-3-030-42504-3_16 . ISBN 978-3-030-42503-6. ISSN 1868-4238.
^ «Amazon Lex, технология, лежащая в основе Alexa, открывается разработчикам». TechCrunch. 20 апреля 2017 г. Получено 10 декабря 2017 г.
^ "Действия в Google | Разработчики Google" . Получено 10 декабря 2017 г. .
^ "Watson – Истории о том, как ИИ и Watson трансформируют бизнес и наш мир". Ibm.com . Получено 10 декабря 2017 г. .
^ Memeti, Suejb; Pllana, Sabri (январь 2018 г.). «PAPA: помощник по параллельному программированию на базе когнитивной вычислительной технологии IBM Watson». Журнал вычислительной науки . 26 : 275–284. doi :10.1016/j.jocs.2018.01.001.
^ "5 потребительских тенденций 2017 года". TrendWatching. 31 октября 2016 г. Получено 10 декабря 2017 г.
^ Рихтер, Феликс (26 августа 2016 г.). «Диаграмма: Цифровые помощники — всегда к вашим услугам». Statista . Получено 10 декабря 2017 г. .
^ abc "Virtual Assistant Industry Statistics". Global Market Insights. 30 января 2017 г. Получено 10 декабря 2017 г.
^ ab "Виртуальные цифровые помощники превзойдут население мира к 2021 году". ovum.informa.com . Получено 11 мая 2018 г. .
^ Джонс, Нори Б.; Грэм, К. Мэтт (февраль 2018 г.). «Может ли Интернет вещей помочь малому бизнесу?». Бюллетень науки, технологий и общества . 38 (1–2): 3–12. doi :10.1177/0270467620902365. ISSN 0270-4676. S2CID 214031256.
^ abc «Alexa и Siri могут услышать эту скрытую команду. Вы не можете». The New York Times . 10 мая 2018 г. ISSN 0362-4331 . Получено 11 мая 2018 г.
^ «Поскольку голосовые помощники становятся мейнстримом, исследователи предупреждают об уязвимостях». CNET . 10 мая 2018 г. . Получено 11 мая 2018 г. .
^ Чунг, Х.; Иорга, М.; Воас, Дж.; Ли, С. (2017). «Алекса, могу ли я тебе доверять?». Компьютер . 50 (9): 100–104. doi :10.1109/MC.2017.3571053. ISSN 0018-9162. PMC 5714311. PMID 29213147 .
^ "Baidu представляет 3 умные колонки с цифровым помощником Duer". 8 января 2018 г.
^ MSV, Джанакирам (20 августа 2015 г.). «Знакомьтесь, Майкрофт — альтернатива Amazon Echo с открытым исходным кодом». Forbes . Получено 27 октября 2016 г.