Siri ( / s iː r i , ˈ s ɪ r i / SEE -ree , SI -ree ) — цифровой помощник, входящий в состав iOS , iPadOS , watchOS , macOS , tvOS , audioOS и VisionOS от Apple Inc. операционные системы . [1] [2] Он использует голосовые запросы, управление с помощью жестов, отслеживание фокуса и пользовательский интерфейс на естественном языке для ответа на вопросы, предоставления рекомендаций и выполнения действий путем делегирования запросов набору интернет- сервисов. При продолжительном использовании он адаптируется к индивидуальному использованию языка, поисковым запросам и предпочтениям пользователей, возвращая индивидуальные результаты.
Siri — это побочный продукт проекта, разработанного Международным центром искусственного интеллекта SRI. Его механизм распознавания речи был предоставлен Nuance Communications , и для работы он использует передовые технологии машинного обучения . Оригинальные американские, британские и австралийские актеры озвучивания записали свои голоса примерно в 2005 году, не подозревая о возможном использовании записей. Siri была выпущена как приложение для iOS в феврале 2010 года. Два месяца спустя Apple приобрела ее и интегрировала в iPhone 4S при его выпуске 4 октября 2011 года, удалив отдельное приложение из iOS App Store . С тех пор Siri стала неотъемлемой частью продуктов Apple и была адаптирована для других аппаратных устройств, включая новые модели iPhone , iPad , iPod Touch , Mac , AirPods , Apple TV и HomePod .
Siri поддерживает широкий спектр пользовательских команд, включая выполнение действий на телефоне, проверку основной информации, планирование событий и напоминаний, обработку настроек устройства, поиск в Интернете, навигацию по областям, поиск информации о развлечениях и возможность взаимодействия с приложениями, интегрированными в iOS. С выпуском iOS 10 в 2016 году Apple открыла ограниченный доступ третьих сторон к Siri, включая сторонние приложения для обмена сообщениями, а также приложения для платежей, совместного использования поездок и интернет-звонков . С выпуском iOS 11 Apple обновила голос Siri и добавила поддержку дополнительных вопросов, языкового перевода и дополнительных сторонних действий.iOS 17 позволила пользователям активировать Siri, просто сказав «Siri», хотя предыдущая команда «Привет, Siri» по-прежнему поддерживается.
Оригинальная версия Siri для iPhone 4S в 2011 году получила неоднозначные отзывы. Он получил похвалу за распознавание голоса и контекстуальное знание пользовательской информации, включая встречи в календаре, но подвергся критике за требование жестких пользовательских команд и отсутствие гибкости. Его также критиковали за отсутствие информации о некоторых близлежащих местах и за неспособность понимать некоторые английские акценты . В 2016 и 2017 годах в ряде сообщений СМИ говорилось, что Siri не хватает инноваций, особенно в сравнении с новыми конкурирующими голосовыми помощниками. В отчетах говорилось об ограниченном наборе функций Siri, «плохом» распознавании голоса и неразвитой интеграции сервисов, которые создают проблемы для Apple в области искусственного интеллекта и облачных сервисов; Основанием для жалоб, как сообщается, является сдерживание развития, вызванное тем, что Apple уделяет приоритетное внимание конфиденциальности пользователей и борьбе за исполнительную власть внутри компании. [3] Его запуск также был омрачен смертью Стива Джобса , которая произошла через день после запуска.
Siri является дочерним предприятием Центра искусственного интеллекта Стэнфордского исследовательского института и ответвлением проекта CALO , финансируемого Агентством перспективных исследовательских проектов Министерства обороны США (DARPA) . [4] SRI International использовала NABC Framework, чтобы определить ценностное предложение Siri. [5] Его основателями выступили Даг Киттлаус, Том Грубер и выпускник Калифорнийского университета в Лос-Анджелесе Адам Чейер . [4] Киттлаус назвал Siri в честь коллеги из Норвегии ; Имя представляет собой краткую форму имени Сигрид , от древнескандинавского Sigríðr , состоящего из элементов sigr «победа» и fríðr «красивый». [6]
Механизм распознавания речи Siri был предоставлен компанией Nuance Communications , занимающейся речевыми технологиями. [7] Ни Apple, ни Nuance не признавали этого в течение многих лет, [8] [9] пока генеральный директор Nuance Пол Риччи не подтвердил это на технологической конференции 2013 года. [7] Система распознавания речи использует сложные методы машинного обучения , в том числе сверточные нейронные сети и длинную кратковременную память . [10]
Первоначальный прототип Siri был реализован с использованием платформы Active — совместного проекта Центра искусственного интеллекта SRI International и группы Vrai в Федеральной политехнической школе Лозанны . Платформа Active была в центре внимания доктора философии. диссертацию возглавил Дидье Гуццони , который присоединился к Siri в качестве главного ученого. [11]
Siri была приобретена Apple Inc. в апреле 2010 года под руководством Стива Джобса . [12] Первая идея Apple о цифровом личном помощнике появилась в концептуальном видео 1987 года « Навигатор знаний» . [13] [14]
Оригинальный американский голос Siri был записан в июле 2005 года Сьюзен Беннетт , которая не знала, что в конечном итоге он будет использоваться для голосового помощника. [15] [16] В репортаже The Verge в сентябре 2013 года об актерах озвучивания, их работе и разработках в области машинного обучения намекалось, что Эллисон Дафти была голосом за Siri, [17] [18] но это было опровергнуто, когда Дафти написал на ее веб-сайте говорится, что она «абсолютно, определенно не голос Сири». [16] Ссылаясь на растущее давление, Беннетт раскрыла свою роль Сири в октябре, и ее заявление было подтверждено Эдом Примо, американским экспертом по аудиокриминалистике . [16] Apple никогда этого не признавала. [16]
Оригинальный британский мужской голос был предоставлен Джоном Бриггсом , бывшим техническим журналистом, который в течение 12 лет озвучивал популярную викторину BBC «Слабое звено» . [15] Обнаружив, что он озвучивает Сири, смотря телевизор, он впервые заговорил об этой роли в ноябре 2011 года. Он признал, что озвучка была сделана «пять или шесть лет назад», и что он не знал, как будут происходить записи. использоваться. [19] [20]
Оригинальный австралийский голос был предоставлен Карен Джейкобсен , артисткой озвучки, известной в Австралии как девушка GPS . [15] [21]
В интервью всем трем актерам озвучивания с The Guardian Бриггс сказал, что «оригинальная система была записана для американской компании Scansoft, которую затем купила Nuance. Apple просто лицензировала ее». [21]
Для iOS 11 Apple прослушала сотни кандидатов, чтобы найти новые женские голоса, затем записала несколько часов речи, включая разные личности и выражения, чтобы создать новый голос для преобразования текста в речь на основе технологии глубокого обучения . [22] В феврале 2022 года Apple добавила Куинн, свой первый гендерно-нейтральный голос, в качестве пятого пользовательского варианта в версию для разработчиков iOS 15.4. [23]
Siri выпущена как отдельное приложение для операционной системы iOS в феврале 2010 года, и в то время разработчики также намеревались выпустить Siri для устройств Android и BlackBerry . [24] Два месяца спустя Apple приобрела Siri. [25] [26] [27] 4 октября 2011 года Apple представила iPhone 4S с бета-версией Siri. [28] [29] После этого анонса Apple удалила существующее автономное приложение Siri из App Store . [30] TechCrunch пишет, что, хотя приложение Siri поддерживает iPhone 4 , его удаление из App Store могло также иметь финансовый аспект для компании, поскольку стимулировало клиентов обновлять устройства. [30] Стороннему разработчику Стивену Тротон-Смиту, однако, удалось портировать Siri на iPhone 4, хотя и без возможности связи с серверами Apple. [31] Несколько дней спустя Тротон-Смит, работая с анонимным человеком по прозвищу «Chpwn», сумел полностью взломать Siri, обеспечив ее полную функциональность на устройствах iPhone 4 и iPod Touch . [32] Кроме того, разработчики также смогли успешно создавать и распространять легальные порты Siri на любое устройство, поддерживающее iOS 5 , хотя для взаимодействия с сервером Apple требовался прокси-сервер . [33]
С годами Apple расширила линейку официально поддерживаемых продуктов, включая новые модели iPhone , [34] а также поддержку iPad в июне 2012 года, [35] поддержку iPod Touch в сентябре 2012 года, [36] поддержку Apple TV и автономный Siri Remote , в сентябре 2015 г., [37] поддержка Mac и AirPods в сентябре 2016 г., [38] [39] и поддержка HomePod в феврале 2018 г. [40] [41]
Apple предлагает широкий спектр голосовых команд для взаимодействия с Siri, включая, помимо прочего: [42]
Siri также предлагает множество заранее запрограммированных ответов на забавные вопросы. К таким вопросам относятся: «В чем смысл жизни?» на что Сири может ответить: «Все имеющиеся на сегодняшний день данные свидетельствуют о том, что это шоколад»; «Почему я здесь?», на что он может ответить: «Я не знаю. Честно говоря, я сам задавался этим вопросом»; и «Ты выйдешь за меня замуж?», на что он может ответить: «Мое лицензионное соглашение с конечным пользователем не распространяется на брак. Мои извинения». [45] [46]
Первоначально ограниченная женскими голосами, в июне 2013 года Apple объявила, что Siri будет иметь возможность выбора пола, добавив мужской голосовой аналог. [47]
В сентябре 2014 года Apple добавила пользователям возможность говорить «Привет, Siri», чтобы включить помощника без необходимости физического обращения с устройством. [48]
В сентябре 2015 года функция «Привет, Siri» была обновлена и теперь включает индивидуальное распознавание голоса, что предположительно является попыткой предотвратить активацию, не являющуюся владельцем. [49] [50]
С анонсом iOS 10 в июне 2016 года Apple открыла ограниченный доступ сторонних разработчиков к Siri через специальный интерфейс программирования приложений (API). API ограничивает использование Siri взаимодействием со сторонними приложениями для обмена сообщениями, платежными приложениями, приложениями для совместного использования поездок и приложениями для интернет-звонков. [51] [52]
В iOS 11 Siri может отвечать на дополнительные вопросы, поддерживает языковой перевод и открывает больше возможностей для сторонних действий, включая управление задачами. [53] [54] Кроме того, пользователи могут печатать в Siri, [55] а новая, ориентированная на конфиденциальность технология «обучения на устройстве» улучшает предложения Siri, анализируя личное использование различных приложений iOS. [56]
iOS 17 и IPadOS 17 позволят пользователям просто сказать «Siri», чтобы запустить Siri, а виртуальный помощник теперь поддерживает последовательные запросы, позволяя пользователям отправлять несколько запросов и разговоров без повторной активации. [57] В публичных бета-версиях iOS 17, iPadOS 17 и macOS Sonoma Apple добавила поддержку двуязычных запросов в Siri. [58]
Siri получила неоднозначные отзывы во время бета-версии встроенной части iPhone 4S в октябре 2011 года.
М.Г. Сиглер из TechCrunch написал, что Siri была «великолепной», высоко оценив потенциал Siri после потери бета-тега:
Количество случаев, когда Siri не могла понять и выполнить мой запрос, удивительно мало. ... Только представьте, что произойдет, когда Apple начнет сотрудничать с другими сервисами для дальнейшего расширения возможностей Siri. И представьте, что у них есть API, который может использовать любой разработчик. Это действительно может изменить мобильный ландшафт. [59]
В статье для The New York Times Дэвид Пог также похвалил Siri за понимание языка и способность понимать контекст:
[Сири] думает несколько секунд, отображает красиво оформленный ответ и говорит спокойным женским голосом. ... Поразительно, насколько неточными могут быть ваши высказывания. Сири понимает все, начиная с вопроса «Какая погода будет в Тусоне на этих выходных?» на «Нужен ли мне зонтик сегодня вечером?» ... Однажды я попытался сказать: «Назначьте встречу с Патриком на четверг в 3». Сири ответила: «Обратите внимание, что у вас уже назначена встреча на весь день по поводу «Поездки в Бостон» на этот четверг. Мне все равно запланировать это? Невероятный. [60]
Жаки Ченг из Ars Technica написала, что заявления Apple о возможностях Siri были смелыми, а ранние демо-версии «еще смелее»:
Хотя Siri демонстрирует реальный потенциал, такие высокие ожидания обязательно будут разочарованы. ... Apple ясно дает понять, что продукт все еще находится в стадии бета-тестирования — на наш взгляд, это подходящая метка. [61]
Высоко оценивая его способность «расшифровывать нашу повседневную речь» и выдавать «очень конкретный и точный результат», иногда даже предоставляя дополнительную информацию, Ченг отметил и раскритиковал его ограничения, особенно когда язык отошел от «более жестких команд» к более человечному взаимодействию. Один из примеров включал фразу «Отправьте сообщение Джейсону, Клинту, Сэму и Ли о том, что мы ужинаем в Серебряном Облаке», которую Siri интерпретировала как отправку сообщения только Джейсону, содержащее текст «Клинт Сэм и Ли говорят, что мы ужинаем в Серебряном Облаке». Она также отметила отсутствие надлежащих возможностей редактирования, поскольку фраза «Отредактируйте сообщение так: «Мы в Серебряном Облаке, и вы должны найти нас»» привела к тому, что «Клинт Сэм и Ли сказали, что мы ужинаем в Серебряном Облаке, чтобы сказать, что мы» ты в Серебряном Облаке, и тебе следует найти нас». [61]
Исполнительный председатель и бывший руководитель Google Эрик Шмидт признал, что Siri может представлять конкурентную угрозу для основного поискового бизнеса компании. [62]
Siri подверглась критике со стороны организаций по защите прав на аборты , в том числе Американского союза гражданских свобод (ACLU) и NARAL Pro-Choice America , после того, как пользователи обнаружили, что Siri не может предоставить информацию о местонахождении поблизости пунктов противозачаточных средств или поставщиков абортов, иногда направляя пользователей Вместо этого центры кризисной беременности . [63] [64] [65]
Натали Керрис, пресс-секретарь Apple, рассказала The New York Times :
Наши клиенты хотят использовать Siri для поиска всех типов информации, и хотя с ее помощью можно найти много информации, она не всегда находит то, что вам нужно. ... Это не намеренные упущения, призванные кого-либо обидеть. Это просто означает, что по мере того, как мы переводим Siri из бета-версии в конечный продукт, мы находим места, где мы можем добиться большего, и мы это сделаем в ближайшие недели. [66]
В январе 2016 года Fast Company сообщила, что в последние месяцы Siri начала путать слово «аборт» со « усыновлением », ссылаясь на «экспертов в области здравоохранения», которые заявили, что ситуация «ухудшилась». Однако на момент публикации отчета Fast Company ситуация немного изменилась: Siri предложила «более полный список учреждений по планированию семьи », хотя «клиники по усыновлению продолжают появляться, но ближе к концу списка». [67] [68]
Siri также не была хорошо принята некоторыми носителями английского языка с характерным акцентом, в том числе шотландцами [69] и американцами из Бостона и Юга . [70]
В марте 2012 года Фрэнк М. Фацио подал коллективный иск против Apple от имени людей, которые купили iPhone 4S и чувствовали себя введенными в заблуждение относительно возможностей Siri, утверждая, что она не работает так, как показано в рекламе Apple Siri. Фацио подал иск в Калифорнии и заявил, что iPhone 4S будет просто «более дорогим iPhone 4», если Siri не будет работать так, как рекламируется. [71] [72] 22 июля 2013 года окружной судья США Клаудия Уилкен в Сан-Франциско отклонила иск, но заявила, что истцы могут внести поправки позднее. Причиной увольнения было то, что истцы не задокументировали достаточное количество искажений со стороны Apple для продолжения судебного разбирательства. [73]
В июне 2016 года Шон О'Кейн из The Verge написал о предстоящих на тот момент крупных обновлениях iOS 10 с заголовком, в котором говорилось: «Большие обновления Siri не будут иметь значения, если она не сможет понимать своих пользователей»:
О чем Apple не рассказала, так это о решении самых больших и основных недостатков Siri: она по-прежнему не очень хороша в распознавании голоса, и когда она делает это правильно, результаты часто бывают неуклюжими. И эти проблемы выглядят еще хуже, если учесть, что у Apple теперь есть полноценные конкуренты в этой сфере: Alexa от Amazon , Cortana от Microsoft и Assistant от Google . [74]
Также в статье для The Verge Уолт Моссберг ранее подвергал сомнению усилия Apple в сфере облачных сервисов, написав: [75]
... возможно, самым большим разочарованием среди облачных сервисов Apple является тот, который нужен компании больше всего сегодня и прямо сейчас: Siri. До того, как Apple купила ее, Siri была на пути к тому, чтобы стать надежным цифровым помощником, который мог бы делать многое и интегрироваться со многими сервисами, хотя его создавал стартап с ограниченными средствами и людьми. После того, как Apple купила Siri, гигантская компания, казалось, относилась к ней как к захолустью, ограничивая ее выполнением лишь нескольких, постепенно увеличивая количество задач, таких как сообщение погоды, результаты спортивных состязаний, списки фильмов и ресторанов, а также управление функциями устройства. Ее недовольные основатели покинули Apple, чтобы создать новый сервис искусственного интеллекта под названием Viv . И в слишком многих случаях Siri либо ошибается, либо не знает ответа, либо не может его выразить словами. Вместо этого он показывает вам результат веб-поиска, даже если вы не можете его прочитать.
В октябре 2016 года агентство Bloomberg сообщило, что Apple планирует объединить команды, стоящие за различными облачными сервисами, включая единый кампус и реорганизованные ресурсы облачных вычислений, направленные на улучшение обработки запросов Siri, [76] хотя в другом отчете The Verge , в июне 2017 года еще раз назвал распознавание голоса Siri «плохим». [77]
В июне 2017 года The Wall Street Journal опубликовал обширный отчет об отсутствии инноваций в Siri после достижений конкурентов в области голосовых помощников. Отмечая, что уровень беспокойства работников Apple «поднялся на ступеньку» после анонса Alexa от Amazon, журнал написал : «Сегодня Apple догоняет изобретённую ею категорию продуктов, усиливая опасения по поводу того, не потерял ли технологический гигант часть своих доходов». своего инновационного преимущества». В отчете указаны основные причины: приоритет Apple в отношении конфиденциальности пользователей, включая случайно помеченные шестимесячные поисковые запросы Siri, тогда как Google и Amazon хранят данные до тех пор, пока они не будут активно удалены пользователем, [ необходимы разъяснения ] и борьба за исполнительную власть внутри Apple. Apple не прокомментировала отчет, а Эдди Кью заявил: «Apple часто использует общие данные, а не пользовательские данные для обучения своих систем, и имеет возможность улучшить производительность Siri для отдельных пользователей с помощью информации, хранящейся на их iPhone». [3] [78]
В июле 2019 года анонимный информатор и бывший подрядчик Apple Томас ле Бонньек заявил, что Siri регулярно записывает некоторые разговоры своих пользователей, даже когда она не была активирована. Записи отправляются подрядчикам Apple, которые оценивают ответы Siri по множеству факторов. Помимо прочего, подрядчики регулярно слышат частные разговоры между врачами и пациентами, деловые сделки и сделки с наркотиками, а также пары, занимающиеся сексом. Apple не раскрыла это в своей документации по конфиденциальности и не предоставила своим пользователям возможность согласиться или отказаться от участия. [79]
В августе 2019 года Apple извинилась, остановила программу оценки Siri и заявила, что планирует возобновить ее «позже этой осенью, когда обновления программного обеспечения будут выпущены для [ее] пользователей». [80] Компания также объявила, что «больше не будет слушать записи Siri без вашего разрешения». [81] В iOS 13.2, выпущенной в октябре 2019 года, появилась возможность отказаться от программы оценивания и удалить все голосовые записи, которые Apple хранила на своих серверах. [82] Пользователям был предоставлен выбор, будут ли их аудиоданные получены Apple или нет, с возможностью менять свое решение так часто, как им хочется.
В мае 2020 года Томас ле Бонньек раскрыл себя как разоблачитель и направил письмо европейским регулирующим органам по защите данных, призывая их расследовать «прошлое и настоящее» использование Apple записей Siri. Он утверждал, что, хотя Apple и извинилась, она никогда не сталкивалась с последствиями своей многолетней программы оценок. [83] [84]
Постоянно возникают проблемы с конфиденциальностью, связанные с новой интеграцией Siri в настройки «умного дома» и «умного автомобиля». В августе 2023 года добавление команд Siri к управлению транспортными средствами Tesla [85] привело к появлению нового ряда широко неизвестных проблем безопасности и конфиденциальности.
Версия Siri для iOS поставляется с фильтром ненормативного контента; однако по умолчанию он отключен и должен быть включен пользователем вручную. [86]
В 2018 году Ars Technica сообщила о новой ошибке, которой мог воспользоваться пользователь, запрашивающий определение слова « мать » вслух. Siri выдавала ответ и спрашивала пользователя, хотят ли они услышать следующее определение; когда пользователь отвечает «да», Siri упоминает «мама» как сокращение от « ублюдок ». [87] В результате на YouTube появилось множество видеороликов, показывающих ответы и/или способы их запуска. Apple исправила проблему молча. Содержимое взято из сторонних источников, таких как Оксфордский словарь английского языка , а не из предоставленного сообщения корпорации. [88]
Сири озвучила Путера в фильме «Лего Бэтмен» . [89]
Голоса Siri были записаны в 2005 году компанией, которая затем передала Apple лицензию на использование голосов в Siri. Тремя главными голосами Siri при первоначальном запуске были Карен Джейкобсон (в Австралии), Сьюзан Беннетт (в США) и Джон Бриггс…