stringtranslate.com

Голоса Microsoft для преобразования текста в речь

Голоса Microsoft text-to-speech — это синтезаторы речи , предоставляемые для использования с приложениями, которые используют Microsoft Speech API (SAPI) или платформу Microsoft Speech Server. Существуют клиентские, серверные и мобильные версии голосов Microsoft text-to-speech. Клиентские голоса поставляются с операционными системами Windows; серверные голоса доступны для загрузки для использования с серверными приложениями, такими как Speech Server, Lync и т. д. как для клиентских, так и для серверных платформ Windows, а мобильные голоса часто поставляются с более поздними версиями.

Голоса

Windows 2000 и Windows XP

Пример речи Microsoft Sam. Это версия голоса SAPI 5.
Первая часть использует вариацию панаграммы " The quick brown fox jumps over the lazy dog " , а вторая часть демонстрирует глюк "soy/soi", связанный с Sam.

Microsoft Sam — это мужской голос по умолчанию для преобразования текста в речь в Microsoft Windows 2000 и Windows XP . Он используется программой Narrator , встроенной в операционную систему программой чтения с экрана .

Microsoft Mike и Microsoft Mary — это опциональные мужской и женский голоса соответственно, доступные для загрузки с веб-сайта Microsoft. Michael и Michelle — это также опциональные мужской и женский голоса, лицензированные Microsoft у Lernout & Hauspie , и доступные через Microsoft Office XP и Microsoft Office 2003 или Microsoft Reader .

Существуют версии SAPI 4 и SAPI 5 этих голосов преобразования текста в речь. Голоса SAPI 4 доступны только в Windows 2000 и более поздних операционных системах на базе Windows NT. Распространяемые версии голосов SAPI 4 были доступны для загрузки в операционных системах Windows 9x , однако они больше не предлагаются на веб-сайте Microsoft. В то время как версии SAPI 5 Microsoft Mike и Microsoft Mary доступны для загрузки только в виде модуля Merge [1] , устанавливаемые версии могут быть установлены на системах конечных пользователей с помощью речевых приложений, таких как Microsoft Reader.

Речевые шаблоны версий SAPI 4 и SAPI 5 голосов преобразования текста в речь отличаются друг от друга. Версии SAPI 4 Microsoft Sam, Microsoft Mike и Microsoft Mary могут использоваться в Windows XP, Windows Vista и более поздних версиях со сторонней программой (например, Speakonia и TTSReader), установленной на машине, поддерживающей эти операционные системы. Кроме того, голоса Michael и Michelle от Lernout & Hauspie также будут работать в Windows Vista и более поздних версиях, если версии SAPI 4 голосов на британском английском будут загружены и использованы со сторонней программой, например, Speakonia (наоборот, указанные голоса также совместимы с XP и более ранними версиями).

Windows Vista и Windows 7

Начиная с Windows Vista и Windows 7 , Microsoft Anna является английским голосом по умолчанию. Это женский голос, поддерживаемый только SAPI 5, и он звучат более естественно, чем Microsoft Sam. [2] Microsoft Streets & Trips 2006 и более поздние версии устанавливают голос Microsoft Anna на системы Windows XP для функции голосовых подсказок. В Windows Vista и Windows 7 нет мужских голосов, и ни Microsoft Mike, ни Microsoft Mary не будут работать в Windows 7.

Женский голос под названием Microsoft Lili , который заменяет более ранний мужской голос SAPI 5 «Microsoft Simplified Chinese», доступен в китайских версиях Windows Vista и Windows 7. Его также можно получить в некитайских версиях Windows 7 или Vista, установив китайский языковой пакет .

В 2010 году Microsoft выпустила новые голоса, совместимые с Speech Platform, для распознавания речи и преобразования текста в речь для использования с клиентскими и серверными приложениями. Эти голоса доступны на 26 языках [3] и могут быть установлены на клиентских и серверных операционных системах Windows. Голоса Speech Platform, в отличие от голосов SAPI 5, являются только женскими; мужские голоса никогда не выпускались.

Windows 8 и Windows 8.1

В Windows 8 есть три новых клиентских (настольных) голоса - Microsoft David (мужской из США), Hazel (женский из Великобритании) и Zira (женский из США), которые должны звучать более естественно, чем Microsoft Anna. Серверные версии этих голосов доступны через вышеупомянутую речевую платформу для операционных систем более ранних, чем Windows 8. Другие голоса доступны для определенных языковых версий Windows 8 или Windows 8.1 . [4]

В отличие от Windows 7 или Vista, для Microsoft Anna нельзя использовать никакие сторонние программы, поскольку не существует официального API Anna Voice для загрузки (тем более, что Microsoft Anna была доступна только в SAPI 5, а версия SAPI 4 голоса отсутствовала).

Виндовс 10

В Windows 10 Microsoft Hazel был удален из языкового пакета US English, а голоса Microsoft для мобильных устройств (телефон/планшет) доступны (Microsoft Mark и Microsoft Zira). Это те же голоса, что и в Windows Phone 8, Windows Phone 8.1 и Windows 10 Mobile .

Также с этими голосами доступны языковые пакеты для различных голосов, похожих на те, что есть в Windows 8 и 8.1. Ни один из этих голосов не соответствует голосу Cortana для преобразования текста в речь, который можно найти в Windows Phone 8.1, Windows 10 и Windows 10 Mobile.

В попытке унифицировать свое программное обеспечение с Windows 10 все текущие платформы Microsoft используют одни и те же голоса преобразования текста в речь, за исключением Microsoft David и нескольких других.

Мобильный

Каждый мобильный голосовой пакет имеет комбинацию мужского/женского, в то время как большинство настольных голосовых пакетов имеют только женские голоса. Все мобильные голоса были сделаны универсальными, и любой пользователь, который загружает языковой пакет по этому выбору, будет иметь один дополнительный мужской и женский голос на этот пакет.

Скрытый голос для преобразования текста в речь в Windows 10 под названием Microsoft Eva Mobile присутствует в системе. Пользователи могут загрузить предварительно упакованный файл реестра с веб-сайта windowsreport.com. Microsoft Eva считается ранним голосом для Cortana, пока Microsoft не заменила ее голосом Джен Тейлор в большинстве областей.

Эти голоса обновляются вместе с Windows и звучат более естественно, чем в оригинальной версии, как это можно увидеть в обновленных розничных сборках Windows 10.

Виндовс 11

Windows 11 представила три новых «естественных голоса», начиная с версии 22H2: Microsoft Aria, Jenny и Guy. [5] Эти естественные голоса призваны звучать более естественно, чем предыдущие голоса преобразования текста в речь, и основаны на голосах из облачной вычислительной платформы Microsoft Azure . Они доступны только через Narrator и в настоящее время недоступны для использования какими-либо программами за его пределами с 2024 года , включая все собственные и сторонние приложения.

Голоса из Windows 10 теперь переклассифицированы как «устаревшие голоса», однако Дэвид по-прежнему использовался по умолчанию для настольного клиента.

Смотрите также

Ссылки

  1. ^ Речевой SDK 5.1
  2. Chambers, Rob (29 августа 2006 г.). "Microsoft Anna - Новый голос TTS в Vista". Блоги MSDN . Microsoft . Получено 26 июня 2015 г. .
  3. ^ «Microsoft Speech Platform». 20 января 2015 г.
  4. ^ Бесплатные синтезаторы речи (TTS) или синтезаторы речи в Microsoft Windows
  5. ^ «Экранный диктор Windows 11 получает лучшие голоса». How-To Geek . 27 января 2022 г.

Внешние ссылки