Система синтеза речи Festival — это многоязычная система синтеза речи , изначально разработанная Аланом В. Блэком , Полом Тейлором и Ричардом Кейли [1] в Центре исследований речевых технологий (CSTR) Эдинбургского университета . Значительный вклад также внесли Университет Карнеги-Меллона и другие сайты. Она распространяется по лицензии свободного программного обеспечения, аналогичной лицензии BSD .
Он предлагает полноценную систему преобразования текста в речь с различными API , а также среду для разработки и исследования методов синтеза речи. Он написан на C++ с командным интерпретатором, похожим на Scheme , для общей настройки и расширения. [2]
Festival разработан для поддержки нескольких языков и поставляется с поддержкой английского ( британское и американское произношение), валлийского и испанского . Существуют голосовые пакеты для нескольких других языков, таких как кастильский испанский , чешский , финский , хинди , итальянский , маратхи , польский , русский и телугу .
Проект Festvox направлен на то, чтобы сделать создание новых синтетических голосов более систематичным и лучше документированным, [3] позволяя любому человеку создать новый голос. Он распространяется по лицензии свободного программного обеспечения, аналогичной лицензии MIT .
Festvox — это набор инструментов Алана В. Блэка и Кевина Ленцо для создания синтетических голосов для Festival. Он включает пошаговое руководство с примерами в документе под названием «Создание синтетических голосов». [4]
Flite — это небольшой движок для синтеза речи, разработанный в Университете Карнеги — Меллона , созданный на основе Festival и Festvox. [5]
Для GStreamer есть плагин Festival . Festival уже упакован для нескольких дистрибутивов Linux .