GI SP0256 относится к семейству тесно связанных чипов NMOS LSI, произведенных General Instrument в начале 1980-х годов, способных моделировать человеческий голосовой тракт с помощью программируемого цифрового фильтра , создавая цифровой выход , преобразованный в аналоговый сигнал через внешний фильтр нижних частот . SP0256 включает 2 КБ маски ROM . Различные версии SP0256 отличаются в основном голосовыми данными, запрограммированными в их масках ROM.
SP0256 (и его предшественник SP0250) реализует 12-полюсную линейно-предиктивную модель голосового тракта (VTM) ( Linear Predictive Coding , также известную как LPC-12). SP0256 генерирует речь с частотой дискретизации 10 кГц. SP0256 реализует свой 12-полюсный фильтр с помощью ряда каскадных 2-полюсных секций фильтра IIR . Это контрастирует с его современниками, такими как речевые чипы Texas Instruments LPC , которые использовали частоту дискретизации 8 кГц с 10-полюсной моделью и реализовали свой VTM с помощью решетчатого фильтра .
SP0256 объединяет VTM с простым контроллером, который загружает сжатые данные коэффициентов в VTM либо из встроенного ПЗУ, либо из внешних речевых ПЗУ, таких как SPR-128, либо, в случае Intellivoice , из FIFO речевых данных SPB640 .
General Instrument выпустила несколько вариантов SP0256. Эти варианты в основном отличались содержимым маски ПЗУ. Ниже перечислены некоторые известные варианты. Вероятно, существуют и другие, не перечисленные на этой странице.
SP0256-AL2, пожалуй, наиболее часто встречающийся вариант. Он содержит 59 аллофонов, в первую очередь предназначенных для использования с фразами на английском языке и пятью паузами во внутреннем ПЗУ объемом 16 Кб (2 Кб ) . [1] SP0256-AL2 требует управления внешнего микропроцессора для объединения аллофонов в слова. [2]
SP0256-AL2 был доступен в домашних наборах для синтеза речи , опубликованных в специализированных журналах для микрокомпьютеров , таких как VIC-20 [3] и Atari 8-bit computers . [4] [5] Другие компании производили дополнения для различных 8-битных микрокомпьютеров, таких как Currah MicroSpeech [6] и Tandy Speech/Sound Program Pak для TRS-80 . Чип также продавался под брендом Archer в магазинах RadioShack как «Narrator Speech Processor» (номер детали 276-1784), тогда как в более ранней документации он был неправильно идентифицирован как SPO256 (с буквой «O» вместо цифры «0»). [2]
SP0256-AL2 в последнее время использовался в MIDI Narrator от Rare Waves. Это устройство позволяет вам обращаться к аллофонам через информацию о нотах MIDI и регулировать информацию о высоте тона через сообщения о питче. [7]
Приставка Mattel Intellivoice для своей игровой системы Intellivision использует SP0256-012. Этот вариант содержит только игровые фразы, специфичные для Mattel, включая энергичную фразу «Mattel Electronics Presents», фразы для цифр и несколько дополнительных игровых фраз. Он не содержит аллофонов, найденных в SP0256-AL2 или SP0256-019. Mattel выпустила только пять игр с поддержкой этого устройства. [8]
SP0256-017 взят из говорящих часов и содержит фразы, характерные для говорящих часов. SP0256-017 продавался Radio Shack под брендом Archer под номером детали 276-1783. В комплект деталей также входил SPR016-117, внешнее последовательное речевое ПЗУ. Словарь включал цифры (в комбинации) до 59, соответствующие говорящим часам. Встроенная память также обеспечивала синтез следующих фраз: AM, PM, It is, Hour, Minute, Hundred Hour, Good Morning, Attention Please, Please Hurry и три мелодии с именами A, B и C.
Вставка "Голос" Magnavox Odyssey² использует SP0256-019. Этот вариант включал те же аллофоны, что и SP0256-AL2 (но для аллофонов требуется внешняя микросхема ПЗУ), а также некоторые игровые фразы, специфичные для Odyssey².
Используемый в прототипе радар-детектора Fuzzbuster , [ необходима ссылка ] SP0264-021 имеет соответствующие фразы и совместим по выводам с серией SP0256.
Реализация классического синтезатора речи восьмидесятых SP0256 на базе FPGA, созданная Нильсом Мозли для Retro Challenge в октябре 2017 года, доступна на его аккаунте GitHub. [9] github