Дельта-модуляция с плавно изменяемым наклоном ( CVSD или CVSDM ) — метод кодирования голоса . Это дельта-модуляция с переменным размером шага (т. е. частный случай адаптивной дельта-модуляции ), впервые предложенная Грефкесом и Рименсом в 1970 году.
CVSD кодирует со скоростью 1 бит на сэмпл, поэтому звук, дискретизированный с частотой 16 кГц, кодируется со скоростью 16 кбит/с.
Кодер поддерживает эталонный образец и размер шага. Каждый входной образец сравнивается с эталонным образцом. Если входной образец больше, кодер выдает бит 1 и добавляет размер шага к эталонному образцу. Если входной образец меньше, кодер выдает бит 0 и вычитает размер шага из эталонного образца. Кодер также сохраняет предыдущие N битов вывода ( N = 3 или N = 4 очень распространены) для определения корректировок размера шага; если предыдущие N битов все 1 или 0, размер шага увеличивается. В противном случае размер шага уменьшается (обычно экспоненциально, в диапазоне 5 мс). Размер шага корректируется для каждого обработанного входного образца.
Чтобы обеспечить затухание ошибок битов и (ре)синхронизацию с текущим потоком битов, выходной регистр (который хранит опорный образец) обычно реализуется как утечка интегратора с постоянной времени ( ) около 1 мс.
Декодер обращает этот процесс, начиная с эталонного образца и добавляя или вычитая размер шага в соответствии с потоком битов. Последовательность скорректированных эталонных образцов представляет собой восстановленную форму волны, а размер шага регулируется в соответствии с той же логикой «все 1 или 0», что и в кодере.
Адаптация размера шага позволяет избежать перегрузки по наклону (шаг квантования увеличивается при быстром изменении сигнала) и уменьшает гранулярный шум при постоянном сигнале (уменьшение шага квантования).
CVSD иногда называют компромиссом между простотой, низким битрейтом и качеством. Обычные битрейты составляют 9,6–128 кбит/с.
Как и в других методах дельта-модуляции, выходной сигнал декодера не полностью соответствует исходному входному сигналу кодера.
CVSD со скоростью 12 кбит/с используется в линейке продуктов двусторонней радиосвязи Motorola SECURENET с цифровым шифрованием .
CVSD со скоростями 16 и 32 кбит/с использовались военными цифровыми телефонами TRI-TAC (DNVT, DSVT) для использования в зонах развертывания для обеспечения качества звука распознавания голоса. Скорости 16 кбит/с обычно использовались армией США для экономии полосы пропускания на тактических линиях связи. Скорости 32 кбит/с обычно использовались ВВС США для улучшения качества голоса.
64 кбит/с CVSD — один из вариантов кодирования голосовых сигналов в профилях услуг Bluetooth , связанных с телефонией ; например, между мобильными телефонами и беспроводными гарнитурами. Другие варианты — PCM с логарифмическим a-законом или μ-законом квантования, а также кодек mSBC с частотой дискретизации 16 кГц и наилучшим качеством.
Многочисленные аркадные игры, такие как Sinistar и Smash TV , а также автоматы для игры в пинбол, такие как Gorgar или Space Shuttle , воспроизводят предварительно записанную речь через декодер CVSD HC-55516. [1] [2]
Дельта-модуляция использовалась Satellite Business Systems или SBS для ее голосовых портов для предоставления услуг дальней телефонной связи крупным отечественным корпорациям со значительной потребностью в межкорпоративной связи (таким как IBM). Эта система находилась в эксплуатации на протяжении 1980-х годов. Голосовые порты использовали цифровую реализацию дельта-модуляции 24 кбит/с с компрессией голосовой активности (VAC) и эхо-подавителями для управления полусекундным эхо-трактом через спутник. Были проведены прослушивающие испытания, чтобы убедиться, что дельта-модулятор 24 кбит/с обеспечивает «полное качество голоса» без заметного ухудшения по сравнению с высококачественной телефонной линией или стандартным 64 кбит/с μ-законом компандированным PCM. Это обеспечило улучшение 8:3 пропускной способности спутникового канала. IBM разработала контроллер спутниковой связи и функции голосового порта.
Первоначальное предложение 1974 года использовало современный дельта-модулятор 24 кбит/с с одним интегратором и компандером Шиндлера, модифицированным для восстановления ошибок усиления. Оказалось, что это не обеспечивает полного качества речи телефонной линии. В 1977 году один инженер с двумя помощниками в лаборатории IBM Research Triangle Park , NC, был назначен для улучшения качества.
Окончательная реализация заменила интегратор предиктором, реализованным с двухполюсным комплексно-парным фильтром нижних частот, разработанным для аппроксимации долгосрочного среднего спектра речи. Теория заключалась в том, что в идеале интегратор должен быть предиктором, разработанным для соответствия спектру сигнала. Почти идеальный компандер Шиндлера заменил модифицированную версию. Было обнаружено, что модифицированный компандер привел к неидеальному размеру шага на большинстве уровней сигнала, а быстрое восстановление ошибки усиления увеличило шум, как было определено реальными испытаниями прослушивания по сравнению с простыми измерениями отношения сигнал-шум. Окончательный компандер достиг очень мягкого восстановления ошибки усиления из-за естественной ошибки округления, вызванной 12-битной арифметикой.
Полная функция дельта-модуляции, VAC и управления эхом для 6 портов была реализована в одной цифровой интегральной микросхеме с 12-битной арифметикой. Один ЦАП был общим для всех 6 портов, обеспечивая функции сравнения напряжения для модуляторов и питая схемы выборки и хранения для выходов демодулятора. Одна карта содержала чип, ЦАП и все аналоговые схемы для интерфейса телефонной линии, включая трансформаторы.