Импульсно-кодовая модуляция ( ИКМ ) — это метод, используемый для цифрового представления аналоговых сигналов . Это стандартная форма цифрового звука в компьютерах, компакт-дисках , цифровой телефонии и других цифровых аудиоприложениях. В потоке PCM амплитуда аналогового сигнала дискретизируется через одинаковые интервалы, и каждая выборка квантуется до ближайшего значения в пределах диапазона цифровых шагов.
Линейная импульсно-кодовая модуляция ( LPCM ) — это особый тип PCM, в котором уровни квантования линейно однородны. [5] В этом отличие от кодировок PCM, в которых уровни квантования изменяются в зависимости от амплитуды (как в случае с алгоритмом A-закона или алгоритмом μ-закона ). Хотя PCM — более общий термин, он часто используется для описания данных, закодированных в формате LPCM.
Поток PCM имеет два основных свойства, которые определяют точность потока исходному аналоговому сигналу: частота дискретизации , которая представляет собой количество раз в секунду, когда берутся выборки; и разрядность , которая определяет количество возможных цифровых значений, которые можно использовать для представления каждой выборки.
Ранние электрические коммуникации начали осуществлять выборку сигналов, чтобы мультиплексировать выборки из нескольких телеграфных источников и передавать их по одному телеграфному кабелю. Американский изобретатель Мозес Г. Фармер придумал телеграфное мультиплексирование с временным разделением (TDM) еще в 1853 году. Инженер-электрик У.М. Майнер в 1903 году использовал электромеханический коммутатор для мультиплексирования с временным разделением нескольких телеграфных сигналов; он также применил эту технологию к телефонии . Он получил разборчивую речь из каналов, выбранных с частотой выше 3500–4300 Гц; более низкие ставки оказались неудовлетворительными.
В 1920 году система передачи изображений по кабелю Бартлейн использовала телеграфную передачу символов, пробитых на бумажной ленте, для отправки образцов изображений, квантованных до 5 уровней. [6] В 1926 году Пол М. Рейни из Western Electric запатентовал факсимильный аппарат , который передавал сигнал с использованием 5-битной PCM, закодированной оптико-механическим аналого-цифровым преобразователем . [7] Машина не пошла в производство. [8]
Британский инженер Алек Ривз , не знавший о предыдущих работах, задумал использовать PCM для голосовой связи в 1937 году, когда работал в компании International Telephone and Telegraph во Франции. Он описал теорию и ее преимущества, но практического применения не последовало. Ривз подал заявку на французский патент в 1938 году, а его патент в США был выдан в 1943 году. [9] К этому времени Ривз начал работать в Научно-исследовательском институте телекоммуникаций . [8]
Первая передача речи с помощью цифровых технологий, шифровальное оборудование SIGSALY , обеспечивала связь союзников высокого уровня во время Второй мировой войны . В 1943 году исследователи Bell Labs , разработавшие систему SIGSALY, узнали об использовании двоичного кодирования PCM, как уже предлагал Ривз. В 1949 году для системы DATAR ВМС Канады компания Ferranti Canada построила действующую радиосистему PCM, которая могла передавать оцифрованные радиолокационные данные на большие расстояния. [10]
Компания PCM в конце 1940-х и начале 1950-х годов использовала электронно-лучевую кодирующую трубку с пластинчатым электродом , имеющим кодирующие перфорации. [11] Как и в осциллографе , луч перемещался по горизонтали с частотой дискретизации, в то время как вертикальное отклонение контролировалось входным аналоговым сигналом, заставляя луч проходить через верхние или нижние части перфорированной пластины. Пластина собирала или пропускала луч, создавая текущие изменения в двоичном коде, по одному биту за раз. Вместо естественной двоичной сетки сетка более поздней трубки Гудолла была перфорирована для создания кода Грея без сбоев и производила все биты одновременно, используя веерный луч вместо сканирующего луча. [12]
В Соединенных Штатах Национальный зал славы изобретателей удостоил Бернарда М. Оливера [13] и Клода Шеннона [14] как изобретателей PCM [15] , как описано в «Системе связи, использующей импульсно-кодовую модуляцию», патент США № 2,801,281. подан в 1946 и 1952 годах, выдан в 1956 году. Другой патент с тем же названием был подан Джоном Р. Пирсом в 1945 году и выдан в 1948 году: патент США 2 437 707 . Все трое опубликовали «Философию PCM» в 1948 году. [16]
Система T-carrier , представленная в 1961 году, использует две линии передачи витой пары для передачи 24 телефонных вызовов PCM, дискретизированных с частотой 8 кГц и 8-битным разрешением. Эта разработка улучшила пропускную способность и качество связи по сравнению с предыдущими схемами мультиплексирования с частотным разделением каналов .
В 1973 году П. Каммиски, Никил Джаянт и Джеймс Л. Фланаган разработали адаптивную дифференциальную импульсно-кодовую модуляцию (ADPCM) . [17]
В 1967 году исследовательскими центрами NHK в Японии был разработан первый диктофон PCM . [18] 12-битное устройство с частотой 30 кГц использовало компандер (похожий на шумоподавление DBX ) для расширения динамического диапазона и сохраняло сигналы на видеомагнитофоне . В 1969 году NHK расширила возможности системы до 2-канального стерео и 13-битного разрешения 32 кГц. В январе 1971 года, используя систему записи PCM NHK, инженеры Denon записали первые коммерческие цифровые записи. [примечание 1] [18]
В 1972 году Denon представила первый 8-канальный цифровой рекордер DN-023R, в котором использовался вещательный видеомагнитофон с открытой катушкой с 4 головками для записи 13-битного звука PCM с частотой 47,25 кГц. [примечание 2] В 1977 году компания Denon разработала портативную систему записи PCM DN-034R. Как и DN-023R, он записывал 8 каналов с частотой 47,25 кГц, но использовал 14 бит «с акцентом , что делало его эквивалентным 15,5 битам». [18]
В 1979 году был записан первый цифровой поп-альбом Boptil You Drop . Он был записан в формате 16-битной линейной PCM с частотой 50 кГц с использованием цифрового магнитофона 3M. [19]
Компакт -диск (CD) привнес PCM в потребительские аудиоприложения с его появлением в 1982 году. Компакт-диск использует частоту дискретизации 44 100 Гц и 16-битное разрешение и хранит до 80 минут стереозвука на диске.
Быстрое развитие и широкое распространение цифровой телефонии PCM стало возможным благодаря технологии переключаемых конденсаторов (SC) металл-оксид-полупроводник (MOS) , разработанной в начале 1970-х годов. [20] Это привело к разработке чипов кодеков-фильтров PCM в конце 1970-х годов. [20] [21] Чип кодека -фильтра PCM с кремниевым затвором CMOS (дополнительный MOS), разработанный Дэвидом А. Ходжесом и У. К. Блэком в 1980 году, [20] с тех пор стал отраслевым стандартом для цифровой телефонии. [20] [21] К 1990-м годам телекоммуникационные сети , такие как коммутируемая телефонная сеть общего пользования (PSTN), были в значительной степени оцифрованы с помощью CMOS PCM-кодеков-фильтров очень большой интеграции (VLSI), широко используемых в электронных системах коммутации для телефонной связи. телефонные станции , модемы на стороне пользователя и широкий спектр приложений цифровой передачи , таких как цифровая сеть с интеграцией услуг (ISDN), беспроводные телефоны и сотовые телефоны . [21]
PCM — это метод кодирования, обычно используемый для несжатого цифрового звука. [заметка 3]
На диаграмме синусоидальная волна (красная кривая) дискретизируется и квантуется для PCM. Синусоидальная волна отбирается через равные промежутки времени и отображается вертикальными линиями. Для каждой выборки выбирается одно из доступных значений (по оси Y). Процесс PCM обычно реализуется на одной интегральной схеме , называемой аналого-цифровым преобразователем (АЦП). Это создает полностью дискретное представление входного сигнала (синие точки), которое можно легко закодировать в виде цифровых данных для хранения или обработки. Несколько потоков PCM также могут быть мультиплексированы в более крупный совокупный поток данных , как правило, для передачи нескольких потоков по одному физическому каналу. Один из методов называется мультиплексированием с временным разделением (TDM) и широко используется, особенно в современных системах общественного телефона.
Электроника, задействованная в создании точного аналогового сигнала из дискретных данных, аналогична той, которая используется для генерации цифрового сигнала. Эти устройства представляют собой цифро-аналоговые преобразователи (ЦАП). Они вырабатывают напряжение или ток (в зависимости от типа), который представляет значение, подаваемое на их цифровые входы. Этот выходной сигнал затем обычно фильтруется и усиливается для использования.
Чтобы восстановить исходный сигнал из дискретных данных, демодулятор может применить обратную процедуру модуляции. После каждого периода выборки демодулятор считывает следующее значение и преобразует выходной сигнал в новое значение. В результате этих переходов сигнал сохраняет значительное количество высокочастотной энергии из-за эффектов визуализации. Чтобы удалить эти нежелательные частоты, демодулятор пропускает сигнал через восстанавливающий фильтр , который подавляет энергию за пределами ожидаемого диапазона частот (больше, чем частота Найквиста ). [примечание 4]
Обычная глубина выборки для LPCM составляет 8, 16, 20 или 24 бита на выборку . [1] [2] [3] [29]
LPCM кодирует один звуковой канал. Поддержка многоканального звука зависит от формата файла и основана на синхронизации нескольких потоков LPCM. [5] [30] Хотя два канала (стерео) являются наиболее распространенным форматом, системы могут поддерживать до 8 аудиоканалов (объемный звук 7.1) [2] [3] или более.
Обычная частота дискретизации составляет 48 кГц для видео формата DVD или 44,1 кГц для компакт-дисков. Частоты дискретизации 96 кГц или 192 кГц могут использоваться на некотором оборудовании, но преимущества обсуждаются. [31]
Теорема выборки Найквиста-Шеннона показывает, что устройства PCM могут работать без искажений в пределах разработанных для них полос частот, если они обеспечивают частоту дискретизации, по крайней мере, в два раза превышающую самую высокую частоту, содержащуюся во входном сигнале. Например, в телефонии используемый диапазон голосовых частот находится в диапазоне примерно от 300 Гц до 3400 Гц. [32] Поэтому для эффективного восстановления голосового сигнала в телефонных приложениях обычно используется частота дискретизации 8000 Гц, которая более чем в два раза превышает максимальную используемую голосовую частоту.
Тем не менее, в любой системе PCM есть потенциальные источники ухудшения:
Некоторые формы PCM сочетают обработку сигналов с кодированием. В более старых версиях этих систем обработка в аналоговой области применялась как часть аналого-цифрового процесса; новые реализации делают это в цифровой сфере. Эти простые методы в значительной степени устарели из-за современных методов сжатия звука на основе преобразований , таких как кодирование с модифицированным дискретным косинусным преобразованием (MDCT).
В телефонии стандартный аудиосигнал для одного телефонного звонка кодируется как 8000 выборок в секунду по 8 бит каждая, что дает цифровой сигнал со скоростью 64 кбит/с, известный как DS0 . Кодировкой сжатия сигнала по умолчанию на DS0 является либо PCM по закону μ (Северная Америка и Япония), либо PCM по закону A (Европа и большая часть остального мира). Это системы логарифмического сжатия, в которых 12- или 13-битное линейное число выборок PCM преобразуется в 8-битное значение. Эта система описана международным стандартом G.711 .
Если стоимость канала высока и потеря качества речи приемлема, иногда имеет смысл еще больше сжать голосовой сигнал. Алгоритм ADPCM используется для преобразования серии 8-битных выборок PCM с μ-законом или A-законом в серию 4-битных выборок ADPCM. Таким образом, пропускная способность линии увеличивается вдвое. Этот метод подробно описан в стандарте G.726 .
Форматы аудиокодирования и аудиокодеки были разработаны для обеспечения дальнейшего сжатия. Некоторые из этих методов были стандартизированы и запатентованы. Передовые методы сжатия, такие как модифицированное дискретное косинусное преобразование (MDCT) и линейное прогнозирующее кодирование (LPC), в настоящее время широко используются в мобильных телефонах , передаче голоса по IP (VoIP) и потоковом мультимедиа .
PCM может быть либо с возвратом в ноль (RZ), либо без возврата в ноль (NRZ). Для синхронизации системы NRZ с использованием внутриполосной информации не должно быть длинных последовательностей одинаковых символов, таких как единицы или нули. Для двоичных систем PCM плотность 1-символов называется плотностью единиц . [33]
Плотность единиц часто контролируется с помощью методов предварительного кодирования, таких как кодирование с ограниченной длиной серии , где код PCM расширяется до немного более длинного кода с гарантированной границей плотности единиц перед модуляцией в канал. В других случаях в поток добавляются дополнительные биты кадрирования , что гарантирует, по крайней мере, случайные переходы символов.
Другой метод, используемый для управления плотностью единиц, — это использование скремблера данных , который будет стремиться превратить поток данных в поток, который выглядит псевдослучайным , но где данные могут быть точно восстановлены с помощью дополнительного дешифратора. В этом случае на выходе все еще возможны длинные серии нулей или единиц, но они считаются достаточно маловероятными, чтобы обеспечить надежную синхронизацию.
В других случаях важно долговременное значение постоянного тока модулированного сигнала, поскольку создание смещения постоянного тока будет иметь тенденцию выводить схемы связи за пределы их рабочего диапазона. В этом случае принимаются специальные меры для учета совокупного смещения постоянного тока и изменения кодов, если необходимо, чтобы смещение постоянного тока всегда стремилось обратно к нулю.
Многие из этих кодов являются биполярными кодами , где импульсы могут быть положительными, отрицательными или отсутствовать. В типичном коде инверсии альтернативной метки ненулевые импульсы чередуются между положительными и отрицательными. Эти правила могут быть нарушены для создания специальных символов, используемых для кадрирования или других специальных целей.
Слово « импульс» в термине « импульсно-кодовая модуляция» относится к импульсам, которые можно найти в линии передачи. Возможно, это является естественным следствием того, что этот метод развивался вместе с двумя аналоговыми методами: широтно-импульсной и позиционно-импульсной модуляцией , в которых кодируемая информация представлена дискретными сигнальными импульсами различной ширины или положения соответственно. [ нужна цитата ] В этом отношении PCM мало похож на эти другие формы кодирования сигналов, за исключением того, что все они могут использоваться при мультиплексировании с временным разделением, а числа кодов PCM представлены в виде электрических импульсов.
{{cite journal}}
: Требуется цитировать журнал |journal=
( помощь ){{cite journal}}
: Требуется цитировать журнал |journal=
( помощь ){{cite journal}}
: Требуется цитировать журнал |journal=
( помощь ){{cite book}}
: |work=
игнорируется ( помощь ){{cite book}}
: |work=
игнорируется ( помощь )Альбом Ry Cooder Bop Till You Drop стал первым поп-альбомом, записанным в цифровом формате.
{{cite journal}}
: Требуется цитировать журнал |journal=
( помощь ){{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )