Импульсно-кодовая модуляция ( ИКМ ) — метод, используемый для цифрового представления аналоговых сигналов. Это стандартная форма цифрового звука в компьютерах, компакт-дисках, цифровой телефонии и других цифровых аудиоприложениях. В потоке ИКМ амплитуда аналогового сигнала дискретизируется с равномерными интервалами , и каждый сэмпл квантуется до ближайшего значения в пределах диапазона цифровых шагов. Алек Ривз , Клод Шеннон , Барни Оливер и Джон Р. Пирс приписывают его изобретение. [6] [7] [8]
Линейная импульсно-кодовая модуляция ( LPCM ) — это особый тип PCM, в котором уровни квантования линейно равномерны. [5] Это контрастирует с кодированием PCM, в котором уровни квантования изменяются как функция амплитуды (как в алгоритме A-law или алгоритме μ-law ). Хотя PCM — более общий термин, его часто используют для описания данных, закодированных как LPCM.
Поток PCM имеет два основных свойства, которые определяют точность потока по отношению к исходному аналоговому сигналу: частоту дискретизации , которая представляет собой количество раз в секунду, когда берутся выборки; и битовую глубину , которая определяет количество возможных цифровых значений, которые могут быть использованы для представления каждой выборки.
Ранние электрические коммуникации начали производить выборку сигналов для мультиплексирования выборок из нескольких источников телеграфии и передачи их по одному телеграфному кабелю. Американский изобретатель Мозес Г. Фармер задумал телеграфное временное мультиплексирование (TDM) еще в 1853 году. Инженер-электрик В. М. Майнер в 1903 году использовал электромеханический коммутатор для временного мультиплексирования нескольких телеграфных сигналов; он также применил эту технологию в телефонии . Он получил разборчивую речь из каналов, дискретизированных с частотой выше 3500–4300 Гц; более низкие частоты оказались неудовлетворительными.
В 1920 году система передачи изображений по кабелю Бартлейн использовала телеграфную сигнализацию символов, пробитых на бумажной ленте, для отправки образцов изображений, квантованных до 5 уровней. [9] В 1926 году Пол М. Рейни из Western Electric запатентовал факсимильный аппарат , который передавал свой сигнал с помощью 5-битной PCM, кодированной оптико-механическим аналого-цифровым преобразователем . [10] Аппарат не был запущен в производство. [11]
Британский инженер Алек Ривз , не зная о предыдущих работах, задумал использовать PCM для голосовой связи в 1937 году, работая в International Telephone and Telegraph во Франции. Он описал теорию и ее преимущества, но практического применения не последовало. Ривз подал заявку на французский патент в 1938 году, а его патент в США был выдан в 1943 году. [12] К этому времени Ривз начал работать в Telecommunications Research Establishment . [11]
Первая передача речи с помощью цифровых технологий, шифровальное оборудование SIGSALY , передало высокоуровневые сообщения союзников во время Второй мировой войны . В 1943 году исследователи Bell Labs , которые разработали систему SIGSALY, узнали об использовании двоичного кодирования PCM, как уже предлагал Ривз. В 1949 году для системы DATAR канадского флота Ferranti Canada построила рабочую радиосистему PCM, которая могла передавать оцифрованные радиолокационные данные на большие расстояния. [13]
PCM в конце 1940-х и начале 1950-х годов использовала электронно-лучевую кодирующую трубку с плоским электродом , имеющим кодирующие перфорации. [14] Как и в осциллографе , луч был горизонтально развёрнут с частотой дискретизации, в то время как вертикальное отклонение контролировалось входным аналоговым сигналом, заставляя луч проходить через более высокие или более низкие части перфорированной пластины. Пластина собирала или пропускала луч, производя изменения тока в двоичном коде, по одному биту за раз. Вместо естественного двоичного кода, сетка более поздней трубки Гудолла была перфорирована для получения безглючного кода Грея и производила все биты одновременно, используя веерный луч вместо сканирующего луча. [15]
В Соединенных Штатах Национальный зал славы изобретателей почтил Бернарда М. Оливера [16] и Клода Шеннона [17] как изобретателей PCM, [18] как описано в «Системе связи, использующей импульсно-кодовую модуляцию», патент США 2,801,281 , поданный в 1946 и 1952 годах, выданный в 1956 году. Другой патент с тем же названием был подан Джоном Р. Пирсом в 1945 году и выдан в 1948 году: патент США 2,437,707 . Все трое опубликовали «Философию PCM» в 1948 году. [19]
Система T-carrier , представленная в 1961 году, использует две витые пары линий передачи для передачи 24 телефонных звонков PCM с частотой дискретизации 8 кГц и разрешением 8 бит. Эта разработка улучшила пропускную способность и качество звонков по сравнению с предыдущими схемами частотного мультиплексирования .
В 1973 году П. Каммиски, Никил Джайант и Джеймс Л. Фланаган разработали адаптивную дифференциальную импульсно-кодовую модуляцию (АДИКМ) . [20]
В 1967 году исследовательскими центрами NHK в Японии был разработан первый PCM-рекордер . [21] 30 кГц 12-битное устройство использовало компандер ( похожий на DBX Noise Reduction ) для расширения динамического диапазона и сохраняло сигналы на видеомагнитофоне . В 1969 году NHK расширила возможности системы до 2-канального стерео и 32 кГц 13-битного разрешения. В январе 1971 года, используя PCM-систему записи NHK, инженеры Denon записали первые коммерческие цифровые записи. [примечание 1] [21]
В 1972 году Denon представил первый 8-канальный цифровой рекордер DN-023R, который использовал 4-головочный открытый катушечный вещательный видеомагнитофон для записи в формате 47,25 кГц, 13-битного PCM-аудио. [примечание 2] В 1977 году Denon разработал портативную систему записи PCM DN-034R. Как и DN-023R, он записывал 8 каналов в формате 47,25 кГц, но использовал 14 бит «с акцентом , что делало его эквивалентным 15,5 бит». [21]
В 1979 году был записан первый цифровой поп-альбом Bop till You Drop . Он был записан в формате 50 кГц, 16 бит линейной PCM с использованием цифрового магнитофона 3M. [22]
Компакт -диск (CD) привнес PCM в потребительские аудиоприложения с момента своего появления в 1982 году. CD использует частоту дискретизации 44 100 Гц и разрешение 16 бит, а на одном диске можно хранить до 80 минут стереозвука.
Быстрое развитие и широкое внедрение цифровой телефонии PCM стало возможным благодаря технологии коммутируемых конденсаторов (SC) на основе металл-оксид-полупроводника (МОП) , разработанной в начале 1970-х годов. [23] Это привело к разработке микросхем кодека-фильтра PCM в конце 1970-х годов. [23] [24] Микросхема кодека-фильтра PCM на основе КМОП (комплементарных МОП) с кремниевым затвором , разработанная Дэвидом А. Ходжесом и В. К. Блэком в 1980 году, [23] с тех пор является отраслевым стандартом для цифровой телефонии. [23] [24] К 1990-м годам телекоммуникационные сети , такие как телефонная сеть общего пользования (PSTN), были в значительной степени оцифрованы с помощью сверхбольшой интеграции (VLSI) CMOS PCM кодеков-фильтров, широко используемых в электронных коммутационных системах для телефонных станций , модемов на концах пользователей и широкого спектра приложений цифровой передачи , таких как цифровая сеть с интеграцией услуг (ISDN), беспроводные телефоны и сотовые телефоны . [24]
PCM — это метод кодирования, обычно используемый для несжатого цифрового звука. [примечание 3]
На диаграмме синусоида ( красная кривая) дискретизируется и квантуется для PCM. Синусоида дискретизируется через регулярные интервалы, показанные в виде вертикальных линий. Для каждой выборки выбирается одно из доступных значений (на оси Y). Процесс PCM обычно реализуется на одной интегральной схеме, называемой аналого-цифровым преобразователем (АЦП). Это создает полностью дискретное представление входного сигнала (синие точки), которое можно легко закодировать в виде цифровых данных для хранения или обработки. Несколько потоков PCM также могут быть мультиплексированы в более крупный совокупный поток данных , как правило, для передачи нескольких потоков по одному физическому каналу. Один из методов называется временным мультиплексированием (TDM) и широко используется, особенно в современной телефонной системе общего пользования.
Электроника, используемая для создания точного аналогового сигнала из дискретных данных, похожа на ту, которая используется для создания цифрового сигнала. Эти устройства представляют собой цифро-аналоговые преобразователи (ЦАП). Они создают напряжение или ток (в зависимости от типа), представляющие значение, представленное на их цифровых входах. Затем этот выход обычно фильтруется и усиливается для использования.
Чтобы восстановить исходный сигнал из выборочных данных, демодулятор может применить процедуру модуляции в обратном порядке. После каждого периода выборки демодулятор считывает следующее значение и переводит выходной сигнал в новое значение. В результате этих переходов сигнал сохраняет значительное количество высокочастотной энергии из-за эффектов визуализации. Чтобы удалить эти нежелательные частоты, демодулятор пропускает сигнал через фильтр реконструкции , который подавляет энергию за пределами ожидаемого диапазона частот (больше частоты Найквиста ). [примечание 4]
Обычные значения глубины выборки для LPCM составляют 8, 16, 20 или 24 бита на выборку . [1] [2] [3] [32]
LPCM кодирует один звуковой канал. Поддержка многоканального звука зависит от формата файла и опирается на синхронизацию нескольких потоков LPCM. [5] [33] Хотя наиболее распространенным форматом является два канала (стерео), системы могут поддерживать до 8 аудиоканалов (7.1 Surround) [2] [3] или больше.
Обычные частоты дискретизации составляют 48 кГц , как в видеоформате DVD , или 44,1 кГц, как в CD. Частоты дискретизации 96 кГц или 192 кГц могут использоваться на некотором оборудовании, но преимущества были обсуждены. [34]
Теорема дискретизации Найквиста -Шеннона показывает, что устройства PCM могут работать без внесения искажений в пределах своих проектных частотных диапазонов, если они обеспечивают частоту дискретизации, по крайней мере, вдвое превышающую самую высокую частоту, содержащуюся во входном сигнале. Например, в телефонии используемый диапазон частот голоса составляет приблизительно от 300 Гц до 3400 Гц. [35] Поэтому для эффективного восстановления голосового сигнала приложения телефонии обычно используют частоту дискретизации 8000 Гц, что более чем в два раза превышает самую высокую используемую частоту голоса.
Несмотря на это, существуют потенциальные источники ухудшения, присущие любой системе PCM:
Некоторые формы PCM объединяют обработку сигнала с кодированием. Более старые версии этих систем применяли обработку в аналоговой области как часть аналого-цифрового процесса; более новые реализации делают это в цифровой области. Эти простые методы в значительной степени устарели из-за современных методов сжатия звука на основе преобразования , таких как кодирование с модифицированным дискретным косинусным преобразованием (MDCT).
В телефонии стандартный аудиосигнал для одного телефонного звонка кодируется как 8000 выборок в секунду , по 8 бит каждая, что дает цифровой сигнал 64 кбит/с, известный как DS0 . Кодирование сжатия сигнала по умолчанию на DS0 - это либо μ-закон (мю-закон) PCM (Северная Америка и Япония), либо A-закон PCM (Европа и большая часть остального мира). Это логарифмические системы сжатия, в которых 12- или 13-битный линейный номер выборки PCM отображается в 8-битное значение. Эта система описывается международным стандартом G.711 .
Если стоимость схемы высока, а потеря качества голоса приемлема, иногда имеет смысл сжать голосовой сигнал еще больше. Алгоритм ADPCM используется для преобразования серии 8-битных выборок PCM μ-law или A-law в серию 4-битных выборок ADPCM. Таким образом, пропускная способность линии удваивается. Метод подробно описан в стандарте G.726 .
Для достижения еще большего сжатия были разработаны форматы аудиокодирования и аудиокодеки . Некоторые из этих методов были стандартизированы и запатентованы. Современные методы сжатия, такие как модифицированное дискретное косинусное преобразование (MDCT) и линейное предсказательное кодирование (LPC), в настоящее время широко используются в мобильных телефонах , передаче голоса по IP (VoIP) и потоковом медиа .
PCM может быть либо с возвратом к нулю (RZ), либо без возврата к нулю (NRZ). Для синхронизации системы NRZ с использованием внутриполосной информации не должно быть длинных последовательностей одинаковых символов, таких как единицы или нули. Для двоичных систем PCM плотность 1-символов называется плотностью единиц . [36]
Плотность единиц часто контролируется с помощью методов предварительного кодирования, таких как кодирование с ограниченной длиной серии , где код PCM расширяется до немного более длинного кода с гарантированной границей плотности единиц перед модуляцией в канал. В других случаях в поток добавляются дополнительные биты кадрирования , что гарантирует по крайней мере случайные переходы символов.
Другой метод, используемый для управления плотностью единиц, — это использование скремблера на данных, который будет стремиться превратить поток данных в поток, который выглядит псевдослучайным , но где данные могут быть точно восстановлены дополнительным дескремблером. В этом случае длинные серии нулей или единиц все еще возможны на выходе, но считаются достаточно маловероятными, чтобы обеспечить надежную синхронизацию.
В других случаях долгосрочное значение постоянного тока модулированного сигнала важно, поскольку накопление смещения постоянного тока будет иметь тенденцию выводить схемы связи из их рабочего диапазона. В этом случае принимаются специальные меры для ведения подсчета кумулятивного смещения постоянного тока и для изменения кодов при необходимости, чтобы смещение постоянного тока всегда стремилось к нулю.
Многие из этих кодов являются биполярными кодами , где импульсы могут быть положительными, отрицательными или отсутствовать. В типичном коде с инверсией альтернативных знаков ненулевые импульсы чередуются между положительными и отрицательными. Эти правила могут быть нарушены для генерации специальных символов, используемых для кадрирования или других специальных целей.
Слово «импульс» в термине импульсно-кодовая модуляция относится к импульсам, которые можно обнаружить в линии передачи. Возможно, это является естественным следствием того, что эта техника развивалась вместе с двумя аналоговыми методами, широтно-импульсной модуляцией и импульсно-позиционной модуляцией , в которых информация, подлежащая кодированию, представлена дискретными импульсами сигнала различной ширины или положения соответственно. [ необходима цитата ] В этом отношении PCM мало похожа на эти другие формы кодирования сигналов, за исключением того, что все они могут использоваться в мультиплексировании с временным разделением, а числа кодов PCM представлены в виде электрических импульсов.
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь ){{cite journal}}
: Цитировать журнал требует |journal=
( помощь ){{cite journal}}
: Цитировать журнал требует |journal=
( помощь ){{cite book}}
: |work=
проигнорировано ( помощь ){{cite book}}
: |work=
проигнорировано ( помощь )Альбом Ry Cooder Bop Till You Drop стал первым поп-альбомом, записанным в цифровом формате
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь ){{cite journal}}
: CS1 maint: multiple names: authors list (link)