stringtranslate.com

Импульсно-кодовая модуляция

Импульсно-кодовая модуляция ( ИКМ ) — это метод, используемый для цифрового представления аналоговых сигналов . Это стандартная форма цифрового звука в компьютерах, компакт-дисках , цифровой телефонии и других цифровых аудиоприложениях. В потоке PCM амплитуда аналогового сигнала дискретизируется через одинаковые интервалы, и каждая выборка квантуется до ближайшего значения в пределах диапазона цифровых шагов.

Линейная импульсно-кодовая модуляция ( LPCM ) — это особый тип PCM, в котором уровни квантования линейно однородны. [5] В этом отличие от кодировок PCM, в которых уровни квантования изменяются в зависимости от амплитуды (как в случае с алгоритмом A-закона или алгоритмом μ-закона ). Хотя PCM — более общий термин, он часто используется для описания данных, закодированных в формате LPCM.

Поток PCM имеет два основных свойства, которые определяют точность потока исходному аналоговому сигналу: частота дискретизации , которая представляет собой количество раз в секунду, когда берутся выборки; и разрядность , которая определяет количество возможных цифровых значений, которые можно использовать для представления каждой выборки.

История

Ранние электрические коммуникации начали осуществлять выборку сигналов, чтобы мультиплексировать выборки из нескольких телеграфных источников и передавать их по одному телеграфному кабелю. Американский изобретатель Мозес Г. Фармер придумал телеграфное мультиплексирование с временным разделением (TDM) еще в 1853 году. Инженер-электрик У.М. Майнер в 1903 году использовал электромеханический коммутатор для мультиплексирования с временным разделением нескольких телеграфных сигналов; он также применил эту технологию к телефонии . Он получил разборчивую речь из каналов, выбранных с частотой выше 3500–4300 Гц; более низкие ставки оказались неудовлетворительными.

В 1920 году система передачи изображений по кабелю Бартлейн использовала телеграфную передачу символов, пробитых на бумажной ленте, для отправки образцов изображений, квантованных до 5 уровней. [6] В 1926 году Пол М. Рейни из Western Electric запатентовал факсимильный аппарат , который передавал сигнал с использованием 5-битной PCM, закодированной оптико-механическим аналого-цифровым преобразователем . [7] Машина не пошла в производство. [8]

Британский инженер Алек Ривз , не знавший о предыдущих работах, задумал использовать PCM для голосовой связи в 1937 году, когда работал в компании International Telephone and Telegraph во Франции. Он описал теорию и ее преимущества, но практического применения не последовало. Ривз подал заявку на французский патент в 1938 году, а его патент в США был выдан в 1943 году. [9] К этому времени Ривз начал работать в Научно-исследовательском институте телекоммуникаций . [8]

Первая передача речи с помощью цифровых технологий, шифровальное оборудование SIGSALY , обеспечивала связь союзников высокого уровня во время Второй мировой войны . В 1943 году исследователи Bell Labs , разработавшие систему SIGSALY, узнали об использовании двоичного кодирования PCM, как уже предлагал Ривз. В 1949 году для системы DATAR ВМС Канады компания Ferranti Canada построила действующую радиосистему PCM, которая могла передавать оцифрованные радиолокационные данные на большие расстояния. [10]

Компания PCM в конце 1940-х и начале 1950-х годов использовала электронно-лучевую кодирующую трубку с пластинчатым электродом , имеющим кодирующие перфорации. [11] Как и в осциллографе , луч перемещался по горизонтали с частотой дискретизации, в то время как вертикальное отклонение контролировалось входным аналоговым сигналом, заставляя луч проходить через верхние или нижние части перфорированной пластины. Пластина собирала или пропускала луч, создавая текущие изменения в двоичном коде, по одному биту за раз. Вместо естественной двоичной сетки сетка более поздней трубки Гудолла была перфорирована для создания кода Грея без сбоев и производила все биты одновременно, используя веерный луч вместо сканирующего луча. [12]

В Соединенных Штатах Национальный зал славы изобретателей удостоил Бернарда М. Оливера [13] и Клода Шеннона [14] как изобретателей PCM [15] , как описано в «Системе связи, использующей импульсно-кодовую модуляцию», патент США № 2,801,281. подан в 1946 и 1952 годах, выдан в 1956 году. Другой патент с тем же названием был подан Джоном Р. Пирсом в 1945 году и выдан в 1948 году: патент США 2 437 707 . Все трое опубликовали «Философию PCM» в 1948 году. [16]

Система T-carrier , представленная в 1961 году, использует две линии передачи витой пары для передачи 24 телефонных вызовов PCM, дискретизированных с частотой 8 кГц и 8-битным разрешением. Эта разработка улучшила пропускную способность и качество связи по сравнению с предыдущими схемами мультиплексирования с частотным разделением каналов .

В 1973 году П. Каммиски, Никил Джаянт и Джеймс Л. Фланаган разработали адаптивную дифференциальную импульсно-кодовую модуляцию (ADPCM) . [17]

Цифровые аудиозаписи

В 1967 году исследовательскими центрами NHK в Японии был разработан первый диктофон PCM . [18] 12-битное устройство с частотой 30 кГц использовало компандер (похожий на шумоподавление DBX ) для расширения динамического диапазона и сохраняло сигналы на видеомагнитофоне . В 1969 году NHK расширила возможности системы до 2-канального стерео и 13-битного разрешения 32 кГц. В январе 1971 года, используя систему записи PCM NHK, инженеры Denon записали первые коммерческие цифровые записи. [примечание 1] [18]

В 1972 году Denon представила первый 8-канальный цифровой рекордер DN-023R, в котором использовался вещательный видеомагнитофон с открытой катушкой с 4 головками для записи 13-битного звука PCM с частотой 47,25 кГц. [примечание 2] В 1977 году компания Denon разработала портативную систему записи PCM DN-034R. Как и DN-023R, он записывал 8 каналов с частотой 47,25 кГц, но использовал 14 бит «с акцентом , что делало его эквивалентным 15,5 битам». [18]

В 1979 году был записан первый цифровой поп-альбом Boptil You Drop . Он был записан в формате 16-битной линейной PCM с частотой 50 кГц с использованием цифрового магнитофона 3M. [19]

Компакт -диск (CD) привнес PCM в потребительские аудиоприложения с его появлением в 1982 году. Компакт-диск использует частоту дискретизации 44 100 Гц и 16-битное разрешение и хранит до 80 минут стереозвука на диске.

Цифровая телефония

Быстрое развитие и широкое распространение цифровой телефонии PCM стало возможным благодаря технологии переключаемых конденсаторов (SC) металл-оксид-полупроводник (MOS) , разработанной в начале 1970-х годов. [20] Это привело к разработке чипов кодеков-фильтров PCM в конце 1970-х годов. [20] [21] Чип кодека -фильтра PCM с кремниевым затвором CMOS (дополнительный MOS), разработанный Дэвидом А. Ходжесом и У. К. Блэком в 1980 году, [20] с тех пор стал отраслевым стандартом для цифровой телефонии. [20] [21] К 1990-м годам телекоммуникационные сети , такие как коммутируемая телефонная сеть общего пользования (PSTN), были в значительной степени оцифрованы с помощью CMOS PCM-кодеков-фильтров очень большой интеграции (VLSI), широко используемых в электронных системах коммутации для телефонной связи. телефонные станции , модемы на стороне пользователя и широкий спектр приложений цифровой передачи , таких как цифровая сеть с интеграцией услуг (ISDN), беспроводные телефоны и сотовые телефоны . [21]

Реализации

PCM — это метод кодирования, обычно используемый для несжатого цифрового звука. [заметка 3]

Модуляция

Выборка и квантование сигнала (красный) для 4-битного LPCM во временной области на определенной частоте.

На диаграмме синусоидальная волна (красная кривая) дискретизируется и квантуется для PCM. Синусоидальная волна отбирается через равные промежутки времени и отображается вертикальными линиями. Для каждой выборки выбирается одно из доступных значений (по оси Y). Процесс PCM обычно реализуется на одной интегральной схеме , называемой аналого-цифровым преобразователем (АЦП). Это создает полностью дискретное представление входного сигнала (синие точки), которое можно легко закодировать в виде цифровых данных для хранения или обработки. Несколько потоков PCM также могут быть мультиплексированы в более крупный совокупный поток данных , как правило, для передачи нескольких потоков по одному физическому каналу. Один из методов называется мультиплексированием с временным разделением (TDM) и широко используется, особенно в современных системах общественного телефона.

Демодуляция

Электроника, задействованная в создании точного аналогового сигнала из дискретных данных, аналогична той, которая используется для генерации цифрового сигнала. Эти устройства представляют собой цифро-аналоговые преобразователи (ЦАП). Они вырабатывают напряжение или ток (в зависимости от типа), который представляет значение, подаваемое на их цифровые входы. Этот выходной сигнал затем обычно фильтруется и усиливается для использования.

Чтобы восстановить исходный сигнал из дискретных данных, демодулятор может применить обратную процедуру модуляции. После каждого периода выборки демодулятор считывает следующее значение и преобразует выходной сигнал в новое значение. В результате этих переходов сигнал сохраняет значительное количество высокочастотной энергии из-за эффектов визуализации. Чтобы удалить эти нежелательные частоты, демодулятор пропускает сигнал через восстанавливающий фильтр , который подавляет энергию за пределами ожидаемого диапазона частот (больше, чем частота Найквиста ). [примечание 4]

Стандартная точность и частота отбора проб

Обычная глубина выборки для LPCM составляет 8, 16, 20 или 24 бита на выборку . [1] [2] [3] [29]

LPCM кодирует один звуковой канал. Поддержка многоканального звука зависит от формата файла и основана на синхронизации нескольких потоков LPCM. [5] [30] Хотя два канала (стерео) являются наиболее распространенным форматом, системы могут поддерживать до 8 аудиоканалов (объемный звук 7.1) [2] [3] или более.

Обычная частота дискретизации составляет 48 кГц для видео формата DVD или 44,1 кГц для компакт-дисков. Частоты дискретизации 96 кГц или 192 кГц могут использоваться на некотором оборудовании, но преимущества обсуждаются. [31]

Ограничения

Теорема выборки Найквиста-Шеннона показывает, что устройства PCM могут работать без искажений в пределах разработанных для них полос частот, если они обеспечивают частоту дискретизации, по крайней мере, в два раза превышающую самую высокую частоту, содержащуюся во входном сигнале. Например, в телефонии используемый диапазон голосовых частот находится в диапазоне примерно от 300  Гц до 3400 Гц. [32] Поэтому для эффективного восстановления голосового сигнала в телефонных приложениях обычно используется частота дискретизации 8000 Гц, которая более чем в два раза превышает максимальную используемую голосовую частоту.

Тем не менее, в любой системе PCM есть потенциальные источники ухудшения:

Обработка и кодирование

Некоторые формы PCM сочетают обработку сигналов с кодированием. В более старых версиях этих систем обработка в аналоговой области применялась как часть аналого-цифрового процесса; новые реализации делают это в цифровой сфере. Эти простые методы в значительной степени устарели из-за современных методов сжатия звука на основе преобразований , таких как кодирование с модифицированным дискретным косинусным преобразованием (MDCT).

В телефонии стандартный аудиосигнал для одного телефонного звонка кодируется как 8000 выборок в секунду по 8 бит каждая, что дает цифровой сигнал со скоростью 64 кбит/с, известный как DS0 . Кодировкой сжатия сигнала по умолчанию на DS0 является либо PCM по закону μ (Северная Америка и Япония), либо PCM по закону A (Европа и большая часть остального мира). Это системы логарифмического сжатия, в которых 12- или 13-битное линейное число выборок PCM преобразуется в 8-битное значение. Эта система описана международным стандартом G.711 .

Если стоимость канала высока и потеря качества речи приемлема, иногда имеет смысл еще больше сжать голосовой сигнал. Алгоритм ADPCM используется для преобразования серии 8-битных выборок PCM с μ-законом или A-законом в серию 4-битных выборок ADPCM. Таким образом, пропускная способность линии увеличивается вдвое. Этот метод подробно описан в стандарте G.726 .

Форматы аудиокодирования и аудиокодеки были разработаны для обеспечения дальнейшего сжатия. Некоторые из этих методов были стандартизированы и запатентованы. Передовые методы сжатия, такие как модифицированное дискретное косинусное преобразование (MDCT) и линейное прогнозирующее кодирование (LPC), в настоящее время широко используются в мобильных телефонах , передаче голоса по IP (VoIP) и потоковом мультимедиа .

Кодирование для последовательной передачи

PCM может быть либо с возвратом в ноль (RZ), либо без возврата в ноль (NRZ). Для синхронизации системы NRZ с использованием внутриполосной информации не должно быть длинных последовательностей одинаковых символов, таких как единицы или нули. Для двоичных систем PCM плотность 1-символов называется плотностью единиц . [33]

Плотность единиц часто контролируется с помощью методов предварительного кодирования, таких как кодирование с ограниченной длиной серии , где код PCM расширяется до немного более длинного кода с гарантированной границей плотности единиц перед модуляцией в канал. В других случаях в поток добавляются дополнительные биты кадрирования , что гарантирует, по крайней мере, случайные переходы символов.

Другой метод, используемый для управления плотностью единиц, — это использование скремблера данных , который будет стремиться превратить поток данных в поток, который выглядит псевдослучайным , но где данные могут быть точно восстановлены с помощью дополнительного дешифратора. В этом случае на выходе все еще возможны длинные серии нулей или единиц, но они считаются достаточно маловероятными, чтобы обеспечить надежную синхронизацию.

В других случаях важно долговременное значение постоянного тока модулированного сигнала, поскольку создание смещения постоянного тока будет иметь тенденцию выводить схемы связи за пределы их рабочего диапазона. В этом случае принимаются специальные меры для учета совокупного смещения постоянного тока и изменения кодов, если необходимо, чтобы смещение постоянного тока всегда стремилось обратно к нулю.

Многие из этих кодов являются биполярными кодами , где импульсы могут быть положительными, отрицательными или отсутствовать. В типичном коде инверсии альтернативной метки ненулевые импульсы чередуются между положительными и отрицательными. Эти правила могут быть нарушены для создания специальных символов, используемых для кадрирования или других специальных целей.

Номенклатура

Слово « импульс» в термине « импульсно-кодовая модуляция» относится к импульсам, которые можно найти в линии передачи. Возможно, это является естественным следствием того, что этот метод развивался вместе с двумя аналоговыми методами: широтно-импульсной и позиционно-импульсной модуляцией , в которых кодируемая информация представлена ​​дискретными сигнальными импульсами различной ширины или положения соответственно. [ нужна цитата ] В этом отношении PCM мало похож на эти другие формы кодирования сигналов, за исключением того, что все они могут использоваться при мультиплексировании с временным разделением, а числа кодов PCM представлены в виде электрических импульсов.

Смотрите также

Заметки с пояснениями

  1. Среди первых записей была «Uzu: The World Of Stomu Yamash'ta 2» Стому Ямашты .
  2. Первая запись с использованием этой новой системы была записана в Токио 24–26 апреля 1972 года.
  3. ^ Существуют и другие методы, такие как модуляция плотности импульса, используемая также на Super Audio CD .
  4. ^ Некоторые системы используют цифровую фильтрацию для устранения части наложений, преобразуя сигнал из цифрового в аналоговый с более высокой частотой дискретизации, так что аналоговый фильтр сглаживания намного проще. В некоторых системах явная фильтрация вообще не выполняется; поскольку ни одна система не может воспроизвести сигнал с бесконечной полосой пропускания, собственные потери в системе компенсируют артефакты — или система просто не требует большой точности.
  5. ^ Ошибка квантования колеблется от - q /2 до q /2. В идеальном случае (при полностью линейном АЦП и уровне сигнала >> q ) он равномерно распределен по этому интервалу с нулевым средним значением и дисперсией q 2 /12.
  6. ^ Небольшая разница между тактовыми частотами кодирования и декодирования обычно не является серьезной проблемой; небольшая постоянная погрешность не заметна. Однако ошибка часов становится серьезной проблемой, если часы имеют значительный джиттер .

Рекомендации

  1. ^ abc Альвестранд, Харальд Твейт; Салсман, Джеймс (май 1999 г.). «RFC 2586 – Тип контента MIME Audio/L16». Интернет-сообщество. дои : 10.17487/RFC2586 . Проверено 16 марта 2010 г. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  2. ^ abc Каснер, С. (март 2007 г.). «RFC 4856 — Регистрация типа носителя для форматов полезной нагрузки в профиле RTP для аудио- и видеоконференций — Регистрация типа носителя audio/L8». Фонд IETF. дои : 10.17487/RFC4856 . Проверено 16 марта 2010 г. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  3. ^ abcd Борман, К.; Каснер, С.; Кобаяши, К.; Огава, А. (январь 2002 г.). «RFC 3190 - Формат полезной нагрузки RTP для 12-битного звука DAT и 20- и 24-битного линейного дискретизированного звука». Интернет-сообщество. дои : 10.17487/RFC3190 . Проверено 16 марта 2010 г. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  4. ^ «Типы аудионосителей». Управление по присвоению номеров в Интернете . Проверено 16 марта 2010 г.
  5. ^ abcd «Аудио с линейной импульсно-кодовой модуляцией (LPCM)» . Библиотека Конгресса . 19 апреля 2022 г. . Проверено 5 сентября 2022 г.
  6. ^ "Система передачи Бартлейна". DigicamHistory.com. Архивировано из оригинала 10 февраля 2010 года . Проверено 7 января 2010 г.
  7. ^ Патент США № 1608527; также см. стр. 8, Руководство по преобразованию данных , Уолтер Аллан Кестер, изд., Newnes, 2005, ISBN 0-7506-7841-0
  8. ^ ab Джон Вардалас (июнь 2013 г.), Импульсно-кодовая модуляция: все началось 75 лет назад с Алеком Ривзом, IEEE
  9. ^ США 2272070 
  10. ^ Портер, Артур (2004). Так много холмов, на которые нужно подняться . Группа публикаций Бекхэма. ISBN 9780931761188.[ нужна страница ]
  11. ^ Сирс, RW (январь 1948 г.). Трубка отклонения электронного луча для импульсно-кодовой модуляции. Том. 27. Лаборатории Белла . стр. 44–57 . Проверено 14 мая 2017 г. {{cite book}}: |work=игнорируется ( помощь )
  12. ^ Гудолл, WM (январь 1951 г.). Телевидение с помощью импульсно-кодовой модуляции. Том. 30. Лаборатории Белла . стр. 33–49 . Проверено 14 мая 2017 г. {{cite book}}: |work=игнорируется ( помощь )
  13. ^ "Бернард Оливер". Национальный зал славы изобретателей . Архивировано из оригинала 5 декабря 2010 года . Проверено 6 февраля 2011 г.
  14. ^ "Клод Шеннон". Национальный зал славы изобретателей . Архивировано из оригинала 6 декабря 2010 года . Проверено 6 февраля 2011 г.
  15. ^ «Национальный зал славы изобретателей объявляет класс изобретателей 2004 года» . Научный блог . 11 февраля 2004 года . Проверено 6 февраля 2011 г.
  16. ^ Б.М. Оливер; Дж. Р. Пирс и К. Э. Шеннон (ноябрь 1948 г.). «Философия ПКМ». Труды ИРЭ . 36 (11): 1324–1331. дои : 10.1109/JRPROC.1948.231941. ISSN  0096-8390. S2CID  51663786.
  17. ^ П. Каммиски, Н. С. Джаянт и Дж. Л. Фланаган, «Адаптивное квантование при дифференциальном ИКМ-кодировании речи», Bell Syst. Тех. Дж., вып. 52, стр. 1105–1118, сентябрь 1973 г.
  18. ^ abc Томас Файн (2008). «Рассвет коммерческой цифровой записи» (PDF) . Журнал АРСК . 39 (1): 1–17.
  19. ^ Роджер Николс. «Я не могу угнаться за всеми форматами II». Архивировано из оригинала 20 октября 2002 года. Альбом Ry Cooder Bop Till You Drop стал первым поп-альбомом, записанным в цифровом формате.
  20. ^ abcd Allstot, Дэвид Дж. (2016). «Фильтры с переключаемыми конденсаторами» (PDF) . В Малоберти, Франко; Дэвис, Энтони К. (ред.). Краткая история схем и систем: от экологически чистых, мобильных, всеобъемлющих сетей к вычислениям больших данных . Общество схем и систем IEEE . стр. 105–110. ISBN 9788793609860. Архивировано из оригинала (PDF) 30 сентября 2021 года . Проверено 29 ноября 2019 г.
  21. ^ abc Флойд, Майкл Д.; Хиллман, Гарт Д. (8 октября 2018 г.) [1-й паб. 2000]. «Кодек-фильтры импульсно-кодовой модуляции». Справочник по коммуникациям (2-е изд.). ЦРК Пресс . стр. 26–1, 26–2, 26–3. ISBN 9781420041163.
  22. Камброн, Дж. Кейт (17 октября 2012 г.). Глобальные сети: проектирование, эксплуатация и проектирование . Джон Уайли и сыновья. п. 345.
  23. ^ Ассоциация дисков Blu-ray (март 2005 г.), Официальный документ Формат диска Blu-ray - 2.B Спецификации формата аудиовизуальных приложений для BD-ROM (PDF) , получено 26 июля 2009 г.
  24. ^ «Технические примечания к DVD (DVD Video - «Книга B») - Характеристики аудиоданных» . 21 июля 1996 года . Проверено 16 марта 2010 г.
  25. ^ Джим Тейлор. «Часто задаваемые вопросы (и ответы) о DVD – Подробности об аудио DVD-Video» . Проверено 20 марта 2010 г.
  26. ^ «Как работает DV» . Архивировано из оригинала 6 декабря 2007 года . Проверено 21 марта 2010 г.
  27. ^ «Информационный веб-сайт AVCHD - обзор спецификаций формата AVCHD» . Проверено 21 марта 2010 г.
  28. ^ EBU (июль 2009 г.), EBU Tech 3306 - MBWF / RF64: Расширенный формат файла для аудио (PDF) , заархивировано из оригинала (PDF) 22 ноября 2009 г. , получено 19 января 2010 г.
  29. ^ Мостафа, Мохамед; Кумар, Раджеш (май 2001 г.). «RFC 3108 - Соглашения об использовании протокола описания сеанса (SDP) для соединений ATM-носителя». дои : 10.17487/RFC3108 . Проверено 16 марта 2010 г. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  30. ^ «PCM, аудио с импульсно-кодовой модуляцией» . Библиотека Конгресса. 6 апреля 2022 г. . Проверено 5 сентября 2022 г.
  31. ^ Кристофер, Монтгометри. «24/192 загрузки музыки и почему они не имеют смысла». Крис «Монти» Монтгомери. Архивировано из оригинала 6 сентября 2014 года . Проверено 16 марта 2013 г.
  32. ^ https://www.its.bldrdoc.gov/fs-1037/dir-039/_5829.htm [ не удалось пройти проверку ]
  33. ^ Столлингс, Уильям, Методы цифровой сигнализации, декабрь 1984 г., Том. 22, № 12, журнал IEEE Communications.

дальнейшее чтение

Внешние ссылки