stringtranslate.com

Импульсно-кодовая модуляция

Импульсно-кодовая модуляция ( ИКМ ) — метод, используемый для цифрового представления аналоговых сигналов. Это стандартная форма цифрового звука в компьютерах, компакт-дисках, цифровой телефонии и других цифровых аудиоприложениях. В потоке ИКМ амплитуда аналогового сигнала дискретизируется с равномерными интервалами , и каждый сэмпл квантуется до ближайшего значения в пределах диапазона цифровых шагов. Алек Ривз , Клод Шеннон , Барни Оливер и Джон Р. Пирс приписывают его изобретение. [6] [7] [8]

Линейная импульсно-кодовая модуляция ( LPCM ) — это особый тип PCM, в котором уровни квантования линейно равномерны. [5] Это контрастирует с кодированием PCM, в котором уровни квантования изменяются как функция амплитуды (как в алгоритме A-law или алгоритме μ-law ). Хотя PCM — более общий термин, его часто используют для описания данных, закодированных как LPCM.

Поток PCM имеет два основных свойства, которые определяют точность потока по отношению к исходному аналоговому сигналу: частоту дискретизации , которая представляет собой количество раз в секунду, когда берутся выборки; и битовую глубину , которая определяет количество возможных цифровых значений, которые могут быть использованы для представления каждой выборки.

История

Ранние электрические коммуникации начали производить выборку сигналов для мультиплексирования выборок из нескольких источников телеграфии и передачи их по одному телеграфному кабелю. Американский изобретатель Мозес Г. Фармер задумал телеграфное временное мультиплексирование (TDM) еще в 1853 году. Инженер-электрик В. М. Майнер в 1903 году использовал электромеханический коммутатор для временного мультиплексирования нескольких телеграфных сигналов; он также применил эту технологию в телефонии . Он получил разборчивую речь из каналов, дискретизированных с частотой выше 3500–4300 Гц; более низкие частоты оказались неудовлетворительными.

В 1920 году система передачи изображений по кабелю Бартлейна использовала телеграфную сигнализацию символов, пробитых на бумажной ленте, для отправки образцов изображений, квантованных до 5 уровней. [9] В 1926 году Пол М. Рейни из Western Electric запатентовал факсимильный аппарат , который передавал свой сигнал с помощью 5-битной PCM, кодированной оптико-механическим аналого-цифровым преобразователем . [10] Аппарат не был запущен в производство. [11]

Британский инженер Алек Ривз , не зная о предыдущих работах, задумал использовать PCM для голосовой связи в 1937 году, работая в International Telephone and Telegraph во Франции. Он описал теорию и ее преимущества, но практического применения не последовало. Ривз подал заявку на французский патент в 1938 году, а его патент в США был выдан в 1943 году. [12] К этому времени Ривз начал работать в Telecommunications Research Establishment . [11]

Первая передача речи с помощью цифровых технологий, шифровальное оборудование SIGSALY , передало высокоуровневые сообщения союзников во время Второй мировой войны . В 1943 году исследователи Bell Labs , которые разработали систему SIGSALY, узнали об использовании двоичного кодирования PCM, как уже предлагал Ривз. В 1949 году для системы DATAR канадского флота Ferranti Canada построила рабочую радиосистему PCM, которая могла передавать оцифрованные радиолокационные данные на большие расстояния. [13]

PCM в конце 1940-х и начале 1950-х годов использовала электронно-лучевую кодирующую трубку с пластинчатым электродом, имеющим кодирующие перфорации. [14] Как и в осциллографе , луч был горизонтально развернут с частотой дискретизации, в то время как вертикальное отклонение контролировалось входным аналоговым сигналом, заставляя луч проходить через более высокие или более низкие части перфорированной пластины. Пластина собирала или пропускала луч, производя изменения тока в двоичном коде, по одному биту за раз. Вместо естественного двоичного кода, сетка более поздней трубки Гудолла была перфорирована для получения безглючного кода Грея и производила все биты одновременно, используя веерный луч вместо сканирующего луча. [15]

В Соединенных Штатах Национальный зал славы изобретателей почтил Бернарда М. Оливера [16] и Клода Шеннона [17] как изобретателей PCM, [18] как описано в «Системе связи, использующей импульсно-кодовую модуляцию», патент США 2,801,281 , поданный в 1946 и 1952 годах, выданный в 1956 году. Другой патент с таким же названием был подан Джоном Р. Пирсом в 1945 году и выдан в 1948 году: патент США 2,437,707 . Все трое опубликовали «Философию PCM» в 1948 году. [19]

Система T-carrier , представленная в 1961 году, использует две витые пары линий передачи для передачи 24 телефонных звонков PCM с частотой дискретизации 8 кГц и разрешением 8 бит. Эта разработка улучшила пропускную способность и качество звонков по сравнению с предыдущими схемами частотного мультиплексирования .

В 1973 году П. Каммиски, Никил Джайант и Джеймс Л. Фланаган разработали адаптивную дифференциальную импульсно-кодовую модуляцию (АДИКМ) . [20]

Цифровые аудиозаписи

В 1967 году исследовательскими центрами NHK в Японии был разработан первый PCM-рекордер . [21] 30 кГц 12-битное устройство использовало компандер ( похожий на DBX Noise Reduction ) для расширения динамического диапазона и сохраняло сигналы на видеомагнитофоне . В 1969 году NHK расширила возможности системы до 2-канального стерео и 32 кГц 13-битного разрешения. В январе 1971 года, используя PCM-систему записи NHK, инженеры Denon записали первые коммерческие цифровые записи. [примечание 1] [21]

В 1972 году Denon представил первый 8-канальный цифровой рекордер DN-023R, который использовал 4-головочный открытый катушечный вещательный видеомагнитофон для записи в формате 47,25 кГц, 13-битного PCM-аудио. [примечание 2] В 1977 году Denon разработал портативную систему записи PCM DN-034R. Как и DN-023R, он записывал 8 каналов в формате 47,25 кГц, но использовал 14 бит «с акцентом , что делало его эквивалентным 15,5 бит». [21]

В 1979 году был записан первый цифровой поп-альбом Bop till You Drop . Он был записан в формате 50 кГц, 16 бит линейной PCM с использованием цифрового магнитофона 3M. [22]

Компакт -диск (CD) привнес PCM в потребительские аудиоприложения с момента своего появления в 1982 году. CD использует частоту дискретизации 44 100 Гц и разрешение 16 бит, а на одном диске можно хранить до 80 минут стереозвука.

Цифровая телефония

Быстрое развитие и широкое внедрение цифровой телефонии PCM стало возможным благодаря технологии коммутируемых конденсаторов (SC) на основе металл-оксид-полупроводника (МОП) , разработанной в начале 1970-х годов. [23] Это привело к разработке микросхем кодека-фильтра PCM в конце 1970-х годов. [23] [24] Микросхема кодека-фильтра PCM на основе КМОП (комплементарных МОП) с кремниевым затвором , разработанная Дэвидом А. Ходжесом и В. К. Блэком в 1980 году, [23] с тех пор является отраслевым стандартом для цифровой телефонии. [23] [24] К 1990-м годам телекоммуникационные сети , такие как телефонная сеть общего пользования (PSTN), были в значительной степени оцифрованы с помощью сверхбольшой интеграции (VLSI) CMOS PCM кодеков-фильтров, широко используемых в электронных коммутационных системах для телефонных станций , модемов на концах пользователей и широкого спектра приложений цифровой передачи , таких как цифровая сеть с интеграцией услуг (ISDN), беспроводные телефоны и сотовые телефоны . [24]

Реализации

PCM — это метод кодирования, обычно используемый для несжатого цифрового звука. [примечание 3]

Модуляция

Дискретизация и квантование сигнала (красный) для 4-битной LPCM во временной области на определенной частоте

На диаграмме синусоида ( красная кривая) дискретизируется и квантуется для PCM. Синусоида дискретизируется через регулярные интервалы, показанные в виде вертикальных линий. Для каждой выборки выбирается одно из доступных значений (на оси Y). Процесс PCM обычно реализуется на одной интегральной схеме, называемой аналого-цифровым преобразователем (АЦП). Это создает полностью дискретное представление входного сигнала (синие точки), которое можно легко закодировать в виде цифровых данных для хранения или обработки. Несколько потоков PCM также могут быть мультиплексированы в более крупный совокупный поток данных , как правило, для передачи нескольких потоков по одному физическому каналу. Один из методов называется мультиплексированием с временным разделением (TDM) и широко используется, особенно в современной телефонной системе общего пользования.

Демодуляция

Электроника, используемая для создания точного аналогового сигнала из дискретных данных, похожа на ту, которая используется для создания цифрового сигнала. Эти устройства представляют собой цифро-аналоговые преобразователи (ЦАП). Они создают напряжение или ток (в зависимости от типа), представляющие значение, представленное на их цифровых входах. Затем этот выход обычно фильтруется и усиливается для использования.

Чтобы восстановить исходный сигнал из выборочных данных, демодулятор может применить процедуру модуляции в обратном порядке. После каждого периода выборки демодулятор считывает следующее значение и переводит выходной сигнал в новое значение. В результате этих переходов сигнал сохраняет значительное количество высокочастотной энергии из-за эффектов визуализации. Чтобы удалить эти нежелательные частоты, демодулятор пропускает сигнал через фильтр реконструкции , который подавляет энергию за пределами ожидаемого частотного диапазона (больше частоты Найквиста ). [примечание 4]

Стандартная точность и скорость выборки

Обычные значения глубины выборки для LPCM составляют 8, 16, 20 или 24 бита на выборку . [1] [2] [3] [32]

LPCM кодирует один звуковой канал. Поддержка многоканального звука зависит от формата файла и опирается на синхронизацию нескольких потоков LPCM. [5] [33] Хотя наиболее распространенным форматом является два канала (стерео), системы могут поддерживать до 8 аудиоканалов (7.1 Surround) [2] [3] или больше.

Обычные частоты дискретизации составляют 48 кГц , как в видеоформате DVD , или 44,1 кГц, как в CD. Частоты дискретизации 96 кГц или 192 кГц могут использоваться на некотором оборудовании, но преимущества были обсуждены. [34]

Ограничения

Теорема дискретизации Найквиста -Шеннона показывает, что устройства PCM могут работать без внесения искажений в пределах своих проектных частотных диапазонов, если они обеспечивают частоту дискретизации, по крайней мере, вдвое превышающую самую высокую частоту, содержащуюся во входном сигнале. Например, в телефонии используемый диапазон частот голоса составляет приблизительно от 300  Гц до 3400 Гц. [35] Поэтому для эффективного восстановления голосового сигнала приложения телефонии обычно используют частоту дискретизации 8000 Гц, что более чем вдвое превышает самую высокую используемую частоту голоса.

Несмотря на это, существуют потенциальные источники ухудшения, присущие любой системе PCM:

Обработка и кодирование

Некоторые формы PCM объединяют обработку сигнала с кодированием. Более старые версии этих систем применяли обработку в аналоговой области как часть аналого-цифрового процесса; более новые реализации делают это в цифровой области. Эти простые методы в значительной степени устарели из-за современных методов сжатия звука на основе преобразования , таких как кодирование с модифицированным дискретным косинусным преобразованием (MDCT).

В телефонии стандартный аудиосигнал для одного телефонного звонка кодируется как 8000 выборок в секунду , по 8 бит каждая, что дает цифровой сигнал 64 кбит/с, известный как DS0 . Кодирование сжатия сигнала по умолчанию на DS0 - это либо μ-закон (мю-закон) PCM (Северная Америка и Япония), либо A-закон PCM (Европа и большая часть остального мира). Это логарифмические системы сжатия, в которых 12- или 13-битный линейный номер выборки PCM отображается в 8-битное значение. Эта система описывается международным стандартом G.711 .

Если стоимость схемы высока, а потеря качества голоса приемлема, иногда имеет смысл сжать голосовой сигнал еще больше. Алгоритм ADPCM используется для преобразования серии 8-битных выборок μ-law или A-law PCM в серию 4-битных выборок ADPCM. Таким образом, пропускная способность линии удваивается. Метод подробно описан в стандарте G.726 .

Для достижения еще большего сжатия были разработаны форматы аудиокодирования и аудиокодеки . Некоторые из этих методов были стандартизированы и запатентованы. Современные методы сжатия, такие как модифицированное дискретное косинусное преобразование (MDCT) и линейное предсказательное кодирование (LPC), в настоящее время широко используются в мобильных телефонах , передаче голоса по IP (VoIP) и потоковом медиа .

Кодирование для последовательной передачи

PCM может быть либо с возвратом к нулю (RZ), либо без возврата к нулю (NRZ). Для синхронизации системы NRZ с использованием внутриполосной информации не должно быть длинных последовательностей одинаковых символов, таких как единицы или нули. Для двоичных систем PCM плотность 1-символов называется плотностью единиц . [36]

Плотность единиц часто контролируется с помощью методов предварительного кодирования, таких как кодирование с ограниченной длиной серии , где код PCM расширяется до немного более длинного кода с гарантированной границей плотности единиц перед модуляцией в канал. В других случаях в поток добавляются дополнительные биты кадрирования , что гарантирует по крайней мере случайные переходы символов.

Другой метод, используемый для управления плотностью единиц, — это использование скремблера на данных, который будет стремиться превратить поток данных в поток, который выглядит псевдослучайным , но где данные могут быть точно восстановлены дополнительным дескремблером. В этом случае длинные серии нулей или единиц все еще возможны на выходе, но считаются достаточно маловероятными, чтобы обеспечить надежную синхронизацию.

В других случаях долгосрочное значение постоянного тока модулированного сигнала важно, поскольку накопление смещения постоянного тока будет иметь тенденцию выводить схемы связи из их рабочего диапазона. В этом случае принимаются специальные меры для ведения подсчета кумулятивного смещения постоянного тока и для изменения кодов при необходимости, чтобы смещение постоянного тока всегда стремилось к нулю.

Многие из этих кодов являются биполярными кодами , где импульсы могут быть положительными, отрицательными или отсутствовать. В типичном коде с инверсией альтернативных знаков ненулевые импульсы чередуются между положительными и отрицательными. Эти правила могут быть нарушены для генерации специальных символов, используемых для кадрирования или других специальных целей.

Номенклатура

Слово «импульс» в термине импульсно-кодовая модуляция относится к импульсам, которые можно обнаружить в линии передачи. Возможно, это является естественным следствием того, что эта техника развивалась вместе с двумя аналоговыми методами, широтно-импульсной модуляцией и импульсно-позиционной модуляцией , в которых информация, подлежащая кодированию, представлена ​​дискретными импульсами сигнала различной ширины или положения соответственно. [ необходима цитата ] В этом отношении PCM мало похожа на эти другие формы кодирования сигнала, за исключением того, что все они могут использоваться в мультиплексировании с временным разделением, а числа кодов PCM представлены в виде электрических импульсов.

Смотрите также

Пояснительные записки

  1. Среди первых записей была Uzu: The World Of Stomu Yamash'ta 2 от Stomu Yamashta .
  2. Первая запись с использованием этой новой системы была сделана в Токио 24–26 апреля 1972 года.
  3. ^ Существуют и другие методы, такие как модуляция плотности импульсов, используемая также на Super Audio CD .
  4. ^ Некоторые системы используют цифровую фильтрацию для удаления части наложения спектров, преобразуя сигнал из цифрового в аналоговый с более высокой частотой дискретизации, так что аналоговый фильтр сглаживания спектров становится намного проще. В некоторых системах явная фильтрация вообще не выполняется; поскольку ни одна система не может воспроизвести сигнал с бесконечной полосой пропускания, собственные потери в системе компенсируют артефакты — или система просто не требует большой точности.
  5. ^ Ошибка квантования колеблется между - q / 2 и q / 2. В идеальном случае (при полностью линейном АЦП и уровне сигнала >> q ) она равномерно распределена по этому интервалу с нулевым средним и дисперсией q 2 / 12.
  6. ^ Небольшая разница между тактовыми частотами кодирования и декодирования обычно не является серьезной проблемой; небольшая постоянная ошибка не заметна. Однако ошибка часов становится серьезной проблемой, если часы содержат значительный джиттер .

Ссылки

  1. ^ abc Alvestrand, Harald Tveit; Salsman, James (май 1999). "RFC 2586 – Тип содержимого Audio/L16 MIME". The Internet Society. doi :10.17487/RFC2586 . Получено 16 марта 2010 г. . {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  2. ^ abc Casner, S. (март 2007 г.). "RFC 4856 – Media Type Registration of Payload Formats in the RTP Profile for Audio and Video Conferences – Registration of Media Type audio/L8". IETF Trust. doi :10.17487/RFC4856 . Получено 16 марта 2010 г. . {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  3. ^ abcd Борман, C.; Каснер, S.; Кобаяши, K.; Огава, A. (январь 2002 г.). "RFC 3190 – Формат полезной нагрузки RTP для 12-битного звука DAT и 20- и 24-битного линейно-сэмплированного звука". The Internet Society. doi : 10.17487/RFC3190 . Получено 16 марта 2010 г. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  4. ^ "Типы аудионосителей". Internet Assigned Numbers Authority . Получено 16 марта 2010 г.
  5. ^ abcd "Linear Pulse Code Modulated Audio (LPCM)". Библиотека Конгресса . 19 апреля 2022 г. Получено 5 сентября 2022 г.
  6. ^ Нолл, А. Майкл (1997). Шоссе мечты: критический взгляд вдоль информационной супермагистрали. Телекоммуникации (пересмотренное издание). Махвах, Нью-Джерси: Erlbaum. стр. 50. ISBN 978-0-8058-2557-2.
  7. ^ Лейбсон, Стивен (7 сентября 2021 г.). «Краткая история однокристального DSP, часть I». EEJournal . Получено 19 сентября 2024 г. .
  8. ^ Барретт, Г. Дуглас (2023). Экспериментируя с человеком: искусство, музыка и современный постчеловек. Чикаго Лондон: Издательство Чикагского университета . стр. 102. ISBN 978-0-226-82340-9.
  9. ^ "Система передачи Бартлейна". DigicamHistory.com. Архивировано из оригинала 10 февраля 2010 г. Получено 7 января 2010 г.
  10. ^ Патент США номер 1,608,527; также см. стр. 8, Справочник по преобразованию данных , Уолтер Аллан Кестер, ред., Newnes, 2005, ISBN 0-7506-7841-0
  11. ^ ab Джон Вардалас (июнь 2013 г.), Импульсно-кодовая модуляция: все началось 75 лет назад с Алеком Ривзом, IEEE
  12. ^ США 2272070 
  13. ^ Портер, Артур (2004). Так много холмов, которые нужно покорить . Beckham Publications Group. ISBN 9780931761188.[ нужна страница ]
  14. ^ Sears, RW (январь 1948). Электронно-лучевая отклоняющая трубка для импульсно-кодовой модуляции. Том 27. Bell Labs . С. 44–57 . Получено 14 мая 2017 г. {{cite book}}: |work=проигнорировано ( помощь )
  15. ^ Goodall, WM (январь 1951). Телевидение с помощью импульсно-кодовой модуляции. Том 30. Bell Labs . С. 33–49 . Получено 14 мая 2017 г. {{cite book}}: |work=проигнорировано ( помощь )
  16. ^ "Бернард Оливер". Национальный зал славы изобретателей . Архивировано из оригинала 5 декабря 2010 года . Получено 6 февраля 2011 года .
  17. ^ "Клод Шеннон". Национальный зал славы изобретателей . Архивировано из оригинала 6 декабря 2010 года . Получено 6 февраля 2011 года .
  18. ^ "Национальный зал славы изобретателей объявляет класс изобретателей 2004 года". Научный блог . 11 февраля 2004 г. Получено 6 февраля 2011 г.
  19. ^ BM Oliver; JR Pierce & CE Shannon (ноябрь 1948 г.). «Философия PCM». Труды IRE . 36 (11): 1324–1331. doi :10.1109/JRPROC.1948.231941. ISSN  0096-8390. S2CID  51663786.
  20. ^ П. Каммиски, Н. С. Джайант и Дж. Л. Фланаган, «Адаптивное квантование в дифференциальном кодировании речи PCM», Bell Syst. Tech. J., т. 52, стр. 1105–1118, сентябрь 1973 г.
  21. ^ abc Thomas Fine (2008). «Рассвет коммерческой цифровой записи» (PDF) . ARSC Journal . 39 (1): 1–17.
  22. ^ Роджер Николс. "I Can't Keep Up With All The Formats II". Архивировано из оригинала 20 октября 2002 года. Альбом Ry Cooder Bop Till You Drop стал первым поп-альбомом, записанным в цифровом формате
  23. ^ abcd Allstot, David J. (2016). "Фильтры с переключаемыми конденсаторами" (PDF) . В Maloberti, Franco; Davies, Anthony C. (ред.). Краткая история схем и систем: от экологичных, мобильных, всепроникающих сетей до вычислений на основе больших данных . IEEE Circuits and Systems Society . стр. 105–110. ISBN 9788793609860. Архивировано из оригинала (PDF) 30 сентября 2021 г. . Получено 29 ноября 2019 г. .
  24. ^ abc Floyd, Michael D.; Hillman, Garth D. (8 октября 2018 г.) [1-е издание 2000 г.]. «Импульсно-кодовая модуляция Кодеки-Фильтры». Справочник по коммуникациям (2-е изд.). CRC Press . С. 26–1, 26–2, 26–3. ISBN 9781420041163.
  25. ^ Кэмброн, Г. Кит (17 октября 2012 г.). Глобальные сети: проектирование, эксплуатация и дизайн . John Wiley & Sons. стр. 345.
  26. Blu-ray Disc Association (март 2005 г.), Белая книга Формат Blu-ray Disc – 2.B Спецификации формата аудиовизуальных приложений для BD-ROM (PDF) , получено 26 июля 2009 г.
  27. ^ "DVD Technical Notes (DVD Video – "Book B") – Характеристики аудиоданных". 21 июля 1996 г. Получено 16 марта 2010 г.
  28. ^ Джим Тейлор. "Часто задаваемые вопросы о DVD (и ответы) – Подробности аудио в DVD-Video" . Получено 20 марта 2010 г. .
  29. ^ "Как работает DV". Архивировано из оригинала 6 декабря 2007 г. Получено 21 марта 2010 г.
  30. ^ "Информационный сайт AVCHD – Обзор спецификаций формата AVCHD" . Получено 21 марта 2010 г. .
  31. EBU (июль 2009 г.), EBU Tech 3306 – MBWF / RF64: расширенный формат файла для аудио (PDF) , заархивировано из оригинала (PDF) 22 ноября 2009 г. , извлечено 19 января 2010 г.
  32. ^ Мостафа, Мохамед; Кумар, Раджеш (май 2001 г.). "RFC 3108 – Соглашения об использовании протокола описания сеанса (SDP) для соединений ATM Bearer". doi :10.17487/RFC3108 . Получено 16 марта 2010 г. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  33. ^ "PCM, Pulse Code Modulated Audio". Библиотека Конгресса. 6 апреля 2022 г. Получено 5 сентября 2022 г.
  34. ^ Кристофер, Монтгомери. «24/192 Music Downloads, and why they do not make sense». Крис «Монти» Монтгомери. Архивировано из оригинала 6 сентября 2014 г. Получено 16 марта 2013 г.
  35. ^ https://www.its.bldrdoc.gov/fs-1037/dir-039/_5829.htm [ проверка не пройдена ]
  36. Столлингс, Уильям, Цифровые методы сигнализации, декабрь 1984 г., т. 22, № 12, IEEE Communications Magazine

Дальнейшее чтение

Внешние ссылки