stringtranslate.com

Импульсно-кодовая модуляция

Импульсно-кодовая модуляция ( ИКМ ) — метод, используемый для цифрового представления аналоговых сигналов. Это стандартная форма цифрового звука в компьютерах, компакт-дисках, цифровой телефонии и других цифровых аудиоприложениях. В потоке ИКМ амплитуда аналогового сигнала дискретизируется с равномерными интервалами , и каждый сэмпл квантуется до ближайшего значения в пределах диапазона цифровых шагов. Алек Ривз , Клод Шеннон , Барни Оливер и Джон Р. Пирс приписывают его изобретение. [6] [7] [8]

Линейная импульсно-кодовая модуляция ( LPCM ) — это особый тип PCM, в котором уровни квантования линейно равномерны. [5] Это контрастирует с кодированием PCM, в котором уровни квантования изменяются как функция амплитуды (как в алгоритме A-law или алгоритме μ-law ). Хотя PCM — более общий термин, его часто используют для описания данных, закодированных как LPCM.

Поток PCM имеет два основных свойства, которые определяют точность потока по отношению к исходному аналоговому сигналу: частоту дискретизации , которая представляет собой количество раз в секунду, когда берутся выборки; и битовую глубину , которая определяет количество возможных цифровых значений, которые могут быть использованы для представления каждой выборки.

История

Ранние электрические коммуникации начали производить выборку сигналов для мультиплексирования выборок из нескольких источников телеграфии и передачи их по одному телеграфному кабелю. Американский изобретатель Мозес Г. Фармер задумал телеграфное временное мультиплексирование (TDM) еще в 1853 году. Инженер-электрик В. М. Майнер в 1903 году использовал электромеханический коммутатор для временного мультиплексирования нескольких телеграфных сигналов; он также применил эту технологию в телефонии . Он получил разборчивую речь из каналов, дискретизированных с частотой выше 3500–4300 Гц; более низкие частоты оказались неудовлетворительными.

В 1920 году система передачи изображений по кабелю Бартлейн использовала телеграфную сигнализацию символов, пробитых на бумажной ленте, для отправки образцов изображений, квантованных до 5 уровней. [9] В 1926 году Пол М. Рейни из Western Electric запатентовал факсимильный аппарат , который передавал свой сигнал с помощью 5-битной PCM, кодированной оптико-механическим аналого-цифровым преобразователем . [10] Аппарат не был запущен в производство. [11]

Британский инженер Алек Ривз , не зная о предыдущих работах, задумал использовать PCM для голосовой связи в 1937 году, работая в International Telephone and Telegraph во Франции. Он описал теорию и ее преимущества, но практического применения не последовало. Ривз подал заявку на французский патент в 1938 году, а его патент в США был выдан в 1943 году. [12] К этому времени Ривз начал работать в Telecommunications Research Establishment . [11]

Первая передача речи с помощью цифровых технологий, шифровальное оборудование SIGSALY , передало высокоуровневые сообщения союзников во время Второй мировой войны . В 1943 году исследователи Bell Labs , которые разработали систему SIGSALY, узнали об использовании двоичного кодирования PCM, как уже предлагал Ривз. В 1949 году для системы DATAR канадского флота Ferranti Canada построила рабочую радиосистему PCM, которая могла передавать оцифрованные радиолокационные данные на большие расстояния. [13]

PCM в конце 1940-х и начале 1950-х годов использовала электронно-лучевую кодирующую трубку с плоским электродом , имеющим кодирующие перфорации. [14] Как и в осциллографе , луч был горизонтально развёрнут с частотой дискретизации, в то время как вертикальное отклонение контролировалось входным аналоговым сигналом, заставляя луч проходить через более высокие или более низкие части перфорированной пластины. Пластина собирала или пропускала луч, производя изменения тока в двоичном коде, по одному биту за раз. Вместо естественного двоичного кода, сетка более поздней трубки Гудолла была перфорирована для получения безглючного кода Грея и производила все биты одновременно, используя веерный луч вместо сканирующего луча. [15]

В Соединенных Штатах Национальный зал славы изобретателей почтил Бернарда М. Оливера [16] и Клода Шеннона [17] как изобретателей PCM, [18] как описано в «Системе связи, использующей импульсно-кодовую модуляцию», патент США 2,801,281 , поданный в 1946 и 1952 годах, выданный в 1956 году. Другой патент с тем же названием был подан Джоном Р. Пирсом в 1945 году и выдан в 1948 году: патент США 2,437,707 . Все трое опубликовали «Философию PCM» в 1948 году. [19]

Система T-carrier , представленная в 1961 году, использует две витые пары линий передачи для передачи 24 телефонных звонков PCM с частотой дискретизации 8 кГц и разрешением 8 бит. Эта разработка улучшила пропускную способность и качество звонков по сравнению с предыдущими схемами частотного мультиплексирования .

В 1973 году П. Каммиски, Никил Джайант и Джеймс Л. Фланаган разработали адаптивную дифференциальную импульсно-кодовую модуляцию (АДИКМ) . [20]

Цифровые аудиозаписи

В 1967 году исследовательскими центрами NHK в Японии был разработан первый PCM-рекордер . [21] 30 кГц 12-битное устройство использовало компандер ( похожий на DBX Noise Reduction ) для расширения динамического диапазона и сохраняло сигналы на видеомагнитофоне . В 1969 году NHK расширила возможности системы до 2-канального стерео и 32 кГц 13-битного разрешения. В январе 1971 года, используя PCM-систему записи NHK, инженеры Denon записали первые коммерческие цифровые записи. [примечание 1] [21]

В 1972 году Denon представил первый 8-канальный цифровой рекордер DN-023R, который использовал 4-головочный открытый катушечный вещательный видеомагнитофон для записи в формате 47,25 кГц, 13-битного PCM-аудио. [примечание 2] В 1977 году Denon разработал портативную систему записи PCM DN-034R. Как и DN-023R, он записывал 8 каналов в формате 47,25 кГц, но использовал 14 бит «с акцентом , что делало его эквивалентным 15,5 бит». [21]

В 1979 году был записан первый цифровой поп-альбом Bop till You Drop . Он был записан в формате 50 кГц, 16 бит линейной PCM с использованием цифрового магнитофона 3M. [22]

Компакт -диск (CD) привнес PCM в потребительские аудиоприложения с момента своего появления в 1982 году. CD использует частоту дискретизации 44 100 Гц и разрешение 16 бит, а на одном диске можно хранить до 80 минут стереозвука.

Цифровая телефония

Быстрое развитие и широкое внедрение цифровой телефонии PCM стало возможным благодаря технологии коммутируемых конденсаторов (SC) на основе металл-оксид-полупроводника (МОП) , разработанной в начале 1970-х годов. [23] Это привело к разработке микросхем кодека-фильтра PCM в конце 1970-х годов. [23] [24] Микросхема кодека-фильтра PCM на основе КМОП (комплементарных МОП) с кремниевым затвором , разработанная Дэвидом А. Ходжесом и В. К. Блэком в 1980 году, [23] с тех пор является отраслевым стандартом для цифровой телефонии. [23] [24] К 1990-м годам телекоммуникационные сети , такие как телефонная сеть общего пользования (PSTN), были в значительной степени оцифрованы с помощью сверхбольшой интеграции (VLSI) CMOS PCM кодеков-фильтров, широко используемых в электронных коммутационных системах для телефонных станций , модемов на концах пользователей и широкого спектра приложений цифровой передачи , таких как цифровая сеть с интеграцией услуг (ISDN), беспроводные телефоны и сотовые телефоны . [24]

Реализации

PCM — это метод кодирования, обычно используемый для несжатого цифрового звука. [примечание 3]

Модуляция

Дискретизация и квантование сигнала (красный) для 4-битной LPCM во временной области на определенной частоте

На диаграмме синусоида ( красная кривая) дискретизируется и квантуется для PCM. Синусоида дискретизируется через регулярные интервалы, показанные в виде вертикальных линий. Для каждой выборки выбирается одно из доступных значений (на оси Y). Процесс PCM обычно реализуется на одной интегральной схеме, называемой аналого-цифровым преобразователем (АЦП). Это создает полностью дискретное представление входного сигнала (синие точки), которое можно легко закодировать в виде цифровых данных для хранения или обработки. Несколько потоков PCM также могут быть мультиплексированы в более крупный совокупный поток данных , как правило, для передачи нескольких потоков по одному физическому каналу. Один из методов называется временным мультиплексированием (TDM) и широко используется, особенно в современной телефонной системе общего пользования.

Демодуляция

Электроника, используемая для создания точного аналогового сигнала из дискретных данных, похожа на ту, которая используется для создания цифрового сигнала. Эти устройства представляют собой цифро-аналоговые преобразователи (ЦАП). Они создают напряжение или ток (в зависимости от типа), представляющие значение, представленное на их цифровых входах. Затем этот выход обычно фильтруется и усиливается для использования.

Чтобы восстановить исходный сигнал из выборочных данных, демодулятор может применить процедуру модуляции в обратном порядке. После каждого периода выборки демодулятор считывает следующее значение и переводит выходной сигнал в новое значение. В результате этих переходов сигнал сохраняет значительное количество высокочастотной энергии из-за эффектов визуализации. Чтобы удалить эти нежелательные частоты, демодулятор пропускает сигнал через фильтр реконструкции , который подавляет энергию за пределами ожидаемого диапазона частот (больше частоты Найквиста ). [примечание 4]

Стандартная точность и скорость выборки

Обычные значения глубины выборки для LPCM составляют 8, 16, 20 или 24 бита на выборку . [1] [2] [3] [32]

LPCM кодирует один звуковой канал. Поддержка многоканального звука зависит от формата файла и опирается на синхронизацию нескольких потоков LPCM. [5] [33] Хотя наиболее распространенным форматом является два канала (стерео), системы могут поддерживать до 8 аудиоканалов (7.1 Surround) [2] [3] или больше.

Обычные частоты дискретизации составляют 48 кГц , как в видеоформате DVD , или 44,1 кГц, как в CD. Частоты дискретизации 96 кГц или 192 кГц могут использоваться на некотором оборудовании, но преимущества были обсуждены. [34]

Ограничения

Теорема дискретизации Найквиста -Шеннона показывает, что устройства PCM могут работать без внесения искажений в пределах своих проектных частотных диапазонов, если они обеспечивают частоту дискретизации, по крайней мере, вдвое превышающую самую высокую частоту, содержащуюся во входном сигнале. Например, в телефонии используемый диапазон частот голоса составляет приблизительно от 300  Гц до 3400 Гц. [35] Поэтому для эффективного восстановления голосового сигнала приложения телефонии обычно используют частоту дискретизации 8000 Гц, что более чем в два раза превышает самую высокую используемую частоту голоса.

Несмотря на это, существуют потенциальные источники ухудшения, присущие любой системе PCM:

Обработка и кодирование

Некоторые формы PCM объединяют обработку сигнала с кодированием. Более старые версии этих систем применяли обработку в аналоговой области как часть аналого-цифрового процесса; более новые реализации делают это в цифровой области. Эти простые методы в значительной степени устарели из-за современных методов сжатия звука на основе преобразования , таких как кодирование с модифицированным дискретным косинусным преобразованием (MDCT).

В телефонии стандартный аудиосигнал для одного телефонного звонка кодируется как 8000 выборок в секунду , по 8 бит каждая, что дает цифровой сигнал 64 кбит/с, известный как DS0 . Кодирование сжатия сигнала по умолчанию на DS0 - это либо μ-закон (мю-закон) PCM (Северная Америка и Япония), либо A-закон PCM (Европа и большая часть остального мира). Это логарифмические системы сжатия, в которых 12- или 13-битный линейный номер выборки PCM отображается в 8-битное значение. Эта система описывается международным стандартом G.711 .

Если стоимость схемы высока, а потеря качества голоса приемлема, иногда имеет смысл сжать голосовой сигнал еще больше. Алгоритм ADPCM используется для преобразования серии 8-битных выборок PCM μ-law или A-law в серию 4-битных выборок ADPCM. Таким образом, пропускная способность линии удваивается. Метод подробно описан в стандарте G.726 .

Для достижения еще большего сжатия были разработаны форматы аудиокодирования и аудиокодеки . Некоторые из этих методов были стандартизированы и запатентованы. Современные методы сжатия, такие как модифицированное дискретное косинусное преобразование (MDCT) и линейное предсказательное кодирование (LPC), в настоящее время широко используются в мобильных телефонах , передаче голоса по IP (VoIP) и потоковом медиа .

Кодирование для последовательной передачи

PCM может быть либо с возвратом к нулю (RZ), либо без возврата к нулю (NRZ). Для синхронизации системы NRZ с использованием внутриполосной информации не должно быть длинных последовательностей одинаковых символов, таких как единицы или нули. Для двоичных систем PCM плотность 1-символов называется плотностью единиц . [36]

Плотность единиц часто контролируется с помощью методов предварительного кодирования, таких как кодирование с ограниченной длиной серии , где код PCM расширяется до немного более длинного кода с гарантированной границей плотности единиц перед модуляцией в канал. В других случаях в поток добавляются дополнительные биты кадрирования , что гарантирует по крайней мере случайные переходы символов.

Другой метод, используемый для управления плотностью единиц, — это использование скремблера на данных, который будет стремиться превратить поток данных в поток, который выглядит псевдослучайным , но где данные могут быть точно восстановлены дополнительным дескремблером. В этом случае длинные серии нулей или единиц все еще возможны на выходе, но считаются достаточно маловероятными, чтобы обеспечить надежную синхронизацию.

В других случаях долгосрочное значение постоянного тока модулированного сигнала важно, поскольку накопление смещения постоянного тока будет иметь тенденцию выводить схемы связи из их рабочего диапазона. В этом случае принимаются специальные меры для ведения подсчета кумулятивного смещения постоянного тока и для изменения кодов при необходимости, чтобы смещение постоянного тока всегда стремилось к нулю.

Многие из этих кодов являются биполярными кодами , где импульсы могут быть положительными, отрицательными или отсутствовать. В типичном коде с инверсией альтернативных знаков ненулевые импульсы чередуются между положительными и отрицательными. Эти правила могут быть нарушены для генерации специальных символов, используемых для кадрирования или других специальных целей.

Номенклатура

Слово «импульс» в термине импульсно-кодовая модуляция относится к импульсам, которые можно обнаружить в линии передачи. Возможно, это является естественным следствием того, что эта техника развивалась вместе с двумя аналоговыми методами, широтно-импульсной модуляцией и импульсно-позиционной модуляцией , в которых информация, подлежащая кодированию, представлена ​​дискретными импульсами сигнала различной ширины или положения соответственно. [ необходима цитата ] В этом отношении PCM мало похожа на эти другие формы кодирования сигналов, за исключением того, что все они могут использоваться в мультиплексировании с временным разделением, а числа кодов PCM представлены в виде электрических импульсов.

Смотрите также

Пояснительные записки

  1. Среди первых записей была Uzu: The World Of Stomu Yamash'ta 2 от Stomu Yamashta .
  2. Первая запись с использованием этой новой системы была сделана в Токио 24–26 апреля 1972 года.
  3. ^ Существуют и другие методы, такие как модуляция плотности импульсов, используемая также на Super Audio CD .
  4. ^ Некоторые системы используют цифровую фильтрацию для удаления части наложения спектров, преобразуя сигнал из цифрового в аналоговый с более высокой частотой дискретизации, так что аналоговый фильтр сглаживания спектров становится намного проще. В некоторых системах явная фильтрация вообще не выполняется; поскольку ни одна система не может воспроизвести сигнал с бесконечной полосой пропускания, собственные потери в системе компенсируют артефакты — или система просто не требует большой точности.
  5. ^ Ошибка квантования колеблется между - q / 2 и q / 2. В идеальном случае (при полностью линейном АЦП и уровне сигнала >> q ) она равномерно распределена по этому интервалу с нулевым средним и дисперсией q 2 / 12.
  6. ^ Небольшая разница между тактовыми частотами кодирования и декодирования обычно не является серьезной проблемой; небольшая постоянная ошибка не заметна. Однако ошибка часов становится серьезной проблемой, если часы содержат значительный джиттер .

Ссылки

  1. ^ abc Alvestrand, Harald Tveit; Salsman, James (май 1999). "RFC 2586 – Тип содержимого Audio/L16 MIME". The Internet Society. doi :10.17487/RFC2586 . Получено 16 марта 2010 г. . {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  2. ^ abc Casner, S. (март 2007 г.). "RFC 4856 – Media Type Registration of Payload Formats in the RTP Profile for Audio and Video Conferences – Registration of Media Type audio/L8". IETF Trust. doi :10.17487/RFC4856 . Получено 16 марта 2010 г. . {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  3. ^ abcd Борман, C.; Каснер, S.; Кобаяши, K.; Огава, A. (январь 2002 г.). "RFC 3190 – Формат полезной нагрузки RTP для 12-битного звука DAT и 20- и 24-битного линейно-сэмплированного звука". The Internet Society. doi : 10.17487/RFC3190 . Получено 16 марта 2010 г. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  4. ^ "Типы аудионосителей". Internet Assigned Numbers Authority . Получено 16 марта 2010 г.
  5. ^ abcd "Linear Pulse Code Modulated Audio (LPCM)". Библиотека Конгресса . 19 апреля 2022 г. Получено 5 сентября 2022 г.
  6. ^ Нолл, А. Майкл (1997). Шоссе мечты: критический взгляд вдоль информационной супермагистрали. Телекоммуникации (пересмотренное издание). Махвах, Нью-Джерси: Erlbaum. стр. 50. ISBN 978-0-8058-2557-2.
  7. ^ Лейбсон, Стивен (7 сентября 2021 г.). «Краткая история однокристального DSP, часть I». EEJournal . Получено 19 сентября 2024 г. .
  8. ^ Барретт, Г. Дуглас (2023). Экспериментируя с человеком: искусство, музыка и современный постчеловек. Чикаго Лондон: Издательство Чикагского университета . стр. 102. ISBN 978-0-226-82340-9.
  9. ^ "Система передачи Бартлейна". DigicamHistory.com. Архивировано из оригинала 10 февраля 2010 г. Получено 7 января 2010 г.
  10. ^ Патент США номер 1,608,527; также см. стр. 8, Справочник по преобразованию данных , Уолтер Аллан Кестер, ред., Newnes, 2005, ISBN 0-7506-7841-0
  11. ^ ab Джон Вардалас (июнь 2013 г.), Импульсно-кодовая модуляция: все началось 75 лет назад с Алеком Ривзом, IEEE
  12. ^ США 2272070 
  13. ^ Портер, Артур (2004). Так много холмов, которые нужно покорить . Beckham Publications Group. ISBN 9780931761188.[ нужна страница ]
  14. ^ Sears, RW (январь 1948). Электронно-лучевая отклоняющая трубка для импульсно-кодовой модуляции. Том 27. Bell Labs . С. 44–57 . Получено 14 мая 2017 г. {{cite book}}: |work=проигнорировано ( помощь )
  15. ^ Goodall, WM (январь 1951). Телевидение с помощью импульсно-кодовой модуляции. Том 30. Bell Labs . С. 33–49 . Получено 14 мая 2017 г. {{cite book}}: |work=проигнорировано ( помощь )
  16. ^ "Бернард Оливер". Национальный зал славы изобретателей . Архивировано из оригинала 5 декабря 2010 года . Получено 6 февраля 2011 года .
  17. ^ "Клод Шеннон". Национальный зал славы изобретателей . Архивировано из оригинала 6 декабря 2010 года . Получено 6 февраля 2011 года .
  18. ^ "Национальный зал славы изобретателей объявляет класс изобретателей 2004 года". Научный блог . 11 февраля 2004 г. Получено 6 февраля 2011 г.
  19. ^ BM Oliver; JR Pierce & CE Shannon (ноябрь 1948 г.). «Философия PCM». Труды IRE . 36 (11): 1324–1331. doi :10.1109/JRPROC.1948.231941. ISSN  0096-8390. S2CID  51663786.
  20. ^ П. Каммиски, Н. С. Джайант и Дж. Л. Фланаган, «Адаптивное квантование в дифференциальном кодировании речи PCM», Bell Syst. Tech. J., т. 52, стр. 1105–1118, сентябрь 1973 г.
  21. ^ abc Thomas Fine (2008). «Рассвет коммерческой цифровой записи» (PDF) . ARSC Journal . 39 (1): 1–17.
  22. ^ Роджер Николс. "I Can't Keep Up With All The Formats II". Архивировано из оригинала 20 октября 2002 года. Альбом Ry Cooder Bop Till You Drop стал первым поп-альбомом, записанным в цифровом формате
  23. ^ abcd Allstot, David J. (2016). "Фильтры с переключаемыми конденсаторами" (PDF) . В Maloberti, Franco; Davies, Anthony C. (ред.). Краткая история схем и систем: от экологичных, мобильных, всепроникающих сетей до вычислений на основе больших данных . IEEE Circuits and Systems Society . стр. 105–110. ISBN 9788793609860. Архивировано из оригинала (PDF) 30 сентября 2021 г. . Получено 29 ноября 2019 г. .
  24. ^ abc Floyd, Michael D.; Hillman, Garth D. (8 октября 2018 г.) [1-е издание 2000 г.]. «Импульсно-кодовая модуляция Кодеки-Фильтры». Справочник по коммуникациям (2-е изд.). CRC Press . С. 26–1, 26–2, 26–3. ISBN 9781420041163.
  25. ^ Кэмброн, Г. Кит (17 октября 2012 г.). Глобальные сети: проектирование, эксплуатация и дизайн . John Wiley & Sons. стр. 345.
  26. Blu-ray Disc Association (март 2005 г.), Белая книга Формат Blu-ray Disc – 2.B Спецификации формата аудиовизуальных приложений для BD-ROM (PDF) , получено 26 июля 2009 г.
  27. ^ "DVD Technical Notes (DVD Video – "Book B") – Характеристики аудиоданных". 21 июля 1996 г. Получено 16 марта 2010 г.
  28. ^ Джим Тейлор. "Часто задаваемые вопросы о DVD (и ответы) – Подробности аудио в DVD-Video" . Получено 20 марта 2010 г. .
  29. ^ "Как работает DV". Архивировано из оригинала 6 декабря 2007 г. Получено 21 марта 2010 г.
  30. ^ "Информационный сайт AVCHD – Обзор спецификаций формата AVCHD" . Получено 21 марта 2010 г. .
  31. EBU (июль 2009 г.), EBU Tech 3306 – MBWF / RF64: расширенный формат файла для аудио (PDF) , заархивировано из оригинала (PDF) 22 ноября 2009 г. , извлечено 19 января 2010 г.
  32. ^ Мостафа, Мохамед; Кумар, Раджеш (май 2001 г.). "RFC 3108 – Соглашения об использовании протокола описания сеанса (SDP) для соединений ATM Bearer". doi :10.17487/RFC3108 . Получено 16 марта 2010 г. {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  33. ^ "PCM, Pulse Code Modulated Audio". Библиотека Конгресса. 6 апреля 2022 г. Получено 5 сентября 2022 г.
  34. ^ Кристофер, Монтгомери. «24/192 Music Downloads, and why they do not make sense». Крис «Монти» Монтгомери. Архивировано из оригинала 6 сентября 2014 г. Получено 16 марта 2013 г.
  35. ^ https://www.its.bldrdoc.gov/fs-1037/dir-039/_5829.htm [ проверка не пройдена ]
  36. Столлингс, Уильям, Цифровые методы сигнализации, декабрь 1984 г., т. 22, № 12, IEEE Communications Magazine

Дальнейшее чтение

Внешние ссылки