stringtranslate.com

Выборка (обработка сигнала)

Представление выборки сигнала. Непрерывный сигнал S ( t ) представлен зеленой линией, а дискретные выборки обозначены синими вертикальными линиями.

В обработке сигналов дискретизация это преобразование сигнала непрерывного времени в сигнал дискретного времени . Типичным примером является преобразование звуковой волны в последовательность «выборок». Выборка это значение сигнала в определенный момент времени и/или пространства; это определение отличается от использования этого термина в статистике , которая относится к набору таких значений. [А]

Сэмплер — это подсистема или операция, которая извлекает выборки из непрерывного сигнала . Теоретически идеальный пробоотборник производит выборки, эквивалентные мгновенному значению непрерывного сигнала в нужных точках.

Исходный сигнал может быть восстановлен из последовательности выборок, вплоть до предела Найквиста , путем пропускания последовательности выборок через фильтр реконструкции .

Теория

Можно выбирать функции пространства, времени или любого другого измерения, причем аналогичным образом в двух или более измерениях.

Для функций, которые изменяются со временем, пусть S ( t ) будет непрерывной функцией (или «сигналом»), подлежащей выборке, и пусть выборка выполняется путем измерения значения непрерывной функции каждые T секунд, что называется интервалом выборки или период выборки . [1]   Тогда выборочная функция задается последовательностью:

S ( nT ), для целых значений n .

Частота дискретизации или частота дискретизации , f s , представляет собой среднее количество выборок, полученных за одну секунду, таким образом, f s = 1/ T , с единицей выборки в секунду , иногда называемой герцами , например, например, 48 кГц - это 48 000 выборок. в секунду .

Восстановление непрерывной функции по выборкам осуществляется с помощью алгоритмов интерполяции. Формула интерполяции Уиттекера -Шеннона математически эквивалентна идеальному фильтру нижних частот, входные данные которого представляют собой последовательность дельта-функций Дирака , которые модулируются (умножаются) значениями выборки. Когда временной интервал между соседними выборками является константой ( T ), последовательность дельта-функций называется гребенкой Дирака . Математически модулированная гребенка Дирака эквивалентна произведению функции гребенки на s ( t ). Эту математическую абстракцию иногда называют импульсной выборкой . [2]

Большинство дискретизированных сигналов не просто сохраняются и реконструируются. Точность теоретической реконструкции является общепринятым показателем эффективности выборки. Эта точность снижается, когда s ( t ) содержит частотные компоненты, длина цикла (период) которых меньше 2 интервалов выборки (см. Совмещение ). Соответствующий предел частоты в циклах в секунду ( герц ) составляет 0,5 цикла/выборка ×  f с  выборок/секунду = f с /2, что известно как частота Найквиста пробоотборника. Следовательно, s ( t ) обычно является выходным сигналом фильтра нижних частот , функционально известного как фильтр сглаживания . Без фильтра сглаживания частоты выше частоты Найквиста будут влиять на выборки таким образом, что это будет неправильно интерпретировано процессом интерполяции. [3]

Практические соображения

На практике непрерывный сигнал дискретизируется с помощью аналого-цифрового преобразователя (АЦП) — устройства с различными физическими ограничениями. Это приводит к отклонениям от теоретически идеальной реконструкции, которые в совокупности называются искажениями .

Могут возникнуть различные типы искажений, в том числе:

Хотя использование передискретизации может полностью устранить апертурную ошибку и наложение спектров за счет их смещения за пределы полосы пропускания, этот метод практически невозможно использовать на частотах выше нескольких ГГц и может быть непомерно дорогим на гораздо более низких частотах. Более того, хотя передискретизация и может уменьшить ошибки квантования и нелинейность, она не может устранить их полностью. Следовательно, практические АЦП на звуковых частотах обычно не имеют наложения спектров, ошибки апертуры и не ограничены ошибкой квантования. Вместо этого доминирует аналоговый шум. На радиочастотных и микроволновых частотах, где передискретизация нецелесообразна, а фильтры дороги, ошибка апертуры, ошибка квантования и наложение спектров могут стать существенными ограничениями.

Джиттер, шум и квантование часто анализируются путем их моделирования как случайных ошибок, добавляемых к значениям выборки. Эффекты интегрирования и удержания нулевого порядка можно анализировать как форму фильтрации нижних частот . Нелинейности АЦП или ЦАП анализируются путем замены идеального отображения линейной функции предлагаемой нелинейной функцией .

Приложения

Сэмплирование аудио

Цифровое аудио использует импульсно-кодовую модуляцию (PCM) и цифровые сигналы для воспроизведения звука. Сюда входят аналого-цифровое преобразование (АЦП), цифро-аналоговое преобразование (ЦАП), хранение и передача. По сути, система, обычно называемая цифровой, на самом деле является аналогом предыдущего электрического аналога с дискретным временем и дискретным уровнем. Хотя современные системы могут быть весьма тонкими в своих методах, основная польза цифровой системы заключается в способности хранить, извлекать и передавать сигналы без потери качества.

Когда необходимо захватить звук, охватывающий весь диапазон человеческого слуха 20–20 000 Гц [5] , например, при записи музыки или многих типов акустических событий, звуковые сигналы обычно дискретизируются с частотой 44,1 кГц ( CD ), 48 кГц, 88,2 кГц. , или 96 кГц. [6] Требование приблизительно двойной ставки является следствием теоремы Найквиста . Частоты дискретизации выше 50–60 кГц не могут предоставить слушателям больше полезной информации. По этой причине первые производители профессионального аудиооборудования выбирали частоту дискретизации в диапазоне от 40 до 50 кГц.

В отрасли наблюдается тенденция к увеличению частоты дискретизации, значительно превышающей базовые требования: например, 96 кГц и даже 192 кГц [7]. Несмотря на то, что ультразвуковые частоты неслышимы для человека, запись и микширование при более высоких частотах дискретизации эффективно устраняют искажения, которые могут быть вызвано обратным псевдонимом . И наоборот, ультразвуковые звуки могут взаимодействовать со слышимой частью частотного спектра и модулировать ее ( интермодуляционные искажения ), ухудшая качество воспроизведения. [8] Одним из преимуществ более высоких частот дискретизации является то, что они могут ослабить требования к конструкции фильтров нижних частот для АЦП и ЦАП , но с современными дельта-сигма-преобразователями с передискретизацией это преимущество менее важно.

Общество аудиоинженеров рекомендует частоту дискретизации 48 кГц для большинства приложений, но признает частоту 44,1 кГц для компакт-дисков и других потребительских целей, 32 кГц для приложений, связанных с передачей, и 96 кГц для более широкой полосы пропускания или смягченной фильтрации сглаживания . [9] И Lavry Engineering, и Дж. Роберт Стюарт заявляют, что идеальная частота дискретизации должна составлять около 60 кГц, но, поскольку это не стандартная частота, для целей записи рекомендуются 88,2 или 96 кГц. [10] [11] [12] [13]

Более полный список распространенных частот дискретизации звука:

Разрядность

Звук обычно записывается с глубиной 8, 16 и 24 бита, что дает теоретическое максимальное отношение сигнал/шум квантования (SQNR) для чистой синусоидальной волны примерно 49,93  дБ , 98,09 дБ и 122,17 дБ. . [21] Звук CD-качества использует 16-битные сэмплы. Тепловой шум ограничивает истинное количество битов, которые можно использовать при квантовании. Лишь немногие аналоговые системы имеют отношение сигнал/шум (SNR), превышающее 120 дБ. Однако операции цифровой обработки сигналов могут иметь очень широкий динамический диапазон, поэтому обычно операции микширования и мастеринга выполняются с 32-битной точностью, а затем преобразуются в 16- или 24-битные для распространения.

Выборка речи

Речевые сигналы, то есть сигналы, предназначенные для передачи только человеческой речи , обычно могут дискретизироваться с гораздо меньшей частотой. Для большинства фонем почти вся энергия содержится в диапазоне 100 Гц – 4 кГц, что позволяет использовать частоту дискретизации 8 кГц. Это частота дискретизации , используемая почти всеми телефонными системами, использующими спецификации дискретизации и квантования G.711 . [ нужна цитата ]

Выборка видео

Телевидение стандартной четкости (SDTV) использует для видимой области изображения либо 720 на 480 пикселей (США NTSC, 525 строк), либо 720 на 576 пикселей (UK PAL, 625 строк).

Телевидение высокой четкости (HDTV) использует разрешение 720p (прогрессивное), 1080i (чересстрочное) и 1080p (прогрессивное, также известное как Full-HD).

В цифровом видео временная частота дискретизации определяется как частота кадров  (или, скорее, частота полей  ), а не как условная тактовая частота пикселей. Частота дискретизации изображения — это частота повторения периода интеграции датчика. Поскольку период интегрирования может быть значительно короче времени между повторениями, частота дискретизации может отличаться от обратной величины времени выборки:

Цифро-аналоговые преобразователи видео работают в мегагерцовом диапазоне (от ~ 3 МГц для низкокачественных композитных видеоскейлеров в ранних игровых консолях до 250 МГц и более для выхода VGA с самым высоким разрешением).

Когда аналоговое видео преобразуется в цифровое , происходит другой процесс дискретизации, на этот раз с частотой пикселей, соответствующей частоте пространственной дискретизации вдоль строк сканирования . Общая частота дискретизации пикселей :

Пространственная выборка в другом направлении определяется расстоянием между линиями сканирования в растре . Частота дискретизации и разрешение в обоих пространственных направлениях могут измеряться в строках на высоту изображения.

Пространственное наложение высокочастотных видеокомпонентов яркости или цветности проявляется в виде муара .

3D-сэмплинг

Процесс объемной визуализации производит выборку трехмерной сетки вокселов для создания трехмерной визуализации нарезанных (томографических) данных. Предполагается, что трехмерная сетка представляет собой непрерывную область трехмерного пространства. Объемная визуализация широко распространена в медицинской визуализации, например, рентгеновская компьютерная томография (КТ/КТ), магнитно-резонансная томография (МРТ), позитронно-эмиссионная томография (ПЭТ). Он также используется для сейсмической томографии и других приложений.

На двух верхних графиках изображены преобразования Фурье двух разных функций, которые дают одинаковые результаты при выборке с определенной частотой. Функция основной полосы дискретизируется быстрее, чем ее частота Найквиста, а функция полосового пропускания субдискретизируется, эффективно преобразуя ее в полосу частот. Нижние графики показывают, как идентичные спектральные результаты создаются псевдонимами процесса выборки.

Недостаточная выборка

Когда полосовой сигнал дискретизируется медленнее, чем его частота Найквиста , выборки неотличимы от выборок низкочастотного псевдонима высокочастотного сигнала. Часто это делается целенаправленно таким образом, чтобы псевдоним самой низкой частоты удовлетворял критерию Найквиста , поскольку полосовой сигнал по-прежнему однозначно представлен и поддается восстановлению. Такая недостаточная дискретизация также известна как полосовая выборка , гармоническая выборка , выборка ПЧ и прямое преобразование ПЧ в цифровой формат. [22]

Передискретизация

Передискретизация используется в большинстве современных аналого-цифровых преобразователей для уменьшения искажений, вносимых практическими цифро-аналоговыми преобразователями , таких как удержание нулевого порядка вместо идеализаций, таких как формула интерполяции Уиттекера-Шеннона . [23]

Комплексная выборка

Комплексная выборка (или выборка I/Q ) — это одновременная выборка двух разных, но связанных сигналов, в результате чего образуются пары выборок, которые впоследствии обрабатываются как комплексные числа . [C]   Когда одна форма сигнала   является преобразованием Гильберта другой формы сигнала   , комплекснозначная функция     называется аналитическим сигналом , преобразование Фурье которого равно нулю для всех отрицательных значений частоты. В этом случае скорость Найквиста для сигнала без частот ≥  B может быть уменьшена до B (комплексных выборок в секунду) вместо 2 B (реальных выборок в секунду). [D] Более очевидно, что эквивалентный сигнал основной полосы частот также     имеет коэффициент Найквиста B , потому что все его ненулевое частотное содержимое сдвинуто в интервал [-B/2, B/2).

Хотя комплексные выборки можно получить, как описано выше, они также создаются путем манипулирования выборками действительнозначной формы сигнала. Например, эквивалентный сигнал основной полосы частот можно создать без явных вычислений   путем обработки последовательности произведений [E]  через цифровой фильтр нижних частот, частота среза которого равна B /2. [F] Вычисление только каждой второй выборки выходной последовательности уменьшает частоту дискретизации, соизмеримую с уменьшенной частотой Найквиста. В результате получается вдвое меньше комплексных выборок, чем исходное количество реальных выборок. Никакая информация не теряется, и при необходимости можно восстановить исходную форму сигнала s(t).

Смотрите также

Примечания

  1. ^ Например, «количество выборок» при обработке сигналов примерно эквивалентно « размеру выборки » в статистике.
  2. ^ Существуют еще более высокие частоты дискретизации DSD, но преимущества от них, вероятно, незаметны, а размер этих файлов будет огромным.
  3. ^ Пары выборок также иногда рассматриваются как точки на диаграмме созвездия .
  4. ^ Когда комплексная частота дискретизации равна B , частотный компонент с частотой 0,6  B , например, будет иметь псевдоним -0,4  B , что является однозначным из-за ограничения, согласно которому предварительно дискретизированный сигнал был аналитическим. Также см. Псевдоним § Комплексные синусоиды .
  5. ^ Когда s ( t ) отбирается на частоте Найквиста (1/ T = 2 B ), последовательность продуктов упрощается до
  6. ^ Последовательность комплексных чисел свернута с импульсной характеристикой фильтра с вещественными коэффициентами. Это эквивалентно раздельной фильтрации последовательностей действительных и мнимых частей и преобразованию комплексных пар на выходе.

Рекомендации

  1. ^ Мартин Х. Вейк (1996). Стандартный словарь коммуникаций. Спрингер. ISBN 0412083914.
  2. ^ Рао, Р. (2008). Сигналы и системы. Prentice-Hall Of India Pvt. Ограниченное. ISBN 9788120338593.
  3. ^ CE Шеннон , «Связь в присутствии шума», Proc. Институт радиоинженеров , вып. 37, № 1, стр. 10–21, январь 1949 г. Перепечатка как классическая статья в: Proc. IEEE, Том. 86, № 2, (февраль 1998 г.). Архивировано 8 февраля 2010 г. в Wayback Machine.
  4. ^ Х. О. Йоханссон и К. Свенссон, «Временное разрешение переключателей выборки NMOS», IEEE J. Solid-State Circuits, том: 33, выпуск: 2, стр. 237–245, февраль 1998 г.
  5. ^ Д'Амброуз, Кристопер; Чоудхари, Ризван (2003). Элерт, Гленн (ред.). «Частотный диапазон человеческого слуха». Справочник по физике . Проверено 22 января 2022 г.
  6. ^ Селф, Дуглас (2012). Объяснение аудиотехники. Тейлор и Фрэнсис США. стр. 200, 446. ISBN. 978-0240812731.
  7. ^ "Цифровой профессиональный звук" . Проверено 8 января 2014 г.
  8. Коллетти, Джастин (4 февраля 2013 г.). «Наука о частоте дискретизации (когда выше, тем лучше, а когда нет)». Поверьте мне, я учёный . Проверено 6 февраля 2013 г. во многих случаях мы можем услышать звук более высоких частот дискретизации не потому, что они более прозрачны, а потому, что они менее прозрачны. Они могут фактически внести непреднамеренные искажения в слышимый спектр.
  9. ^ ab AES5-2008: Рекомендуемая практика AES для профессионального цифрового звука - Предпочтительные частоты дискретизации для приложений, использующих импульсно-кодовую модуляцию, Общество аудиоинженеров, 2008 г. , получено 18 января 2010 г.
  10. ^ Лаври, Дэн (3 мая 2012 г.). «Оптимальная частота дискретизации для качественного звука» (PDF) . Лаври Инжиниринг Инк . Хотя 60 КГц было бы ближе к идеалу; Учитывая существующие стандарты, наиболее близкими к оптимальной частоте дискретизации являются 88,2 кГц и 96 кГц.
  11. ^ Лаври, Дэн. «Оптимальная частота дискретизации для качественного звука». Гирслуц . Проверено 10 ноября 2018 г. Я стараюсь приспособить все уши, и есть сообщения о том, что лишь немногие люди действительно могут слышать частоту чуть выше 20 кГц. Я думаю, что 48 кГц — это довольно хороший компромисс, но 88,2 или 96 кГц дают некоторый дополнительный запас.
  12. ^ Лаври, Дэн. «Микшировать в 96к или нет?». Гирслуц . Проверено 10 ноября 2018 г. В настоящее время многие хорошие дизайнеры и специалисты по слуху считают частоту дискретизации 60–70 кГц оптимальной для уха. Он достаточно быстрый, чтобы включить то, что мы слышим, но достаточно медленный, чтобы сделать это довольно точно.
  13. ^ Стюарт, Дж. Роберт (1998). Кодирование высококачественного цифрового звука . CiteSeerX 10.1.1.501.6731 . как психоакустический анализ, так и опыт говорят нам, что минимальный прямоугольный канал, необходимый для обеспечения прозрачности, использует линейную PCM с 18,2-битными выборками на частоте 58 кГц. ... существуют веские аргументы в пользу сохранения целочисленных соотношений с существующими частотами дискретизации, что предполагает принятие значения 88,2 кГц или 96 кГц. 
  14. ^ «Телефоны Cisco VoIP, сети и аксессуары — Поставка VoIP» .
  15. ^ «Процедура восстановления – часть 1» . Восстановление 78s.co.uk. Архивировано из оригинала 14 сентября 2009 г. Проверено 18 января 2011 г. Для большинства записей достаточно частоты дискретизации 22050 в стерео. Исключением, вероятно, станут записи, сделанные во второй половине века, для которых может потребоваться частота дискретизации 44100.
  16. ^ «Цифровые беспроводные передатчики Zaxcom» . Zaxcom.com. Архивировано из оригинала 9 февраля 2011 г. Проверено 18 января 2011 г.
  17. ^ "RME: Hammerfall DSP 9632" . www.rme-audio.de . Проверено 18 декабря 2018 г. Поддерживаемые частоты дискретизации: внутренние 32, 44,1, 48, 64, 88,2, 96, 176,4, 192 кГц.
  18. ^ "SX-S30DAB | Пионер" . www.pioneer-audiovisual.eu . Проверено 18 декабря 2018 г. Поддерживаемые частоты дискретизации: 44,1 кГц, 48 кГц, 64 кГц, 88,2 кГц, 96 кГц, 176,4 кГц, 192 кГц.
  19. ^ Кристина Бахманн, Хайко Бишофф; Шютте, Бенджамин. «Настроить меню частоты дискретизации». Steinberg WaveLab Pro . Проверено 18 декабря 2018 г. Общая частота дискретизации: 64 000 Гц
  20. ^ «M Track 2x2M Cubase Pro 9 не может изменить частоту дискретизации» . М-Аудио . Проверено 18 декабря 2018 г. [Скриншот Cubase]
  21. ^ «MT-001: раскрываем тайну печально известной формулы «SNR = 6,02N + 1,76 дБ» и почему вас это должно волновать» (PDF) .
  22. ^ Уолт Кестер (2003). Методы проектирования смешанных сигналов и DSP. Ньюнес. п. 20. ISBN 978-0-7506-7611-3. Проверено 8 января 2014 г.
  23. ^ Уильям Моррис Хартманн (1997). Сигналы, звук и ощущение. Спрингер. ISBN 1563962837.

дальнейшее чтение

Внешние ссылки