Выборка (обработка сигнала)

В обработке сигналов дискретизация — это преобразование сигнала непрерывного времени в сигнал дискретного времени . Типичным примером является преобразование звуковой волны в последовательность «выборок». Выборка — это значение сигнала в определенный момент времени и/или пространства; это определение отличается от использования этого термина в статистике , которая относится к набору таких значений. ^[А]

Сэмплер — это подсистема или операция, которая извлекает выборки из непрерывного сигнала . Теоретически идеальный пробоотборник производит выборки, эквивалентные мгновенному значению непрерывного сигнала в нужных точках.

Исходный сигнал может быть восстановлен из последовательности выборок, вплоть до предела Найквиста , путем пропускания последовательности выборок через фильтр реконструкции .

Теория

Можно выбирать функции пространства, времени или любого другого измерения, причем аналогичным образом в двух или более измерениях.

Для функций, которые изменяются со временем, пусть S ( t ) будет непрерывной функцией (или «сигналом»), подлежащей выборке, и пусть выборка выполняется путем измерения значения непрерывной функции каждые T секунд, что называется интервалом выборки или период выборки . ^[1] Тогда выборочная функция задается последовательностью:

S ( nT ), для целых значений n .

Частота дискретизации или частота дискретизации , f _s , представляет собой среднее количество выборок, полученных за одну секунду, таким образом, f _s = 1/ T , с единицей выборки в секунду , иногда называемой герцами , например, например, 48 кГц - это 48 000 выборок. в секунду .

Восстановление непрерывной функции по выборкам осуществляется с помощью алгоритмов интерполяции. Формула интерполяции Уиттекера-Шеннона математически эквивалентна идеальному фильтру нижних частот , входные данные которого представляют собой последовательность дельта-функций Дирака , которые модулируются (умножаются) значениями выборки. Когда временной интервал между соседними выборками является константой ( T ), последовательность дельта-функций называется гребенкой Дирака . Математически модулированная гребенка Дирака эквивалентна произведению функции гребенки на s ( t ). Эту математическую абстракцию иногда называют импульсной выборкой . ^[2]

Большинство дискретизированных сигналов не просто сохраняются и реконструируются. Точность теоретической реконструкции является общепринятым показателем эффективности выборки. Эта точность снижается, когда s ( t ) содержит частотные компоненты, длина цикла (период) которых меньше 2 интервалов выборки (см. Совмещение ). Соответствующий предел частоты в циклах в секунду ( герц ) составляет 0,5 цикла/выборка × f _с выборок/секунду = f _с /2, что известно как частота Найквиста пробоотборника. Следовательно, s ( t ) обычно является выходным сигналом фильтра нижних частот , функционально известного как фильтр сглаживания . Без фильтра сглаживания частоты выше частоты Найквиста будут влиять на выборки таким образом, что это будет неправильно интерпретировано процессом интерполяции. ^[3]

Практические соображения

На практике непрерывный сигнал дискретизируется с помощью аналого-цифрового преобразователя (АЦП) — устройства с различными физическими ограничениями. Это приводит к отклонениям от теоретически идеальной реконструкции, которые в совокупности называются искажениями .

Могут возникнуть различные типы искажений, в том числе:

Псевдонимы . Некоторое количество псевдонимов неизбежно, поскольку только теоретические, бесконечно длинные функции не могут иметь частотного содержания выше частоты Найквиста. Сглаживание можно сделать сколь угодно малым , используя фильтр сглаживания достаточно большого порядка.
Ошибка апертуры возникает из-за того, что выборка получается как среднее по времени в пределах области выборки, а не просто равна значению сигнала в момент выборки. ^[4] В схеме выборки и хранения на основе конденсатора ошибки апертуры возникают по нескольким причинам. Например, конденсатор не может мгновенно отслеживать входной сигнал, а конденсатор не может мгновенно изолироваться от входного сигнала.
Джиттер или отклонение от точных интервалов синхронизации выборки.
Шум , включая шум термодатчика, шум аналоговой цепи и т. д.
Ошибка ограничения скорости нарастания , вызванная неспособностью входного значения АЦП изменяться достаточно быстро.
Квантование как следствие конечной точности слов, представляющих преобразованные значения.
Ошибка из-за других нелинейных эффектов преобразования входного напряжения в преобразованное выходное значение (помимо эффектов квантования).

Хотя использование передискретизации может полностью устранить апертурную ошибку и наложение спектров за счет их смещения за пределы полосы пропускания, этот метод практически невозможно использовать на частотах выше нескольких ГГц и может быть непомерно дорогим на гораздо более низких частотах. Более того, хотя передискретизация и может уменьшить ошибки квантования и нелинейность, она не может устранить их полностью. Следовательно, практические АЦП на звуковых частотах обычно не имеют наложения спектров, ошибки апертуры и не ограничены ошибкой квантования. Вместо этого доминирует аналоговый шум. На радиочастотных и микроволновых частотах, где передискретизация нецелесообразна, а фильтры дороги, ошибка апертуры, ошибка квантования и наложение спектров могут стать существенными ограничениями.

Джиттер, шум и квантование часто анализируются путем их моделирования как случайных ошибок, добавляемых к значениям выборки. Эффекты интегрирования и удержания нулевого порядка можно анализировать как форму фильтрации нижних частот . Нелинейности АЦП или ЦАП анализируются путем замены идеального отображения линейной функции предлагаемой нелинейной функцией .

Приложения

Сэмплирование аудио

Цифровое аудио использует импульсно-кодовую модуляцию (PCM) и цифровые сигналы для воспроизведения звука. Сюда входят аналого-цифровое преобразование (АЦП), цифро-аналоговое преобразование (ЦАП), хранение и передача. По сути, система, обычно называемая цифровой, на самом деле является аналогом предыдущего электрического аналога с дискретным временем и дискретным уровнем. Хотя современные системы могут быть весьма тонкими в своих методах, основная польза цифровой системы заключается в способности хранить, извлекать и передавать сигналы без потери качества.

Когда необходимо захватить звук, охватывающий весь диапазон человеческого слуха 20–20 000 Гц ^[5] , например, при записи музыки или многих типов акустических событий, звуковые сигналы обычно дискретизируются с частотой 44,1 кГц ( CD ), 48 кГц, 88,2 кГц. , или 96 кГц. ^[6] Требование приблизительно двойной ставки является следствием теоремы Найквиста . Частоты дискретизации выше 50–60 кГц не могут предоставить слушателям больше полезной информации. По этой причине первые производители профессионального аудиооборудования выбирали частоту дискретизации в диапазоне от 40 до 50 кГц.

В отрасли наблюдается тенденция к увеличению частоты дискретизации, значительно превышающей базовые требования: например, 96 кГц и даже 192 кГц ^[7]. Несмотря на то, что ультразвуковые частоты неслышимы для человека, запись и микширование при более высоких частотах дискретизации эффективно устраняют искажения, которые могут быть вызвано обратным псевдонимом . И наоборот, ультразвуковые звуки могут взаимодействовать со слышимой частью частотного спектра и модулировать ее ( интермодуляционные искажения ), ухудшая качество воспроизведения. ^[8] Одним из преимуществ более высоких частот дискретизации является то, что они могут ослабить требования к конструкции фильтров нижних частот для АЦП и ЦАП , но с современными дельта-сигма-преобразователями с передискретизацией это преимущество менее важно.

Общество аудиоинженеров рекомендует частоту дискретизации 48 кГц для большинства приложений, но признает частоту 44,1 кГц для компакт-дисков и других потребительских целей, 32 кГц для приложений, связанных с передачей, и 96 кГц для более широкой полосы пропускания или смягченной фильтрации сглаживания . ^[9] И Lavry Engineering, и Дж. Роберт Стюарт заявляют, что идеальная частота дискретизации должна составлять около 60 кГц, но, поскольку это не стандартная частота, для целей записи рекомендуются 88,2 или 96 кГц. ^[10]^[11]^[12]^[13]

Более полный список распространенных частот дискретизации звука:

Разрядность

Звук обычно записывается с глубиной 8, 16 и 24 бита, что дает теоретическое максимальное отношение сигнал/шум квантования (SQNR) для чистой синусоидальной волны примерно 49,93 дБ , 98,09 дБ и 122,17 дБ. . ^[21] Звук CD-качества использует 16-битные сэмплы. Тепловой шум ограничивает истинное количество битов, которые можно использовать при квантовании. Лишь немногие аналоговые системы имеют отношение сигнал/шум (SNR), превышающее 120 дБ. Однако операции цифровой обработки сигналов могут иметь очень широкий динамический диапазон, поэтому обычно операции микширования и мастеринга выполняются с 32-битной точностью, а затем преобразуются в 16- или 24-битные для распространения.

Выборка речи

Речевые сигналы, то есть сигналы, предназначенные для передачи только человеческой речи , обычно могут дискретизироваться с гораздо меньшей частотой. Для большинства фонем почти вся энергия содержится в диапазоне 100 Гц – 4 кГц, что позволяет использовать частоту дискретизации 8 кГц. Это частота дискретизации , используемая почти всеми телефонными системами, использующими спецификации дискретизации и квантования G.711 . ^{[ нужна цитата ]}

Выборка видео

Телевидение стандартной четкости (SDTV) использует для видимой области изображения либо 720 на 480 пикселей (США NTSC , 525 строк), либо 720 на 576 пикселей (UK PAL , 625 строк).

Телевидение высокой четкости (HDTV) использует разрешение 720p (прогрессивное), 1080i (чересстрочное) и 1080p (прогрессивное, также известное как Full-HD).

В цифровом видео временная частота дискретизации определяется частотой кадров – или, скорее, частотой полей – а не условной частотой пикселей. Частота дискретизации изображения — это частота повторения периода интеграции датчика. Поскольку период интегрирования может быть значительно короче времени между повторениями, частота дискретизации может отличаться от обратной величины времени выборки:

50 Гц – видео PAL
60/1,001 Гц ~= 59,94 Гц — видео NTSC

Цифро-аналоговые преобразователи видео работают в мегагерцовом диапазоне (от ~ 3 МГц для низкокачественных композитных видеоскейлеров в ранних игровых консолях до 250 МГц и более для выхода VGA с самым высоким разрешением).

Когда аналоговое видео преобразуется в цифровое , происходит другой процесс дискретизации, на этот раз с частотой пикселей, соответствующей частоте пространственной дискретизации вдоль строк сканирования . Общая частота дискретизации пикселей :

13,5 МГц — CCIR 601 , видео D1

Пространственная выборка в другом направлении определяется расстоянием между линиями сканирования в растре . Частота дискретизации и разрешение в обоих пространственных направлениях могут измеряться в строках на высоту изображения.

Пространственное сглаживание высокочастотных видеокомпонентов яркости или цветности проявляется в виде муара .

3D-сэмплинг

Процесс объемной визуализации выбирает трехмерную сетку вокселов для создания трехмерной визуализации срезов (томографических) данных. Предполагается, что трехмерная сетка представляет собой непрерывную область трехмерного пространства. Объемная визуализация широко распространена в медицинской визуализации, например, рентгеновская компьютерная томография (КТ/КТ), магнитно-резонансная томография (МРТ), позитронно-эмиссионная томография (ПЭТ). Он также используется для сейсмической томографии и других приложений.

Недостаточная выборка

Когда полосовой сигнал дискретизируется медленнее, чем его частота Найквиста , выборки неотличимы от выборок низкочастотного псевдонима высокочастотного сигнала. Часто это делается целенаправленно таким образом, чтобы псевдоним самой низкой частоты удовлетворял критерию Найквиста , поскольку полосовой сигнал по-прежнему однозначно представлен и поддается восстановлению. Такая недостаточная дискретизация также известна как полосовая выборка , гармоническая выборка , выборка ПЧ и прямое преобразование ПЧ в цифровой формат. ^[22]

Передискретизация

Передискретизация используется в большинстве современных аналого-цифровых преобразователей для уменьшения искажений, вносимых практическими цифро-аналоговыми преобразователями , таких как удержание нулевого порядка вместо идеализаций, таких как формула интерполяции Уиттекера-Шеннона . ^[23]

Комплексная выборка

Комплексная выборка (или выборка I/Q ) — это одновременная выборка двух разных, но связанных сигналов, в результате чего образуются пары выборок, которые впоследствии обрабатываются как комплексные числа . ^[C] Когда одна форма сигнала является преобразованием Гильберта другой формы сигнала , комплекснозначная функция называется аналитическим сигналом , преобразование Фурье которого равно нулю для всех отрицательных значений частоты. В этом случае скорость Найквиста для сигнала без частот ≥ B может быть уменьшена до B (комплексных выборок в секунду) вместо 2 B (реальных выборок в секунду). ^[D] Более очевидно, что эквивалентный сигнал основной полосы частот также имеет коэффициент Найквиста B , потому что все его ненулевое частотное содержимое сдвинуто в интервал [-B/2, B/2). ${\ displaystyle , {\ шляпа {s}} (т),}$ ${\displaystyle,s(t),\,}$ $s_{a}(t)\triangleq s(t)+i\cdot {\hat {s}}(t),$ $s_{a}(t)\cdot e^{-i2\pi {\frac {B}{2}}t},$

Хотя комплексные выборки можно получить, как описано выше, они также создаются путем манипулирования выборками действительнозначной формы сигнала. Например, эквивалентный сигнал основной полосы частот можно создать без явных вычислений путем обработки последовательности произведений ^[E] через цифровой фильтр нижних частот, частота среза которого равна B /2. ^[F] Вычисление только каждой второй выборки выходной последовательности уменьшает частоту дискретизации, соизмеримую с уменьшенной частотой Найквиста. В результате получается вдвое меньше комплексных выборок, чем исходное количество реальных выборок. Никакая информация не теряется, и при необходимости можно восстановить исходную форму сигнала s(t). ${\hat {s}}(т),$ ${\displaystyle,\left[s(nT)\cdot e^{-i2\pi {\frac {B}{2}}Tn}\right],}$

Смотрите также

Примечания

^ Например, «количество выборок» при обработке сигналов примерно эквивалентно « размеру выборки » в статистике.
^ Существуют еще более высокие частоты дискретизации DSD, но преимущества от них, вероятно, незаметны, а размер этих файлов будет огромным.
^ Пары выборок также иногда рассматриваются как точки на диаграмме созвездия .
^ Когда комплексная частота дискретизации равна B , например, частотный компонент при 0,6 B будет иметь псевдоним -0,4 B , что является однозначным из-за ограничения, согласно которому предварительно дискретизированный сигнал был аналитическим. Также см. Псевдоним § Комплексные синусоиды .
^ Когда s ( t ) отбирается на частоте Найквиста (1/ T = 2 B ), последовательность продуктов упрощается до $\left[s(nT)\cdot (-i)^{n}\right].$
^ Последовательность комплексных чисел свернута с импульсной характеристикой фильтра с вещественными коэффициентами. Это эквивалентно раздельной фильтрации последовательностей действительных и мнимых частей и преобразованию комплексных пар на выходе.

дальнейшее чтение

Мэтт Фарр, Венцель Якоб и Грег Хамфрис, Физически обоснованный рендеринг: от теории к реализации, 3-е изд. , Морган Кауфманн, ноябрь 2016 г. ISBN 978-0128006450 . Глава о выборке (доступна в Интернете) прекрасно написана и содержит диаграммы, основную теорию и пример кода.

Внешние ссылки

Журнал, посвященный теории выборки
Данные I/Q для чайников – страница, пытающаяся ответить на вопрос « Почему данные I/Q?»
Выборка аналоговых сигналов – интерактивная презентация в веб-демо в Институте телекоммуникаций Штутгартского университета.