В обработке сигналов дискретизация — это преобразование сигнала непрерывного времени в сигнал дискретного времени . Типичным примером является преобразование звуковой волны в последовательность «выборок». Выборка — это значение сигнала в определенный момент времени и/или пространства; это определение отличается от использования этого термина в статистике , которая относится к набору таких значений. [А]
Сэмплер — это подсистема или операция, которая извлекает выборки из непрерывного сигнала . Теоретически идеальный пробоотборник производит выборки, эквивалентные мгновенному значению непрерывного сигнала в нужных точках.
Исходный сигнал может быть восстановлен из последовательности выборок, вплоть до предела Найквиста , путем пропускания последовательности выборок через фильтр реконструкции .
Можно выбирать функции пространства, времени или любого другого измерения, причем аналогичным образом в двух или более измерениях.
Для функций, которые изменяются со временем, пусть S ( t ) будет непрерывной функцией (или «сигналом»), подлежащей выборке, и пусть выборка выполняется путем измерения значения непрерывной функции каждые T секунд, что называется интервалом выборки или период выборки . [1] Тогда выборочная функция задается последовательностью:
Частота дискретизации или частота дискретизации , f s , представляет собой среднее количество выборок, полученных за одну секунду, таким образом, f s = 1/ T , с единицей выборки в секунду , иногда называемой герцами , например, например, 48 кГц - это 48 000 выборок. в секунду .
Восстановление непрерывной функции по выборкам осуществляется с помощью алгоритмов интерполяции. Формула интерполяции Уиттекера-Шеннона математически эквивалентна идеальному фильтру нижних частот , входные данные которого представляют собой последовательность дельта-функций Дирака , которые модулируются (умножаются) значениями выборки. Когда временной интервал между соседними выборками является константой ( T ), последовательность дельта-функций называется гребенкой Дирака . Математически модулированная гребенка Дирака эквивалентна произведению функции гребенки на s ( t ). Эту математическую абстракцию иногда называют импульсной выборкой . [2]
Большинство дискретизированных сигналов не просто сохраняются и реконструируются. Точность теоретической реконструкции является общепринятым показателем эффективности выборки. Эта точность снижается, когда s ( t ) содержит частотные компоненты, длина цикла (период) которых меньше 2 интервалов выборки (см. Совмещение ). Соответствующий предел частоты в циклах в секунду ( герц ) составляет 0,5 цикла/выборка × f с выборок/секунду = f с /2, что известно как частота Найквиста пробоотборника. Следовательно, s ( t ) обычно является выходным сигналом фильтра нижних частот , функционально известного как фильтр сглаживания . Без фильтра сглаживания частоты выше частоты Найквиста будут влиять на выборки таким образом, что это будет неправильно интерпретировано процессом интерполяции. [3]
На практике непрерывный сигнал дискретизируется с помощью аналого-цифрового преобразователя (АЦП) — устройства с различными физическими ограничениями. Это приводит к отклонениям от теоретически идеальной реконструкции, которые в совокупности называются искажениями .
Могут возникнуть различные типы искажений, в том числе:
Хотя использование передискретизации может полностью устранить апертурную ошибку и наложение спектров за счет их смещения за пределы полосы пропускания, этот метод практически невозможно использовать на частотах выше нескольких ГГц и может быть непомерно дорогим на гораздо более низких частотах. Более того, хотя передискретизация и может уменьшить ошибки квантования и нелинейность, она не может устранить их полностью. Следовательно, практические АЦП на звуковых частотах обычно не имеют наложения спектров, ошибки апертуры и не ограничены ошибкой квантования. Вместо этого доминирует аналоговый шум. На радиочастотных и микроволновых частотах, где передискретизация нецелесообразна, а фильтры дороги, ошибка апертуры, ошибка квантования и наложение спектров могут стать существенными ограничениями.
Джиттер, шум и квантование часто анализируются путем их моделирования как случайных ошибок, добавляемых к значениям выборки. Эффекты интегрирования и удержания нулевого порядка можно анализировать как форму фильтрации нижних частот . Нелинейности АЦП или ЦАП анализируются путем замены идеального отображения линейной функции предлагаемой нелинейной функцией .
Цифровое аудио использует импульсно-кодовую модуляцию (PCM) и цифровые сигналы для воспроизведения звука. Сюда входят аналого-цифровое преобразование (АЦП), цифро-аналоговое преобразование (ЦАП), хранение и передача. По сути, система, обычно называемая цифровой, на самом деле является аналогом предыдущего электрического аналога с дискретным временем и дискретным уровнем. Хотя современные системы могут быть весьма тонкими в своих методах, основная польза цифровой системы заключается в способности хранить, извлекать и передавать сигналы без потери качества.
Когда необходимо захватить звук, охватывающий весь диапазон человеческого слуха 20–20 000 Гц [5] , например, при записи музыки или многих типов акустических событий, звуковые сигналы обычно дискретизируются с частотой 44,1 кГц ( CD ), 48 кГц, 88,2 кГц. , или 96 кГц. [6] Требование приблизительно двойной ставки является следствием теоремы Найквиста . Частоты дискретизации выше 50–60 кГц не могут предоставить слушателям больше полезной информации. По этой причине первые производители профессионального аудиооборудования выбирали частоту дискретизации в диапазоне от 40 до 50 кГц.
В отрасли наблюдается тенденция к увеличению частоты дискретизации, значительно превышающей базовые требования: например, 96 кГц и даже 192 кГц [7]. Несмотря на то, что ультразвуковые частоты неслышимы для человека, запись и микширование при более высоких частотах дискретизации эффективно устраняют искажения, которые могут быть вызвано обратным псевдонимом . И наоборот, ультразвуковые звуки могут взаимодействовать со слышимой частью частотного спектра и модулировать ее ( интермодуляционные искажения ), ухудшая качество воспроизведения. [8] Одним из преимуществ более высоких частот дискретизации является то, что они могут ослабить требования к конструкции фильтров нижних частот для АЦП и ЦАП , но с современными дельта-сигма-преобразователями с передискретизацией это преимущество менее важно.
Общество аудиоинженеров рекомендует частоту дискретизации 48 кГц для большинства приложений, но признает частоту 44,1 кГц для компакт-дисков и других потребительских целей, 32 кГц для приложений, связанных с передачей, и 96 кГц для более широкой полосы пропускания или смягченной фильтрации сглаживания . [9] И Lavry Engineering, и Дж. Роберт Стюарт заявляют, что идеальная частота дискретизации должна составлять около 60 кГц, но, поскольку это не стандартная частота, для целей записи рекомендуются 88,2 или 96 кГц. [10] [11] [12] [13]
Более полный список распространенных частот дискретизации звука:
Звук обычно записывается с глубиной 8, 16 и 24 бита, что дает теоретическое максимальное отношение сигнал/шум квантования (SQNR) для чистой синусоидальной волны примерно 49,93 дБ , 98,09 дБ и 122,17 дБ. . [21] Звук CD-качества использует 16-битные сэмплы. Тепловой шум ограничивает истинное количество битов, которые можно использовать при квантовании. Лишь немногие аналоговые системы имеют отношение сигнал/шум (SNR), превышающее 120 дБ. Однако операции цифровой обработки сигналов могут иметь очень широкий динамический диапазон, поэтому обычно операции микширования и мастеринга выполняются с 32-битной точностью, а затем преобразуются в 16- или 24-битные для распространения.
Речевые сигналы, то есть сигналы, предназначенные для передачи только человеческой речи , обычно могут дискретизироваться с гораздо меньшей частотой. Для большинства фонем почти вся энергия содержится в диапазоне 100 Гц – 4 кГц, что позволяет использовать частоту дискретизации 8 кГц. Это частота дискретизации , используемая почти всеми телефонными системами, использующими спецификации дискретизации и квантования G.711 . [ нужна цитата ]
Телевидение стандартной четкости (SDTV) использует для видимой области изображения либо 720 на 480 пикселей (США NTSC , 525 строк), либо 720 на 576 пикселей (UK PAL , 625 строк).
Телевидение высокой четкости (HDTV) использует разрешение 720p (прогрессивное), 1080i (чересстрочное) и 1080p (прогрессивное, также известное как Full-HD).
В цифровом видео временная частота дискретизации определяется частотой кадров – или, скорее, частотой полей – а не условной частотой пикселей. Частота дискретизации изображения — это частота повторения периода интеграции датчика. Поскольку период интегрирования может быть значительно короче времени между повторениями, частота дискретизации может отличаться от обратной величины времени выборки:
Цифро-аналоговые преобразователи видео работают в мегагерцовом диапазоне (от ~ 3 МГц для низкокачественных композитных видеоскейлеров в ранних игровых консолях до 250 МГц и более для выхода VGA с самым высоким разрешением).
Когда аналоговое видео преобразуется в цифровое , происходит другой процесс дискретизации, на этот раз с частотой пикселей, соответствующей частоте пространственной дискретизации вдоль строк сканирования . Общая частота дискретизации пикселей :
Пространственная выборка в другом направлении определяется расстоянием между линиями сканирования в растре . Частота дискретизации и разрешение в обоих пространственных направлениях могут измеряться в строках на высоту изображения.
Пространственное сглаживание высокочастотных видеокомпонентов яркости или цветности проявляется в виде муара .
Процесс объемной визуализации выбирает трехмерную сетку вокселов для создания трехмерной визуализации срезов (томографических) данных. Предполагается, что трехмерная сетка представляет собой непрерывную область трехмерного пространства. Объемная визуализация широко распространена в медицинской визуализации, например, рентгеновская компьютерная томография (КТ/КТ), магнитно-резонансная томография (МРТ), позитронно-эмиссионная томография (ПЭТ). Он также используется для сейсмической томографии и других приложений.
Когда полосовой сигнал дискретизируется медленнее, чем его частота Найквиста , выборки неотличимы от выборок низкочастотного псевдонима высокочастотного сигнала. Часто это делается целенаправленно таким образом, чтобы псевдоним самой низкой частоты удовлетворял критерию Найквиста , поскольку полосовой сигнал по-прежнему однозначно представлен и поддается восстановлению. Такая недостаточная дискретизация также известна как полосовая выборка , гармоническая выборка , выборка ПЧ и прямое преобразование ПЧ в цифровой формат. [22]
Передискретизация используется в большинстве современных аналого-цифровых преобразователей для уменьшения искажений, вносимых практическими цифро-аналоговыми преобразователями , таких как удержание нулевого порядка вместо идеализаций, таких как формула интерполяции Уиттекера-Шеннона . [23]
Комплексная выборка (или выборка I/Q ) — это одновременная выборка двух разных, но связанных сигналов, в результате чего образуются пары выборок, которые впоследствии обрабатываются как комплексные числа . [C] Когда одна форма сигнала является преобразованием Гильберта другой формы сигнала , комплекснозначная функция называется аналитическим сигналом , преобразование Фурье которого равно нулю для всех отрицательных значений частоты. В этом случае скорость Найквиста для сигнала без частот ≥ B может быть уменьшена до B (комплексных выборок в секунду) вместо 2 B (реальных выборок в секунду). [D] Более очевидно, что эквивалентный сигнал основной полосы частот также имеет коэффициент Найквиста B , потому что все его ненулевое частотное содержимое сдвинуто в интервал [-B/2, B/2).
Хотя комплексные выборки можно получить, как описано выше, они также создаются путем манипулирования выборками действительнозначной формы сигнала. Например, эквивалентный сигнал основной полосы частот можно создать без явных вычислений путем обработки последовательности произведений [E] через цифровой фильтр нижних частот, частота среза которого равна B /2. [F] Вычисление только каждой второй выборки выходной последовательности уменьшает частоту дискретизации, соизмеримую с уменьшенной частотой Найквиста. В результате получается вдвое меньше комплексных выборок, чем исходное количество реальных выборок. Никакая информация не теряется, и при необходимости можно восстановить исходную форму сигнала s(t).
во многих случаях мы можем услышать звук более высоких частот дискретизации не потому, что они более прозрачны, а потому, что они менее прозрачны. Они могут фактически внести непреднамеренные искажения в слышимый спектр.
Хотя 60 КГц было бы ближе к идеалу; Учитывая существующие стандарты, наиболее близкими к оптимальной частоте дискретизации являются 88,2 кГц и 96 кГц.
Я стараюсь приспособить все уши, и есть сообщения о том, что лишь немногие люди действительно могут слышать частоту чуть выше 20 кГц. Я думаю, что 48 кГц — это довольно хороший компромисс, но 88,2 или 96 кГц дают некоторый дополнительный запас.
В настоящее время многие хорошие дизайнеры и специалисты по слуху считают частоту дискретизации 60–70 кГц оптимальной для уха. Он достаточно быстрый, чтобы включить то, что мы слышим, но достаточно медленный, чтобы сделать это довольно точно.
как психоакустический анализ, так и опыт говорят нам, что минимальный прямоугольный канал, необходимый для обеспечения прозрачности, использует линейную PCM с 18,2-битными выборками на частоте 58 кГц. ... существуют веские аргументы в пользу сохранения целочисленных соотношений с существующими частотами дискретизации, что предполагает принятие значения 88,2 кГц или 96 кГц.
Для большинства записей достаточно частоты дискретизации 22050 в стерео. Исключением, вероятно, станут записи, сделанные во второй половине века, для которых может потребоваться частота дискретизации 44100.
Поддерживаемые частоты дискретизации: внутренние 32, 44,1, 48, 64, 88,2, 96, 176,4, 192 кГц.
Поддерживаемые частоты дискретизации: 44,1 кГц, 48 кГц, 64 кГц, 88,2 кГц, 96 кГц, 176,4 кГц, 192 кГц.
Общая частота дискретизации: 64 000 Гц
[Скриншот Cubase]