В обработке сигналов выборка — это преобразование непрерывного сигнала в дискретный сигнал . Типичным примером является преобразование звуковой волны в последовательность «выборок». Выборка — это значение сигнала в определенный момент времени и/или пространства; это определение отличается от использования этого термина в статистике , где он относится к набору таких значений. [A]
Сэмплер — это подсистема или операция, которая извлекает выборки из непрерывного сигнала . Теоретически идеальный сэмплер производит выборки, эквивалентные мгновенному значению непрерывного сигнала в желаемых точках.
Исходный сигнал можно восстановить из последовательности выборок вплоть до предела Найквиста , пропустив последовательность выборок через фильтр реконструкции .
Функции пространства, времени или любого другого измерения могут быть отобраны, и то же самое можно сделать в двух или более измерениях.
Для функций, которые изменяются со временем, пусть будет непрерывной функцией (или «сигналом»), подлежащей выборке, и пусть выборка выполняется путем измерения значения непрерывной функции каждые секунды, что называется интервалом выборки или периодом выборки . [1] [2] Тогда выборочная функция задается последовательностью:
Частота дискретизации или частота дискретизации — это среднее число выборок, полученных за одну секунду, то есть единица измерения — выборки в секунду , иногда называемая герцем , например, 48 кГц — это 48 000 выборок в секунду .
Восстановление непрерывной функции из выборок выполняется с помощью алгоритмов интерполяции. Формула интерполяции Уиттекера–Шеннона математически эквивалентна идеальному фильтру нижних частот , входом которого является последовательность дельта-функций Дирака , которые модулируются (умножаются) на значения выборки. Когда временной интервал между соседними выборками является константой , последовательность дельта-функций называется гребнем Дирака . Математически модулированный гребень Дирака эквивалентен произведению функции гребня на . Эту математическую абстракцию иногда называют импульсной выборкой . [3]
Большинство дискретизированных сигналов не просто сохраняются и реконструируются. Точность теоретической реконструкции является общепринятой мерой эффективности дискретизации. Эта точность снижается, когда содержит частотные компоненты, длина цикла (период) которых меньше 2 интервалов дискретизации (см. Наложение спектров ). Соответствующий предел частоты в циклах в секунду ( герц ) равен цикл/выборка × выборок/секунду = , известный как частота Найквиста дискретизатора. Таким образом, обычно является выходным сигналом фильтра нижних частот , функционально известного как фильтр сглаживания . Без фильтра сглаживания спектров частоты выше частоты Найквиста будут влиять на выборки таким образом, что процесс интерполяции будет неправильно истолкован. [4]
На практике непрерывный сигнал дискретизируется с помощью аналого-цифрового преобразователя (АЦП), устройства с различными физическими ограничениями. Это приводит к отклонениям от теоретически идеальной реконструкции, которые в совокупности называются искажением .
Могут возникнуть различные типы искажений, в том числе:
Хотя использование передискретизации может полностью устранить ошибку апертуры и наложение спектров, выведя их за пределы полосы пропускания, этот метод не может быть практически использован выше нескольких ГГц и может быть непозволительно дорогим на гораздо более низких частотах. Кроме того, хотя передискретизация может уменьшить ошибку квантования и нелинейность, она не может полностью их устранить. Следовательно, практические АЦП на звуковых частотах обычно не демонстрируют наложение спектров, ошибку апертуры и не ограничены ошибкой квантования. Вместо этого доминирует аналоговый шум. На радиочастотах и микроволновых частотах, где передискретизация непрактична, а фильтры дороги, ошибка апертуры, ошибка квантования и наложение спектров могут быть существенными ограничениями.
Джиттер, шум и квантование часто анализируются путем моделирования их как случайных ошибок, добавленных к значениям выборки. Интеграция и эффекты удержания нулевого порядка могут быть проанализированы как форма фильтрации нижних частот . Нелинейности АЦП или ЦАП анализируются путем замены идеального линейного отображения функции на предлагаемую нелинейную функцию .
Цифровое аудио использует импульсно-кодовую модуляцию (ИКМ) и цифровые сигналы для воспроизведения звука. Это включает в себя аналого-цифровое преобразование (АЦП), цифро-аналоговое преобразование (ЦАП), хранение и передачу. По сути, система, обычно называемая цифровой, на самом деле является дискретным по времени и уровню аналогом предыдущего электрического аналога. Хотя современные системы могут быть довольно тонкими в своих методах, основная полезность цифровой системы заключается в способности хранить, извлекать и передавать сигналы без какой-либо потери качества.
Когда необходимо захватить аудио, охватывающее весь диапазон человеческого слуха 20–20 000 Гц [6], например, при записи музыки или многих типов акустических событий, аудиосигналы обычно дискретизируются на частоте 44,1 кГц ( CD ), 48 кГц, 88,2 кГц или 96 кГц. [7] Требование приблизительно двойной частоты является следствием теоремы Найквиста . Частоты дискретизации выше, чем примерно 50 кГц–60 кГц, не могут предоставить больше полезной информации для слушателей. По этой причине первые производители профессионального аудиооборудования выбирали частоты дискретизации в районе 40–50 кГц.
В отрасли наблюдается тенденция к частотам дискретизации, значительно превышающим основные требования: например, 96 кГц и даже 192 кГц [8]. Несмотря на то, что ультразвуковые частоты не слышны человеку, запись и микширование на более высоких частотах дискретизации эффективно устраняют искажения, которые могут быть вызваны фолдбэк-алиасингом . И наоборот, ультразвуковые звуки могут взаимодействовать с слышимой частью частотного спектра и модулировать ее ( интермодуляционные искажения ), ухудшая точность воспроизведения. [9] Одним из преимуществ более высоких частот дискретизации является то, что они могут смягчить требования к конструкции фильтра нижних частот для АЦП и ЦАП , но с современными дельта-сигма-преобразователями с избыточной дискретизацией это преимущество менее важно.
Audio Engineering Society рекомендует частоту дискретизации 48 кГц для большинства приложений, но признает 44,1 кГц для CD и других потребительских применений, 32 кГц для приложений, связанных с передачей, и 96 кГц для более высокой полосы пропускания или ослабленной фильтрации сглаживания . [10] И Lavry Engineering, и J. Robert Stuart утверждают, что идеальная частота дискретизации будет около 60 кГц, но поскольку это не стандартная частота, рекомендуют 88,2 или 96 кГц для целей записи. [11] [12] [13] [14]
Более полный список распространенных частот дискретизации звука:
Аудио обычно записывается с глубиной 8, 16 и 24 бит, что дает теоретическое максимальное отношение сигнал/шум квантования (SQNR) для чистой синусоиды приблизительно 49,93 дБ , 98,09 дБ и 122,17 дБ. [22] Аудио CD-качества использует 16-битные сэмплы. Тепловой шум ограничивает истинное количество бит, которые могут быть использованы при квантовании. Немногие аналоговые системы имеют отношение сигнал/шум (SNR), превышающее 120 дБ. Однако операции цифровой обработки сигнала могут иметь очень высокий динамический диапазон, поэтому обычно операции микширования и мастеринга выполняют с точностью 32 бита, а затем преобразуют в 16- или 24-бит для распространения.
Речевые сигналы, т. е. сигналы, предназначенные для передачи только человеческой речи , обычно могут быть дискретизированы с гораздо более низкой частотой. Для большинства фонем почти вся энергия содержится в диапазоне 100 Гц – 4 кГц, что позволяет использовать частоту дискретизации 8 кГц. Это частота дискретизации, используемая почти всеми телефонными системами, которые используют спецификации дискретизации и квантования G.711 . [ необходима цитата ]
Телевидение стандартной четкости (SDTV) использует для видимой области изображения разрешение 720 на 480 пикселей (US NTSC 525 строк) или 720 на 576 пикселей (UK PAL 625 строк).
Телевидение высокой четкости (HDTV) использует форматы 720p (прогрессивный), 1080i (чересстрочный) и 1080p (прогрессивный, также известный как Full-HD).
В цифровом видео временная частота дискретизации определяется как частота кадров — или, скорее, частота поля — а не как условные пиксельные часы. Частота дискретизации изображения — это частота повторения периода интеграции сенсора. Поскольку период интеграции может быть значительно короче времени между повторениями, частота дискретизации может отличаться от обратной величины времени выборки:
Цифро-аналоговые преобразователи видео работают в мегагерцовом диапазоне (от ~3 МГц для низкокачественных композитных видеомасштабаторов в ранних игровых консолях до 250 МГц и более для выхода VGA с самым высоким разрешением).
Когда аналоговое видео преобразуется в цифровое видео , происходит другой процесс выборки, на этот раз с частотой пикселей, соответствующей пространственной частоте выборки вдоль строк сканирования . Обычная частота выборки пикселей составляет:
Пространственная выборка в другом направлении определяется интервалом между строками сканирования в растре . Частоты выборки и разрешения в обоих пространственных направлениях могут быть измерены в единицах строк на высоту изображения.
Пространственное наложение высокочастотных компонентов яркости или цветности видео проявляется в виде муарового узора .
Процесс объемного рендеринга использует 3D-сетку вокселей для создания 3D-рендеров срезов (томографических) данных. Предполагается, что 3D-сетка представляет собой непрерывную область трехмерного пространства. Объемный рендеринг распространен в медицинской визуализации, рентгеновской компьютерной томографии (КТ/КТ), магнитно-резонансной томографии (МРТ), позитронно-эмиссионной томографии (ПЭТ) — вот некоторые примеры. Он также используется для сейсмической томографии и других приложений.
Когда полосовой сигнал дискретизируется медленнее, чем его скорость Найквиста , выборки неотличимы от выборок низкочастотного псевдонима высокочастотного сигнала. Это часто делается намеренно таким образом, чтобы низкочастотный псевдоним удовлетворял критерию Найквиста , поскольку полосовой сигнал по-прежнему уникально представлен и восстанавливаем. Такая недостаточная выборка также известна как полосовая выборка , гармоническая выборка , выборка ПЧ и прямое преобразование ПЧ в цифровую форму. [23]
Передискретизация используется в большинстве современных аналого-цифровых преобразователей для уменьшения искажений, вносимых практическими цифро-аналоговыми преобразователями , например, удержание нулевого порядка вместо идеализаций, таких как интерполяционная формула Уиттекера-Шеннона . [24]
Комплексная выборка (или выборка I/Q ) — это одновременная выборка двух различных, но связанных форм сигналов, в результате чего получаются пары выборок, которые впоследствии обрабатываются как комплексные числа . [C] Когда одна форма сигнала, , является преобразованием Гильберта другой формы сигнала, , комплекснозначная функция, , называется аналитическим сигналом , преобразование Фурье которого равно нулю для всех отрицательных значений частоты. В этом случае скорость Найквиста для формы сигнала без частот ≥ B может быть уменьшена просто до B (комплексных выборок/сек), вместо (действительных выборок/сек). [D] Более очевидно, что эквивалентная форма сигнала основной полосы частот , , также имеет скорость Найквиста , поскольку все ее ненулевое частотное содержимое смещено в интервал .
Хотя комплексные выборки могут быть получены, как описано выше, они также создаются путем манипулирования выборками действительной формы сигнала. Например, эквивалентная форма сигнала основной полосы может быть создана без явного вычисления , путем обработки последовательности продукта, , [E] через цифровой фильтр нижних частот, частота среза которого равна . [F] Вычисление только каждой второй выборки выходной последовательности снижает частоту выборки соразмерно уменьшенной частоте Найквиста. Результатом является половина комплексных выборок по сравнению с исходным числом действительных выборок. Никакая информация не теряется, и исходная форма сигнала может быть восстановлена, если необходимо.
многих случаях мы можем слышать звук более высоких частот дискретизации не потому, что они более прозрачны, а потому, что они менее прозрачны. Они могут фактически вносить непреднамеренные искажения в слышимый спектр
60 кГц было бы ближе к идеалу, учитывая существующие стандарты, 88,2 кГц и 96 кГц наиболее близки к оптимальной частоте дискретизации.
Я пытаюсь учесть все уши, и есть сообщения о нескольких людях, которые действительно могут слышать немного выше 20 кГц. Я думаю, что 48 кГц — это довольно хороший компромисс, но 88,2 или 96 кГц дают некоторый дополнительный запас.
В настоящее время есть ряд хороших дизайнеров и специалистов по слуху, которые считают частоту дискретизации 60-70 кГц оптимальной для слуха. Она достаточно быстра, чтобы включить то, что мы слышим, но достаточно медленна, чтобы делать это довольно точно.
И психоакустический анализ, и опыт говорят нам, что минимальный прямоугольный канал, необходимый для обеспечения прозрачности, использует линейную PCM с 18,2-битными выборками при 58 кГц. ... существуют веские аргументы в пользу сохранения целочисленных соотношений с существующими частотами дискретизации, что предполагает принятие 88,2 кГц или 96 кГц.
Для большинства записей частота дискретизации 22050 в стерео является адекватной. Исключением, вероятно, будут записи, сделанные во второй половине века, для которых может потребоваться частота дискретизации 44100.
Поддерживаемые частоты дискретизации: Внутренние 32, 44.1, 48, 64, 88.2, 96, 176.4, 192 кГц.
Поддерживаемые частоты дискретизации: 44,1 кГц, 48 кГц, 64 кГц, 88,2 кГц, 96 кГц, 176,4 кГц, 192 кГц
Распространенные частоты дискретизации: 64 000 Гц
[Скриншот Cubase]