Теорема дискретизации Найквиста-Шеннона является важнейшим принципом цифровой обработки сигналов, связывающим диапазон частот сигнала и частоту дискретизации, необходимую для избежания типа искажения , называемого наложением спектров . Теорема гласит, что частота дискретизации должна быть как минимум в два раза больше полосы пропускания сигнала, чтобы избежать наложения спектров. На практике она используется для выбора фильтров, ограничивающих полосу пропускания , чтобы удерживать наложение спектров ниже приемлемого уровня при дискретизации аналогового сигнала или при изменении частоты дискретизации в функции цифровой обработки сигнала.
Теорема дискретизации Найквиста–Шеннона — это теорема в области обработки сигналов , которая служит фундаментальным мостом между непрерывными и дискретными сигналами . Она устанавливает достаточное условие для частоты дискретизации , которая позволяет дискретной последовательности выборок захватывать всю информацию из непрерывного сигнала с конечной полосой пропускания .
Строго говоря, теорема применима только к классу математических функций , имеющих преобразование Фурье , равное нулю вне конечной области частот. Интуитивно мы ожидаем, что когда мы сводим непрерывную функцию к дискретной последовательности и интерполируем обратно к непрерывной функции, точность результата зависит от плотности (или частоты дискретизации ) исходных выборок. Теорема дискретизации вводит понятие частоты дискретизации, достаточной для идеальной точности для класса функций, которые ограничены полосой пропускания заданной ширины, так что никакая фактическая информация не теряется в процессе дискретизации. Она выражает достаточную частоту дискретизации в терминах полосы пропускания для класса функций. Теорема также приводит к формуле для идеального восстановления исходной непрерывной функции из выборок.
Идеальная реконструкция все еще может быть возможна, когда критерий частоты дискретизации не выполняется, при условии, что известны другие ограничения на сигнал (см. § Выборка сигналов, отличных от основной полосы частот, ниже и сжатое зондирование ). В некоторых случаях (когда критерий частоты дискретизации не выполняется) использование дополнительных ограничений позволяет проводить приблизительные реконструкции. Точность этих реконструкций можно проверить и количественно оценить, используя теорему Бохнера . [1]
Название теорема выборки Найквиста–Шеннона дано в честь Гарри Найквиста и Клода Шеннона , но теорема была также ранее открыта Э. Т. Уиттакером (опубликована в 1915 году), и Шеннон цитировал статью Уиттакера в своей работе. Таким образом, теорема также известна под названиями теорема выборки Уиттакера–Шеннона , Уиттакера–Шеннона и Уиттакера–Найквиста–Шеннона , и может также упоминаться как кардинальная теорема интерполяции .
Выборка — это процесс преобразования сигнала (например, функции непрерывного времени или пространства) в последовательность значений (функцию дискретного времени или пространства). Версия теоремы Шеннона гласит: [2]
Теорема — Если функция не содержит частот выше B герц , то ее можно полностью определить по ее ординатам в последовательности точек, отстоящих друг от друга менее чем на секунду.
Достаточная частота дискретизации, следовательно, любая, большая, чем выборки в секунду. Эквивалентно, для заданной частоты дискретизации , идеальная реконструкция гарантированно возможна для предела полосы пропускания .
Когда предел полосы пропускания слишком высок (или предел полосы пропускания отсутствует), реконструкция демонстрирует несовершенства, известные как наложение спектров . Современные формулировки теоремы иногда тщательно указывают, что не должно содержать синусоидального компонента с точной частотой или что оно должно быть строго меньше половины частоты дискретизации. Порог называется частотой Найквиста и является атрибутом непрерывного во времени входного сигнала , который должен быть дискретизирован. Частота дискретизации должна превышать частоту Найквиста, чтобы выборки были достаточны для представления Порог называется частотой Найквиста и является атрибутом оборудования для дискретизации . Все значимые частотные компоненты правильно дискретизированного существуют ниже частоты Найквиста. Условие, описываемое этими неравенствами, называется критерием Найквиста или иногда условием Раабе . Теорема также применима к функциям других областей, таких как пространство, в случае оцифрованного изображения. Единственное изменение в случае других областей — это единицы измерения, приписываемые и
Символ обычно используется для представления интервала между выборками и называется периодом выборки или интервалом выборки . Выборки функции обычно обозначаются как [3] (альтернативно в старой литературе по обработке сигналов) для всех целых значений Множитель является результатом перехода от непрерывного времени к дискретному времени (см. Дискретное_временное_преобразование_Фурье#Отношение_к_преобразованию_Фурье ), и он сохраняет энергию сигнала при изменении.
Математически идеальный способ интерполяции последовательности включает использование функций sinc . Каждый образец в последовательности заменяется функцией sinc, центрированной на оси времени в исходном местоположении образца с амплитудой функции sinc, масштабированной до значения образца. Впоследствии функции sinc суммируются в непрерывную функцию. Математически эквивалентный метод использует гребень Дирака и осуществляется путем свертки одной функции sinc с серией дельта-импульсов Дирака , взвешенных по значениям образца. Ни один из методов не является численно практичным. Вместо этого используется некоторый тип аппроксимации функций sinc, конечная по длине. Несовершенства, приписываемые аппроксимации, известны как ошибка интерполяции .
Практические цифро-аналоговые преобразователи не производят ни масштабированные и задержанные функции sinc , ни идеальные импульсы Дирака . Вместо этого они производят кусочно-постоянную последовательность масштабированных и задержанных прямоугольных импульсов ( удержание нулевого порядка ), обычно сопровождаемую фильтром нижних частот (называемым «фильтром анти-изображения») для удаления ложных высокочастотных реплик (изображений) исходного сигнала основной полосы частот.
Когда функция имеет преобразование Фурье :
Тогда выборок достаточно для создания периодического суммирования ( см. Дискретное_временное_преобразование_Фурье#Отношение_к_преобразованию_Фурье ) :
которая является периодической функцией и ее эквивалентным представлением в виде ряда Фурье , коэффициенты которого равны . Эта функция также известна как дискретное преобразование Фурье (DTFT) последовательности выборок.
Как показано, копии смещаются на кратные частоты дискретизации и объединяются путем сложения. Для функции с ограниченной полосой пропускания и достаточно большой возможно, что копии останутся отличными друг от друга. Но если критерий Найквиста не выполняется, соседние копии перекрываются, и в общем случае невозможно различить однозначный Любой частотный компонент выше неотличим от компонента с более низкой частотой, называемого псевдонимом , связанного с одной из копий. В таких случаях обычные методы интерполяции создают псевдоним, а не исходный компонент. Когда частота дискретизации предопределена другими соображениями (например, отраслевым стандартом), обычно фильтруется для снижения его высоких частот до приемлемых уровней перед его дискретизацией. Тип требуемого фильтра - фильтр нижних частот , и в этом приложении он называется фильтром сглаживания .
Если нет перекрытия копий (также известных как «изображения») , член уравнения 1 может быть восстановлен с помощью произведения:
где:
Теорема выборки доказана, поскольку однозначно определяет .
Остается только вывести формулу для реконструкции. не обязательно точно определять в области, поскольку в этой области равен нулю. Однако наихудший случай — это когда частота Найквиста. Функция, которая достаточна для этого и всех менее тяжелых случаев, это :
где — прямоугольная функция . Следовательно:
Обратное преобразование обеих сторон дает интерполяционную формулу Уиттекера–Шеннона :
который показывает, как образцы, , могут быть объединены для реконструкции .
Пуассон показывает, что ряд Фурье в уравнении 1 производит периодическое суммирование , независимо от и . Шеннон, однако, выводит коэффициенты ряда только для случая . Фактически цитируя оригинальную статью Шеннона:
Доказательство теоремы Шеннона на этом этапе завершено, но он продолжает обсуждать реконструкцию с помощью sinc-функций , то, что мы теперь называем интерполяционной формулой Уиттекера–Шеннона, как обсуждалось выше. Он не выводит и не доказывает свойства sinc-функции, поскольку парное соотношение Фурье между rect (прямоугольной функцией) и sinc-функциями было хорошо известно к тому времени. [4]
Пусть будет образцом. Тогда функция будет представлена как:
Как и в другом доказательстве, предполагается существование преобразования Фурье исходного сигнала, поэтому доказательство не говорит, распространяется ли теорема о выборке на стационарные случайные процессы с ограниченной полосой пропускания.
Теорема выборки обычно формулируется для функций одной переменной. Следовательно, теорема напрямую применима к сигналам, зависящим от времени, и обычно формулируется в этом контексте. Однако теорема выборки может быть расширена простым способом на функции произвольного числа переменных. Например, изображения в оттенках серого часто представляются в виде двумерных массивов (или матриц) действительных чисел, представляющих относительную интенсивность пикселей ( элементов изображения), расположенных на пересечениях местоположений выборки строк и столбцов. В результате изображениям требуются две независимые переменные, или индексы, чтобы однозначно указать каждый пиксель — один для строки и один для столбца.
Цветные изображения обычно состоят из композиции из трех отдельных изображений в оттенках серого, по одному для представления каждого из трех основных цветов — красного, зеленого и синего, или RGB для краткости. Другие цветовые пространства, использующие 3-векторы для цветов, включают HSV, CIELAB, XYZ и т. д. Некоторые цветовые пространства, такие как голубой, пурпурный, желтый и черный (CMYK), могут представлять цвет в четырех измерениях. Все они рассматриваются как векторные функции в двумерной выборочной области.
Подобно одномерным дискретным сигналам, изображения также могут страдать от наложения спектров, если разрешение выборки или плотность пикселей недостаточны. Например, цифровая фотография полосатой рубашки с высокими частотами (другими словами, расстояние между полосами мало) может вызвать наложение спектров рубашки при ее выборке датчиком изображения камеры . Наложение спектров проявляется в виде муарового узора . «Решением» более высокой выборки в пространственной области для этого случая было бы перемещение ближе к рубашке, использование датчика с более высоким разрешением или оптическое размывание изображения перед его получением датчиком с использованием оптического фильтра нижних частот .
Другой пример показан здесь в кирпичных узорах. Верхнее изображение показывает эффекты, когда условие теоремы выборки не выполняется. Когда программное обеспечение масштабирует изображение (тот же процесс, который создает миниатюру, показанную на нижнем изображении), оно, по сути, сначала пропускает изображение через фильтр нижних частот , а затем понижает разрешение изображения, чтобы получить меньшее изображение, которое не демонстрирует муаровый узор . Верхнее изображение — это то, что происходит, когда изображение понижается без фильтрации нижних частот: в результате возникает алиасинг.
Теорема выборки применима к системам камер, где сцена и объектив представляют собой источник аналогового пространственного сигнала, а датчик изображения является устройством пространственной выборки. Каждый из этих компонентов характеризуется функцией передачи модуляции (MTF), представляющей точное разрешение (пространственную полосу пропускания), доступное в этом компоненте. Эффекты наложения спектров или размытия могут возникать, когда MTF объектива и MTF датчика не совпадают. Когда оптическое изображение, которое дискретизируется датчиком, содержит более высокие пространственные частоты, чем датчик, недостаточная выборка действует как фильтр нижних частот для уменьшения или устранения наложения спектров. Когда область пятна выборки (размер пиксельного датчика) недостаточно велика для обеспечения достаточного пространственного сглаживания , в систему камеры может быть включен отдельный фильтр сглаживания (оптический фильтр нижних частот) для уменьшения MTF оптического изображения. Вместо того, чтобы требовать оптический фильтр, графический процессор камер смартфона выполняет цифровую обработку сигнала для удаления наложения спектров с помощью цифрового фильтра. Цифровые фильтры также применяют повышение резкости для усиления контраста линзы на высоких пространственных частотах, который в противном случае быстро падает на дифракционных пределах.
Теорема выборки также применима к постобработке цифровых изображений, например, к выборке вверх или вниз. Эффекты алиасинга, размытия и резкости могут быть скорректированы с помощью цифровой фильтрации, реализованной в программном обеспечении, которое обязательно следует теоретическим принципам.
Для иллюстрации необходимости рассмотрим семейство синусоид, порожденных различными значениями в этой формуле:
С или эквивалентно образцы задаются следующим образом:
независимо от значения Такого рода неоднозначность является причиной строгого неравенства условия теоремы выборки.
Как обсуждает Шеннон: [2]
Аналогичный результат справедлив, если полоса начинается не с нулевой частоты, а с некоторого более высокого значения, и может быть доказан линейным переносом (физически соответствующим однополосной модуляции ) случая нулевой частоты. В этом случае элементарный импульс получается из однополосной модуляции.
То есть, существует достаточное условие отсутствия потерь для дискретизации сигналов , не имеющих компонентов основной полосы , которое включает ширину ненулевого частотного интервала в отличие от его самого высокого частотного компонента. См. дискретизацию для получения более подробной информации и примеров.
Например, для того чтобы оцифровать радиосигналы FM в диапазоне частот 100–102 МГц , не обязательно производить оцифровку на частоте 204 МГц (в два раза больше верхней частоты), а достаточно производить оцифровку на частоте 4 МГц (в два раза больше ширины частотного интервала).
Условие пропускания полосы пропускания заключается в том, что для всех неотрицательных частот вне открытой полосы пропускания:
для некоторого неотрицательного целого числа . Эта формулировка включает в себя нормальное условие базовой полосы, как случай
Соответствующая функция интерполяции представляет собой импульсную характеристику идеального полосового фильтра с кирпичной стеной (в отличие от идеального фильтра нижних частот с кирпичной стеной, использованного выше) с отсечками на верхнем и нижнем краях указанной полосы, что представляет собой разницу между парой импульсных характеристик нижних частот:
Возможны и другие обобщения, например, для сигналов, занимающих несколько несмежных полос. Даже самая обобщенная форма теоремы о выборке не имеет доказуемо истинной обратной. То есть нельзя сделать вывод, что информация обязательно теряется только потому, что условия теоремы о выборке не выполняются; однако с инженерной точки зрения обычно можно с уверенностью предположить, что если теорема о выборке не выполняется, то информация, скорее всего, будет потеряна.
Теория выборки Шеннона может быть обобщена для случая неравномерной выборки , то есть выборки, взятые неравномерно во времени. Теория выборки Шеннона для неравномерной выборки утверждает, что сигнал с ограниченной полосой пропускания может быть идеально восстановлен из его выборок, если средняя частота выборки удовлетворяет условию Найквиста. [5] Поэтому, хотя равномерно распределенные выборки могут привести к более простым алгоритмам реконструкции, это не является необходимым условием для идеальной реконструкции.
Общая теория для немодулированных и неоднородных выборок была разработана в 1967 году Генри Ландау . [6] Он доказал, что средняя частота дискретизации (равномерной или иной) должна быть в два раза больше занимаемой полосы пропускания сигнала, предполагая, что априори известно, какая часть спектра занята.
В конце 1990-х годов эта работа была частично расширена для охвата сигналов, для которых известна величина занимаемой полосы пропускания, но фактическая занимаемая часть спектра неизвестна. [7] В 2000-х годах была разработана полная теория (см. раздел Выборка ниже скорости Найквиста при дополнительных ограничениях ниже) с использованием сжатого зондирования . В частности, теория, использующая язык обработки сигналов, описана в статье 2009 года Мишали и Эльдара. [8] Они показывают, среди прочего, что если местоположения частот неизвестны, то необходимо производить выборку по крайней мере в два раза больше критерия Найквиста; другими словами, вы должны заплатить по крайней мере в 2 раза больше за незнание местоположения спектра . Обратите внимание, что минимальные требования к выборке не обязательно гарантируют стабильность .
Теорема выборки Найквиста–Шеннона обеспечивает достаточное условие для выборки и реконструкции сигнала с ограниченной полосой пропускания. Когда реконструкция выполняется с помощью интерполяционной формулы Уиттекера–Шеннона , критерий Найквиста также является необходимым условием для избежания наложения спектров, в том смысле, что если выборки берутся с меньшей скоростью, чем в два раза больше предела полосы пропускания, то есть некоторые сигналы, которые не будут правильно восстановлены. Однако если на сигнал налагаются дополнительные ограничения, то критерий Найквиста может перестать быть необходимым условием .
Нетривиальный пример использования дополнительных предположений о сигнале дает недавняя область сжатого зондирования , которая позволяет проводить полную реконструкцию с частотой дискретизации ниже Найквиста. В частности, это относится к сигналам, которые являются разреженными (или сжимаемыми) в некоторой области. Например, сжатое зондирование имеет дело с сигналами, которые могут иметь низкую общую полосу пропускания (скажем, эффективную полосу пропускания ), но местоположения частот неизвестны, а не все вместе в одной полосе, так что метод полосы пропускания неприменим. Другими словами, частотный спектр разрежен. Традиционно необходимая частота дискретизации составляет Таким образом, используя методы сжатого зондирования, сигнал может быть идеально реконструирован, если он дискретизируется с частотой немного ниже, чем При таком подходе реконструкция больше не задается формулой, а вместо этого решением линейной программы оптимизации .
Другой пример, где суб-Найквистовская выборка является оптимальной, возникает при дополнительном ограничении, что выборки квантуются оптимальным образом, как в комбинированной системе выборки и оптимального сжатия с потерями . [9] Эта настройка актуальна в случаях, когда необходимо учитывать совместный эффект выборки и квантования , и может обеспечить нижнюю границу для минимальной ошибки реконструкции, которая может быть достигнута при выборке и квантовании случайного сигнала . Для стационарных гауссовых случайных сигналов эта нижняя граница обычно достигается при суб-Найквистовской частоте выборки, что указывает на то, что суб-Найквистовская выборка является оптимальной для этой модели сигнала при оптимальном квантовании . [10]
Теорема о дискретизации подразумевалась в работе Гарри Найквиста в 1928 году [11] , в которой он показал, что до независимых импульсных выборок можно посылать через систему полосы пропускания ; но он явно не рассматривал проблему дискретизации и реконструкции непрерывных сигналов. Примерно в то же время Карл Купфмюллер показал аналогичный результат [12] и рассмотрел импульсную характеристику sinc-функции фильтра, ограничивающего полосу пропускания, через ее интеграл, интеграл синуса ступенчатой реакции ; этот фильтр, ограничивающий полосу пропускания и восстанавливающий полосу пропускания, который является столь центральным для теоремы о дискретизации, иногда называют фильтром Купфмюллера (но редко в английском языке).
Теорема выборки, по сути, двойственная результату Найквиста, была доказана Клодом Э. Шенноном . [2] Математик Э. Т. Уиттекер опубликовал похожие результаты в 1915 году, [13] Дж. М. Уиттекер в 1935 году, [14] и Габор в 1946 году («Теория связи»).
В 1948 и 1949 годах Клод Э. Шеннон опубликовал две революционные статьи, в которых он основал теорию информации . [15] [16] [2] В « Математической теории связи » Шеннона теорема о выборке сформулирована как «Теорема 13»: Пусть не содержит частот, превышающих W. Тогда
где
Только после публикации этих статей теорема, известная как «теорема выборки Шеннона», стала общеизвестной среди инженеров связи, хотя сам Шеннон пишет, что это общеизвестный факт в искусстве связи. [B] Однако несколькими строками дальше он добавляет: «но, несмотря на ее очевидную важность, [она], по-видимому, не появилась явно в литературе по теории связи ». Несмотря на то, что его теорема выборки была опубликована в конце 1940-х годов, Шеннон вывел свою теорему выборки еще в 1940 году. [17]
Другие, кто независимо открыл или сыграл роль в развитии теоремы выборки, обсуждались в нескольких исторических статьях, например, Джерри [18] и Люке. [19] Например, Люке указывает, что Х. Раабе, помощник Купфмюллера, доказал теорему в своей докторской диссертации 1939 года; термин « условие Раабе» стал ассоциироваться с критерием однозначного представления (частота выборки больше, чем в два раза больше полосы пропускания). Мейеринг [20] упоминает несколько других первооткрывателей и имена в абзаце и паре сносок:
Как указал Хиггинс, теорему о выборках следует рассматривать в двух частях, как это сделано выше: первая часть утверждает тот факт, что функция с ограниченной полосой частот полностью определяется своими выборками, вторая описывает, как восстановить функцию с помощью ее выборок. Обе части теоремы о выборках были даны в несколько иной форме Дж. М. Уиттакером, а до него также Огурой. Они, вероятно, не знали о том, что первая часть теоремы была сформулирована еще в 1897 году Борелем. [Мейеринг 1] Как мы видели, Борель также использовал примерно в то же время то, что стало известно как кардинальный ряд. Однако он, по-видимому, не установил этой связи. В более поздние годы стало известно, что теорема о выборках была представлена до Шеннона русскому коммуникационному сообществу Котельниковым . В более неявной, словесной форме она также была описана в немецкой литературе Раабе. Несколько авторов упоминали, что Сомея представил теорему в японской литературе параллельно с Шенноном. В английской литературе Уэстон представил ее независимо от Шеннона примерно в то же время. [Мейеринг 2]
- ^ Некоторые авторы, вслед за Блэком, утверждали, что эта первая часть теоремы об отсчетах была сформулирована еще раньше Коши в статье, опубликованной в 1841 году. Однако статья Коши не содержит такого утверждения, как было указано Хиггинсом.
- ^ В результате открытия нескольких независимых введений теоремы выборки, люди начали ссылаться на теорему, включая имена вышеупомянутых авторов, что привело к таким крылатым фразам, как «теорема выборки Уиттекера–Котельникова–Шеннона (WKS)» или даже «теорема выборки Уиттекера–Котельникова–Раабе–Шеннона–Сомейи». Чтобы избежать путаницы, возможно, лучше всего называть ее теоремой выборки, «а не пытаться найти название, которое было бы справедливо для всех претендентов».
— Эрик Мейеринг, «Хронология интерполяции от древней астрономии до современной обработки сигналов и изображений» (цитаты опущены)
В русской литературе она известна как теорема Котельникова, названная в честь Владимира Котельникова , открывшего ее в 1933 году. [21]
Как именно, когда или почему Гарри Найквист связал свое имя с теоремой выборки, остается неясным. Термин Теорема выборки Найквиста (с заглавной буквы) появился еще в 1959 году в книге его бывшего работодателя, Bell Labs , [22] и снова появился в 1963 году, [23] и не был написан с заглавной буквы в 1965 году. [24] Она была названа Теоремой выборки Шеннона еще в 1954 году, [25] но также просто теоремой выборки в нескольких других книгах в начале 1950-х годов.
В 1958 году Блэкман и Тьюки процитировали статью Найквиста 1928 года как ссылку на теорему выборки теории информации [26] , хотя эта статья не рассматривает выборку и реконструкцию непрерывных сигналов, как это делали другие. Их глоссарий терминов включает следующие записи:
- Теорема выборки (теории информации)
- Результат Найквиста, согласно которому равномерно распределенные данные с двумя или более точками на цикл с самой высокой частотой, позволяют реконструировать функции с ограниченной полосой пропускания. (См. Кардинальную теорему .)
- Основная теорема (теории интерполяции)
- Точное описание условий, при которых значения, заданные в бесконечном в обе стороны наборе равноотстоящих точек, могут быть интерполированы для получения непрерывной функции с ограниченной полосой с помощью функции
О каком именно «результате Найквиста» идет речь, остается загадкой.
Когда Шеннон сформулировал и доказал теорему выборки в своей статье 1949 года, по словам Мейеринга [20], «он назвал критический интервал выборки интервалом Найквиста , соответствующим полосе , в знак признания открытия Найквиста фундаментальной важности этого интервала в связи с телеграфией». Это объясняет имя Найквиста в отношении критического интервала, но не в отношении теоремы.
Аналогичным образом имя Найквиста было добавлено к коэффициенту Найквиста в 1953 году Гарольдом С. Блэком :
Если существенный диапазон частот ограничен циклами в секунду, было дано Найквистом как максимальное количество элементов кода в секунду, которые могут быть однозначно разрешены, предполагая, что пиковая помеха составляет менее половины квантового шага. Эта скорость обычно называется сигнализацией со скоростью Найквиста и была названа интервалом Найквиста .
— Гарольд Блэк, Теория модуляции [27] (жирный шрифт добавлен для выразительности; курсив как в оригинале)
Согласно Оксфордскому словарю английского языка , это может быть источником термина Nyquist rate . В использовании Блэка это не частота дискретизации, а скорость сигнализации.