В цифровом аудио 44 100 Гц (альтернативно представлено как 44,1 кГц ) является распространенной частотой дискретизации . Аналоговый звук часто записывается путем дискретизации 44 100 раз в секунду, а затем эти выборки используются для реконструкции аудиосигнала при его воспроизведении.
TheЧастота дискретизации звука 44,1 кГц широко используется благодаря формату компакт-дисков (CD), который компания Sony начала использовать с 1979 года.
Частота дискретизации 44,1 кГц возникла в конце 1970-х годов с адаптерами PCM , которые записывали цифровой звук на видеокассеты , [примечание 1] в частности, Sony PCM-1600, представленный в 1979 году и перенесенный в последующие модели этой серии. Затем это стало основой для Compact Disc Digital Audio (CD-DA), определенного в стандарте Red Book в 1980 году. [1] : раздел 2.6 Его использование продолжилось в качестве опции в стандартах 1990-х годов, таких как DVD , и в 2000-х годах, таких как HDMI . Эта частота дискретизации обычно используется для MP3 и других потребительских форматов аудиофайлов , которые изначально были созданы из материала, скопированного с компакт-дисков.
Выбор частоты дискретизации был основан в первую очередь на необходимости воспроизведения слышимого диапазона частот 20–20 000 Гц (20 кГц). Теорема дискретизации Найквиста–Шеннона гласит, что необходима частота дискретизации, превышающая максимальную частоту записываемого сигнала более чем в два раза, что приводит к требуемой частоте более 40 кГц. Точная частота дискретизации 44,1 кГц была унаследована от адаптеров PCM, которые были наиболее доступным способом передачи данных из студии звукозаписи производителю компакт-дисков на момент разработки спецификации компакт-дисков. [1] : раздел 2.6
Скорость была выбрана после дебатов между производителями, в частности Sony и Philips , и ее реализации Sony, что привело к фактическому стандарту. Фактический выбор скорости был предметом некоторых дебатов, с другими альтернативами, включая 44,1 / 1,001 ≈ 44,056 кГц (соответствующая частоте цветового поля NTSC 60 / 1,001 = 59,94 Гц) или приблизительно 44 кГц, предложенными Philips. В конечном итоге Sony преобладала как по частоте дискретизации (44,1 кГц), так и по битовой глубине (16 бит на выборку, а не 14 бит на выборку). Техническое обоснование выбора скорости связано с характеристиками человеческого слуха и ранних цифровых систем аудиозаписи, как описано ниже. [1] : раздел 8.5
Теорема дискретизации Найквиста-Шеннона гласит, что частота дискретизации должна быть больше, чем в два раза больше максимальной частоты, которую хотят воспроизвести. Чтобы охватить диапазон человеческого слуха примерно от 20 Гц до 20 000 Гц, частота дискретизации должна быть больше 40 кГц.
Но чтобы избежать наложения спектров при дискретизации, сигналы должны быть сначала ограничены полосой пропускания в пределах половины частоты дискретизации, что может быть достигнуто с помощью фильтрации нижних частот . В то время как идеальный фильтр нижних частот ( sinc-фильтр ) может идеально пропускать частоты ниже 20 кГц (не ослабляя их) и идеально обрезать частоты выше 20 кГц, этот идеальный фильтр теоретически и практически невозможно реализовать, поскольку он не является причинно-следственным , поэтому на практике необходима переходная полоса , в которой частоты частично ослабляются. Чем шире эта переходная полоса, тем проще и экономичнее сделать фильтр сглаживания . Частота дискретизации 44,1 кГц допускает переходную полосу 2,05 кГц.
Ранний цифровой звук записывался на существующие аналоговые видеокассеты, поскольку видеомагнитофоны были единственными доступными транспортными устройствами с достаточной емкостью для хранения значимых длин цифрового звука. [примечание 2] Чтобы обеспечить повторное использование с минимальной модификацией видеооборудования, они работали на той же скорости, что и видео, и использовали большую часть тех же схем. 44,1 кГц считалось самой высокой используемой частотой, совместимой как с видео PAL , так и с NTSC и требующей кодирования не более 3 выборок на видеостроку на аудиоканал.
Частота дискретизации составляется следующим образом: [примечание 3]
NTSC имеет 490 активных строк на кадр из 525 общих строк; PAL имеет 588 активных строк на кадр из 625 общих строк.
44 100 является произведением квадратов первых четырех простых чисел ( ) и, следовательно, имеет много полезных целых множителей .
Используются различные половинчатые и удвоенные частоты 44,1 кГц — более низкие частоты 11,025 кГц и 22,05 кГц встречаются в файлах WAV и подходят для приложений с низкой пропускной способностью, в то время как более высокие частоты 88,2 кГц и 176,4 кГц используются при мастеринге и в DVD-Audio — более высокие частоты полезны как по обычной причине обеспечения дополнительного разрешения (следовательно, меньшей чувствительности к искажениям, вносимым редактированием), так и для облегчения фильтрации нижних частот, поскольку возможна гораздо большая переходная полоса (между слышимой человеком на частоте 20 кГц и половиной частоты дискретизации). Частоты 88,2 кГц и 176,4 кГц в основном используются, когда конечной целью является компакт-диск.
Несколько других частот дискретизации также использовались в раннем цифровом аудио. Частота дискретизации 50 кГц, используемая Soundstream в 1970-х годах, после прототипа 37 кГц. В начале 1980-х годов частота дискретизации 32 кГц использовалась в вещании (особенно в Великобритании и Японии), поскольку этого достаточно для стереопередач FM , которые имеют полосу пропускания 15 кГц. Некоторое цифровое аудио предоставлялось для домашнего использования в двух несовместимых форматах EIAJ , соответствующих 525/59,94 (дискретизация 44 056 Гц) и 625/50 (дискретизация 44,1 кГц).
Формат Digital Audio Tape (DAT) был выпущен в 1987 году с частотой дискретизации 48 кГц. Эта частота дискретизации стала стандартной частотой для профессионального аудио . [2] До недавнего времени преобразование частоты дискретизации между 44 100 Гц и 48 000 Гц было осложнено высоким соотношением между этими частотами, поскольку наименьший общий знаменатель 44 100 и 48 000 составляет 147:160, но с помощью современных технологий это преобразование выполняется быстро и эффективно. [3] Ранние потребительские DAT-машины не поддерживали 44,1 кГц, и эта разница затрудняла создание прямых цифровых копий 44,1 кГц CD с использованием 48 кГц DAT-оборудования. [4]
Из-за популярности компакт-дисков существует большое количество оборудования с частотой 44,1 кГц, а также большое количество аудио, записанного на частоте 44,1 кГц (или кратных ей). Однако некоторые более поздние стандарты используют 48 кГц в дополнение к 44,1 кГц или вместо них. [2] В видео 48 кГц теперь является стандартом, но для аудио, предназначенного для компакт-дисков, по-прежнему используются 44,1 кГц (и кратные им).
Стандарт HDMI TV (2003) допускает как 44,1 кГц, так и 48 кГц (и кратные им значения). Это обеспечивает совместимость с DVD-плеерами, воспроизводящими содержимое CD, VCD и SVCD . Стандарты DVD-Video и Blu-ray Disc используют только кратные 48 кГц.
Большинство звуковых карт ПК содержат цифро-аналоговый преобразователь , способный работать на частоте 44,1 кГц или 48 кГц. Некоторые старые процессоры поддерживают только выход 44,1 кГц, а некоторые более дешевые новые процессоры поддерживают только выход 48 кГц, требуя от ПК выполнения цифрового преобразования частоты дискретизации для вывода других частот дискретизации. Аналогично, карты имеют ограничения на поддерживаемые ими частоты дискретизации для записи.