Обработка аудиосигналов — это подраздел обработки сигналов , который занимается электронным манипулированием аудиосигналами . Аудиосигналы — это электронные представления звуковых волн — продольных волн , которые распространяются в воздухе, состоящие из сжатий и разрежений. Энергия, содержащаяся в аудиосигналах, или уровень звуковой мощности обычно измеряется в децибелах . Поскольку аудиосигналы могут быть представлены как в цифровом , так и в аналоговом формате, обработка может происходить в любой области. Аналоговые процессоры работают непосредственно с электрическим сигналом, в то время как цифровые процессоры работают математически с его цифровым представлением.
Мотивация к обработке аудиосигналов возникла в начале 20-го века с такими изобретениями, как телефон , фонограф и радио , которые позволяли передавать и хранить аудиосигналы. Обработка аудио была необходима для раннего радиовещания , поскольку существовало много проблем со связью студия-передатчик . [1] Теория обработки сигналов и ее применение к аудио были в значительной степени разработаны в Bell Labs в середине 20-го века. Ранние работы Клода Шеннона и Гарри Найквиста по теории связи , теории дискретизации и импульсно-кодовой модуляции (ИКМ) заложили основы для этой области. В 1957 году Макс Мэтьюз стал первым человеком, синтезировавшим аудио с помощью компьютера , что дало начало компьютерной музыке .
Основные разработки в области цифрового аудиокодирования и сжатия аудиоданных включают дифференциальную импульсно-кодовую модуляцию (DPCM) C. Chapin Cutler в Bell Labs в 1950 году, [2] линейное предсказательное кодирование (LPC) Fumitada Itakura ( Университет Нагоя ) и Shuzo Saito ( Nippon Telegraph and Telephone ) в 1966 году, [3] адаптивное DPCM (ADPCM) P. Cummiskey, Nikil S. Jayant и James L. Flanagan в Bell Labs в 1973 году, [4] [5] кодирование с дискретным косинусным преобразованием (DCT) Nasir Ahmed , T. Natarajan и KR Rao в 1974 году, [6] и модифицированное дискретное косинусное преобразование (MDCT) JP Princen, AW Johnson и AB Bradley в Университете Суррея в 1987 году. [7] LPC является основой перцептивного кодирования и широко используется в кодирование речи , [8] в то время как кодирование MDCT широко используется в современных форматах кодирования звука, таких как MP3 [9] и Advanced Audio Coding (AAC). [10]
Аналоговый аудиосигнал — это непрерывный сигнал, представленный электрическим напряжением или током, который аналогичен звуковым волнам в воздухе. Аналоговая обработка сигнала затем включает физическое изменение непрерывного сигнала путем изменения напряжения, тока или заряда через электрические цепи .
Исторически, до появления широко распространенной цифровой технологии , аналоговый метод был единственным методом манипулирования сигналом. С тех пор, как компьютеры и программное обеспечение стали более эффективными и доступными, цифровая обработка сигнала стала методом выбора. Однако в музыкальных приложениях аналоговая технология часто все еще желательна, поскольку она часто производит нелинейные отклики , которые трудно воспроизвести с помощью цифровых фильтров.
Цифровое представление выражает звуковую волну как последовательность символов, обычно двоичных чисел . Это позволяет обрабатывать сигнал с использованием цифровых схем, таких как цифровые сигнальные процессоры , микропроцессоры и компьютеры общего назначения. Большинство современных аудиосистем используют цифровой подход, поскольку методы цифровой обработки сигнала намного мощнее и эффективнее, чем обработка сигнала в аналоговой области. [11]
Методы обработки и области применения включают хранение , сжатие данных , поиск музыкальной информации , обработку речи , локализацию , акустическое обнаружение , передачу , шумоподавление , акустическое снятие отпечатков пальцев , распознавание звука , синтез и улучшение (например , эквализация , фильтрация , сжатие уровня , удаление или добавление эха и реверберации и т. д.).
Обработка аудиосигнала используется при трансляции аудиосигналов для повышения их точности или оптимизации полосы пропускания или задержки. В этой области наиболее важная обработка аудио происходит непосредственно перед передатчиком. Аудиопроцессор здесь должен предотвращать или минимизировать перемодуляцию , компенсировать нелинейные передатчики (потенциальная проблема с вещанием на средних и коротких волнах ) и регулировать общую громкость до желаемого уровня.
Активное шумоподавление — это метод, разработанный для снижения уровня нежелательного звука. Создавая сигнал, идентичный нежелательному шуму, но с противоположной полярностью, два сигнала нейтрализуются из-за деструктивной интерференции .
Типы активного шумоподавления:
1) Активное шумоподавление с прямой связью 2) Активное шумоподавление с обратной связью 3) Гибридное активное шумоподавление
Области применения: 1) Автомобильная промышленность 2) Авиакосмическая промышленность 3) Бытовая электроника
Аудиосинтез — это электронная генерация аудиосигналов. Музыкальный инструмент, который это делает, называется синтезатором. Синтезаторы могут либо имитировать звуки , либо генерировать новые. Аудиосинтез также используется для генерации человеческой речи с помощью синтеза речи .
Аудиоэффекты изменяют звучание музыкального инструмента или другого источника звука. Распространенные эффекты включают искажение , часто используемое с электрогитарой в электро-блюзе и рок-музыке ; динамические эффекты, такие как педали громкости и компрессоры , которые влияют на громкость; фильтры , такие как педали вау-вау и графические эквалайзеры , которые изменяют частотные диапазоны; эффекты модуляции , такие как хорус , флэнжеры и фазеры ; эффекты высоты тона , такие как питч-шифтеры ; и временные эффекты, такие как реверберация и задержка , которые создают эхо-звуки и имитируют звук различных пространств.
Музыканты, звукорежиссеры и продюсеры используют блоки эффектов во время живых выступлений или в студии, как правило, с электрогитарой, бас-гитарой, электронной клавиатурой или электрическим пианино . Хотя эффекты чаще всего используются с электрическими или электронными инструментами, их можно использовать с любым источником звука, например, с акустическими инструментами, барабанами и вокалом. [12] [13]
Компьютерное прослушивание (CA) или машинное прослушивание — это общая область изучения алгоритмов и систем для аудиоинтерпретации машинами. [14] [15] Поскольку понятие того, что означает для машины «слышать», очень широкое и несколько расплывчатое, компьютерное прослушивание пытается объединить несколько дисциплин, которые изначально имели дело с конкретными проблемами или имели в виду конкретное применение. Инженер Парис Смарагдис , интервьюируемый в Technology Review , рассказывает об этих системах — «программном обеспечении, которое использует звук для определения местонахождения людей, перемещающихся по помещениям, для мониторинга машин на предмет надвигающихся поломок или для активации дорожных камер для записи аварий». [16]
Вдохновленный моделями человеческого слуха , CA занимается вопросами представления, трансдукции , группировки, использования музыкальных знаний и общей звуковой семантики с целью выполнения компьютером интеллектуальных операций над аудио- и музыкальными сигналами. Технически это требует сочетания методов из областей обработки сигналов , слухового моделирования, восприятия и познания музыки , распознавания образов и машинного обучения , а также более традиционных методов искусственного интеллекта для представления музыкальных знаний. [17] [18]{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка )