Обработка аудиосигнала

Обработка аудиосигналов — это подраздел обработки сигналов , который занимается электронным манипулированием аудиосигналами . Аудиосигналы — это электронные представления звуковых волн — продольных волн , которые распространяются в воздухе, состоящие из сжатий и разрежений. Энергия, содержащаяся в аудиосигналах, или уровень звуковой мощности обычно измеряется в децибелах . Поскольку аудиосигналы могут быть представлены как в цифровом , так и в аналоговом формате, обработка может происходить в любой области. Аналоговые процессоры работают непосредственно с электрическим сигналом, в то время как цифровые процессоры работают математически с его цифровым представлением.

История

Мотивация к обработке аудиосигналов возникла в начале 20-го века с такими изобретениями, как телефон , фонограф и радио , которые позволяли передавать и хранить аудиосигналы. Обработка аудио была необходима для раннего радиовещания , поскольку существовало много проблем со связью студия-передатчик . ^[1] Теория обработки сигналов и ее применение к аудио были в значительной степени разработаны в Bell Labs в середине 20-го века. Ранние работы Клода Шеннона и Гарри Найквиста по теории связи , теории дискретизации и импульсно-кодовой модуляции (ИКМ) заложили основы для этой области. В 1957 году Макс Мэтьюз стал первым человеком, синтезировавшим аудио с помощью компьютера , что дало начало компьютерной музыке .

Основные разработки в области цифрового аудиокодирования и сжатия аудиоданных включают дифференциальную импульсно-кодовую модуляцию (DPCM) C. Chapin Cutler в Bell Labs в 1950 году, ^[2] линейное предсказательное кодирование (LPC) Fumitada Itakura ( Университет Нагоя ) и Shuzo Saito ( Nippon Telegraph and Telephone ) в 1966 году, ^[3] адаптивное DPCM (ADPCM) P. Cummiskey, Nikil S. Jayant и James L. Flanagan в Bell Labs в 1973 году, ^[4]^{[5] кодирование с} дискретным косинусным преобразованием (DCT) Nasir Ahmed , T. Natarajan и KR Rao в 1974 году, ^[6] и модифицированное дискретное косинусное преобразование (MDCT) JP Princen, AW Johnson и AB Bradley в Университете Суррея в 1987 году. ^[7] LPC является основой перцептивного кодирования и широко используется в кодирование речи , ^[8] в то время как кодирование MDCT широко используется в современных форматах кодирования звука, таких как MP3 ^[9] и Advanced Audio Coding (AAC). ^[10]

Типы

Аналоговый

Аналоговый аудиосигнал — это непрерывный сигнал, представленный электрическим напряжением или током, который аналогичен звуковым волнам в воздухе. Аналоговая обработка сигнала затем включает физическое изменение непрерывного сигнала путем изменения напряжения, тока или заряда через электрические цепи .

Исторически, до появления широко распространенной цифровой технологии , аналоговый метод был единственным методом манипулирования сигналом. С тех пор, как компьютеры и программное обеспечение стали более эффективными и доступными, цифровая обработка сигнала стала методом выбора. Однако в музыкальных приложениях аналоговая технология часто все еще желательна, поскольку она часто производит нелинейные отклики , которые трудно воспроизвести с помощью цифровых фильтров.

Цифровой

Цифровое представление выражает звуковую волну как последовательность символов, обычно двоичных чисел . Это позволяет обрабатывать сигнал с использованием цифровых схем, таких как цифровые сигнальные процессоры , микропроцессоры и компьютеры общего назначения. Большинство современных аудиосистем используют цифровой подход, поскольку методы цифровой обработки сигнала намного мощнее и эффективнее, чем обработка сигнала в аналоговой области. ^[11]

Приложения

Методы обработки и области применения включают хранение , сжатие данных , поиск музыкальной информации , обработку речи , локализацию , акустическое обнаружение , передачу , шумоподавление , акустическое снятие отпечатков пальцев , распознавание звука , синтез и улучшение (например , эквализация , фильтрация , сжатие уровня , удаление или добавление эха и реверберации и т. д.).

Аудио вещание

Обработка аудиосигнала используется при трансляции аудиосигналов для повышения их точности или оптимизации полосы пропускания или задержки. В этой области наиболее важная обработка аудио происходит непосредственно перед передатчиком. Аудиопроцессор здесь должен предотвращать или минимизировать перемодуляцию , компенсировать нелинейные передатчики (потенциальная проблема с вещанием на средних и коротких волнах ) и регулировать общую громкость до желаемого уровня.

Активный контроль шума

Активное шумоподавление — это метод, разработанный для снижения уровня нежелательного звука. Создавая сигнал, идентичный нежелательному шуму, но с противоположной полярностью, два сигнала нейтрализуются из-за деструктивной интерференции .

Типы активного шумоподавления:

1) Активное шумоподавление с прямой связью 2) Активное шумоподавление с обратной связью 3) Гибридное активное шумоподавление

Области применения: 1) Автомобильная промышленность 2) Авиакосмическая промышленность 3) Бытовая электроника

Синтез звука

Аудиосинтез — это электронная генерация аудиосигналов. Музыкальный инструмент, который это делает, называется синтезатором. Синтезаторы могут либо имитировать звуки , либо генерировать новые. Аудиосинтез также используется для генерации человеческой речи с помощью синтеза речи .

Аудио эффекты

Аудиоэффекты изменяют звучание музыкального инструмента или другого источника звука. Распространенные эффекты включают искажение , часто используемое с электрогитарой в электро-блюзе и рок-музыке ; динамические эффекты, такие как педали громкости и компрессоры , которые влияют на громкость; фильтры , такие как педали вау-вау и графические эквалайзеры , которые изменяют частотные диапазоны; эффекты модуляции , такие как хорус , флэнжеры и фазеры ; эффекты высоты тона , такие как питч-шифтеры ; и временные эффекты, такие как реверберация и задержка , которые создают эхо-звуки и имитируют звук различных пространств.

Музыканты, звукорежиссеры и продюсеры используют блоки эффектов во время живых выступлений или в студии, как правило, с электрогитарой, бас-гитарой, электронной клавиатурой или электрическим пианино . Хотя эффекты чаще всего используются с электрическими или электронными инструментами, их можно использовать с любым источником звука, например, с акустическими инструментами, барабанами и вокалом. ^[12]^[13]

Компьютерное прослушивание

Компьютерное прослушивание (CA) или машинное прослушивание — это общая область изучения алгоритмов и систем для аудиоинтерпретации машинами. ^[14]^[15] Поскольку понятие того, что означает для машины «слышать», очень широкое и несколько расплывчатое, компьютерное прослушивание пытается объединить несколько дисциплин, которые изначально имели дело с конкретными проблемами или имели в виду конкретное применение. Инженер Парис Смарагдис , интервьюируемый в Technology Review , рассказывает об этих системах — «программном обеспечении, которое использует звук для определения местонахождения людей, перемещающихся по помещениям, для мониторинга машин на предмет надвигающихся поломок или для активации дорожных камер для записи аварий». ^[16]

Вдохновленный моделями человеческого слуха , CA занимается вопросами представления, трансдукции , группировки, использования музыкальных знаний и общей звуковой семантики с целью выполнения компьютером интеллектуальных операций над аудио- и музыкальными сигналами. Технически это требует сочетания методов из областей обработки сигналов , слухового моделирования, восприятия и познания музыки , распознавания образов и машинного обучения , а также более традиционных методов искусственного интеллекта для представления музыкальных знаний. ^[17]^[18]

Смотрите также

Ссылки

^ Атти, Андреас Спаниас, Тед Пейнтер, Венкатраман (2006). Обработка и кодирование аудиосигналов ([Online-Ausg.] ред.). Хобокен, Нью-Джерси: John Wiley & Sons. стр. 464. ISBN 0-471-79147-4.{{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )
^ Патент США 2605361, C. Chapin Cutler, «Дифференциальное квантование сигналов связи», выдан 29 июля 1952 г.
^ Грей, Роберт М. (2010). «История цифровой речи в реальном времени в пакетных сетях: часть II линейного предиктивного кодирования и интернет-протокола» (PDF) . Найдено. Trends Signal Process . 3 (4): 203–303. doi : 10.1561/2000000036 . ISSN 1932-8346. Архивировано (PDF) из оригинала 2022-10-09.
^ П. Каммиски, Никил С. Джайант и Дж. Л. Фланаган, «Адаптивное квантование в дифференциальном кодировании PCM речи», Bell Syst. Tech. J. , т. 52, стр. 1105—1118, сентябрь 1973 г.
^ Cummiskey, P.; Jayant, Nikil S.; Flanagan, JL (1973). «Адаптивное квантование в дифференциальном кодировании PCM речи». The Bell System Technical Journal . 52 (7): 1105–1118. doi :10.1002/j.1538-7305.1973.tb02007.x. ISSN 0005-8580.
^ Насир Ахмед ; Т. Натараджан; Камисетти Рамамохан Рао (январь 1974 г.). «Дискретное косинусное преобразование» (PDF) . IEEE Transactions on Computers . C-23 (1): 90–93. doi :10.1109/TC.1974.223784. S2CID 149806273. Архивировано (PDF) из оригинала 2022-10-09.
^ JP Princen, AW Johnson и AB Bradley: Кодирование подполос/преобразований с использованием конструкций банков фильтров на основе устранения наложения спектров во временной области , IEEE Proc. Международная конференция по акустике, речи и обработке сигналов (ICASSP), 2161–2164, 1987.
^ Шредер, Манфред Р. (2014). "Bell Laboratories". Акустика, информация и связь: Мемориальный том в честь Манфреда Р. Шредера . Springer. стр. 388. ISBN 9783319056609.
^ Guckert, John (весна 2012 г.). «Использование FFT и MDCT в сжатии аудио MP3» (PDF) . University of Utah . Архивировано (PDF) из оригинала 2022-10-09 . Получено 14 июля 2019 г. .
^ Бранденбург, Карлхайнц (1999). "MP3 и AAC Explained" (PDF) . Архивировано (PDF) из оригинала 2017-02-13.
^ Zölzer, Udo (1997). Цифровая обработка аудиосигнала . John Wiley and Sons. ISBN 0-471-97226-6.
^ Хорн, Грег (2000). Полный метод акустической гитары: Освоение акустической гитары c. Alfred Music. стр. 92. ISBN 9781457415043.
^ Якабуски, Джим (2001). Профессиональные методы звукоусиления: советы и рекомендации концертного звукорежиссера. Хэл Леонард. стр. 139. ISBN 9781931140065.
^ Машинное прослушивание: принципы, алгоритмы и системы. IGI Global. 2011. ISBN 9781615209194.
^ «Машинное прослушивание: принципы, алгоритмы и системы» (PDF) .
^ Пэрис Смарагдис научил компьютеры играть более реалистичную музыку
^ Тангян (Тангян), Андраник (1993). Искусственное восприятие и распознавание музыки . Конспект лекций по искусственному интеллекту. Том 746. Берлин-Гейдельберг: Springer. ISBN 978-3-540-57394-4.
^ Тангуиан (Tanguiane), Андраник (1994). «Принцип корреляции восприятия и его применение к распознаванию музыки». Music Perception . 11 (4): 465–502. doi :10.2307/40285634. JSTOR 40285634.

Дальнейшее чтение

Рокчессо, Давиде (20 марта 2003 г.). Введение в обработку звука (PDF) .
Вилмеринг, Томас; Моффат, Дэвид; Майло, Алессия; Сандлер, Марк Б. (2020). «История аудиоэффектов». Прикладные науки . 10 (3): 791. doi : 10.3390/app10030791 . hdl : 10026.1/15335 .