Подавление эха и эхоподавление — это методы, используемые в телефонии для улучшения качества голоса путем предотвращения создания эха или его удаления после того, как оно уже присутствует. Помимо улучшения субъективного качества звука, эхоподавление увеличивает пропускную способность, достигаемую за счет подавления тишины , предотвращая распространение эха по телекоммуникационной сети . Подавители эха были разработаны в 1950-х годах в ответ на первое использование спутников для телекоммуникаций.
Методы эхоподавления и подавления обычно называются акустическим эхоподавлением ( AES ) и акустическим эхоподавлением ( AEC ), а реже — линейным эхоподавлением ( LEC ). В некоторых случаях эти термины более точны, поскольку существуют различные типы и причины эха с уникальными характеристиками, включая акустическое эхо (звуки из громкоговорителя отражаются и записываются микрофоном, которые могут существенно меняться с течением времени) и линейное эхо ( электрические импульсы, вызванные, например, связью между передающим и принимающим проводами, несоответствием импеданса, электрическими отражениями и т. д., [1] которые варьируются гораздо меньше, чем акустическое эхо). Однако на практике для обработки всех типов эха используются одни и те же методы, поэтому подавитель акустического эха может подавлять как линейное, так и акустическое эхо. AEC , в частности, обычно используется для обозначения эхокомпенсаторов в целом, независимо от того, предназначены ли они для акустического эха, линейного эха или того и другого.
Хотя эхоподавители и эхоподавители преследуют схожие цели — не дать говорящему человеку услышать эхо собственного голоса, — методы, которые они используют, разные:
Стандарты ITU G.168 и P.340 описывают требования и тесты для эхокомпенсаторов в цифровых приложениях и приложениях PSTN соответственно.
В телефонии эхо — это отраженная копия голоса, услышанная некоторое время спустя. Если задержка достаточно значительна (более нескольких сотен миллисекунд), она считается раздражающей. Если задержка очень мала (десятки миллисекунд или меньше [3] ), явление называется самопрослушиванием . Если задержка немного больше, около 50 миллисекунд, люди не смогут услышать эхо как отдельный звук, а вместо этого услышат эффект хоруса . [3]
На заре развития телекоммуникаций эхоподавление использовалось, чтобы уменьшить нежелательный характер эха для пользователей. Один человек говорит, а другой слушает, и они говорят взад и вперед. Подавитель эха пытается определить, какое направление является основным, и позволяет этому каналу двигаться вперед. В обратном канале он устанавливает ослабление для блокировки или подавления любого сигнала при условии, что сигнал является эхом. Хотя подавитель эффективно борется с эхом, такой подход приводит к ряду проблем, которые могут раздражать обе стороны вызова.
В ответ на это в начале 1960-х годов Bell Labs разработала теорию эхокомпенсаторов, [4] [5], которая затем привела к созданию лабораторных эхокомпенсаторов в конце 1960-х годов и коммерческих эхоподавителей в 1980-х годах. [6] Подавитель эха работает, генерируя оценку эха из сигнала говорящего и вычитая эту оценку из обратного пути. Этот метод требует адаптивного фильтра для генерации сигнала, достаточно точного, чтобы эффективно подавлять эхо, когда эхо может отличаться от оригинала из-за различных видов ухудшения на этом пути. С момента изобретения в AT&T Bell Labs [5] алгоритмы эхоподавления были улучшены и отточены. Как и все процессы эхоподавления, эти первые алгоритмы были разработаны для прогнозирования сигнала, который неизбежно повторно войдет в путь передачи, и его подавления.
Быстрый прогресс в цифровой обработке сигналов позволил сделать эхокомпенсаторы меньшего размера и более экономичными. В 1990-х годах эхоподавители были впервые реализованы в голосовых коммутаторах (в Northern Telecom DMS-250 ), а не как отдельные устройства. Интеграция эхоподавления непосредственно в коммутатор означала, что эхокомпенсаторы можно было надежно включать и выключать для каждого вызова, устраняя необходимость в отдельных группах соединительных линий для голосовых вызовов и вызовов данных. В современных технологиях телефонии часто используются эхоподавители в небольших или портативных устройствах связи с помощью программного голосового механизма , который обеспечивает подавление либо акустического эха, либо остаточного эха, вносимого дальней системой шлюза PSTN; такие системы обычно подавляют отражения эха с задержкой до 64 миллисекунд.
Процесс эхоподавления работает следующим образом:
Основной задачей эхокомпенсатора является определение характеристик отклика фильтра, который будет применяться к сигналу на дальнем конце, чтобы он напоминал результирующее эхо на ближнем конце. По сути, фильтр представляет собой модель динамика, микрофона и акустических атрибутов помещения. Подавители эха должны быть адаптивными, поскольку характеристики динамика и микрофона ближнего конца обычно заранее неизвестны. Акустические характеристики комнаты ближнего конца также обычно не известны заранее и могут измениться (например, если микрофон перемещается относительно говорящего или если люди ходят по комнате, вызывая изменения в акустических отражениях). [2] [7] Используя сигнал на дальнем конце в качестве стимула, современные системы используют адаптивный фильтр и могут переходить от отсутствия подавления к подавлению на 55 дБ примерно за 200 мс. [ нужна цитата ]
Во многих приложениях само подавление эха может оказаться недостаточным. Эхокомпенсация и подавление могут работать совместно для достижения приемлемой производительности.
Эхо измеряется какпотеря обратного эха (ERL). Это соотношение, выраженное вдецибелах, исходного сигнала и его эха.[8]Высокие значения означают, что эхо очень слабое, а низкие значения означают, что эхо очень сильное. Отрицательное значение указывает на то, что эхо сильнее исходного сигнала, что, если его не отрегулировать, приведет к возникновениюзвуковой обратной связи.
Производительность эхокомпенсатора измеряется коэффициентом усиления потерь обратного эха (ERLE), [3] [9] , который представляет собой величину дополнительных потерь сигнала, применяемых эхокомпенсатором. Большинство эхокомпенсаторов способны применять ERLE от 18 до 35 дБ.
Полная потеря эхо-сигнала (ACOM) представляет собой сумму ERL и ERLE. [9] [10]
Источники эха встречаются в повседневной обстановке, например:
В некоторых из этих случаев звук из громкоговорителя поступает в микрофон практически неизменным. Трудности с подавлением эха связаны с изменением исходного звука окружающим пространством. Эти изменения могут включать поглощение определенных частот мягкой мебелью и отражение различных частот с разной силой.
Реализация AEC требует инженерных знаний и быстрого процессора, обычно в виде процессора цифровых сигналов (DSP). Эта стоимость обработки может быть высокой, однако многие встроенные системы имеют полнофункциональный AEC.
Интеллектуальные динамики и системы интерактивного голосового ответа , которые принимают речь для ввода, используют AEC во время воспроизведения речевых подсказок, чтобы предотвратить ложное распознавание системой распознавания речи отраженных подсказок и других выходных данных.
В стандартных телефонных линиях для передачи и приема звука используется одна и та же пара проводов, в результате чего небольшая часть исходящего сигнала отражается обратно. Это полезно для людей, разговаривающих по телефону, поскольку дает говорящему сигнал о том, что их голос проходит через систему. Однако этот отраженный сигнал создает проблемы для модема, который не может отличить сигнал удаленного модема от эха своего собственного сигнала.
По этой причине более ранние модемы коммутируемого доступа разделяли частоты сигнала, так что устройства на обоих концах использовали разные тона, позволяя каждому игнорировать любые сигналы в диапазоне частот, который оно использовало для передачи. Однако это уменьшило объем полосы пропускания, доступной обеим сторонам.
Эхоподавление смягчило эту проблему. В течение периода установления вызова и согласования оба модема посылают серию уникальных тональных сигналов, а затем прослушивают их возвращение через телефонную систему. Они измеряют общее время задержки, а затем настраивают линию задержки на этот же период. После завершения соединения они отправляют свои сигналы в телефонные линии как обычно, а также в линию задержки. Когда их сигнал отражается обратно, он смешивается с инвертированным сигналом линии задержки, что нейтрализует эхо. Это позволило обоим модемам использовать весь доступный спектр, удвоив возможную скорость.
Многие телекоммуникационные компании также применяют эхоподавление к самой линии и могут привести к повреждению данных, а не к улучшению сигнала. Некоторые телефонные коммутаторы или преобразователи (например, адаптеры аналоговых терминалов) отключают эхоподавление или эхоподавление при обнаружении тонов ответа 2100 или 2225 Гц , связанных с такими вызовами, в соответствии с рекомендацией ITU-T G.164 или G.165 .
Модемы ISDN и DSL, работающие на частотах выше голосового диапазона по стандартным телефонным проводам витой пары, также используют автоматическое эхоподавление, чтобы обеспечить одновременную двунаправленную передачу данных. Вычислительная сложность реализации адаптивного фильтра значительно снижается по сравнению с эхоподавлением голоса, поскольку передаваемый сигнал представляет собой цифровой поток битов. Вместо операции умножения и сложения для каждого касания в фильтре требуется только сложение. Схема эхоподавления на основе справочной таблицы ОЗУ [11] [12] исключает даже операцию сложения, просто обращаясь к памяти с усеченным потоком передаваемых битов для получения оценки эха. Эхоподавление теперь обычно реализуется с помощью технологий цифрового сигнального процессора (DSP).
Некоторые модемы используют отдельные входящие и исходящие частоты или выделяют отдельные временные интервалы для передачи и приема, чтобы исключить необходимость эхоподавления. Более высокие частоты, выходящие за пределы исходных проектных пределов телефонных кабелей, подвергаются значительным искажениям затухания из-за отводов моста и неполного согласования импедансов . Часто в результате возникают глубокие и узкие частотные разрывы, которые невозможно устранить с помощью эхоподавления. Они обнаруживаются и отображаются во время согласования соединения.