Подавление и подавление эха

Подавление эха и эхоподавление — это методы, используемые в телефонии для улучшения качества голоса путем предотвращения создания эха или его удаления после того, как оно уже присутствует. Помимо улучшения субъективного качества звука, эхоподавление увеличивает пропускную способность, достигаемую за счет подавления тишины , предотвращая распространение эха по телекоммуникационной сети . Подавители эха были разработаны в 1950-х годах в ответ на первое использование спутников для телекоммуникаций.

Методы эхоподавления и подавления обычно называются акустическим эхоподавлением ( AES ) и акустическим эхоподавлением ( AEC ), а реже — линейным эхоподавлением ( LEC ). В некоторых случаях эти термины более точны, поскольку существуют различные типы и причины эха с уникальными характеристиками, включая акустическое эхо (звуки из громкоговорителя отражаются и записываются микрофоном, которые могут существенно меняться с течением времени) и линейное эхо ( электрические импульсы, вызванные, например, связью между передающим и принимающим проводами, несоответствием импеданса, электрическими отражениями и т. д., ^[1] которые варьируются гораздо меньше, чем акустическое эхо). Однако на практике для обработки всех типов эха используются одни и те же методы, поэтому подавитель акустического эха может подавлять как линейное, так и акустическое эхо. AEC , в частности, обычно используется для обозначения эхокомпенсаторов в целом, независимо от того, предназначены ли они для акустического эха, линейного эха или того и другого.

Хотя эхоподавители и эхоподавители преследуют схожие цели — не дать говорящему человеку услышать эхо собственного голоса, — методы, которые они используют, разные:

Подавители эха работают, обнаруживая речевой сигнал , идущий в одном направлении по цепи, а затем приглушая или ослабляя сигнал в другом направлении. Обычно эхоподавитель на дальнем конце цепи отключает звук, когда обнаруживает голос, исходящий с ближнего конца цепи. Это приглушение не позволяет говорящему слышать собственный голос, возвращающийся с дальнего конца.
Эхоподавление включает в себя сначала распознавание первоначально переданного сигнала, который с некоторой задержкой снова появляется в переданном или полученном сигнале. Как только эхо распознано, его можно удалить, вычитая его из переданного или полученного сигнала. Этот метод обычно реализуется в цифровом виде с использованием процессора цифровых сигналов или программного обеспечения, хотя его можно реализовать и в аналоговых схемах. ^[2]

Стандарты ITU G.168 и P.340 описывают требования и тесты для эхокомпенсаторов в цифровых приложениях и приложениях PSTN соответственно.

История

В телефонии эхо — это отраженная копия голоса, услышанная некоторое время спустя. Если задержка достаточно значительна (более нескольких сотен миллисекунд), она считается раздражающей. Если задержка очень мала (десятки миллисекунд или меньше ^[3] ), явление называется самопрослушиванием . Если задержка немного больше, около 50 миллисекунд, люди не смогут услышать эхо как отдельный звук, а вместо этого услышат эффект хоруса . ^[3]

На заре развития телекоммуникаций эхоподавление использовалось, чтобы уменьшить нежелательный характер эха для пользователей. Один человек говорит, а другой слушает, и они говорят взад и вперед. Подавитель эха пытается определить, какое направление является основным, и позволяет этому каналу двигаться вперед. В обратном канале он устанавливает ослабление для блокировки или подавления любого сигнала при условии, что сигнал является эхом. Хотя подавитель эффективно борется с эхом, такой подход приводит к ряду проблем, которые могут раздражать обе стороны вызова.

Двойной разговор: в разговоре вполне нормально, когда обе стороны говорят одновременно, хотя бы кратко. Поскольку каждый подавитель эха затем обнаруживает голосовую энергию, исходящую из дальнего конца цепи, обычно потери будут вноситься в обоих направлениях одновременно, эффективно блокируя обе стороны. Чтобы предотвратить это, можно настроить подавители эха на обнаружение речевой активности ближнего динамика и не вносить потери (или вносить меньшие потери), когда говорят как ближний, так и дальний динамик. Это, конечно, временно сводит на нет основной эффект от наличия эхоподавителя вообще.
Отсечение: поскольку эхоподавитель попеременно вставляет и удаляет потери, часто возникает небольшая задержка, когда новый говорящий начинает говорить, что приводит к вырезанию первого слога из речи этого говорящего.
Мертвая установка: если собеседник на дальнем конце находится в шумной обстановке, говорящий на ближнем конце будет слышать этот фоновый шум, пока говорящий на дальнем конце говорит, но подавитель эха будет подавлять этот фоновый шум, когда -конечный говорящий начинает говорить. Внезапное отсутствие фонового шума создает у ближайшего конечного пользователя впечатление, что линия прервалась.

В ответ на это в начале 1960-х годов Bell Labs разработала теорию эхокомпенсаторов, ^[4]^[5], которая затем привела к созданию лабораторных эхокомпенсаторов в конце 1960-х годов и коммерческих эхоподавителей в 1980-х годах. ^[6] Подавитель эха работает, генерируя оценку эха из сигнала говорящего и вычитая эту оценку из обратного пути. Этот метод требует адаптивного фильтра для генерации сигнала, достаточно точного, чтобы эффективно подавлять эхо, когда эхо может отличаться от оригинала из-за различных видов ухудшения на этом пути. С момента изобретения в AT&T Bell Labs ^[5] алгоритмы эхоподавления были улучшены и отточены. Как и все процессы эхоподавления, эти первые алгоритмы были разработаны для прогнозирования сигнала, который неизбежно повторно войдет в путь передачи, и его подавления.

Быстрый прогресс в цифровой обработке сигналов позволил сделать эхокомпенсаторы меньшего размера и более экономичными. В 1990-х годах эхоподавители были впервые реализованы в голосовых коммутаторах (в Northern Telecom DMS-250 ), а не как отдельные устройства. Интеграция эхоподавления непосредственно в коммутатор означала, что эхокомпенсаторы можно было надежно включать и выключать для каждого вызова, устраняя необходимость в отдельных группах соединительных линий для голосовых вызовов и вызовов данных. В современных технологиях телефонии часто используются эхоподавители в небольших или портативных устройствах связи с помощью программного голосового механизма , который обеспечивает подавление либо акустического эха, либо остаточного эха, вносимого дальней системой шлюза PSTN; такие системы обычно подавляют отражения эха с задержкой до 64 миллисекунд.

Операция

Процесс эхоподавления работает следующим образом:

Сигнал дальнего конца доставляется в систему.
Воспроизводится сигнал дальнего конца.
Сигнал на дальнем конце фильтруется и задерживается, чтобы напоминать сигнал на ближнем конце.
Отфильтрованный сигнал дальнего конца вычитается из сигнала ближнего конца.
Результирующий сигнал представляет собой звуки, присутствующие в комнате, за исключением прямых или отраженных звуков.

Основной задачей эхокомпенсатора является определение характеристик отклика фильтра, который будет применяться к сигналу на дальнем конце, чтобы он напоминал результирующее эхо на ближнем конце. По сути, фильтр представляет собой модель динамика, микрофона и акустических атрибутов помещения. Подавители эха должны быть адаптивными, поскольку характеристики динамика и микрофона ближнего конца обычно заранее неизвестны. Акустические характеристики комнаты ближнего конца также обычно не известны заранее и могут измениться (например, если микрофон перемещается относительно говорящего или если люди ходят по комнате, вызывая изменения в акустических отражениях). ^[2]^[7] Используя сигнал на дальнем конце в качестве стимула, современные системы используют адаптивный фильтр и могут переходить от отсутствия подавления к подавлению на 55 дБ примерно за 200 мс. ^{[ нужна цитата ]}

Во многих приложениях само подавление эха может оказаться недостаточным. Эхокомпенсация и подавление могут работать совместно для достижения приемлемой производительности.

Количественное эхо

Эхо измеряется какпотеря обратного эха (ERL). Это соотношение, выраженное вдецибелах, исходного сигнала и его эха.^[8]Высокие значения означают, что эхо очень слабое, а низкие значения означают, что эхо очень сильное. Отрицательное значение указывает на то, что эхо сильнее исходного сигнала, что, если его не отрегулировать, приведет к возникновениюзвуковой обратной связи.

Производительность эхокомпенсатора измеряется коэффициентом усиления потерь обратного эха (ERLE), ^[3]^[9] , который представляет собой величину дополнительных потерь сигнала, применяемых эхокомпенсатором. Большинство эхокомпенсаторов способны применять ERLE от 18 до 35 дБ.

Полная потеря эхо-сигнала (ACOM) представляет собой сумму ERL и ERLE. ^[9]^[10]

Текущее использование

Источники эха встречаются в повседневной обстановке, например:

Автомобильные телефонные системы громкой связи
Обычный телефон или мобильный телефон в режиме громкой связи
Выделенные автономные громкоговорители
Установлены системы конференц-залов с потолочными динамиками и микрофонами на столе.
Физическое соединение, при котором вибрации громкоговорителя передаются на микрофон через корпус трубки.

В некоторых из этих случаев звук из громкоговорителя поступает в микрофон практически неизменным. Трудности с подавлением эха связаны с изменением исходного звука окружающим пространством. Эти изменения могут включать поглощение определенных частот мягкой мебелью и отражение различных частот с разной силой.

Реализация AEC требует инженерных знаний и быстрого процессора, обычно в виде процессора цифровых сигналов (DSP). Эта стоимость обработки может быть высокой, однако многие встроенные системы имеют полнофункциональный AEC.

Интеллектуальные динамики и системы интерактивного голосового ответа , которые принимают речь для ввода, используют AEC во время воспроизведения речевых подсказок, чтобы предотвратить ложное распознавание системой распознавания речи отраженных подсказок и других выходных данных.

Модемы

В стандартных телефонных линиях для передачи и приема звука используется одна и та же пара проводов, в результате чего небольшая часть исходящего сигнала отражается обратно. Это полезно для людей, разговаривающих по телефону, поскольку дает говорящему сигнал о том, что их голос проходит через систему. Однако этот отраженный сигнал создает проблемы для модема, который не может отличить сигнал удаленного модема от эха своего собственного сигнала.

По этой причине более ранние модемы коммутируемого доступа разделяли частоты сигнала, так что устройства на обоих концах использовали разные тона, позволяя каждому игнорировать любые сигналы в диапазоне частот, который оно использовало для передачи. Однако это уменьшило объем полосы пропускания, доступной обеим сторонам.

Эхоподавление смягчило эту проблему. В течение периода установления вызова и согласования оба модема посылают серию уникальных тональных сигналов, а затем прослушивают их возвращение через телефонную систему. Они измеряют общее время задержки, а затем настраивают линию задержки на этот же период. После завершения соединения они отправляют свои сигналы в телефонные линии как обычно, а также в линию задержки. Когда их сигнал отражается обратно, он смешивается с инвертированным сигналом линии задержки, что нейтрализует эхо. Это позволило обоим модемам использовать весь доступный спектр, удвоив возможную скорость.

Многие телекоммуникационные компании также применяют эхоподавление к самой линии и могут привести к повреждению данных, а не к улучшению сигнала. Некоторые телефонные коммутаторы или преобразователи (например, адаптеры аналоговых терминалов) отключают эхоподавление или эхоподавление при обнаружении тонов ответа 2100 или 2225 Гц , связанных с такими вызовами, в соответствии с рекомендацией ITU-T G.164 или G.165 .

Модемы ISDN и DSL, работающие на частотах выше голосового диапазона по стандартным телефонным проводам витой пары, также используют автоматическое эхоподавление, чтобы обеспечить одновременную двунаправленную передачу данных. Вычислительная сложность реализации адаптивного фильтра значительно снижается по сравнению с эхоподавлением голоса, поскольку передаваемый сигнал представляет собой цифровой поток битов. Вместо операции умножения и сложения для каждого касания в фильтре требуется только сложение. Схема эхоподавления на основе справочной таблицы ОЗУ ^[11]^[12] исключает даже операцию сложения, просто обращаясь к памяти с усеченным потоком передаваемых битов для получения оценки эха. Эхоподавление теперь обычно реализуется с помощью технологий цифрового сигнального процессора (DSP).

Некоторые модемы используют отдельные входящие и исходящие частоты или выделяют отдельные временные интервалы для передачи и приема, чтобы исключить необходимость эхоподавления. Более высокие частоты, выходящие за пределы исходных проектных пределов телефонных кабелей, подвергаются значительным искажениям затухания из-за отводов моста и неполного согласования импедансов . Часто в результате возникают глубокие и узкие частотные разрывы, которые невозможно устранить с помощью эхоподавления. Они обнаруживаются и отображаются во время согласования соединения.

Смотрите также

Внешние ссылки

"Эхоподавление". Международный инженерный консорциум. Архивировано из оригинала 8 марта 2007 г.
«Учебник по основам эха». Дитек Сети. Архивировано из оригинала 10 июля 2011 г.
«Акустическое эхоподавление Q-Sys» (PDF) . Аудиопродукты QSC . Проверено 28 июля 2016 г.