Подавление и ликвидация эха

Эхоподавление и эхокомпенсация — это методы, используемые в телефонии для улучшения качества голоса путем предотвращения возникновения эха или его устранения после того, как оно уже присутствует. Помимо улучшения субъективного качества звука, эхоподавление увеличивает пропускную способность, достигаемую за счет подавления тишины , предотвращая распространение эха по телекоммуникационной сети . Эхоподавляющие устройства были разработаны в 1950-х годах в ответ на первое использование спутников для телекоммуникаций.

Методы подавления и компенсации эха обычно называют подавлением акустического эха ( AES ) и подавлением акустического эха ( AEC ), а реже подавлением линейного эха ( LEC ). В некоторых случаях эти термины более точны, поскольку существуют различные типы и причины эха с уникальными характеристиками, включая акустическое эхо (звуки от громкоговорителя, отражаемые и записываемые микрофоном, которые могут существенно меняться со временем) и линейное эхо (электрические импульсы, вызванные, например, связью между передающими и принимающими проводами, несоответствиями импеданса, электрическими отражениями и т. д., ^[1] , которое изменяется гораздо меньше, чем акустическое эхо). На практике, однако, одни и те же методы используются для обработки всех типов эха, поэтому акустический эхокомпенсатор может подавлять линейное эхо, а также акустическое эхо. AEC в частности обычно используется для обозначения эхокомпенсаторов в целом, независимо от того, были ли они предназначены для акустического эха, линейного эха или обоих.

Хотя эхоподавители и эхоподавители имеют схожие цели — не дать говорящему человеку услышать эхо своего собственного голоса, — методы, которые они используют, различны:

Эхоподавляющие устройства работают, обнаруживая голосовой сигнал, идущий в одном направлении по цепи, а затем приглушая или ослабляя сигнал в другом направлении. Обычно эхоподавляющее устройство на дальнем конце цепи выполняет это приглушение, когда обнаруживает голос, идущий с ближнего конца цепи. Это приглушение не позволяет говорящему слышать свой собственный голос, возвращающийся с дальнего конца.
Эхоподавление включает в себя сначала распознавание первоначально переданного сигнала, который снова появляется с некоторой задержкой в переданном или полученном сигнале. После того, как эхо распознано, его можно удалить, вычитая его из переданного или полученного сигнала. Этот метод обычно реализуется в цифровом виде с использованием цифрового процессора сигналов или программного обеспечения, хотя его можно реализовать и в аналоговых схемах. ^[2]

Стандарты МСЭ G.168 и P.340 описывают требования и тесты для эхоподавителей в цифровых и ТфОП- приложениях соответственно.

История

В телефонии эхо — это отраженная копия голоса, услышанная некоторое время спустя. Если задержка довольно значительна (более нескольких сотен миллисекунд), это считается раздражающим. Если задержка очень мала (десятки миллисекунд или меньше ^[3] ), явление называется эффектом боковой акустики . Если задержка немного больше, около 50 миллисекунд, люди не могут слышать эхо как отдельный звук, а вместо этого слышат эффект хора . ^[3]

На заре телекоммуникаций подавление эха использовалось для уменьшения нежелательного характера эха для пользователей-людей. Один человек говорит, пока другой слушает, и они говорят друг с другом. Подавитель эха пытается определить, какое направление является основным, и позволяет этому каналу идти вперед. В обратном канале он устанавливает затухание , чтобы блокировать или подавлять любой сигнал, предполагая, что сигнал является эхом. Хотя подавитель эффективно справляется с эхом, такой подход приводит к нескольким проблемам, которые могут быть неприятными для обеих сторон вызова.

Двойной разговор: вполне нормально, когда обе стороны говорят одновременно, по крайней мере, недолго. Поскольку каждый эхо-подавитель затем обнаруживает голосовую энергию, исходящую с дальнего конца цепи, эффект обычно заключается в том, что потери будут вставлены в обоих направлениях одновременно, эффективно блокируя обе стороны. Чтобы предотвратить это, эхо-подавители могут быть настроены на обнаружение голосовой активности от говорящего на ближнем конце и не вносить потери (или вносить меньшие потери), когда говорят и говорящий на ближнем конце, и говорящий на дальнем конце. Это, конечно, временно сводит на нет основной эффект наличия эхо-подавителя вообще.
Отсечение: поскольку эхоподавитель попеременно вносит и устраняет потери, часто возникает небольшая задержка, когда новый говорящий начинает говорить, что приводит к отсечению первого слога в его речи.
Dead-set: Если дальний абонент во время вызова находится в шумной обстановке, ближний абонент будет слышать этот фоновый шум, пока дальний абонент говорит, но подавитель эха подавит этот фоновый шум, когда ближний абонент начнет говорить. Внезапное отсутствие фонового шума создает у ближнего абонента впечатление, что линия отключилась.

В ответ на это Bell Labs разработала теорию эхоподавления в начале 1960-х годов ^[4]^[5] , которая затем привела к появлению лабораторных эхоподавителей в конце 1960-х годов и коммерческих эхоподавителей в 1980-х годах. ^[6] Эхоподавитель работает, генерируя оценку эха из сигнала говорящего и вычитая эту оценку из обратного пути. Эта техника требует адаптивного фильтра для генерации сигнала, достаточно точного для эффективного подавления эха, где эхо может отличаться от оригинала из-за различных видов деградации на пути. С момента изобретения в AT&T Bell Labs ^[5] алгоритмы эхоподавления были улучшены и отточены. Как и все процессы эхоподавления, эти первые алгоритмы были разработаны для того, чтобы предвидеть сигнал, который неизбежно повторно войдет в путь передачи, и подавить его.

Стремительный прогресс в цифровой обработке сигналов позволил сделать эхоподавители меньше и более экономичными. В 1990-х годах эхоподавители были впервые реализованы в голосовых коммутаторах (в Northern Telecom DMS-250 ), а не как отдельные устройства. Интеграция эхоподавления непосредственно в коммутатор означала, что эхоподавители могли надежно включаться или выключаться на основе вызова за вызовом, устраняя необходимость в отдельных группах каналов для голосовых вызовов и вызовов данных. Современная телефонная технология часто использует эхоподавители в небольших или портативных устройствах связи через программный голосовой движок , который обеспечивает подавление либо акустического эха, либо остаточного эха, вносимого системой шлюза дальнего конца PSTN; такие системы обычно подавляют отражения эха с задержкой до 64 миллисекунд.

Операция

Процесс эхоподавления работает следующим образом:

Сигнал с дальнего конца передается в систему.
Воспроизводится сигнал на дальнем конце.
Сигнал на дальнем конце фильтруется и задерживается, чтобы походить на сигнал на ближнем конце.
Отфильтрованный сигнал дальнего конца вычитается из сигнала ближнего конца.
Результирующий сигнал представляет собой звуки, присутствующие в помещении, за исключением прямого или отраженного звука.

Основная задача для эхоподавителя — определение характеристик отклика фильтра, который будет применяться к сигналу дальнего конца таким образом, чтобы он напоминал результирующее эхо ближнего конца. Фильтр по сути является моделью динамика, микрофона и акустических свойств помещения. Эхоподавители должны быть адаптивными, поскольку характеристики динамика и микрофона ближнего конца, как правило, заранее не известны. Акустические свойства помещения ближнего конца также, как правило, заранее не известны и могут меняться (например, если микрофон перемещается относительно динамика или если люди ходят по комнате, вызывая изменения в акустических отражениях). ^[2]^[7] Используя сигнал дальнего конца в качестве стимула, современные системы используют адаптивный фильтр и могут сходиться от отсутствия подавления до 55 дБ подавления примерно за 200 мс. ^{[ необходима цитата ]}

Эхоподавление само по себе может быть недостаточным во многих приложениях. Эхоподавление и подавление могут работать совместно для достижения приемлемой производительности.

Количественная оценка эха

Эхо измеряется какПотери на отражение эха (ERL). Это соотношение, выраженное вдецибелах, исходного сигнала и его эха.^[8]Высокие значения означают, что эхо очень слабое, а низкие значения означают, что эхо очень сильное. Отрицательные значения указывают на то, что эхо сильнее исходного сигнала, что, если его не проверить, вызоветзвуковую обратную связь.

Эффективность эхоподавителя измеряется в улучшении возвратных потерь эха (ERLE), ^[3]^[9], которое представляет собой величину дополнительных потерь сигнала, применяемых эхоподавителем. Большинство эхоподавителей способны применять ERLE от 18 до 35 дБ.

Полная потеря сигнала эха (ACOM) представляет собой сумму ERL и ERLE. ^[9]^[10]

Текущее использование

Источники эха можно обнаружить в повседневной обстановке, например:

Системы громкой связи в автомобиле
Обычный телефон или сотовый телефон в режиме громкой связи
Выделенные автономные спикерфоны
Установленные системы для конференц-залов , в которых используются потолочные динамики и микрофоны на столе
Физическая связь, при которой вибрации динамика передаются на микрофон через корпус трубки .

В некоторых из этих случаев звук из громкоговорителя попадает в микрофон почти неизмененным. Трудности в устранении эха возникают из-за изменения исходного звука окружающим пространством. Эти изменения могут включать поглощение определенных частот мягкой мебелью и отражение различных частот с разной силой.

Реализация AEC требует инженерного опыта и быстрого процессора, обычно в виде цифрового сигнального процессора (DSP). Стоимость вычислительной мощности может оказаться слишком высокой, однако многие встраиваемые системы имеют полностью функциональный AEC.

Умные колонки и интерактивные системы голосового реагирования, которые принимают речь в качестве входного сигнала, используют AEC во время воспроизведения речевых подсказок, чтобы предотвратить ложное распознавание системой отраженных подсказок и других выходных данных.

Модемы

Стандартные телефонные линии используют одну и ту же пару проводов для отправки и получения аудио, что приводит к тому, что небольшая часть исходящего сигнала отражается обратно. Это полезно для людей, говорящих по телефону, поскольку это дает говорящему сигнал о том, что его голос проходит через систему. Однако этот отраженный сигнал создает проблемы для модема, который не может отличить сигнал от удаленного модема и эхо своего собственного сигнала.

По этой причине ранние модемы dial-up разделяли частоты сигнала, так что устройства на обоих концах использовали разные тоны, позволяя каждому игнорировать любые сигналы в диапазоне частот, который он использовал для передачи. Однако это уменьшало объем полосы пропускания, доступный обеим сторонам.

Эхоподавление смягчило эту проблему. Во время настройки вызова и периода согласования оба модема отправляют серию уникальных тонов, а затем слушают их возвращение через телефонную систему. Они измеряют общее время задержки, затем настраивают линию задержки на тот же период. После завершения соединения они отправляют свои сигналы в телефонные линии как обычно, но также и в линию задержки. Когда их сигнал отражается обратно, он смешивается с инвертированным сигналом из линии задержки, что подавляет эхо. Это позволило обоим модемам использовать весь доступный спектр, удваивая возможную скорость.

Эхоподавление также применяется многими телекоммуникационными компаниями к самой линии и может привести к повреждению данных, а не к улучшению сигнала. Некоторые телефонные коммутаторы или преобразователи (например, аналоговые терминальные адаптеры) отключают эхоподавление или эхоподавление, когда они обнаруживают ответные тоны 2100 или 2225 Гц , связанные с такими вызовами, в соответствии с рекомендацией ITU-T G.164 или G.165 .

Модемы ISDN и DSL, работающие на частотах выше голосового диапазона по стандартным витым парам телефонных проводов, также используют автоматическое эхоподавление для обеспечения одновременной двунаправленной передачи данных. Вычислительная сложность при реализации адаптивного фильтра значительно снижена по сравнению с голосовым эхоподавлением, поскольку передаваемый сигнал представляет собой цифровой поток битов. Вместо операции умножения и сложения для каждого отвода в фильтре требуется только сложение. Схема эхоподавление на основе таблицы поиска в ОЗУ ^[11]^[12] исключает даже операцию сложения, просто обращаясь к памяти с усеченным потоком передаваемых битов для получения оценки эха. Эхоподавление в настоящее время обычно реализуется с помощью методов цифрового сигнального процессора (DSP).

Некоторые модемы используют отдельные входящие и исходящие частоты или выделяют отдельные временные интервалы для передачи и приема, чтобы исключить необходимость эхоподавление. Более высокие частоты за пределами первоначальных проектных пределов телефонных кабелей испытывают значительные искажения затухания из-за мостовых ответвлений и неполного согласования импеданса . Часто возникают глубокие, узкие частотные пробелы, которые невозможно устранить с помощью эхоподавления. Они обнаруживаются и отображаются во время согласования соединения.

Смотрите также

Ссылки

^ "Octasic: Voice Quality Enhancement & Echo Cancellation". Архивировано из оригинала 2014-08-21 . Получено 14 апреля 2014 .
^ ab Eneroth, Peter (2001). Стереофоническое акустическое эхоподавление: теория и реализация (PDF) (диссертация). Лундский университет. ISBN 91-7874-110-6. ISSN 1402-8662 . Получено 25.06.2015 .
^ abc "Эхо в системах передачи голоса по IP" . Получено 2 июля 2014 г.
^ Sondhi, Man Mohan (март 1967). "Адаптивный эхокомпенсатор" (PDF) . Bell System Technical Journal . 46 (3): 497–511. doi :10.1002/j.1538-7305.1967.tb04231.x. Архивировано из оригинала (PDF) 2014-04-16 . Получено 14 апреля 2014 .
^ ab US 3500000, Келли-младший, Джон Л., «Самоадаптивный эхокомпенсатор», опубликовано 10 марта 1970 г., передано Bell Telephone Laboratories, Inc.
^ Мурано, Кадзуо; Унагами, Сигэюки; Амано, Фумио (январь 1990 г.). «Эхоподавление и приложения» (PDF) . Журнал коммуникаций IEEE . 28 (1): 49–55. дои : 10.1109/35.46671. ISSN 0163-6804. S2CID 897792 . Проверено 14 апреля 2014 г.
^ Åhgren, Per (ноябрь 2005 г.). «Акустическое эхоподавление и обнаружение двойного разговора с использованием расчетных импульсных характеристик громкоговорителя» (PDF) . IEEE Transactions on Speech and Audio Processing . 13 (6): 1231–1237. CiteSeerX 10.1.1.530.4556 . doi :10.1109/TSA.2005.851995. S2CID 2575877.
^ "Что такое Echo Return Loss (ERL) и как оно влияет на качество голоса?". Архивировано из оригинала 2015-06-26.
^ ab "Анализ эха для передачи голоса по IP". Cisco Systems . Получено 2 июля 2014 г.
^ Косанович, Богдан (2002-04-11). "Эхоподавление Часть 1: Основы и акустическое эхоподавление". EE Times . Получено 7 июля 2014 г.
^ Холте, Н.; Штюфлоттен, С. (1981). «Новый цифровой эхоподавитель для двухпроводных абонентских линий». Труды IEEE по коммуникациям . 29 (11): 1573–1581. doi :10.1109/TCOM.1981.1094923. ISSN 1558-0857.
^ US 4237463, Бьор, Хокон Э. и Раад, Бьорн Х., «Направленный соединитель», опубликовано 2 декабря 1980 г., передано Elektrisk Bureau A/S.

Внешние ссылки

"Эхоподавление". Международный инженерный консорциум. Архивировано из оригинала 2007-03-08.
"Учебник по основам Echo". Ditech Networks. Архивировано из оригинала 2011-07-10.
"Q-Sys Acoustic Echo Cancellation" (PDF) . QSC Audio Products . Получено 28.07.2016 .