stringtranslate.com

Подавление и подавление эха

Подавление эха и эхоподавление — это методы, используемые в телефонии для улучшения качества голоса путем предотвращения создания эха или его удаления после того, как оно уже присутствует. Помимо улучшения субъективного качества звука, эхоподавление увеличивает пропускную способность, достигаемую за счет подавления тишины , предотвращая распространение эха по телекоммуникационной сети . Подавители эха были разработаны в 1950-х годах в ответ на первое использование спутников для телекоммуникаций.

Методы эхоподавления и подавления обычно называются акустическим эхоподавлением ( AES ) и акустическим эхоподавлением ( AEC ), а реже — линейным эхоподавлением ( LEC ). В некоторых случаях эти термины более точны, поскольку существуют различные типы и причины эха с уникальными характеристиками, включая акустическое эхо (звуки из громкоговорителя отражаются и записываются микрофоном, которые могут существенно меняться с течением времени) и линейное эхо ( электрические импульсы, вызванные, например, связью между передающим и принимающим проводами, несоответствием импеданса, электрическими отражениями и т. д., [1] которые варьируются гораздо меньше, чем акустическое эхо). Однако на практике для обработки всех типов эха используются одни и те же методы, поэтому подавитель акустического эха может подавлять как линейное, так и акустическое эхо. AEC , в частности, обычно используется для обозначения эхокомпенсаторов в целом, независимо от того, предназначены ли они для акустического эха, линейного эха или того и другого.

Хотя эхоподавители и эхоподавители преследуют схожие цели — не дать говорящему человеку услышать эхо собственного голоса, — методы, которые они используют, разные:

Стандарты ITU G.168 и P.340 описывают требования и тесты для эхокомпенсаторов в цифровых приложениях и приложениях PSTN соответственно.

История

В телефонии эхо — это отраженная копия голоса, услышанная некоторое время спустя. Если задержка достаточно значительна (более нескольких сотен миллисекунд), она считается раздражающей. Если задержка очень мала (десятки миллисекунд или меньше [3] ), явление называется самопрослушиванием . Если задержка немного больше, около 50 миллисекунд, люди не смогут услышать эхо как отдельный звук, а вместо этого услышат эффект хоруса . [3]

На заре развития телекоммуникаций эхоподавление использовалось, чтобы уменьшить нежелательный характер эха для пользователей. Один человек говорит, а другой слушает, и они говорят взад и вперед. Подавитель эха пытается определить, какое направление является основным, и позволяет этому каналу двигаться вперед. В обратном канале он устанавливает ослабление для блокировки или подавления любого сигнала при условии, что сигнал является эхом. Хотя подавитель эффективно борется с эхом, такой подход приводит к ряду проблем, которые могут раздражать обе стороны вызова.

В ответ на это в начале 1960-х годов Bell Labs разработала теорию эхокомпенсаторов, [4] [5], которая затем привела к созданию лабораторных эхокомпенсаторов в конце 1960-х годов и коммерческих эхоподавителей в 1980-х годах. [6] Подавитель эха работает, генерируя оценку эха из сигнала говорящего и вычитая эту оценку из обратного пути. Этот метод требует адаптивного фильтра для генерации сигнала, достаточно точного, чтобы эффективно подавлять эхо, когда эхо может отличаться от оригинала из-за различных видов ухудшения на этом пути. С момента изобретения в AT&T Bell Labs [5] алгоритмы эхоподавления были улучшены и отточены. Как и все процессы эхоподавления, эти первые алгоритмы были разработаны для прогнозирования сигнала, который неизбежно повторно войдет в путь передачи, и его подавления.

Быстрый прогресс в цифровой обработке сигналов позволил сделать эхокомпенсаторы меньшего размера и более экономичными. В 1990-х годах эхоподавители были впервые реализованы в голосовых коммутаторах (в Northern Telecom DMS-250 ), а не как отдельные устройства. Интеграция эхоподавления непосредственно в коммутатор означала, что эхокомпенсаторы можно было надежно включать и выключать для каждого вызова, устраняя необходимость в отдельных группах соединительных линий для голосовых вызовов и вызовов данных. В современных технологиях телефонии часто используются эхоподавители в небольших или портативных устройствах связи с помощью программного голосового механизма , который обеспечивает подавление либо акустического эха, либо остаточного эха, вносимого дальней системой шлюза PSTN; такие системы обычно подавляют отражения эха с задержкой до 64 миллисекунд.

Операция

Адаптивный эхоподавитель для телефонной сети. Функция H , гибридного преобразователя , заключается в маршрутизации входящей речи от дальнего конца xk к местному телефону и маршрутизации речи от телефона к дальнему концу. Однако гибрид никогда не бывает идеальным, поэтому его выходные данные d k содержат как желаемую речь с местного телефона, так и отфильтрованную речь с дальнего конца. Подавителем эха является адаптивный фильтр f k , который пытается минимизировать сигнал ошибки ε k путем фильтрации входящей речи на дальнем конце в копию y k речи на дальнем конце, которая просачивается через гибрид. После завершения адаптации сигнал ошибки состоит в основном из речи местного телефона.

Процесс эхоподавления работает следующим образом:

  1. Сигнал дальнего конца доставляется в систему.
  2. Воспроизводится сигнал дальнего конца.
  3. Сигнал на дальнем конце фильтруется и задерживается, чтобы напоминать сигнал на ближнем конце.
  4. Отфильтрованный сигнал дальнего конца вычитается из сигнала ближнего конца.
  5. Результирующий сигнал представляет собой звуки, присутствующие в комнате, за исключением прямых или отраженных звуков.

Основной задачей эхокомпенсатора является определение характеристик отклика фильтра, который будет применяться к сигналу на дальнем конце, чтобы он напоминал результирующее эхо на ближнем конце. По сути, фильтр представляет собой модель динамика, микрофона и акустических атрибутов помещения. Подавители эха должны быть адаптивными, поскольку характеристики динамика и микрофона ближнего конца обычно заранее неизвестны. Акустические характеристики комнаты ближнего конца также обычно не известны заранее и могут измениться (например, если микрофон перемещается относительно говорящего или если люди ходят по комнате, вызывая изменения в акустических отражениях). [2] [7] Используя сигнал на дальнем конце в качестве стимула, современные системы используют адаптивный фильтр и могут переходить от отсутствия подавления к подавлению на 55 дБ примерно за 200 мс. [ нужна цитата ]

Во многих приложениях само подавление эха может оказаться недостаточным. Эхокомпенсация и подавление могут работать совместно для достижения приемлемой производительности.

Количественное эхо

Эхо измеряется какпотеря обратного эха (ERL). Это соотношение, выраженное вдецибелах, исходного сигнала и его эха.[8]Высокие значения означают, что эхо очень слабое, а низкие значения означают, что эхо очень сильное. Отрицательное значение указывает на то, что эхо сильнее исходного сигнала, что, если его не отрегулировать, приведет к возникновениюзвуковой обратной связи.

Производительность эхокомпенсатора измеряется коэффициентом усиления потерь обратного эха (ERLE), [3] [9] , который представляет собой величину дополнительных потерь сигнала, применяемых эхокомпенсатором. Большинство эхокомпенсаторов способны применять ERLE от 18 до 35 дБ.

Полная потеря эхо-сигнала (ACOM) представляет собой сумму ERL и ERLE. [9] [10]

Текущее использование

Источники эха встречаются в повседневной обстановке, например:

В некоторых из этих случаев звук из громкоговорителя поступает в микрофон практически неизменным. Трудности с подавлением эха связаны с изменением исходного звука окружающим пространством. Эти изменения могут включать поглощение определенных частот мягкой мебелью и отражение различных частот с разной силой.

Реализация AEC требует инженерных знаний и быстрого процессора, обычно в виде процессора цифровых сигналов (DSP). Эта стоимость обработки может быть высокой, однако многие встроенные системы имеют полнофункциональный AEC.

Интеллектуальные динамики и системы интерактивного голосового ответа , которые принимают речь для ввода, используют AEC во время воспроизведения речевых подсказок, чтобы предотвратить ложное распознавание системой распознавания речи отраженных подсказок и других выходных данных.

Модемы

В стандартных телефонных линиях для передачи и приема звука используется одна и та же пара проводов, в результате чего небольшая часть исходящего сигнала отражается обратно. Это полезно для людей, разговаривающих по телефону, поскольку дает говорящему сигнал о том, что их голос проходит через систему. Однако этот отраженный сигнал создает проблемы для модема, который не может отличить сигнал удаленного модема от эха своего собственного сигнала.

По этой причине более ранние модемы коммутируемого доступа разделяли частоты сигнала, так что устройства на обоих концах использовали разные тона, позволяя каждому игнорировать любые сигналы в диапазоне частот, который оно использовало для передачи. Однако это уменьшило объем полосы пропускания, доступной обеим сторонам.

Эхоподавление смягчило эту проблему. В течение периода установления вызова и согласования оба модема посылают серию уникальных тональных сигналов, а затем прослушивают их возвращение через телефонную систему. Они измеряют общее время задержки, а затем настраивают линию задержки на этот же период. После завершения соединения они отправляют свои сигналы в телефонные линии как обычно, а также в линию задержки. Когда их сигнал отражается обратно, он смешивается с инвертированным сигналом линии задержки, что нейтрализует эхо. Это позволило обоим модемам использовать весь доступный спектр, удвоив возможную скорость.

Многие телекоммуникационные компании также применяют эхоподавление к самой линии и могут привести к повреждению данных, а не к улучшению сигнала. Некоторые телефонные коммутаторы или преобразователи (например, адаптеры аналоговых терминалов) отключают эхоподавление или эхоподавление при обнаружении тонов ответа 2100 или 2225 Гц , связанных с такими вызовами, в соответствии с рекомендацией ITU-T G.164 или G.165 .

Модемы ISDN и DSL, работающие на частотах выше голосового диапазона по стандартным телефонным проводам витой пары, также используют автоматическое эхоподавление, чтобы обеспечить одновременную двунаправленную передачу данных. Вычислительная сложность реализации адаптивного фильтра значительно снижается по сравнению с эхоподавлением голоса, поскольку передаваемый сигнал представляет собой цифровой поток битов. Вместо операции умножения и сложения для каждого касания в фильтре требуется только сложение. Схема эхоподавления на основе справочной таблицы ОЗУ [11] [12] исключает даже операцию сложения, просто обращаясь к памяти с усеченным потоком передаваемых битов для получения оценки эха. Эхоподавление теперь обычно реализуется с помощью технологий цифрового сигнального процессора (DSP).

Некоторые модемы используют отдельные входящие и исходящие частоты или выделяют отдельные временные интервалы для передачи и приема, чтобы исключить необходимость эхоподавления. Более высокие частоты, выходящие за пределы исходных проектных пределов телефонных кабелей, подвергаются значительным искажениям затухания из-за отводов моста и неполного согласования импедансов . Часто в результате возникают глубокие и узкие частотные разрывы, которые невозможно устранить с помощью эхоподавления. Они обнаруживаются и отображаются во время согласования соединения.

Смотрите также

Рекомендации

  1. ^ «Octasic: улучшение качества голоса и эхоподавление» . Архивировано из оригинала 21 августа 2014 г. Проверено 14 апреля 2014 г.
  2. ^ аб Энерот, Питер (2001). Стереофоническое акустическое эхоподавление: теория и реализация (PDF) (Диссертация). Лундский университет. ISBN 91-7874-110-6. ISSN  1402-8662 . Проверено 25 июня 2015 г.
  3. ^ abc «Эхо в системах передачи голоса по IP» . Проверено 2 июля 2014 г.
  4. ^ Сондхи, Ман Мохан (март 1967 г.). «Адаптивный эхоподавитель» (PDF) . Технический журнал Bell System . 46 (3): 497–511. doi :10.1002/j.1538-7305.1967.tb04231.x. Архивировано из оригинала (PDF) 16 апреля 2014 г. Проверено 14 апреля 2014 г.
  5. ^ ab US 3500000, Келли-младший, Джон Л., «Самоадаптивный эхоподавитель», опубликовано 10 марта 1970 г., передано Bell Telephone Laboratories, Inc. 
  6. ^ Мурано, Кадзуо; Унагами, Сигэюки; Амано, Фумио (январь 1990 г.). «Эхоподавление и приложения» (PDF) . Журнал коммуникаций IEEE . 28 (1): 49–55. дои : 10.1109/35.46671. ISSN  0163-6804. S2CID  897792 . Проверено 14 апреля 2014 г.
  7. ^ Огрен, Пер (ноябрь 2005 г.). «Подавление акустического эха и обнаружение двойных разговоров с использованием расчетных импульсных характеристик громкоговорителя» (PDF) . Транзакции IEEE по обработке речи и аудио . 13 (6): 1231–1237. CiteSeerX 10.1.1.530.4556 . дои : 10.1109/TSA.2005.851995. S2CID  2575877. 
  8. ^ «Что такое потеря возврата эха (ERL) и как она влияет на качество голоса?» Архивировано из оригинала 26 июня 2015 г.
  9. ^ ab «Анализ эха для передачи голоса по IP». Сиско Системы . Проверено 2 июля 2014 г.
  10. ^ Косанович, Богдан (11 апреля 2002 г.). «Эхоподавление. Часть 1: Основы и акустическое эхоподавление». ЭЭ Таймс . Проверено 7 июля 2014 г.
  11. ^ Холте, Н.; Стюфлоттен, С. (1981). «Новый цифровой эхоподавитель для двухпроводных абонентских линий». Транзакции IEEE в области коммуникаций . 29 (11): 1573–1581. дои : 10.1109/TCOM.1981.1094923. ISSN  1558-0857.
  12. ^ US 4237463, Бьор, Хокон Э. и Раад, Бьорн Х., «Направленный соединитель», опубликовано 2 декабря 1980 г., передано Elektrisk Bureau A/S. 

Внешние ссылки