Формат сжатия звука, оптимизированный для кодирования речи
Аудиокодек Adaptive Multi-Rate ( AMR , AMR-NB или GSM-AMR ) — это формат сжатия звука, оптимизированный для кодирования речи . AMR — это узкополосный речевой кодек с несколькими скоростями , который кодирует узкополосные (200–3400 Гц) сигналы с переменной скоростью передачи данных в диапазоне от 4,75 до 12,2 кбит/с с качеством речи междугородной связи [3] , начиная с 7,4 кбит/с. [4]
AMR был принят в качестве стандартного речевого кодека 3GPP в октябре 1999 года и в настоящее время широко используется в GSM [5] и UMTS . Он использует адаптацию соединения для выбора одной из восьми различных скоростей передачи данных в зависимости от состояния соединения.
AMR также является форматом файла для хранения речевого аудио с использованием кодека AMR. Многие современные мобильные телефоны могут хранить короткие аудиозаписи в формате AMR, и существуют как бесплатные , так и фирменные программы (см. Поддержка программного обеспечения) для преобразования между этим и другими форматами, хотя AMR является речевым форматом и вряд ли даст идеальные результаты для другого аудио. Распространенное расширение имени файла — .amr
. Существует также другой формат хранения для AMR, который подходит для приложений с более продвинутыми требованиями к формату хранения, такими как произвольный доступ или синхронизация с видео. Этот формат является форматом контейнера 3GP , указанным 3GPP, на основе базового формата медиафайлов ISO. [6]
Использование
Кадры содержат 160 выборок и имеют длину 20 миллисекунд. [1] AMR использует различные методы, такие как ACELP , DTX , VAD и CNG . Использование AMR требует оптимизированной адаптации соединения, которая выбирает наилучший режим кодека для соответствия требованиям локального радиоканала и емкости. Если условия радиосвязи плохие, кодирование источника уменьшается, а кодирование канала увеличивается. Это улучшает качество и надежность сетевого соединения, жертвуя при этом некоторой четкостью голоса. В конкретном случае AMR это улучшение составляет где-то около S/N = 4–6 дБ для пригодной связи. Новая интеллектуальная система позволяет оператору сети расставлять приоритеты емкости или качества для каждой базовой станции.
Всего существует 14 режимов кодека AMR, восемь из которых доступны в канале с полной скоростью (FR) и шесть — в канале с половинной скоростью (HR) .
Функции
- Частота дискретизации 8 кГц/13 бит (160 выборок для кадров по 20 мс), фильтрация до 200–3400 Гц.
- Кодек AMR использует восемь исходных кодеков со скоростями передачи данных 12,2, 10,2, 7,95, 7,40, 6,70, 5,90, 5,15 и 4,75 кбит/с.
- Генерирует длину кадра 95, 103, 118, 134, 148, 159, 204 или 244 бит для битрейтов AMR FR 4,75, 5,15, 5,90, 6,70, 7,40, 7,95, 10,2 или 12,2 кбит/с соответственно. Длина кадра AMR HR отличается.
- AMR использует прерывистую передачу (DTX) с обнаружением голосовой активности (VAD) и генерацией комфортного шума (CNG) для снижения использования полосы пропускания в периоды тишины
- Алгоритмическая задержка составляет 20 мс на кадр. Для битрейтов 12,2 задержки "алгоритмического" просмотра вперед нет. Для других скоростей задержка просмотра вперед составляет 5 мс. Обратите внимание, что есть "фиктивная" задержка просмотра вперед в 5 мс, чтобы обеспечить бесшовное переключение режимов по кадрам с остальными скоростями.
- AMR — это гибридный речевой кодер, который передает как параметры речи, так и сигнал формы волны.
- Сложность алгоритма оценивается в 5 баллов по относительной шкале, где G.711 равен 1, а G.729a равен 15.
- Тестирование PSQM в идеальных условиях дает средний балл мнения 4,14 для AMR (12,2 кбит/с) по сравнению с 4,45 для G.711 (μ-закон) [ необходима ссылка ]
- Тестирование PSQM в условиях сетевой нагрузки дает средний балл 3,79 для AMR (12,2 кбит/с) по сравнению с 4,13 для G.711 (μ-закон)
Вопросы лицензирования и патентования
Кодеки AMR включают несколько патентов Nokia , Ericsson , NTT и VoiceAge, [7] [8] последний из которых является администратором лицензий для патентных пулов AMR . VoiceAge также принимает заявки на патенты для определения их возможной существенности для этих стандартов. [9] [10]
Первоначальный взнос за профессиональные инструменты для создания контента и продукты «канала реального времени» составляет 6500 долларов США. [ когда? ] Минимальный годовой роялти составляет 10 000 долларов США, что в первый год не включает первоначальный взнос. Лицензионные сборы за канал снижаются с 0,99 до 0,50 долларов США в зависимости от объема, до максимума в 2 миллиона долларов США в год. [7] [8]
В категории персональных компьютеров, например, медиаплееров, декодер AMR лицензируется бесплатно. Лицензионный сбор за проданный кодер снижается с $0,40 до $0,30 в зависимости от объема, до максимума в $300 000 в год. Минимальный годовой роялти не применяется к лицензированным продуктам, которые попадают в категорию персональных компьютеров и используют только бесплатный декодер. [7] [8]
Дополнительная информация:
- Информация о лицензировании VoiceAge, включая цены на лицензирование кодеков AMR
- Правовые вопросы 3GPP
- Патентная платформа 3G и ее политика лицензирования
- Кодеки AMR как общие библиотеки — юридические уведомления об использовании библиотек amrnb и amrwb на основе эталонной реализации
Поддержка программного обеспечения
- 3GPP TS 26.073 – Речевой кодек AMR (исходный код C) – эталонная реализация [11]
- Audacity (бета-версия 1.3) через библиотеки интеграции FFmpeg [12] (входной и выходной формат)
- FFmpeg с библиотеками OpenCORE AMR [13]
- Android [14] Используется для диктофона.
- AMR Codecs as Shared Libraries – сайт разработки библиотек amrnb и amrwb. Эти библиотеки основаны на эталонной реализации и были созданы для предотвращения внедрения возможно запатентованного исходного кода во многие проекты с открытым исходным кодом.
- Программное обеспечение с открытым исходным кодом для преобразования формата .amr: RetroCode, Amr2Wav, оба находятся на ранней стадии разработки.
- AMR Player — это бесплатное программное обеспечение для воспроизведения аудиофайлов AMR, которое может конвертировать AMR из/в аудиоформат MP3/WAV.
- Nokia Multimedia Converter 2.0 может конвертировать (создавать) образцы, можно использовать инструмент конвертации Nokia для создания файлов .amr и .awb. Он также работает в Windows 7, если установка запущена в режиме совместимости с XP.
- MPlayer ( SMPlayer , KMPlayer [15] )
- Parole Media Player 0.8.1 (в Ubuntu 16.04)
- QuickTime Player и мультимедийный фреймворк
- RealPlayer версии 11 и более поздние
- VLC media player версии 1.1.0 и более поздних (только входной формат, а не выходной)
- ffdshow
- Apple iPhone (может воспроизводить файлы AMR)
- iOS и macOS (iMessage)
- Смартфоны BlackBerry (используется для формата файла диктофона, в то время как BlackBerry 10 не может воспроизводить формат AMR)
- Пакет кодеков K-Lite
- Media Player Classic Home Cinema, около 1.7.1
- foobar2000 с компонентом foo_input_amr
Смотрите также
Ссылки
- ^ ab "3GPP TS 26.090 - Обязательные функции обработки речи речевого кодека; Речевой кодек Adaptive Multi-Rate (AMR); Функции транскодирования". 3GPP . Получено 21.07.2010 .
- ^ "3GPP TS 26.071 - Обязательные функции обработки речи речевого кодека; Речевой кодек AMR; Общее описание". 3GPP . Получено 21.07.2010 .
- ^ "Что такое голосовая связь высокого качества?". ITworld . 13 декабря 2000 г. Получено 26 июля 2019 г.
- ^ RFC 4867 — Формат полезной нагрузки RTP и формат хранения файлов для аудиокодеков Adaptive Multi-Rate (AMR) и Adaptive Multi-Rate Wideband (AMR-WB) Страница 35
- ^ «Сортировка по кодекам GSM: Учебное пособие». 11 июля 2003 г.
- ^ RFC 4867 — Формат полезной нагрузки RTP и формат хранения файлов для аудиокодеков Adaptive Multi-Rate (AMR) и Adaptive Multi-Rate Wideband (AMR-WB) Страница 35
- ^ abc VoiceAge Corporation (2007-10-14). "Условия лицензирования AMR". VoiceAge Corporation. Архивировано из оригинала 2007-10-14 . Получено 2009-09-12 .
- ^ abc VoiceAge Corporation (июнь 2007 г.). "Условия лицензирования AMR". VoiceAge Corporation. Архивировано из оригинала 2007-10-14 . Получено 2009-09-12 .
- ^ VoiceAge Corporation. "Лицензирование - Патентные вызовы". VoiceAge Corporation. Архивировано из оригинала 2007-10-14 . Получено 2009-09-12 .
- ^ VoiceAge Corporation (2007-10-14). "Лицензирование - Патентные вызовы". Архивировано из оригинала 2007-10-14 . Получено 2009-09-12 .
- ^ 3GPP (2008-12-11) 3GPP TS 26.073 - AMR речевой кодек, получено 2009-09-08
- ↑ Получено 28.02.2010
- ^ Общая документация FFmpeg — внешняя библиотека AMR, получено 08.07.2009
- ^ Кодеки Android AMR, Получено 2009-07-08 Архивировано 18 февраля 2009 г. на Wayback Machine
- ^ Настройки внутреннего аудиодекодера KMPlayer. Архивировано 22 октября 2014 г. на Wayback Machine . Получено 22 октября 2014 г.
Внешние ссылки
- 3GPP TS 26.090 — Обязательные функции обработки речи речевого кодека; Речевой кодек Adaptive Multi-Rate (AMR); Функции транскодирования
- 3GPP TS 26.071 — Обязательные функции обработки речи речевого кодека; Речевой кодек AMR; Общее описание
- Спецификации кодеков 3GPP; 3G и далее / GSM, 26 серия
- RFC 4867 – Формат полезной нагрузки RTP и формат хранения файлов для аудиокодеков Adaptive Multi-Rate (AMR) и Adaptive Multi-Rate Wideband (AMR-WB)
- RFC 4281 – Параметр кодеков для типов носителей «Bucket»