stringtranslate.com

Программное обеспечение для транскрипции

Программное обеспечение для транскрипции помогает преобразовывать человеческую речь в текстовую расшифровку. Аудио- или видеофайлы можно транскрибировать вручную или автоматически. [1] Транскрибаторы могут несколько раз воспроизвести запись в редакторе транскрипции и набрать то, что они слышат. Используя горячие клавиши транскрипции, можно ускорить ручную транскрипцию, отфильтровать звук, выровнять его или отрегулировать темп, если четкость не очень хорошая. С помощью технологии распознавания речи транскрибаторы могут автоматически преобразовывать записи в текстовые расшифровки, открывая записи на ПК и загружая их в облако для автоматической транскрипции, или транскрибировать записи в реальном времени с помощью цифровой диктовки . В зависимости от качества записей, машинно-генерируемые расшифровки могут по-прежнему нуждаться в ручной проверке. Уровень точности автоматической транскрипции зависит от нескольких факторов, таких как фоновые шумы, расстояние говорящих от микрофона и акценты.

Программное обеспечение для транскрипции, как и услуги транскрипции , часто предоставляется для деловых, юридических или медицинских целей . По сравнению с аудиоконтентом, текстовая транскрипция доступна для поиска, занимает меньше памяти компьютера и может использоваться в качестве альтернативного метода общения, например, для субтитров и скрытых титров .

Определение транскрипционного «программного обеспечения», по сравнению с транскрипционным «сервисом», заключается в том, что первое достаточно автоматизировано, чтобы пользователь мог управлять всей системой без привлечения внешнего персонала. Однако появление моделей «программное обеспечение как услуга» и облачных вычислений стирает это различие. Оно использует искусственный интеллект , машинное обучение и обработку естественного языка для преобразования речи в текст и постоянного изучения новых фраз и акцентов. [2]

Разработка

Исследовательская группа Google выпустила бесплатное приложение для Android Google Live Transcribe, работающее на Google Cloud . [3] [4] Google Chrome разработал и имеет встроенную функцию Live Caption на английском языке. [5] Google Docs , Google Translate , Google Assistant , GBoard. Google Text to Speech engine также поддерживает инструмент транскрипции. [6] [7] [8] [9]

В сентябре 2022 года OpenAI запустила Whisper — модель глубокого обучения с открытым исходным кодом для распознавания речи . [10]

Смотрите также

Ссылки

  1. ^ "Функции транскрипции | Transcribear". Общие функции транскрипции и соглашения, Аудиотранскрипции . 2017-06-08 . Получено 2019-02-15 .
  2. ^ Бхатт, Медха. «Что такое транскрипция ИИ? Все, что вам нужно знать». fireflies.ai . Получено 3 июня 2022 г. .
  3. ^ «Использование функции прямой расшифровки — справка по специальным возможностям Android». support.google.com . Получено 14.06.2021 .
  4. ^ Батлер, Сидней (2019-12-09). «Как транскрибировать речь с помощью приложения Google Live Transcribe». 9to5Google . Получено 2021-06-14 .
  5. ^ "Новая функция Live Caption в Google Chrome будет транскрибировать речь в видео". techxplore.com . Получено 14.06.2021 .
  6. ^ «Теперь вы можете транскрибировать речь с помощью Google Translate». Google . 2020-03-17 . Получено 2021-06-14 .
  7. ^ Краснофф, Барбара (2020-08-14). «Как использовать бесплатные инструменты транскрипции Google». The Verge . Получено 2021-06-14 .
  8. ^ "Прямая расшифровка и звуковые уведомления - приложения в Google Play". play.google.com . Получено 2021-06-14 .
  9. ^ "Google запускает транскрипцию и перевод в реальном времени для пользователей Gboard" . Получено 14 июня 2021 г.
  10. ^ Голла, Рамсри Гутам (2023-03-06). «Вот шесть практических вариантов использования нового API Whisper». Slator . Архивировано из оригинала 2023-03-25 . Получено 2023-08-12 .