Компьютерный перевод ( CAT ), также называемый компьютерным переводом или компьютерным человеческим переводом ( CAHT ), представляет собой использование программного обеспечения , также известного как переводчик, для помощи переводчику-человеку в процессе перевода . Перевод создается человеком, и некоторые аспекты процесса облегчаются программным обеспечением; это контрастирует с машинным переводом (MT), в котором перевод создается компьютером, опционально с некоторым человеческим вмешательством (например, предварительным редактированием и постредактированием). [1]
Под инструментами CAT обычно понимают программы, которые специально облегчают сам процесс перевода. Большинство инструментов CAT имеют (a) возможность переводить различные форматы исходных файлов в единой среде редактирования без необходимости использования связанного с форматом файла программного обеспечения для большей части или всего процесса перевода, (b) память переводов и (c) интеграцию различных утилит или процессов, которые повышают производительность и согласованность перевода.
Перевод с помощью компьютера — это широкий и неточный термин, охватывающий ряд инструментов. Они могут включать:
Программы памяти переводов сохраняют ранее переведенные исходные тексты и их эквивалентные целевые тексты в базе данных и извлекают связанные сегменты во время перевода новых текстов. [4]
Такие программы разделяют исходный текст на управляемые единицы, известные как «сегменты». Предложение исходного текста или подобная предложению единица (заголовки, названия или элементы в списке) может считаться сегментом. Тексты также могут быть сегментированы на более крупные единицы, такие как абзацы, или небольшие единицы, такие как предложения. По мере того, как переводчик работает с документом, программное обеспечение отображает каждый исходный сегмент по очереди и предоставляет предыдущий перевод для повторного использования, если оно находит соответствующий исходный сегмент в своей базе данных. Если это не так, программа позволяет переводчику ввести перевод для нового сегмента. После завершения перевода сегмента программа сохраняет новый перевод и переходит к следующему сегменту. В доминирующей парадигме память переводов, в принципе, представляет собой простую базу данных полей, содержащих сегмент исходного языка, перевод сегмента и другую информацию, такую как дата создания сегмента, последний доступ, имя переводчика и т. д. Другой подход к памяти переводов не предполагает создания базы данных, а вместо этого опирается на выровненные справочные документы. [5]
Некоторые программы памяти переводов функционируют как автономные среды, в то время как другие функционируют как надстройка или макрос для коммерческих текстовых процессоров или других бизнес-программ. Дополнительные программы позволяют обрабатывать исходные документы из других форматов, таких как файлы настольных издательских систем, электронные таблицы или HTML- код, с помощью программы TM. Например, см. MEMOrg .
Новое в индустрии перевода программное обеспечение для поиска по языку обычно представляет собой интернет-систему, которая работает аналогично интернет-поисковым системам. Однако вместо поиска в Интернете поисковая система по языку просматривает большой репозиторий памяти переводов, чтобы найти ранее переведенные фрагменты предложений, фразы, целые предложения и даже целые абзацы, которые соответствуют сегментам исходного документа.
Поисковые системы языка разработаны для использования современных поисковых технологий для проведения поиска на основе исходных слов в контексте, чтобы гарантировать, что результаты поиска соответствуют значению исходных сегментов. Как и традиционные инструменты TM, ценность поисковой системы языка во многом зависит от репозитория Translation Memory, в котором она осуществляет поиск.
Программное обеспечение для управления терминологией предоставляет переводчику средство автоматического поиска в заданной терминологической базе данных терминов, встречающихся в документе, либо путем автоматического отображения терминов в окне интерфейса программного обеспечения памяти переводов, либо с помощью горячих клавиш для просмотра записи в терминологической базе данных. Некоторые программы имеют другие комбинации горячих клавиш, позволяющие переводчику добавлять новые пары терминов в терминологическую базу данных на лету во время перевода. Некоторые из более продвинутых систем позволяют переводчикам проверять, либо интерактивно, либо в пакетном режиме , была ли использована правильная комбинация исходного/целевого термина внутри и между сегментами памяти переводов в данном проекте. Существуют также независимые системы управления терминологией, которые могут обеспечивать функциональность рабочего процесса, визуальную таксономию, работать как тип проверки терминов (похоже на проверку орфографии, термины, которые были использованы неправильно, помечаются) и могут поддерживать другие типы многоязычных классификаций аспектов терминов, такие как изображения, видео или звук. [6] [4]
Процесс привязки сегмента исходного языка к соответствующему сегменту целевого языка. Цель — создать базу данных памяти переводов или добавить ее к существующей.
Интерактивный машинный перевод — это парадигма, в которой автоматическая система пытается предсказать перевод, который собирается сделать переводчик-человек, предлагая гипотезы перевода. Эти гипотезы могут быть либо полным предложением, либо частью предложения, которая еще не переведена.
Дополненный перевод — это форма человеческого перевода, выполняемая в интегрированной технологической среде, которая предоставляет переводчикам доступ к подсегменту адаптивного машинного перевода (MT) и памяти переводов (TM), поиску терминологии (CAT) и автоматическому обогащению контента (ACE) для облегчения их работы, а также автоматизирует управление проектами, обработку файлов и другие вспомогательные задачи. [7] [8]
Основываясь на концепции дополненной реальности , дополненный перевод стремится сделать переводчиков более продуктивными, предоставляя им соответствующую информацию по мере необходимости. Эта информация адаптируется к привычкам и стилю отдельных переводчиков, чтобы ускорить их работу и повысить производительность. Он отличается от классического постредактирования МП , при котором лингвисты пересматривают целые тексты, переведенные машинами, тем, что он предоставляет машинный перевод и информацию в виде предложений, которые можно принять целиком, отредактировать или проигнорировать, в зависимости от ситуации. [7]
Дополненный перевод расширяет принципы, впервые разработанные в 1980-х годах, которые попали в CAT-инструменты. Однако он объединяет несколько функций, которые ранее были разрозненными в одной среде. Например, переводчикам исторически приходилось покидать свои среды перевода, чтобы провести исследование терминологии, но в дополненной среде компонент ACE автоматически предоставлял бы ссылки на информацию о терминах и концепциях, найденных в тексте, непосредственно в среде.
По состоянию на май 2017 года не существует полных реализаций среды дополненного перевода, хотя отдельные разработчики создали частичные системы.
{{cite web}}
: CS1 maint: archived copy as title (link){{cite web}}
: CS1 maint: multiple names: authors list (link)