Перевод с помощью компьютера

Компьютерный перевод ( CAT ), также называемый компьютерным переводом или компьютерным человеческим переводом ( CAHT ), представляет собой использование программного обеспечения , также известного как переводчик, для помощи переводчику-человеку в процессе перевода . Перевод создается человеком, и некоторые аспекты процесса облегчаются программным обеспечением; это контрастирует с машинным переводом (MT), в котором перевод создается компьютером, опционально с некоторым человеческим вмешательством (например, предварительным редактированием и постредактированием). ^[1]

Под инструментами CAT обычно понимают программы, которые специально облегчают сам процесс перевода. Большинство инструментов CAT имеют (a) возможность переводить различные форматы исходных файлов в единой среде редактирования без необходимости использования связанного с форматом файла программного обеспечения для большей части или всего процесса перевода, (b) память переводов и (c) интеграцию различных утилит или процессов, которые повышают производительность и согласованность перевода.

Ассортимент инструментов

Перевод с помощью компьютера — это широкий и неточный термин, охватывающий ряд инструментов. Они могут включать:

Инструменты памяти переводов (инструменты ПМ), состоящие из базы данных текстовых сегментов на исходном языке и их переводов на один или несколько целевых языков. ^[2]
Средства проверки орфографии , встроенные в текстовые редакторы или доступные в качестве дополнительных программ .
Средства проверки грамматики , встроенные в текстовые редакторы или доступные в качестве дополнительных программ.
Менеджеры терминологии , которые позволяют переводчикам управлять собственным банком терминологии в электронной форме. Это может быть простая таблица, созданная в текстовом редакторе переводчика или электронной таблице, база данных, созданная в такой программе, как FileMaker Pro или, для более надежных (и более дорогих) решений, специализированные программные пакеты, такие как SDL MultiTerm , LogiTerm, Termex, TermWeb и т. д.
Электронные словари, как одноязычные, так и двуязычные, также известные как Dictorobotaries.
Базы данных терминологии, находящиеся на главном компьютере или доступные через Интернет, например TERMIUM Plus или Grand dictionnaire terminologique от Office Québécois de la langue française.
Инструменты полнотекстового поиска (или индексаторы), которые позволяют пользователю запрашивать уже переведенные тексты или справочные документы различных видов. Некоторые из таких индексаторов — ISYS Search Software , dtSearch Desktop и Naturel
Конкордансеры — программы, которые извлекают примеры слова или выражения и их соответствующий контекст в одноязычном, двуязычном или многоязычном корпусе, например, в битексте или памяти переводов.
Выравниватели двутекстовых текстов : инструменты, которые выравнивают исходный текст и его перевод, которые затем можно проанализировать с помощью инструмента полнотекстового поиска или конкордансера ^[3]
Программное обеспечение для управления проектами , позволяющее лингвистам структурировать сложные переводческие проекты в виде цепочки задач (часто называемой «рабочим процессом»), назначать различные задачи разным людям и отслеживать ход выполнения каждой из этих задач.

Концепции

Программное обеспечение памяти переводов

Программы памяти переводов сохраняют ранее переведенные исходные тексты и их эквивалентные целевые тексты в базе данных и извлекают связанные сегменты во время перевода новых текстов. ^[4]

Такие программы разделяют исходный текст на управляемые единицы, известные как «сегменты». Предложение исходного текста или подобная предложению единица (заголовки, названия или элементы в списке) может считаться сегментом. Тексты также могут быть сегментированы на более крупные единицы, такие как абзацы, или небольшие единицы, такие как предложения. По мере того, как переводчик работает с документом, программное обеспечение отображает каждый исходный сегмент по очереди и предоставляет предыдущий перевод для повторного использования, если оно находит соответствующий исходный сегмент в своей базе данных. Если это не так, программа позволяет переводчику ввести перевод для нового сегмента. После завершения перевода сегмента программа сохраняет новый перевод и переходит к следующему сегменту. В доминирующей парадигме память переводов, в принципе, представляет собой простую базу данных полей, содержащих сегмент исходного языка, перевод сегмента и другую информацию, такую как дата создания сегмента, последний доступ, имя переводчика и т. д. Другой подход к памяти переводов не предполагает создания базы данных, а вместо этого опирается на выровненные справочные документы. ^[5]

Некоторые программы памяти переводов функционируют как автономные среды, в то время как другие функционируют как надстройка или макрос для коммерческих текстовых процессоров или других бизнес-программ. Дополнительные программы позволяют обрабатывать исходные документы из других форматов, таких как файлы настольных издательских систем, электронные таблицы или HTML- код, с помощью программы TM. Например, см. MEMOrg .

Программное обеспечение для поиска языка

Новое в индустрии перевода программное обеспечение для поиска по языку обычно представляет собой интернет-систему, которая работает аналогично интернет-поисковым системам. Однако вместо поиска в Интернете поисковая система по языку просматривает большой репозиторий памяти переводов, чтобы найти ранее переведенные фрагменты предложений, фразы, целые предложения и даже целые абзацы, которые соответствуют сегментам исходного документа.

Поисковые системы языка разработаны для использования современных поисковых технологий для проведения поиска на основе исходных слов в контексте, чтобы гарантировать, что результаты поиска соответствуют значению исходных сегментов. Как и традиционные инструменты TM, ценность поисковой системы языка во многом зависит от репозитория Translation Memory, в котором она осуществляет поиск.

Программное обеспечение для управления терминологией

Программное обеспечение для управления терминологией предоставляет переводчику средство автоматического поиска в заданной терминологической базе данных терминов, встречающихся в документе, либо путем автоматического отображения терминов в окне интерфейса программного обеспечения памяти переводов, либо с помощью горячих клавиш для просмотра записи в терминологической базе данных. Некоторые программы имеют другие комбинации горячих клавиш, позволяющие переводчику добавлять новые пары терминов в терминологическую базу данных на лету во время перевода. Некоторые из более продвинутых систем позволяют переводчикам проверять, либо интерактивно, либо в пакетном режиме , была ли использована правильная комбинация исходного/целевого термина внутри и между сегментами памяти переводов в данном проекте. Существуют также независимые системы управления терминологией, которые могут обеспечивать функциональность рабочего процесса, визуальную таксономию, работать как тип проверки терминов (похоже на проверку орфографии, термины, которые были использованы неправильно, помечаются) и могут поддерживать другие типы многоязычных классификаций аспектов терминов, такие как изображения, видео или звук. ^[6]^[4]

Программное обеспечение для выравнивания

Процесс привязки сегмента исходного языка к соответствующему сегменту целевого языка. Цель — создать базу данных памяти переводов или добавить ее к существующей.

Интерактивный машинный перевод

Интерактивный машинный перевод — это парадигма, в которой автоматическая система пытается предсказать перевод, который собирается сделать переводчик-человек, предлагая гипотезы перевода. Эти гипотезы могут быть либо полным предложением, либо частью предложения, которая еще не переведена.

Расширенный перевод

Дополненный перевод — это форма человеческого перевода, выполняемая в интегрированной технологической среде, которая предоставляет переводчикам доступ к подсегменту адаптивного машинного перевода (MT) и памяти переводов (TM), поиску терминологии (CAT) и автоматическому обогащению контента (ACE) для облегчения их работы, а также автоматизирует управление проектами, обработку файлов и другие вспомогательные задачи. ^[7]^[8]

Основываясь на концепции дополненной реальности , дополненный перевод стремится сделать переводчиков более продуктивными, предоставляя им соответствующую информацию по мере необходимости. Эта информация адаптируется к привычкам и стилю отдельных переводчиков, чтобы ускорить их работу и повысить производительность. Он отличается от классического постредактирования МП , при котором лингвисты пересматривают целые тексты, переведенные машинами, тем, что он предоставляет машинный перевод и информацию в виде предложений, которые можно принять целиком, отредактировать или проигнорировать, в зависимости от ситуации. ^[7]

Дополненный перевод расширяет принципы, впервые разработанные в 1980-х годах, которые попали в CAT-инструменты. Однако он объединяет несколько функций, которые ранее были разрозненными в одной среде. Например, переводчикам исторически приходилось покидать свои среды перевода, чтобы провести исследование терминологии, но в дополненной среде компонент ACE автоматически предоставлял бы ссылки на информацию о терминах и концепциях, найденных в тексте, непосредственно в среде.

По состоянию на май 2017 года не существует полных реализаций среды дополненного перевода, хотя отдельные разработчики создали частичные системы.

Смотрите также

Ссылки

^ Боукер, Линн; Фишер, Дес (2010). «Компьютерный перевод». В Гамбье, Ю.; ван Дорслаер, Л. (ред.). Справочник по переводоведению . Издательская компания Джона Бенджамина. п. 60. ИСБН 978-90-272-0331-1. Получено 4 марта 2024 г. .
^ Кристенсен, Тина Паульсен; Шьёльдагер, Энн. «Исследования памяти перевода (ПМ): что мы знаем и откуда мы это знаем?» (PDF) . Hermes . 44 .
^ «Выравнивание двутекстового текста | Запрос PDF - ResearchGate».
^ ab "Управление терминологией и МП" (PDF) . Circuit . 117 .
^ «CAT Tools vs. Machine Translation: What's the Best Method?». Asian Absolute. 21 декабря 2015 г. Получено 29 января 2017 г.
^ "Архивная копия" (PDF) . Архивировано из оригинала (PDF) 25 апреля 2012 года . Получено 3 октября 2011 года .{{cite web}}: CS1 maint: archived copy as title (link)
^ ab DePalma, Donald A. и Arle Lommel (15 февраля 2017 г.). «Дополненный перевод усиливает языковые службы». Common Sense Advisory . Получено 19 мая 2017 г.
^ Эггерс, Уильям Д., Дэвид Шатски и д-р Питер Вечницкий (26 апреля 2017 г.). «Правительство с искусственным интеллектом: использование когнитивных технологий для перепроектирования работы государственного сектора». Deloitte University Press . Получено 19 мая 2017 г.{{cite web}}: CS1 maint: multiple names: authors list (link)

Внешние ссылки

В Wikibooks есть книга по теме: CAT-инструменты

Медиа, связанные с компьютерным переводом на Wikimedia Commons
Машинный перевод и компьютерный перевод: новый способ перевода?