Нечеткое соответствие (компьютерный перевод)

Нечеткое соответствие — это метод, используемый в автоматизированном переводе как частный случай связи записей . Он работает с совпадениями, которые могут быть менее 100% идеальными при поиске соответствий между сегментами текста и записями в базе данных предыдущих переводов. Обычно он работает на уровне предложений , но некоторые технологии перевода позволяют сопоставлять на уровне фраз . Он используется, когда переводчик работает с памятью переводов (ПМ). Он использует приблизительное соответствие строк .

Фон

Если в базе данных TM не найдено точное совпадение для переводимого текста, есть возможность поиска совпадения, которое не является точным; переводчик устанавливает порог нечеткого совпадения на процентное значение менее 100%, а затем база данных вернет все совпадения в своей памяти, соответствующие этому проценту. Его основная функция — помочь переводчику, ускорив процесс перевода; нечеткое совпадение не предназначено для замены переводчика-человека.

История

Из-за полиморфной и динамической природы языка , особенно английского (на который приходится 90% всех исходных текстов, подвергающихся переводу в сфере локализации ^{[ требуется ссылка ]} ), всегда ищутся методы, которые сделают процесс перевода проще и быстрее. С конца 1980-х годов были разработаны инструменты памяти переводов, чтобы повысить производительность и сделать весь процесс перевода быстрее для переводчика.

В 1990-х годах нечеткое соответствие стало набирать популярность как важная функция инструментов TM, и, несмотря на некоторые проблемы, связанные с дополнительной работой, связанной с редактированием «предложения» нечеткого соответствия, оно по-прежнему является популярным подмножеством TM. В настоящее время это функция большинства популярных инструментов TM.

Методология

Инструмент TM ищет в базе данных сегменты, которые приблизительно соответствуют сегменту в новом исходном тексте, который нужно перевести. TM, по сути, «предлагает» соответствие переводчику; затем переводчику остается принять это предложение или отредактировать его, чтобы оно более полно соответствовало новому исходному тексту, который переводится. Таким образом, нечеткое соответствие может ускорить процесс перевода и привести к повышению производительности.

Это поднимает вопросы о качестве полученных переводов. Иногда переводчик находится под давлением необходимости сдать работу вовремя и, таким образом, вынужден принять предложение о нечетком соответствии, не проверив его пригодность и контекст. Базы данных TM создаются на основе данных, полученных от многочисленных разных переводчиков, работающих над различными текстами, с опасностью того, что предложения, извлеченные из этого словесного «гобелена», будут сшитой мешаниной стилей и антитезой стремящейся к последовательности — то, что некоторые критики окрестили «салат из предложений». Вопрос веры в предложения TM может стать проблемой при попытке найти баланс между более быстрым процессом перевода и качеством этого перевода. Тем не менее, нечеткое соответствие по-прежнему является важной частью набора инструментов переводчика.

Внешние ссылки

Эсселинк, Б. (2000) Практическое руководство по локализации, издательство John Benjamins Publishing Company