stringtranslate.com

Постредактирование

Постредактирование (или постредактирование ) — это процесс, при котором люди вносят поправки в машинный перевод для получения приемлемого конечного продукта. Человека, занимающегося постредактированием, называют постредактором . Понятие постредактирования связано с понятием предварительного редактирования . В процессе перевода текста с помощью машинного перевода наилучшие результаты могут быть получены путем предварительного редактирования исходного текста – например, путем применения принципов контролируемого языка  – и последующего редактирования машинного вывода. Это отличается от редактирования, которое относится к процессу улучшения текста, созданного человеком (процесс, который в области перевода часто называют редактированием). Отредактированный текст впоследствии может быть отредактирован для обеспечения качества выбранного языка и исправления простых ошибок.

Постредактирование включает в себя коррекцию результатов машинного перевода , чтобы гарантировать, что они соответствуют уровню качества, заранее согласованному между клиентом и постредактором. Легкое постредактирование направлено на то, чтобы сделать результат понятным; полный постредактирование , придающее еще и стилистический смысл. С развитием машинного перевода полное постредактирование становится альтернативой ручному переводу. Практически все инструменты компьютерного перевода (CAT) теперь поддерживают постредактирование результатов машинного перевода.

Постредактирование и машинный перевод

Машинный перевод вышел из лабораторий и начал использоваться по своему назначению в конце семидесятых годов в некоторых крупных учреждениях, таких как Европейская комиссия и Панамериканская организация здравоохранения , а затем, позже, в некоторых корпорациях, таких как Caterpillar и General Motors . Первые исследования постредактирования появились в восьмидесятых годах, связанные с этими реализациями. [1] [2] Для разработки соответствующих руководств и обучения члены Американской ассоциации машинного перевода (AMTA) и Европейской ассоциации машинного перевода (EAMT) в 1999 году создали Специальную группу по постредактированию. [3] [4]

После девяностых годов достижения в области компьютерной мощности и возможностей подключения ускорили разработку машинного перевода и позволили его развертывать через веб-браузер, в том числе в качестве бесплатного и полезного дополнения к основным поисковым системам ( Google Translate , Bing Translator , Yahoo! Babel Fish ). Более широкое признание несовершенного машинного перевода сопровождалось также более широким признанием постредактирования. Поскольку спрос на локализацию товаров и услуг растет такими темпами, которые невозможно удовлетворить с помощью человеческого перевода, даже при отсутствии памяти переводов и других технологий управления переводами, отраслевые организации, такие как Общество пользователей автоматизации перевода (TAUS), ожидают машинного перевода и постредактирование будет играть гораздо большую роль в течение следующих нескольких лет. [5]

Использование машинного перевода предполагает иногда предварительное редактирование .

Легкий и полноценный постредактирование

В течение многих лет не существовало общепринятых стандартизированных руководств по постредактированию; [6] однако в 2017 году был опубликован стандарт ISO 18587:2017: Услуги перевода. Постредактирование результатов машинного перевода. Требования . Исследования восьмидесятых годов различали степени постредактирования, которые в контексте Службы переводов Европейской комиссии сначала были определены как обычные и быстрые [7] или полные и быстрые. [8] Легкое и полное постредактирование, кажется, наиболее используемая сегодня формулировка.

Легкое постредактирование подразумевает минимальное вмешательство постредактора с целью обеспечения «достаточно хорошего» или «понятного» качества; [6] ожидается, что клиент будет использовать его только для входящих целей, часто когда текст нужен срочно или имеет короткий промежуток времени.

Полное постредактирование предполагает более высокий уровень вмешательства для достижения определенного уровня качества, который должен быть согласован между клиентом и постредактором; ожидается, что результатом будет текст, который не только будет понятен, но и представлен каким-то стилистически подходящим образом, чтобы его можно было использовать для усвоения и даже для распространения, как для входящих, так и для исходящих целей. Ожидается, что качество будет пригодным для публикации и эквивалентным качеству человеческого перевода. [6]

Однако предполагалось, что переводчикам требуется меньше усилий для работы непосредственно с исходным текстом, чем для последующего редактирования версии, сгенерированной машиной. С развитием машинного перевода ситуация может измениться. Для некоторых языковых пар и для некоторых задач, а также с механизмами, которые были настроены с использованием данных хорошего качества для конкретной предметной области, некоторые клиенты уже просят переводчиков выполнить постредактирование вместо перевода с нуля, полагая, что они достигнут аналогичного качества за небольшие деньги. более низкая стоимость.

Легкая/полная классификация, разработанная в девяностые годы, когда машинный перевод еще существовал на компакт-дисках, также может не соответствовать достижениям в области машинного перевода на этапе облегченного постредактирования. Для некоторых языковых пар и некоторых задач, особенно если исходный код был предварительно отредактирован, необработанный машинный вывод может быть достаточно хорош для целей обобщения, не требуя последующего вмешательства человека.

Эффективность постредактирования

Постредактирование используется, когда необработанный машинный перевод недостаточно хорош и человеческий перевод не требуется. Промышленность советует использовать постредактирование, когда оно может как минимум удвоить производительность ручного перевода, а в случае легкого постредактирования — даже в четыре раза (1000 слов в час против 250 слов в час). [9] [10]

Однако эффективность постредактирования трудно предсказать. Различные исследования, проведенные как в научных кругах, так и в промышленности, утверждают, что постредактирование обычно выполняется быстрее, чем перевод с нуля, независимо от языковых пар или опыта переводчиков. [11] Однако нет единого мнения о том, сколько времени можно сэкономить на практике за счет постредактирования (если оно вообще существует): хотя в отрасли сообщается об экономии времени около 40%, [12] некоторые научные исследования показывают, что время экономия в реальных условиях работы, скорее всего, составит от 0 до 20% или может зависеть от терминологической близости между исходным и целевым языками. [13] Профессионалы также сообщают об отрицательном приросте производительности, когда исправления требуют больше времени, чем перевод с нуля. [14] [15]

Постредактирование и языковая индустрия

Спустя тридцать лет постредактирование все еще остается «зарождающейся профессией». [16] Что такое правильный профиль постредактора, еще до конца не изучено. Постредактирование пересекается с переводом и редактированием, но лишь частично. Большинство считает, что идеальным постредактором будет переводчик, стремящийся обучиться конкретным необходимым навыкам, но есть и те, кто считает, что билингва, не имеющего опыта перевода, легче обучить. [17] Мало что известно и о том, кто на самом деле являются постредакторами, являются ли они профессиональными переводчиками, работают ли они в основном штатными сотрудниками или самозанятыми и на каких условиях. Многие профессиональные переводчики не любят постредактирование, среди прочего, потому, что за него обычно платят меньше, чем за обычный перевод, причем особенно активно об этом говорит Международная ассоциация профессиональных переводчиков (IAPTI). [18]

Качество результатов машинного перевода для постредактирования выше и, следовательно, требует меньше усилий после редактирования, если машинный перевод обеспечивается нейронной, вертикальной или настраиваемой системой машинного перевода . Повышение эффективности перевода можно измерить, отслеживая время, необходимое лингвистам для исправления машинного перевода в одной и той же среде перевода, такой как XTM Cloud, [19] система управления переводами и инструмент компьютерного перевода , где учитываются время постредактирования и оценка лингвистического качества. результаты постредактированных текстов можно сравнивать.

Нет четких цифр о том, насколько велик пирог постредактирования в переводческой отрасли. Недавний опрос показал, что 50% поставщиков языковых услуг предлагают его, но для 85% из них на это приходится менее 10% их пропускной способности. [20] Memsource , веб-инструмент для перевода, утверждает, что более 50 процентов переводов между английским, испанским, французским и другими языками были выполнены на его платформе, сочетающей память переводов с машинным переводом. [21] Постредактирование также осуществляется через краудсорсинговые порталы перевода, такие как Unbabel , которые по состоянию на ноябрь 2014 года заявили, что отредактировали более 11 миллионов слов. [22]

Оценки производительности и объема в любом случае являются движущимися целями, поскольку достижения в области машинного перевода, в значительной степени обусловленные тем, что отредактированный текст возвращается обратно в его механизмы, будут означать, что чем больше будет выполнено постредактирование, тем выше будет станет качество машинного перевода и более широкое распространение постредактирование. [ нужна цитата ]

Смотрите также

Рекомендации

  1. ^ Сенез, Дороти (12–13 ноября 1998 г.). «Услуга постредактирования для пользователей машинного перевода в Европейской комиссии». Перевод и компьютер 20. Материалы конференции АСЛИБ . CiteSeerX  10.1.1.477.4105 .
  2. ^ Васконселлос, Мюриэль; Леон, Марджори (1985). «SPANAM и ENGSPA: машинный перевод в Панамериканской организации здравоохранения». Компьютерная лингвистика . 11 : 122–136. CiteSeerX 10.1.1.14.9212 . 
  3. ^ Аллен, Джеффри Х. (2003). «16. Постредактирование». В Сомерсе, HL (ред.). Компьютеры и перевод: Руководство переводчика . Амстердам Филадельфия: Дж. Бенджаминс. п. 312. ИСБН 978-90-272-1640-3. OCLC  52938937.
  4. ^ Сомерс, HL (январь 2003 г.). Аллен, Джеффри. «Постредактирование», Гарольд Сомерс (редактор) (2003). Компьютеры и перевод. Руководство переводчика . Бенджаминс: Амстердам/Филадельфия, с. 312 . ISBN 978-90-272-1640-3.
  5. ^ "Сайт ТАУС" . YouTube .[ мертвая ссылка на YouTube ]
  6. ^ abc Ху, Кэ; Кэдвелл, Патрик (2016). «Сравнительное исследование рекомендаций по постредактированию». Балтийский журнал современных вычислений . 4 : 346–353.
  7. ^ ЛОФФЛЕР-ЛОРИАН, АНН-МАРИ (1986). «Пост-издание Rapide и пост-издание условное: l Deux modalités d'une activité activité activité specifique». Multilingua – Журнал межкультурной и межъязыковой коммуникации . Вальтер де Грюйтер ГмбХ. 5 (2): 81–88. дои : 10.1515/мульт.1986.5.2.81. ISSN  0167-8507. S2CID  201700030.
  8. ^ Вагнер, Элизабет (10–11 ноября 1983 г.). «Быстрое постредактирование Систрана». Перевод и компьютер 5. Материалы конференции ASLIB : 199–213.
  9. ^ Бойте, Кристиан; Бланшон, Эрве (1994). «Проблемы и проблемы «ТАО для всех». После ЛИДИИ-1 — премьерный макет». Языки . 28 (116): 20–47. дои : 10.3406/lgge.1994.1692.
  10. ^ "Fiche métier - Post-edition | Société française des traducteurs: Syndicat professionalnel (SFT)" . www.sft.fr. _ Проверено 16 августа 2022 г.
  11. ^ Грин, Спенс; Джеффри Хир; Кристофер Д. Мэннинг (2013). «Эффективность человеческого постредактирования языкового перевода» (PDF) . Человеческий фактор ACM в вычислительных системах .
  12. ^ Плитт, Мирко и Франсуа Массело (2010). «Тест продуктивности постредактирования статистического машинного перевода в типичном контексте локализации» (PDF) . Пражский вестник математической лингвистики . 93 : 7–16. дои : 10.2478/v10108-010-0010-x .
  13. ^ Шах, Ритеш; Бойте, Кристиан; Бхаттачарья, Пушпак; Падмакумар, Митхун; Зилио, Леонардо; Калитвянский, Руслан; Насируддин, Мохаммед; Томокиё, Муцуко; Паес, Сандра Кастельянос (2015). «Постредактирование главы специализированного учебника на 7 языков: важность терминологической близости с английским для продуктивности». Материалы 12-й Международной конференции по обработке естественного языка . Тривандрам, Индия: Индийская ассоциация НЛП: 325–332.
  14. ^ Марчелло Федерико; Алессандро Каттелан; Марко Тромбетти (2012). «Измерение производительности пользователей при машинном переводе с использованием компьютерной помощи» (PDF) . Материалы десятой конференции Ассоциации машинного перевода Америки (AMTA), проводимой раз в два года, Сан-Диего, Калифорния, 28 октября – 1 ноября .
  15. ^ Ляубли, Самуэль; Марк Фишел; Гэри Мэсси; Морин Эренсбергер-Доу; Мартин Волк (2013). «Оценка эффективности постредактирования в реалистичной среде перевода» (PDF) . Материалы 2-го семинара по технологии и практике постредактирования . стр. 83–91.
  16. ^ "Сайт ТАУС" .
  17. ^ Хатчинс, Джон (1995). «Размышления об истории и современном состоянии машинного перевода» (PDF) .
  18. ^ "Сайт IAPTI" .
  19. ^ "Официальный сайт XTM International" .
  20. ^ «Постредактирование на практике. Отчет TAUS» (PDF) . Март 2010. с. 13.
  21. ^ "Веб-сайт Memsource" .
  22. ^ «Unbabel запускает службу машинного перевода, редактируемую людьми, чтобы помочь компаниям выйти на глобальный уровень и локализовать поддержку клиентов» .

дальнейшее чтение

Внешние ссылки