stringtranslate.com

Реализация (лингвистика)

В лингвистике реализация — это процесс , посредством которого некоторая поверхностная репрезентация выводится из лежащей в ее основе репрезентации; то есть способ, которым некий абстрактный объект лингвистического анализа создается в реальном языке. Часто говорят, что фонемы реализуются через звуки речи . Различные звуки, которые могут реализовывать определенную фонему, называются ее аллофонами .

Реализация также является подзадачой генерации естественного языка , которая предполагает создание реального текста на человеческом языке (английском, французском и т. д.) из синтаксического представления. Для реализации доступен ряд пакетов программного обеспечения, большинство из которых были разработаны академическими исследовательскими группами NLG. Оставшаяся часть этой статьи посвящена реализации такого рода.

Пример

Например, следующий код Java заставляет простую систему [2] [1] распечатать текст «Женщины не курят». :

Тема NPPhraseSpec = nlgFactory . createNounPhrase ( "the" , "женщина" ); предмет . setPlural ( истина ); Предложение SPhraseSpec = nlgFactory . createClause ( тема , «дым» ); предложение . setFeature ( Feature . NEGATED , true ); Система . вне . println ( реализатор . RealiseSentence ( предложение ));         

В этом примере компьютерная программа определила лингвистические составляющие предложения (глагол, подлежащее), а также лингвистические особенности (подлежащее во множественном числе, отрицание), и на основе этой информации реализатор построил фактическое предложение.

Обработка

Реализация включает в себя три вида обработки:

Синтаксическая реализация : использование грамматических знаний для выбора флексий, добавления служебных слов, а также для определения порядка компонентов. Например, в английском языке подлежащее обычно предшествует глаголу, а отрицательная форма SmokeDon’t Smoke .

Морфологическая реализация : Вычисление изменяемых форм, например, форма множественного числа женщиныженщины (не женщины ).

Орфографическая реализация : работа с регистром, пунктуацией и форматированием. Например, напишите The с заглавной буквы , потому что это первое слово предложения.

Приведенные выше примеры очень просты, большинство реализаторов способны на значительно более сложную обработку.

Системы

За последние 20 лет был разработан ряд реализаций. Эти системы различаются сложностью и изощренностью своей обработки, надежностью в работе с необычными случаями, а также тем, осуществляется ли к ним программный доступ через API или они принимают текстовое представление синтаксической структуры в качестве входных данных.

Существуют также серьезные различия в прагматических факторах, таких как документация, поддержка, условия лицензирования, скорость и использование памяти и т. д.

Невозможно описать здесь всех реализаторов, но вот некоторые из новых областей:

Рекомендации

  1. ^ Гатт и Э. Рейтер (2009). SimpleNLG: Механизм реализации для практических приложений. Материалы ENLG09 [1]

Внешние ссылки