Лексическая замена

Лексическая замена – это задача определения заменителя слова в контексте предложения. Например, при наличии следующего текста: «После матча восполните оставшийся дефицит жидкости, чтобы предотвратить хроническое обезвоживание на протяжении всего турнира», может быть предложена замена игры .

Лексическая замена строго связана с устранением смысловой неоднозначности слова (WSD), поскольку обе они направлены на определение значения слова. Однако, хотя WSD заключается в автоматическом присвоении соответствующего значения из фиксированного набора значений, лексическая замена не накладывает никаких ограничений на то, какой заменитель выбрать в качестве лучшего представителя слова в контексте. Не предписывая инвентаризации, лексическая замена решает проблему детализации смысловых различий и обеспечивает равные условия для автоматических систем, которые автоматически приобретают значения слов (задача, называемая индукцией смысла слова ).

Оценка

Для оценки автоматических систем по лексической замене на оценочном конкурсе «Семевал-2007», проходившем в Праге в 2007 году, было организовано задание. Также выполнено задание «Семевал-2010» по межъязыковой лексической замене.

Модель пропуска грамма

Модель пропуска граммы переносит слова со схожим значением в векторное пространство (набор объектов, которые можно складывать и умножать на числа), которые находятся близко друг к другу в N-измерениях (список элементов). Разнообразные нейронные сети (компьютерная система, смоделированная по образцу человеческого мозга) формируются вместе в результате взаимодействия векторов и сетей. Все это происходит в рамках словаря, созданного в сети. ^[1] Модель использовалась в алгоритмах автоматизации и прогнозирования лексических замен. Один из таких алгоритмов, разработанный Ореном Меламудом, Омером Леви и Идо Даганом, использует модель пропуска грамм для поиска вектора для каждого слова и его синонимов. Затем он вычисляет косинусное расстояние между векторами, чтобы определить, какие слова будут лучшими заменителями. ^[2]

Пример

В предложении типа «Собака шла быстрым шагом» каждое слово имеет определенный вектор по отношению к другому. Вектором для «The» будет [1,0,0,0,0,0,0], потому что 1 — это словарь слов, а 0 — это слова, окружающие этот словарь, которые создают вектор.

Смотрите также

Библиография

Д. Маккарти, Р. Навильи. Задача на лексическую замену английского языка. Языковые ресурсы и оценка , 43(2), Springer, 2009, стр. 139–159.
Д. Маккарти, Р. Навильи. SemEval-2007 Задание 10: Задача по лексической замене английского языка. Учеб. семинара Semeval-2007 (SEMEVAL) на 45-м ежегодном собрании Ассоциации компьютерной лингвистики (ACL 2007), Прага, Чешская Республика, 23–24 июня 2007 г., стр. 48–53.
Д. Маккарти. Лексическая замена как задача оценки WSD. В материалах семинара ACL по устранению неоднозначности смысла слов: недавние успехи и будущие направления, Филадельфия, США, 2002, стр. 109–115.
Р. Навильи. Устранение неоднозначности в смысле слова: опрос, ACM Computing Surveys, 41 (2), 2009 г., стр. 1–69.

Лексическая замена

Оценка

Модель пропуска грамма

Пример

Смотрите также

Библиография

Рекомендации