stringtranslate.com

Лексическая замена

Лексическая замена – это задача определения заменителя слова в контексте предложения. Например, при наличии следующего текста: «После матча восполните оставшийся дефицит жидкости, чтобы предотвратить хроническое обезвоживание на протяжении всего турнира», может быть предложена замена игры .

Лексическая замена строго связана с устранением смысловой неоднозначности слова (WSD), поскольку обе они направлены на определение значения слова. Однако, хотя WSD заключается в автоматическом присвоении соответствующего значения из фиксированного набора значений, лексическая замена не накладывает никаких ограничений на то, какой заменитель выбрать в качестве лучшего представителя слова в контексте. Не предписывая инвентаризации, лексическая замена решает проблему детализации смысловых различий и обеспечивает равные условия для автоматических систем, которые автоматически приобретают значения слов (задача, называемая индукцией смысла слова ).

Оценка

Для оценки автоматических систем по лексической замене на оценочном конкурсе «Семевал-2007», проходившем в Праге в 2007 году, было организовано задание. Также выполнено задание «Семевал-2010» по межъязыковой лексической замене.

Модель пропуска грамма

Модель пропуска граммы переносит слова со схожим значением в векторное пространство (набор объектов, которые можно складывать и умножать на числа), которые находятся близко друг к другу в N-измерениях (список элементов). Разнообразные нейронные сети (компьютерная система, смоделированная по образцу человеческого мозга) формируются вместе в результате взаимодействия векторов и сетей. Все это происходит в рамках словаря, созданного в сети. [1] Модель использовалась в алгоритмах автоматизации и прогнозирования лексических замен. Один из таких алгоритмов, разработанный Ореном Меламудом, Омером Леви и Идо Даганом, использует модель пропуска грамм для поиска вектора для каждого слова и его синонимов. Затем он вычисляет косинусное расстояние между векторами, чтобы определить, какие слова будут лучшими заменителями. [2]

Пример

В предложении типа «Собака шла быстрым шагом» каждое слово имеет определенный вектор по отношению к другому. Вектором для «The» будет [1,0,0,0,0,0,0], потому что 1 — это словарь слов, а 0 — это слова, окружающие этот словарь, которые создают вектор.

Смотрите также

Библиография

Рекомендации

  1. Барацца, Леонардо (3 апреля 2017 г.). «Как работает Skip-Gram в Word2Vec?». Стать Человеком .
  2. ^ Меламуд, Орен; Леви, Омер; Даган, Идо (5 июня 2015 г.). «Простая модель встраивания слов для лексической замены». Материалы NAACL-HLT 201 : 1–7. дои : 10.3115/v1/W15-1501 . S2CID  2897037 . Проверено 16 апреля 2018 г.