Болгарский WordNet ( BulNet ) — это электронный многоязычный словарь наборов синонимов вместе с их пояснительными определениями и наборами семантических связей с другими словами языка. [1] [2]
Он следует структуре Princeton WordNet (PWN), которая реализует традиционные семантические сети , структура которых состоит из узлов и отношений между узлами. [3] [4] [5]
BulNet был запущен в рамках финансируемого ЕС проекта BalkaNet - Многоязычная семантическая сеть балканских языков. После завершения строительства BalkaNet. развитие BulNet продолжалось при поддержке правительства Болгарии.
По состоянию на 2015 год BulNet содержал более 80 000 наборов синонимов , распределенных по девяти частям речи — существительные, глаголы, прилагательные, наречия, местоимения, предлоги , союзы , частицы и междометия .
Слова, включенные в BulNet, были отобраны по разным критериям. Основными критериями являются частотный анализ встречаемости слов в больших текстовых корпусах и включение синсетов . Синсеты включают в себя те, которые уже присутствуют в сетях слов других языков, и синсеты, которые соответствуют высокочастотным значениям слов, встречающимся в параллельных корпусах.
Каждый синсет кодирует отношение эквивалентности между несколькими лексическими элементами — ЛИТЕРАЛАМИ (по крайней мере один из них должен быть явно представлен в SYNSET), каждый из которых имеет уникальное значение (задаваемое значением SENSE), — которые относятся к одному и второму синсету. одной и той же части речи (заданной как значение POS) и представляют одно и то же лексическое значение (заданное как значение DEF). Каждый синсет связан со своим аналогом в PWN 3.0 посредством уникального идентификационного номера — ID. Общие синсеты в балканских языках обозначены как подмножества общих понятий — BCS .
В одноязычной базе данных синсет должен быть связан по крайней мере с одним другим синсетом внутриязыковым отношением. Также может быть закодирована необязательная информация, такая как примеры использования, стилистические особенности, морфологические или синтаксические свойства, сведения об авторе и последнем редактировании.
Большое количество отношений, закодированных в BulNet, эффективно иллюстрирует семантическое и словообразовательное богатство языка, которое предлагает разнообразные возможности для многочисленных приложений многоязычной базы данных. BulNet предлагает лингвистические решения на семантическом уровне, такие как варианты выбора синонима, запросы семантических отношений слова в лексической системе языка ( антонимия , холонимия и т. д.), запросы пояснительного определения и переводные эквиваленты лексического элемента.
BulNet — это электронный многоязычный словарь наборов синонимов, а также их пояснительных определений и наборов смысловых связей с другими словами языка. [1] [2]
Hydra — это независимая от ОС система, предназначенная для разработки, проверки и исследования Wordnet. Программа позволяет пользователям просматривать и редактировать любое количество одноязычных сетей Word одновременно. Отдельные сети слов синхронизируются, так что эквивалентные наборы синонимов или синсеты можно просматривать и исследовать параллельно. [6]
{{cite web}}
: CS1 maint: архивная копия в заголовке ( ссылка )