stringtranslate.com

БулНет

Болгарский WordNet ( BulNet ) — это электронный многоязычный словарь наборов синонимов вместе с их пояснительными определениями и наборами семантических связей с другими словами языка. [1] [2]

Он следует структуре Princeton WordNet (PWN), которая реализует традиционные семантические сети , структура которых состоит из узлов и отношений между узлами. [3] [4] [5]

Общая информация

BulNet был запущен в рамках финансируемого ЕС проекта BalkaNet - Многоязычная семантическая сеть балканских языков. После завершения строительства BalkaNet. развитие BulNet продолжалось при поддержке правительства Болгарии.

Содержание BulNet

Категории

По состоянию на 2015 год BulNet содержал более 80 000 наборов синонимов , распределенных по девяти частям речи — существительные, глаголы, прилагательные, наречия, местоимения, предлоги , союзы , частицы и междометия .

Слова, включенные в BulNet, были отобраны по разным критериям. Основными критериями являются частотный анализ встречаемости слов в больших текстовых корпусах и включение синсетов . Синсеты включают в себя те, которые уже присутствуют в сетях слов других языков, и синсеты, которые соответствуют высокочастотным значениям слов, встречающимся в параллельных корпусах.

Синсеты

Каждый синсет кодирует отношение эквивалентности между несколькими лексическими элементами — ЛИТЕРАЛАМИ (по крайней мере один из них должен быть явно представлен в SYNSET), каждый из которых имеет уникальное значение (задаваемое значением SENSE), — которые относятся к одному и второму синсету. одной и той же части речи (заданной как значение POS) и представляют одно и то же лексическое значение (заданное как значение DEF). Каждый синсет связан со своим аналогом в PWN 3.0 посредством уникального идентификационного номера — ID. Общие синсеты в балканских языках обозначены как подмножества общих понятий — BCS .

В одноязычной базе данных синсет должен быть связан по крайней мере с одним другим синсетом внутриязыковым отношением. Также может быть закодирована необязательная информация, такая как примеры использования, стилистические особенности, морфологические или синтаксические свойства, сведения об авторе и последнем редактировании.

Семантические отношения

Большое количество отношений, закодированных в BulNet, эффективно иллюстрирует семантическое и словообразовательное богатство языка, которое предлагает разнообразные возможности для многочисленных приложений многоязычной базы данных. BulNet предлагает лингвистические решения на семантическом уровне, такие как варианты выбора синонима, запросы семантических отношений слова в лексической системе языка ( антонимия , холонимия и т. д.), запросы пояснительного определения и переводные эквиваленты лексического элемента.

BulNet — это электронный многоязычный словарь наборов синонимов, а также их пояснительных определений и наборов смысловых связей с другими словами языка. [1] [2]

Гидра

Hydra — это независимая от ОС система, предназначенная для разработки, проверки и исследования Wordnet. Программа позволяет пользователям просматривать и редактировать любое количество одноязычных сетей Word одновременно. Отдельные сети слов синхронизируются, так что эквивалентные наборы синонимов или синсеты можно просматривать и исследовать параллельно. [6]

Рекомендации

  1. ^ аб Коева, С. Деривационные и морфосемантические отношения в болгарской сети Wordnet. В интеллектуальных информационных системах, XVI, Варшава, Академическое издательство, 2008, 359—389. ISBN  978-83-60434-44-4 . «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 8 июля 2011 г. Проверено 12 мая 2015 г.{{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )
  2. ^ ab Цветана Димитрова, Екатерина Тарпоманова и Борислав Ризов. Борьба с деривацией в болгарской сети Wordnet. В: Хейли Орав, Кристиан Феллбаум и Пик Воссен (ред.) Материалы седьмой глобальной конференции Wordnet, Тарту, Эстония, 2014 г., стр. 109–117. [1].
  3. ^ Коева, С., Г. Тотков и А. Генов. К болгарскому WordNet. Румынский журнал информационных наук и технологий, Vol. 7, № 1-2, 45-61, 2004. ISSN  1453-8245.
  4. ^ Коева, С. Болгарская WordNet – развитие и перспективы. На Международной конференции «Когнитивное моделирование в лингвистике», Варна, 2005, 270-271.
  5. ^ Коева, С. Болгарский Wordnet - современное состояние, применение и перспективы. В болгаро-американских диалогах, Академическое издательство проф. М. Дринова, София, 2010, 120-132. ISBN 978-954-322-383-1
  6. ^ Борислав Ризов. Hydra: система программного обеспечения для Wordnet. В: Хейли Орав, Кристиан Феллбаум и Пик Воссен (ред.) Материалы седьмой глобальной конференции Wordnet, Тарту, Эстония, 2014 г., стр. 142–147. [2].

Источники

Внешние ссылки