stringtranslate.com

БабельНет

BabelNet — это многоязычная лексикализированная семантическая сеть и онтология , разработанная в группе НЛП Римского университета Сапиенца . [1] [ 2] BabelNet был автоматически создан путем соединения Википедии с самым популярным вычислительным словарем английского языка WordNet . Интеграция осуществляется с помощью автоматического картографирования и заполнения лексических пробелов в языках с ограниченными ресурсами с помощью статистического машинного перевода . Результатом является энциклопедический словарь , который содержит понятия и именованные сущности, лексикализированные на многих языках и связанные большим количеством семантических отношений . Дополнительные лексикализации и определения добавляются путем ссылки на сети слов со свободной лицензией, OmegaWiki, английский Викисловарь , Wikidata , FrameNet , VerbNet и другие. Подобно WordNet, BabelNet группирует слова на разных языках в наборы синонимов , называемые синсетами Babel . Для каждого синсета Babel BabelNet предоставляет краткие определения (называемые глоссами ) на многих языках, взятые как из WordNet, так и из Википедии.

BabelNet — это многоязычная семантическая сеть, полученная в результате интеграции WordNet и Википедии.

Статистика BabelNet

По состоянию на апрель 2021 года BabelNet (версия 5.0) охватывает 500 языков . Он содержит почти 20 миллионов синсетов и около 1,4 миллиарда значений слов (независимо от их языка). Каждый синсет Babel содержит в среднем по 2 синонима на каждый язык, т. е. значения слов. Семантическая сеть включает в себя все лексико-семантические отношения из WordNet ( гиперонимия и гипонимия , меронимия и холонимия , антонимия и синонимия и т. д., всего около 364 000 ребер отношений), а также недоопределенное отношение родства из Википедии (всего около 1,3 миллиарда ребер). . [1] Версия 5.0 также связывает около 51 миллиона изображений с синсетами Babel и обеспечивает кодировку ресурса Lemon RDF , [3] доступную через конечную точку SPARQL . 2,67 миллионам синсетов присвоены доменные метки.

Приложения

Было показано, что BabelNet позволяет использовать многоязычные приложения обработки естественного языка . Было показано , что лексикализованные знания , доступные в BabelNet, дают самые современные результаты в:

Призы и благодарности

BabelNet получила премию META 2015 за «новаторскую работу по преодолению языковых барьеров с помощью многоязычной лексикализованной семантической сети и онтологии с использованием разнородных источников данных».

BabelNet занял видное место в статье в журнале Time [9] о новой эпохе инновационных и современных ресурсов лексических знаний, доступных в Интернете.

Смотрите также

Рекомендации

  1. ^ аб Р. Навильи и С.П. Понцетто. 2012. BabelNet: автоматическое построение, оценка и применение многоязычной семантической сети с широким охватом. Искусственный интеллект, 193, Elsevier, стр. 217–250.
  2. ^ Р. Навильи, С.П. Понцетто. BabelNet: создание очень большой многоязычной семантической сети. Учеб. 48-го ежегодного собрания Ассоциации компьютерной лингвистики (ACL 2010), Упсала, Швеция, 11–16 июля 2010 г., стр. 216–225.
  3. ^ М. Эрманн, Ф. Чеккони, Д. Ваннелла, Дж. МакКрэй, П. Чимиано, Р. Навильи. Представление многоязычных данных как связанных данных: пример BabelNet 2.0. Учеб. 9-й конференции по языковым ресурсам и оценке (LREC 2014), Рейкьявик, Исландия, 26–31 мая 2014 г.
  4. ^ Р. Навильи и С. Понцетто. 2012. Вавилонская связь! Совместный многоязычный подход к вычислению семантической связанности. Архивировано 3 марта 2016 г. в Wayback Machine . Учеб. 26-й конференции AAAI по искусственному интеллекту (AAAI 2012), Торонто, Канада, стр. 108–114.
  5. ^ Дж. Камачо-Колладос, М. Т. Пилевар и Р. Навильи. NASARI: новый подход к семантически осознанному представлению объектов. Учеб. конференции Североамериканского отделения Ассоциации компьютерной лингвистики (NAACL 2015) 2015 г., Денвер, Колорадо (США), 31 мая – 5 июня 2015 г., стр. 567–577.
  6. ^ Р. Навильи и С. Понцетто. Объединение усилий окупается: устранение многоязычной совместной неоднозначности смысла слов. Учеб. Конференции 2012 г. по эмпирическим методам обработки естественного языка (EMNLP 2012), Чеджу, Корея, 12–14 июля 2012 г., стр. 1399–1410.
  7. ^ А. Моро, А. Раганато, Р. Навильи. Связывание сущностей и устранение неоднозначности в смысле слова: единый подход. Архивировано 8 августа 2014 г. в Wayback Machine Transactions Ассоциации компьютерной лингвистики (TACL), 2, стр. 231–244, 2014.
  8. ^ Д. Юргенс, Р. Навильи. «Это все весело и игры, пока кто-нибудь не сделает аннотации: видеоигры с целью лингвистических аннотаций» (PDF) . Архивировано из оригинала 3 января 2015 года . Проверено 03 января 2015 г.{{cite web}}: CS1 maint: bot: исходный статус URL неизвестен ( ссылка )Труды Ассоциации компьютерной лингвистики (TACL), 2, стр. 449–464, 2014 г.
  9. Штайнмец, Кэти (12 мая 2016 г.). «Переопределение современного словаря». Время . 187 : 20-21.

Внешние ссылки