BabelNet — это многоязычная лексикализированная семантическая сеть и онтология , разработанная в группе НЛП Римского университета Сапиенца . [1] [ 2] BabelNet был автоматически создан путем соединения Википедии с самым популярным вычислительным словарем английского языка WordNet . Интеграция осуществляется с помощью автоматического картографирования и заполнения лексических пробелов в языках с ограниченными ресурсами с помощью статистического машинного перевода . Результатом является энциклопедический словарь , который содержит понятия и именованные сущности, лексикализированные на многих языках и связанные большим количеством семантических отношений . Дополнительные лексикализации и определения добавляются путем ссылки на сети слов со свободной лицензией, OmegaWiki, английский Викисловарь , Wikidata , FrameNet , VerbNet и другие. Подобно WordNet, BabelNet группирует слова на разных языках в наборы синонимов , называемые синсетами Babel . Для каждого синсета Babel BabelNet предоставляет краткие определения (называемые глоссами ) на многих языках, взятые как из WordNet, так и из Википедии.
По состоянию на апрель 2021 года [обновлять]BabelNet (версия 5.0) охватывает 500 языков . Он содержит почти 20 миллионов синсетов и около 1,4 миллиарда значений слов (независимо от их языка). Каждый синсет Babel содержит в среднем по 2 синонима на каждый язык, т. е. значения слов. Семантическая сеть включает в себя все лексико-семантические отношения из WordNet ( гиперонимия и гипонимия , меронимия и холонимия , антонимия и синонимия и т. д., всего около 364 000 ребер отношений), а также недоопределенное отношение родства из Википедии (всего около 1,3 миллиарда ребер). . [1] Версия 5.0 также связывает около 51 миллиона изображений с синсетами Babel и обеспечивает кодировку ресурса Lemon RDF , [3] доступную через конечную точку SPARQL . 2,67 миллионам синсетов присвоены доменные метки.
Было показано, что BabelNet позволяет использовать многоязычные приложения обработки естественного языка . Было показано , что лексикализованные знания , доступные в BabelNet, дают самые современные результаты в:
BabelNet получила премию META 2015 за «новаторскую работу по преодолению языковых барьеров с помощью многоязычной лексикализованной семантической сети и онтологии с использованием разнородных источников данных».
BabelNet занял видное место в статье в журнале Time [9] о новой эпохе инновационных и современных ресурсов лексических знаний, доступных в Интернете.
{{cite web}}
: CS1 maint: bot: исходный статус URL неизвестен ( ссылка )Труды Ассоциации компьютерной лингвистики (TACL), 2, стр. 449–464, 2014 г.