Таксономия для поисковых систем относится к методам классификации, которые улучшают релевантность в вертикальном поиске . Таксономии сущностей представляют собой древовидные структуры, узлы которых помечены сущностями, которые, скорее всего, встречаются в поисковом запросе в Интернете . Поисковые системы используют эти деревья для сопоставления ключевых слов из поискового запроса с ключевыми словами из ответов (или фрагментов).
Таксономии , тезаурусы и иерархии концепций являются важнейшими компонентами для многих приложений поиска информации , обработки естественного языка и управления знаниями . Создание, настройка и управление таксономиями и онтологиями являются дорогостоящими, поскольку требуется много ручных операций. В ряде исследований предлагалось автоматизированное создание таксономий на основе лингвистических ресурсов и/или статистического машинного обучения. [1] Также доступен ряд инструментов, использующих стандарт SKOS (включая Unilexicon, [2] PoolParty и редактор Lexaurus, чтобы назвать несколько) для упрощения работы с таксономиями.