Онтология — это своего рода словарь, описывающий информацию в определенной области с использованием концепций и отношений. Он часто реализуется с использованием OWL (Web Ontology Language), стандартного языка на основе XML , который может интерпретироваться компьютерами.
Понятие определяется как абстрактное знание. Например, в геополитической онтологии несамоуправляемая территория и географическая группа являются понятиями. Понятия явно реализуются в онтологии с индивидами и классами :
Индивид определяется как объект, воспринимаемый из реального мира. В геополитической сфере Эфиопия и группа наименее развитых стран являются индивидами.
Класс определяется как совокупность индивидов, разделяющих общие свойства. В геополитической области Эфиопия , Республика Корея и Италия являются индивидами класса самоуправляющаяся территория; а наименее развитые страны являются индивидами класса особая группа .
Отношения между концепциями явно реализуются посредством:
Свойства объекта между индивидами двух классов. Например, имеет член и находится в свойствах группы , как показано на рисунке 1.
Свойства типа данных между индивидуумами и литералами или типами данных XML . Например, индивидуум Afghanistan имеет свойство типа данных CodeISO3 со значением "AFG".
Ограничения в классах и/или свойствах. Например, официальное английское название свойства класса самоуправляемая территория было ограничено только одним значением, это означает, что самоуправляемая территория (или страна) может иметь только одно международно признанное официальное английское название. [1]
Преимущество описания информации в онтологии заключается в том, что она позволяет приобретать знания о предметной области путем определения иерархических структур классов, добавления индивидов, установки свойств объектов и свойств типов данных, а также назначения ограничений.
Онтология ФАО
Геополитическая онтология предоставляет названия на семи языках (арабский, китайский, французский, английский, испанский, русский и итальянский) и идентификаторы в различных международных системах кодирования ( коды ISO2 , ISO3 , AGROVOC , FAOSTAT , FAOTERM, [2] GAUL , UN , UNDP и DBPedia ) для территорий и групп. Более того, геополитическая онтология ФАО отслеживает исторические изменения с 1985 года по сегодняшний день; [3] предоставляет геолокацию (географические координаты); реализует отношения между странами и странами или странами и группами, включая такие свойства, как имеет границу с , является предшественником , является преемником , администрируется , имеет членов и находится в группе ; и распространяет статистику по странам, включая площадь страны, площадь земель, сельскохозяйственную площадь, ВВП или население .
Геополитическая онтология ФАО обеспечивает структурированное описание источников данных. Это включает: имя источника, идентификатор источника, создателя источника и дату обновления источника. Концепции описываются с использованием словаря Dublin Core [4]
Подводя итог, можно сказать, что основными целями геополитической онтологии ФАО являются:
Предоставлять самую актуальную геополитическую информацию (имена, коды, связи, статистика)
Отслеживать исторические изменения в геополитической информации
Улучшить управление информацией и способствовать стандартизированному обмену данными геополитической информации
Можно загрузить геополитическую онтологию ФАО в форматах OWL [5] и RDF [6] . Документация доступна на веб-странице геополитической информации FAO Country Profiles . [7]
Исторические изменения: предшественник, преемник, действителен с, [12] действителен до. [13]
Внедрение в OWL
Геополитическая онтология FAO реализована в OWL . Она состоит из классов, свойств, индивидов и ограничений. Таблица 1 показывает все классы, дает краткое описание и перечисляет некоторых индивидов, которые принадлежат к каждому классу. Обратите внимание, что текущая версия геополитической онтологии не предоставляет индивидов класса «спорные» территории. Таблица 2 и Таблица 3 иллюстрируют свойства типов данных и свойства объектов.
Геополитическая онтология в связанных открытых данных
Геополитическая онтология ФАО охватывает инициативу W3C Linked Open Data (LOD) [14] и выпустила свою версию RDF геополитической онтологии в марте 2011 года. Термин «Связанные открытые данные» относится к набору лучших практик для публикации и соединения структурированных данных в Интернете. Ключевыми технологиями, которые поддерживают связанные данные, являются URI, HTTP и RDF.
Версия RDF геополитической онтологии соответствует всем принципам связанных данных, которые должны быть включены в облако связанных открытых данных, как поясняется ниже. [15] [16]
Разрешаемые http:// URI
Каждый ресурс в формате OWL Геополитической онтологии ФАО имеет уникальный URI. Разыменование было реализовано для того, чтобы позволить назначать три различных URI каждому ресурсу следующим образом:
URI, идентифицирующий неинформационный ресурс
Информационный ресурс с представлением RDF/XML
Информационный ресурс с HTML-представлением
Кроме того, текущие URI, используемые для формата OWL, необходимо было сохранить, чтобы обеспечить обратную совместимость для других систем, которые их используют. Поэтому новые URI для ФАО Геополитическая Онтология в LOD были тщательно созданы, с использованием «Cool URIs for Semantic Web» и с учетом других хороших практик для URI, таких как URI DBpedia.
Новые URI
URI геополитической онтологии должны быть постоянными, следовательно, вся временная информация, такая как год, версия или формат, была исключена из определения URI. К новым URI можно получить доступ [6]
Например, для ресурса «Италия» URI будут следующими:
идентифицирует информационный ресурс с помощью HTML-представления.
Кроме того, «owl: sameAs » используется для сопоставления новых URI с представлением OWL.
Разыменование URI
Когда неинформационный ресурс ищется без какого-либо определенного формата представления, сервер должен перенаправить запрос на информационный ресурс с HTML-представлением. Например, чтобы получить ресурс «Италия», [17], который является неинформационным ресурсом, сервер перенаправляет на HTML-страницу «Италия». [18]
Не менее 1000 троек в наборах данных
Общее количество тройных утверждений в онтологии FAO Geopolitical Ontology составляет 22 495. Не менее 50 ссылок на набор данных, уже находящихся в текущем облаке LOD: онтология FAO Geopolitical Ontology имеет 195 ссылок на DBpedia, которая уже является частью облака LOD.
Доступ ко всему набору данных
Геополитическая онтология ФАО предоставляет весь набор данных в виде дампа RDF. [19]
Версия RDF геополитической онтологии ФАО уже зарегистрирована в CKAN [20] , и ее попросили добавить в облако LOD.
Пример использования
Профили стран ФАО — это инструмент поиска информации, который группирует обширный архив информации ФАО о ее глобальной деятельности в области сельского хозяйства и развития сельских районов в одной области и каталогизирует ее исключительно по странам.
Система профилей стран ФАО обеспечивает доступ к источникам гетерогенных данных по странам. [21] При использовании геополитической онтологии в системе ожидаются следующие преимущества: [22]
Расширенные функциональные возможности системы для агрегации и синхронизации контента из нескольких исходных репозиториев.
Улучшенный доступ к информации и ее просмотр за счет сравнения данных в соседних странах и группах.
На рисунке 3 показана страница в Профилях стран ФАО , где описана геополитическая онтология.
^ Официальные названия стран из терминологической базы данных ФАО. Архивировано 25.04.2009 на Wayback Machine.
^ "ТЕРМИНОЛОГИЯ ФАО". Архивировано из оригинала 2009-02-19.
^ Изменения кодов стран и зон с 1982 года: Статистический отдел Организации Объединенных Наций — добавлены или изменены коды стран и зон
^ "Условия метаданных DCMI". 20 января 2020 г. Получено 2024-03-02 .
^ "OWL ontology". Архивировано из оригинала (XML) 2015-04-13.
^ ab "FAO Geopolitical ontology (RDF)". Архивировано из оригинала 2018-04-07.
^ "Геополитическая онтология". Архивировано из оригинала 2016-04-13.
^ Когда область (территория или группа) изменилась, но сохранила прежнее название, онтология различает две области, подфиксируя название устаревшей с годом (например, «ФАО 2006»). Год указывает на начало действия этой конкретной области.
^ Тип области Другое используется для Антарктиды , которая не имеет правительства и не принадлежит ни одной стране. См. также Политика в Антарктиде .
^ Официальные названия ООН: Доклады Конференции ООН по стандартизации географических названий. Архивировано 30 января 2009 г. на Wayback Machine.
^ Значение свойства типа данных "validSince" — это первый год действительности территории или группы. Геополитическая онтология отслеживает исторические изменения только до 1985 года. Поэтому, если область имеет validSince = 1985, это означает, что область действительна по крайней мере с 1985 года.
^ Значение свойства datatype "validUntil" — последний год действия территории или группы. В случае, если область в настоящее время действительна, это значение по умолчанию устанавливается равным 9999.
^ "Связанные данные | Связанные данные - подключение распределенных данных через Интернет". Архивировано из оригинала 2020-02-05 . Получено 2011-07-08 .
^ "FAO Geopolitical data". Архивировано из оригинала (XML) 29.03.2018.
^ "Геополитическая онтология ФАО". Архивировано из оригинала 2012-03-24.
^ Перечень источников данных, используемых в страновых профилях ФАО. Архивировано 25 сентября 2009 г. на Wayback Machine.
^ Интеграция разнородных данных по странам в Организации Объединенных Наций: геополитическая онтология и услуги ФАО. [ постоянная неработающая ссылка ]
Внешние ссылки
"Геополитическая онтология и услуги ФАО (Слайды о геополитической онтологии ФАО)". Архивировано из оригинала 24.01.2011.
"Профили стран ФАО". ФАО . Получено 2024-03-02 .
«Терминология ФАО» (FAOTERM)
«ФАОСТАТ».
«Статистический отдел ООН — коды M49».
«ISO — Агентство по обслуживанию кодов стран ISO 3166».