Тематическая карта — это стандарт для представления и обмена знаниями с акцентом на находимость информации. Тематические карты были первоначально разработаны в конце 1990-х годов как способ представления структур индексов back-of-the-book , чтобы можно было объединить несколько индексов из разных источников. Однако разработчики быстро поняли, что с небольшим дополнительным обобщением они могут создать метамодель с потенциально гораздо более широким применением. Стандарт ISO / IEC официально известен как ISO/IEC 13250:2003 .
Тематическая карта представляет информацию с использованием
Тематические карты во многом похожи на концептуальные карты и карты разума , хотя только тематические карты являются стандартами ISO. Тематические карты — это форма технологии семантической паутины, похожая на RDF.
Темы, ассоциации и случаи могут быть типизированы, причем типы должны быть определены одним или несколькими создателями тематических карт. Определения разрешенных типов известны как онтология тематической карты.
Тематические карты явно поддерживают концепцию слияния идентичности между несколькими темами или тематическими картами. Кроме того, поскольку онтологии сами по себе являются тематическими картами, их также можно объединять, что позволяет автоматизировать интеграцию информации из различных источников в связную новую тематическую карту. Такие функции, как идентификаторы субъектов ( URI, присвоенные темам) и PSI ( опубликованные индикаторы субъектов ), используются для управления слиянием между различными таксономиями. Область действия по именам обеспечивает способ организации различных имен, присвоенных определенной теме различными источниками.
Работа по стандартизации тематических карт (ISO/IEC 13250) проводилась под эгидой комитета ISO/IEC JTC 1/SC 34 /WG 3 (Объединенный технический комитет ISO/IEC 1, Подкомитет 34, Рабочая группа 3 – Языки описания и обработки документов – Информационная ассоциация). [1] [2] [3] Однако WG3 была расформирована, а поддержка ISO/IEC 13250 была поручена WG8.
Стандарты эталонной модели тематических карт (ISO/IEC 13250) и модели данных определяются независимо от какой-либо конкретной сериализации или синтаксиса.
Спецификация кратко изложена в аннотации следующим образом: «Эта спецификация предоставляет модель и грамматику для представления структуры информационных ресурсов, используемых для определения тем, и ассоциаций (отношений) между темами. Имена, ресурсы и отношения считаются характеристиками абстрактных предметов, которые называются темами. Темы имеют свои характеристики в рамках: т. е. ограниченные контексты, в которых имена и ресурсы рассматриваются как их характеристики имени, ресурса и отношения. Один или несколько взаимосвязанных документов, использующих эту грамматику, называются картой тем».
Обратите внимание, что XTM 1.0 появился раньше и поэтому несовместим с более поздними версиями стандарта (ISO/IEC 13250).
Другие предлагаемые или стандартизированные форматы сериализации включают в себя:
Все вышеперечисленные стандарты были недавно предложены или определены как часть ISO/IEC 13250. Как описано ниже, существуют и другие форматы сериализации, такие как LTM, AsTMa=, которые не были предложены в качестве стандартов.
Линейная нотация тематических карт (LTM) служит своего рода сокращением для написания тематических карт в текстовых редакторах. Это полезно для написания коротких персональных тематических карт или обмена частичными тематическими картами по электронной почте. Формат можно преобразовать в XTM.
Есть еще один формат, называемый AsTMa, который служит схожей цели. При написании тематических карт вручную он гораздо компактнее, но, конечно, его можно преобразовать в XTM. В качестве альтернативы его можно использовать напрямую с Perl Module TM (который также поддерживает LTM).
Форматы данных XTM и LTM аналогичны стандартам W3C для RDF/XML или более старой нотации N3. [4]
Фактический стандарт API под названием Common Topic Maps Application Programming Interface (TMAPI) был опубликован в апреле 2004 года и поддерживается многими реализациями или поставщиками Topic Maps:
При обычном использовании часто желательно иметь способ произвольного запроса данных в определенном хранилище тематических карт. Многие реализации предоставляют синтаксис, с помощью которого это может быть достигнуто (что-то вроде «SQL для тематических карт»), но синтаксис имеет тенденцию сильно различаться между различными реализациями. Учитывая это, работа была направлена на определение стандартизированного синтаксиса для запроса тематических карт:
Также может быть желательно определить набор ограничений, которые могут быть использованы для гарантии или проверки семантической достоверности данных тематических карт для определенного домена. (Нечто вроде ограничений базы данных для тематических карт). Ограничения могут быть использованы для определения таких вещей, как «каждый документ должен иметь автора» или «все менеджеры должны быть людьми». Часто существуют специфические для реализации способы достижения этих целей, но работа была направлена на определение стандартизированного языка ограничений следующим образом:
TMCL функционально похож на схему RDF с языком веб-онтологий (OWL). [4]
Концепция «Тематических карт» существует уже давно. Стандарт HyTime был предложен еще в 1992 году (или раньше?). Существуют также более ранние версии ISO 13250 (чем текущая редакция). Более подробную информацию о таких стандартах можно найти на сайте ISO Topic Maps. [ необходима цитата ]
Была проделана определенная работа по обеспечению взаимодействия между семейством стандартов семантической паутины RDF / OWL / SPARQL W3C и семейством стандартов тематических карт ISO, хотя эти два стандарта имеют несколько разные цели. [ необходима ссылка ]
Семантическая выразительная сила тематических карт во многом эквивалентна силе RDF , [ требуется ссылка ], но основные различия заключаются в том, что тематические карты (i) обеспечивают более высокий уровень семантической абстракции (предоставляя шаблон тем, ассоциаций и вхождений, в то время как RDF предоставляет только шаблон из двух аргументов, связанных одной связью) и (следовательно) (ii) допускают n -арные связи ( гиперграфы ) между любым количеством узлов, в то время как RDF ограничен триплетами . [ требуется ссылка ]
{{cite web}}
: CS1 maint: numeric names: authors list (link)