Семантическая совместимость — это способность компьютерных систем обмениваться данными с недвусмысленным общим значением. Семантическая совместимость — это требование для обеспечения машинно-вычислимой логики , вывода, обнаружения знаний и объединения данных между информационными системами . [1]
Семантическая совместимость, таким образом, касается не только упаковки данных ( синтаксиса ), но и одновременной передачи смысла с данными ( семантики ). Это достигается путем добавления данных о данных ( метаданных ), связывая каждый элемент данных с контролируемым, общим словарем . Значение данных передается вместе с самими данными, в одном самоописывающемся « информационном пакете », который не зависит от какой-либо информационной системы. Именно этот общий словарь и связанные с ним ссылки на онтологию обеспечивают основу и возможности машинной интерпретации, вывода и логики.
Синтаксическая совместимость (см. ниже) является предпосылкой семантической совместимости. Синтаксическая совместимость относится к механизмам упаковки и передачи данных. В здравоохранении HL7 используется уже более тридцати лет (что предшествовало Интернету и веб-технологиям) и использует символ вертикальной черты (|) в качестве разделителя данных. Текущим интернет-стандартом для разметки документов является XML , который использует "< >" в качестве разделителя данных. Разделители данных не передают никакого смысла данным, кроме как структурируют данные. Без словаря данных для перевода содержимого разделителей данные остаются бессмысленными. Хотя существует множество попыток создания словарей данных и информационных моделей для связи с этими механизмами упаковки данных, ни одна из них не была реализована на практике. Это только увековечило продолжающуюся "бабелизацию" данных и невозможность обмениваться данными со смыслом.
С момента введения концепции семантической паутины Тимом Бернерсом-Ли в 1999 году [2] наблюдается рост интереса к стандартам W3C (Консорциум Всемирной паутины) и их применение для предоставления возможностей обмена семантическими данными, объединения и вывода в масштабах всей сети.
Синтаксическая совместимость, обеспечиваемая, например, стандартами XML или SQL , является предпосылкой семантики. Она включает в себя общий формат данных и общий протокол для структурирования любых данных таким образом, чтобы способ обработки информации можно было интерпретировать из структуры. Она также позволяет обнаруживать синтаксические ошибки, тем самым позволяя принимающим системам запрашивать повторную отправку любого сообщения, которое кажется искаженным или неполным. Никакая семантическая связь невозможна, если синтаксис искажен или не может представлять данные. Однако информация, представленная в одном синтаксисе, в некоторых случаях может быть точно переведена в другой синтаксис. Там, где возможен точный перевод синтаксисов, системы, использующие разные синтаксисы, также могут точно взаимодействовать. В некоторых случаях способность точно переводить информацию между системами, использующими разные синтаксисы, может быть ограничена одним направлением, когда используемые формализмы имеют разные уровни выразительности (способности выражать информацию).
Единая онтология, содержащая представления каждого термина, используемого в каждом приложении, обычно считается невозможной из-за быстрого создания новых терминов или присвоения новых значений старым терминам. Однако, хотя невозможно предвидеть каждое понятие, которое пользователь может пожелать представить в компьютере, существует возможность найти некоторый конечный набор «примитивных» представлений понятий, которые можно объединить для создания любого из более конкретных понятий, которые могут понадобиться пользователям для любого заданного набора приложений или онтологий. Наличие базовой онтологии (также называемой верхней онтологией ), содержащей все эти примитивные элементы, обеспечило бы надежную основу для общей семантической совместимости и позволило бы пользователям определять любые новые термины, которые им нужны, используя базовый инвентарь элементов онтологии, и при этом иметь эти новые определенные термины, правильно интерпретируемые любой другой компьютерной системой, которая может интерпретировать базовую онтологию основания. Является ли количество таких примитивных представлений понятий на самом деле конечным или будет расширяться бесконечно, является вопросом, находящимся в стадии активного изучения. Если он конечен, то стабильная онтология фундамента, подходящая для поддержки точной и общей семантической интероперабельности, может развиться после того, как некоторая начальная онтология фундамента будет протестирована и использована широким кругом пользователей. В настоящее время ни одна онтология фундамента не была принята широким сообществом, поэтому такая стабильная онтология фундамента все еще в будущем.
Одно постоянное недопонимание повторяется при обсуждении семантики — это «смешение слов и значений». Значения слов меняются, иногда быстро. Но формальный язык, такой как используемый в онтологии, может кодировать значения (семантику) понятий в форме, которая не меняется. Чтобы определить, каково значение конкретного слова (или термина в базе данных , например), необходимо пометить каждое фиксированное представление понятия в онтологии словом(ами) или термином(ами), которые могут относиться к этому понятию. Когда несколько слов относятся к одному и тому же (фиксированному) понятию в языке, это называется синонимией ; когда одно слово используется для обозначения более чем одного понятия, это называется неоднозначностью .
Неоднозначность и синонимия являются одними из факторов, которые делают компьютерное понимание языка очень сложным. Использование слов для обозначения концепций (значений используемых слов) очень чувствительно к контексту и цели любого использования для многих понятных человеку терминов. Использование онтологий для поддержки семантической совместимости заключается в предоставлении фиксированного набора концепций, значения и отношения которых стабильны и могут быть согласованы пользователями. Задача определения того, какие термины в каких контекстах (каждая база данных представляет собой другой контекст) затем отделяется от задачи создания онтологии и должна быть взята на себя проектировщиком базы данных, проектировщиком формы для ввода данных или разработчиком программы для понимания языка. Когда значение слова, используемого в некотором совместимом контексте, изменяется, то для сохранения совместимости необходимо изменить указатель на элемент(ы) онтологии, который определяет значение этого слова.
Язык представления знаний может быть достаточно выразительным для описания нюансов смысла в хорошо понятных областях. Существует по крайней мере пять уровней сложности этих [ указать ] .
Для общих полуструктурированных данных можно использовать язык общего назначения, такой как XML. [3]
Для многих задач могут потребоваться языки с полной мощью логики предикатов первого порядка .
Человеческие языки очень выразительны, но считаются слишком неоднозначными, чтобы обеспечить желаемую точную интерпретацию, учитывая текущий уровень технологии человеческого языка. Системы семантической совместимости в здравоохранении используют данные стандартизированным образом, поскольку они разбиваются и обмениваются информацией. Например, теперь две системы могут распознавать терминологию и символы лекарств. Системы семантической совместимости в здравоохранении используют данные стандартизированным образом, поскольку они разбиваются и обмениваются информацией. Например, теперь две системы могут распознавать терминологию, символы лекарств и другие нюансы, обмениваясь данными автоматически, без вмешательства человека.
Семантическая совместимость может быть отделена от других форм совместимости, если учесть, имеет ли передаваемая информация в ее переданной форме все значение, необходимое для того, чтобы принимающая система могла ее правильно интерпретировать, даже если алгоритмы, используемые принимающей системой, неизвестны отправляющей системе. Рассмотрим отправку одного числа:
Если эта цифра представляет собой сумму денег, которую одна компания должна другой, то это подразумевает определенные действия или бездействие как со стороны тех, кто отправляет деньги, так и со стороны тех, кто их получает.
Его можно правильно интерпретировать, если отправить его в ответ на конкретный запрос и получить в ожидаемое время и в ожидаемой форме. Эта правильная интерпретация зависит не только от самого числа, которое может представлять почти любой из миллионов типов количественного измерения, но и строго от обстоятельств передачи. То есть интерпретация зависит от того, ожидают ли обе системы, что алгоритмы в другой системе используют число в точно таком же смысле, и она зависит далее от всего пакета передач, которые предшествовали фактической передаче голого числа.
Напротив, если передающая система не знает, как информация будет использоваться другими системами, необходимо иметь общее соглашение о том, как информация с определенным значением (из многих возможных значений) будет отображаться в сообщении. Для конкретной задачи одним из решений является стандартизация формы, такой как запрос на оплату; этот запрос должен был бы кодировать стандартизированным образом всю информацию, необходимую для его оценки, такую как: агент, который должен деньги, агент должен деньги, характер действия, приводящего к возникновению долга, агенты, товары, услуги и другие участники этого действия; время действия; сумма задолженности и валюта, в которой рассчитывается долг; время, отведенное для оплаты; требуемая форма оплаты; и другая информация. Когда две или более систем договорились о том, как интерпретировать информацию в таком запросе, они могут достичь семантической совместимости для этого конкретного типа транзакции . Для обеспечения семантической совместимости в целом необходимо обеспечить стандартизированные способы описания значений гораздо большего числа вещей, чем просто коммерческие транзакции, а число концепций, представление которых необходимо согласовать, составляет как минимум несколько тысяч.
Как достичь семантической интероперабельности для более чем нескольких ограниченных сценариев в настоящее время является предметом исследований и обсуждений. Для проблемы общей семантической интероперабельности требуется некоторая форма фундаментальной онтологии (« верхняя онтология »), которая является достаточно всеобъемлющей, чтобы предоставить определение концепций для более специализированных онтологий в нескольких доменах. За последнее десятилетие было разработано более десяти фундаментальных онтологий, но ни одна из них пока не была принята широкой пользовательской базой.
Необходимость в единой всеобъемлющей всеобъемлющей онтологии для поддержки семантической интероперабельности можно избежать, разработав общую фундаментальную онтологию как набор базовых («примитивных») концепций, которые можно объединить для создания логических описаний значений терминов, используемых в локальных доменных онтологиях или локальных базах данных. Эта тактика основана на следующем принципе:
Если:
(1) согласованы значения и использование примитивных элементов онтологии в базовой онтологии, и(2) элементы онтологии в онтологиях предметной области строятся как логические комбинации элементов в базовой онтологии,
Затем:
Предполагаемые значения элементов онтологии предметной области могут быть вычислены автоматически с использованием логического рассуждения первого порядка (FOL) любой системой, которая принимает значения элементов в базовой онтологии и имеет как базовую онтологию, так и логические спецификации элементов в онтологии предметной области.
Поэтому:
Любая система, желающая точно взаимодействовать с другой системой, должна передавать только данные, которые необходимо передать, а также любые логические описания терминов, используемых в этих данных, которые были созданы локально и еще не включены в общую базовую онтологию.
Эта тактика затем ограничивает необходимость предварительного соглашения о значениях только теми элементами онтологии в общей онтологии Foundation (FO). Исходя из нескольких соображений, это может потребовать менее 10 000 элементов (типов и отношений). Однако для простоты понимания и использования больше элементов онтологии с дополнительными подробностями и особенностями может помочь найти точное место в FO, где можно найти или добавить определенные концепции предметной области.
На практике, вместе с FO, сфокусированным на представлениях примитивных концепций, вероятно, также будет использоваться набор онтологий расширения домена для FO с элементами, указанными с использованием элементов FO. Такие уже существующие расширения облегчат создание онтологий домена, предоставляя существующим элементам предполагаемое значение, и уменьшат вероятность ошибки за счет использования элементов, которые уже были протестированы. Онтологии расширения домена могут быть логически несовместимы друг с другом, и это необходимо определить, если в какой-либо коммуникации используются различные расширения домена.
Также изучается вопрос о том, можно ли избежать использования такой единой базовой онтологии с помощью сложных методов сопоставления между независимо разработанными онтологиями.
Практическая значимость семантической интероперабельности была измерена несколькими исследованиями, которые оценивают стоимость (потерянной эффективности) из-за отсутствия семантической интероперабельности. Одно исследование, [4] сосредоточенное на потере эффективности в передаче медицинской информации, подсчитало, что 77,8 млрд долларов США в год можно сэкономить, внедрив эффективный стандарт интероперабельности в этой области. Другие исследования, посвященные строительной отрасли [5] и цепочке поставок в автомобилестроении [6] , оценивают затраты более чем в 10 млрд долларов США в год из-за отсутствия семантической интероперабельности в этих отраслях. В общей сложности эти цифры можно экстраполировать, чтобы показать, что более 100 млрд долларов США в год теряется из-за отсутствия широко используемого стандарта семантической интероперабельности только в США.
Пока еще не было исследования каждой области политики, которая могла бы предложить большую экономию затрат при применении стандартов семантической интероперабельности. Но чтобы увидеть, какие области политики способны извлечь выгоду из семантической интероперабельности, см. « Интероперабельность » в целом. К таким областям политики относятся электронное правительство , здравоохранение, безопасность и многие другие. ЕС также создал Центр семантической интероперабельности в Европе в июне 2007 года.
Цифровая трансформация несет огромные преимущества, позволяя организациям быть более эффективными, более гибкими и более проворными в реагировании на изменения в бизнесе и условиях эксплуатации. Это подразумевает необходимость интеграции разнородных данных и услуг во всех организациях. Семантическая совместимость решает потребность в общем понимании смысла и контекста.
Для поддержки этого межорганизационная экспертная группа, включающая ISO/IEC JTC1, ETSI, oneM2M и W3C, сотрудничает с AIOTI в целях ускорения внедрения семантических технологий в IoT. Группа совсем недавно опубликовала два совместных документа по семантической совместимости, названных соответственно «Semantic IoT Solutions – A Developer Perspective» и «Towards semantic interoperability standards based on onologies». Это следует за успехом более раннего документа «Semantic Interoperability for the Web of Things».
Источник:
«Семантические решения IoT — точка зрения разработчика»
«На пути к стандартам семантической совместимости на основе онтологий».
Это стало продолжением успеха более раннего документа «Семантическая совместимость для Интернета вещей».
https://www.w3.org/blog/2019/10/aioti-iso-iec-jtc1-etsi-onem2m-and-w3c-collaborate-on-two-joint-white-papers-on-semantic-interoperability- ориентированы на разработчиков и инженеров по стандартизации/
{{cite web}}
: CS1 maint: архивная копия как заголовок ( ссылка )