stringtranslate.com

Семантическая сеть

Пример семантической сети

Семантическая сеть или фреймовая сеть — это база знаний , которая представляет семантические отношения между понятиями в сети. Это часто используется как форма представления знаний . Это ориентированный или неориентированный граф, состоящий из вершин , которые представляют понятия , и ребер , которые представляют семантические отношения между понятиями , [1] отображающие или соединяющие семантические поля . Семантическая сеть может быть реализована, например, как графовая база данных или концептуальная карта . Типичные стандартизированные семантические сети выражаются в виде семантических троек .

Семантические сети используются в нейролингвистике и приложениях обработки естественного языка , таких как семантический анализ [2] и устранение смысловой неоднозначности . [3] Семантические сети также можно использовать в качестве метода анализа больших текстов и определения основных тем и тем (например, публикаций в социальных сетях ), выявления предвзятостей (например, в новостях) или даже для картирования всего исследования. поле. [4]

История

Примеры использования семантических сетей в логике , направленных ациклических графов в качестве мнемонического инструмента датируются столетиями. Самым ранним документально подтвержденным использованием является комментарий греческого философа Порфирия к категориям Аристотеля в третьем веке нашей эры.

В истории вычислений «Семантические сети» для исчисления высказываний были впервые реализованы для компьютеров Ричардом Х. Риченсом из Кембриджского отдела языковых исследований в 1956 году как « интерлингва » для машинного перевода естественных языков , [5] хотя важность этого Работа и Кембриджский отдел языковых исследований были реализованы лишь с опозданием.

Семантические сети были также независимо реализованы Робертом Ф. Симмонсом [6] и Шелдоном Кляйном, используя в качестве основы исчисление предикатов первого порядка , вдохновленные демонстрацией Виктора Ингве . Это направление исследований было начато первым президентом Ассоциации компьютерной лингвистики Виктором Ингве, который в 1960 году опубликовал описания алгоритмов использования грамматики фразовой структуры для генерации синтаксически правильно сформированных бессмысленных предложений. Шелдон Кляйн и я около 1962 года. –1964 были очарованы этой техникой и обобщили ее до метода управления смыслом того, что создается, путем уважения семантических зависимостей слов в том виде, в каком они встречаются в тексте». [7] Другие исследователи, в первую очередь М. Росс Куиллиан [8] и другие из System Development Corporation, внесли свой вклад в их работу в начале 1960-х годов в рамках проекта SYNTHEX. Именно на эти публикации в System Development Corporation большинство современных производных от термина «семантическая сеть» ссылаются в качестве основы. Более поздние выдающиеся работы были сделаны Алланом М. Коллинзом и Куиллианом (например, Коллинз и Куиллиан; [9] [10] Коллинз и Лофтус [11] Куиллиан [12] [13] [14] [15] ). Еще позже, в 2006 году, Герман Хельбиг полностью описал MultiNet . [16]

В конце 1980-х годов два университета в Нидерландах , Гронинген и Твенте , совместно начали проект под названием Графы Знаний , которые представляют собой семантические сети, но с дополнительным ограничением, заключающимся в том, что ребра должны быть из ограниченного набора возможных отношений, чтобы облегчить алгебры на график . [17] В последующие десятилетия различие между семантическими сетями и графами знаний было размыто. [18] [19] В 2012 году Google дала своему графику знаний название «График знаний» .

The semantic link network was systematically studied as a semantic social networking method. Its basic model consists of semantic nodes, semantic links between nodes, and a semantic space that defines the semantics of nodes and links and reasoning rules on semantic links. The systematic theory and model was published in 2004.[20] This research direction can trace to the definition of inheritance rules for efficient model retrieval in 1998[21] and the Active Document Framework ADF.[22] Since 2003, research has developed toward social semantic networking.[23] This work is a systematic innovation at the age of the World Wide Web and global social networking rather than an application or simple extension of the Semantic Net (Network). Its purpose and scope are different from that of the Semantic Net (or network).[24] The rules for reasoning and evolution and automatic discovery of implicit links play an important role in the Semantic Link Network.[25][26] Recently it has been developed to support Cyber-Physical-Social Intelligence.[27] It was used for creating a general summarization method.[28] The self-organised Semantic Link Network was integrated with a multi-dimensional category space to form a semantic space to support advanced applications with multi-dimensional abstractions and self-organised semantic links[29][30] It has been verified that Semantic Link Network play an important role in understanding and representation through text summarisation applications.[31][32] Semantic Link Network has been extended from cyberspace to cyber-physical-social space. Competition relation and symbiosis relation as well as their roles in evolving society were studied in the emerging topic: Cyber-Physical-Social Intelligence[33]

More specialized forms of semantic networks has been created for specific use. For example, in 2008, Fawsy Bendeck's PhD thesis formalized the Semantic Similarity Network (SSN) that contains specialized relationships and propagation algorithms to simplify the semantic similarity representation and calculations.[34]

Basics of semantic networks

A semantic network is used when one has knowledge that is best understood as a set of concepts that are related to one another.

Большинство семантических сетей основаны на когнитивных способностях. Они состоят из дуг (спиц) и узлов (концентраторов), которые можно организовать в таксономическую иерархию. Различные семантические сети также могут быть соединены узлами-мостами. Семантические сети способствовали идеям распространения активации , наследования и узлов как прото-объектов.

Один процесс построения семантических сетей, известный также как сети совместного появления , включает в себя идентификацию ключевых слов в тексте, расчет частоты совпадений и анализ сетей для поиска центральных слов и кластеров тем в сети. [35]

В лингвистике

В области лингвистики семантические сети представляют собой то, как человеческий разум обрабатывает связанные понятия. Обычно понятия в семантической сети могут иметь одно из двух различных отношений: семантическое или ассоциативное.

В семантическом отношении два понятия связаны любым из следующих семантических отношений: синонимия , антонимия , гиперонимия , гипонимия , холонимия , меронимия , или метонимия , или полисемия . Это не единственные семантические отношения, но одни из наиболее распространенных.

В ассоциативном отношении эти два понятия связаны на основе частоты их совместного появления. Эти ассоциации случайны, а это означает, что ничто в их индивидуальных значениях не требует их связи друг с другом, а только то, что обычно так и есть. Примерами этого могут быть свинья и ферма, свинья и корыто или свинья и грязь. Хотя ничто в значении слова «свинья» не заставляет его ассоциироваться с фермами, поскольку свиньи могут быть дикими, тот факт, что свиньи так часто встречаются на фермах, создает случайную ассоциированную связь. Эти тематические отношения распространены в семантических сетях и являются заметными результатами тестов свободных ассоциаций .

Как только произносится первое слово, начинается активация наиболее тесно связанных концепций, распространяющаяся наружу на менее связанные концепции. Примером этого может быть начальное слово «свинья», подсказывающее «млекопитающее», затем «животное», а затем «дышит». Этот пример показывает, что таксономические отношения присущи семантическим сетям. Наиболее тесно связанные понятия обычно имеют общие семантические характеристики , которые являются определяющими для оценки семантического сходства. Слова с более высоким показателем сходства более тесно связаны и, следовательно, имеют более высокую вероятность оказаться близким словом в семантической сети.

Эти отношения можно внушать мозгу посредством прайминга , когда предыдущие примеры тех же отношений показываются до того, как будет показано целевое слово. Влияние прайминга на семантические сетевые связи можно увидеть по скорости реакции на слово. Прайминг может помочь выявить структуру семантической сети и определить, какие слова наиболее тесно связаны с исходным словом.

Нарушение семантической сети может привести к семантическому дефициту, отличному от семантической деменции .

В мозгу

Физическое проявление семантических отношений существует и в мозге. Семантические схемы, специфичные для каждой категории, показывают, что слова, принадлежащие к разным категориям, обрабатываются в цепях, расположенных по-разному в мозгу. Например, семантические цепи слова, связанного с лицом или ртом (например, «лизать»), расположены в другом месте мозга, чем слова, связанные с ногой или ступней (например, «удар ногой»). Это основной результат исследования 2013 года, опубликованного Фридеманом Пульвермюллером. Эти семантические цепи напрямую связаны с сенсомоторными областями мозга. Это известно как воплощенная семантика, подтема воплощенной языковой обработки .

Если произойдет повреждение мозга, нормальная обработка семантических сетей может быть нарушена, что приведет к предпочтению того, какие отношения доминируют в семантической сети в уме.

Примеры

В Лиспе

Следующий код показывает пример семантической сети на языке программирования Lisp с использованием списка ассоциаций .

( setq *database* ' (( канарейка ( это птица ) ( цвет желтый ) ( маленький размер )) ( пингвин ( это птица ) ( движение плавает )) ( птица ( это позвоночное животное ) ( есть часть крыльев ) ( размножение яйцекладкой ))))                   

Чтобы извлечь всю информацию о типе «canary», можно использовать функцию assocс ключом «canary». [36]

ВордНет

Примером семантической сети является WordNet , лексическая база данных английского языка . Он группирует английские слова в наборы синонимов, называемые синсетами , предоставляет краткие общие определения и записывает различные семантические отношения между этими наборами синонимов. Некоторые из наиболее распространенных определяемых семантических отношений - это меронимия (A является меронимом B, если A является частью B), голонимия (B является холонимом A, если B содержит A), гипонимия (или тропонимия ) (A является подчиненным по отношению к B). ; А — разновидность Б), гипернимия (А — вышестоящий по отношению к Б), синонимия (А означает то же, что и Б) и антонимия (А означает противоположность Б).

Свойства WordNet были изучены с точки зрения теории сетей и сравнены с другими семантическими сетями, созданными на основе тезауруса Роже и задач на ассоциации слов . С этой точки зрения все трое представляют собой небольшую мировую структуру . [37]

Другие примеры

Также возможно представить логические описания с использованием семантических сетей, таких как экзистенциальные графы Чарльза Сандерса Пирса или соответствующие концептуальные графы Джона Ф. Совы . [1] Они обладают выразительной силой, равной или превосходящей стандартную логику предикатов первого порядка . В отличие от WordNet или других лексических сетей или сетей просмотра, семантические сети, использующие эти представления, могут использоваться для надежного автоматического логического вывода. Некоторые автоматические рассуждения используют теоретико-графовые особенности сетей во время обработки.

Другими примерами семантических сетей являются модели Геллиша . Геллиш-английский со словарем геллиш-английского языка — это формальный язык , который определяется как сеть отношений между понятиями и названиями понятий. Геллский английский является формальным подмножеством естественного английского языка, точно так же, как геллишский голландский является формальным подмножеством голландского языка, тогда как во многих языках используются одни и те же концепции. Другие сети Gellish состоят из моделей знаний и информационных моделей, выраженных на языке Gellish. Сеть Геллиша — это сеть (бинарных) отношений между вещами. Каждое отношение в сети является выражением факта, который классифицируется по типу отношения. Каждый тип отношения сам по себе является концепцией, определенной в словаре языка геллиш. Каждая связанная вещь является либо понятием, либо отдельной вещью, классифицируемой понятием. Определения понятий создаются в форме моделей определений (сетей определений), которые вместе образуют словарь Геллиша. Сеть Геллиша может быть задокументирована в базе данных Геллиша и интерпретируема компьютером.

SciCrunch — это совместно редактируемая база знаний для научных ресурсов. Он предоставляет однозначные идентификаторы (идентификаторы исследовательских ресурсов или RRID) для программного обеспечения, лабораторных инструментов и т. д., а также предоставляет возможности для создания связей между RRID и сообществами.

Другой пример семантических сетей, основанных на теории категорий , — это ологов . Здесь каждый тип — это объект, представляющий набор вещей, а каждая стрелка — это морфизм, представляющий функцию. Коммутативные диаграммы также предписываются для ограничения семантики.

В социальных науках люди иногда используют термин «семантическая сеть» для обозначения сетей совместного возникновения . [38] [39] Основная идея заключается в том, что слова, которые встречаются в единице текста, например, в предложении, семантически связаны друг с другом. Связи, основанные на совместном появлении, могут затем использоваться для построения семантических сетей. Этот процесс включает в себя определение ключевых слов в тексте, построение сетей совместного появления и анализ сетей для поиска центральных слов и групп тем в сети. Это особенно полезный метод для анализа большого текста и больших данных . [40]

Программные инструменты

Существуют также сложные типы семантических сетей, связанных с соответствующими наборами программных инструментов, используемых для инженерии лексических знаний , таких как система обработки семантических сетей ( SNePS ) Стюарта К. Шапиро [41] или парадигма MultiNet Германа Хельбига, [42] особенно подходит для семантического представления выражений естественного языка и используется в нескольких приложениях НЛП .

Семантические сети используются в специализированных задачах поиска информации, таких как обнаружение плагиата . Они предоставляют информацию об иерархических отношениях, чтобы использовать семантическое сжатие для уменьшения языкового разнообразия и позволить системе сопоставлять значения слов независимо от используемых наборов слов.

График знаний , предложенный Google в 2012 году, на самом деле представляет собой применение семантической сети в поисковой системе.

Моделирование многореляционных данных, таких как семантические сети, в маломерных пространствах с помощью форм внедрения имеет преимущества при выражении отношений сущностей, а также при извлечении отношений из таких носителей, как текст. Существует множество подходов к изучению этих вложений, в частности, с использованием структур байесовской кластеризации или структур, основанных на энергии, а в последнее время — TransE [43] ( NIPS 2013). Приложения внедрения данных базы знаний включают анализ социальных сетей и извлечение связей .

Смотрите также

Другие примеры

Рекомендации

  1. ^ аб Джон Ф. Сова (1987). «Семантические сети». В Стюарте С. Шапиро (ред.). Энциклопедия искусственного интеллекта . Архивировано из оригинала 8 октября 2018 года . Проверено 29 апреля 2008 г.
  2. ^ Пун, Хойфунг и Педро Домингос. «Неконтролируемый семантический анализ. Архивировано 7 февраля 2019 года в Wayback Machine ». Материалы конференции 2009 г. по эмпирическим методам обработки естественного языка: Том 1-Том 1. Ассоциация компьютерной лингвистики, 2009.
  3. ^ Суссна, Майкл. «Устранение неоднозначности смысла слов для индексации произвольного текста с использованием огромной семантической сети. Архивировано 21 сентября 2021 года в Wayback Machine ». Материалы второй международной конференции по управлению информацией и знаниями. АКМ, 1993.
  4. ^ Сегев, Элад (2022). Семантический сетевой анализ в социальных науках. Лондон: Рутледж. ISBN 9780367636524. Архивировано из оригинала 5 декабря 2021 года . Проверено 5 декабря 2021 г.
  5. ^ Леманн, Фриц; Роден, Эрвин Ю., ред. (1992). Семантические сети в искусственном интеллекте . Международная серия по современной прикладной математике и информатике. Том. 24. Оксфорд; Нью-Йорк: Пергамон Пресс . п. 6. ISBN 978-0080420127. OCLC  26391254. Первой семантической сетью для компьютеров была Nude, созданная Р. Х. Риченсом из Кембриджского отдела языковых исследований в 1956 году в качестве интерлингвы для машинного перевода естественных языков.
  6. ^ Роберт Ф. Симмонс (1963). «Синтетическое языковое поведение». Управление обработкой данных . 5 (12): 11–18.
  7. Симмонс, «Темы 1972 года». Архивировано 1 сентября 2019 года в Wayback Machine , Антология ACL , 1982.
  8. ^ Куиллиан, Р. Обозначение для представления концептуальной информации: приложение к семантике и механическому перефразированию английского языка. SP-1395, Корпорация системного развития, Санта-Моника, 1963 год.
  9. ^ Аллан М. Коллинз; М-р Куиллиан (1969). «Время извлечения из семантической памяти». Журнал вербального обучения и вербального поведения . 8 (2): 240–247. дои : 10.1016/S0022-5371(69)80069-1.
  10. ^ Аллан М. Коллинз; М. Росс Куиллиан (1970). «Влияет ли размер категории на время категоризации?». Журнал вербального обучения и вербального поведения . 9 (4): 432–438. дои : 10.1016/S0022-5371(70)80084-6.
  11. ^ Аллан М. Коллинз; Элизабет Ф. Лофтус (1975). «Теория распространения и активации семантической обработки». Психологический обзор . 82 (6): 407–428. дои : 10.1037/0033-295x.82.6.407. S2CID  14217893.
  12. ^ Куиллиан, MR (1967). Концепции слов: теория и моделирование некоторых основных семантических возможностей. Поведенческая наука, 12 (5), 410–430.
  13. ^ Куиллиан, MR (1968). Семантическая память. Семантическая обработка информации, 227–270.
  14. ^ Куиллиан, MR (1969). «Обучаемый язык: программа моделирования и теория языка». Коммуникации АКМ . 12 (8): 459–476. дои : 10.1145/363196.363214 . S2CID  15304609.
  15. ^ Куиллиан, Р. Семантическая память. Неопубликованная докторская диссертация, Технологический институт Карнеги, 1966 г.
  16. ^ Хельбиг, Х. (2006). Представление знаний и семантика естественного языка (PDF) . ISBN 978-3540244615. Архивировано (PDF) из оригинала 30 августа 2017 года . Проверено 19 марта 2018 г.
  17. ^ Джеймс, П. (1992). «График знаний» (PDF) . В Ван де Рит, Р.П. (ред.). Лингвистические инструменты в инженерии знаний . Издательство Elsevier Science. п. 98. ИСБН 978-0444883940. Архивировано из оригинала (PDF) 11 августа 2016 года.Примечание из цитируемой главы: Имя автора П. Джеймс — псевдоним группы исследователей, принимавших или до сих пор принимающих участие в проекте «График знаний», начатом как совместный проект университетов Гронингена и Гронингена. Твенте в Нидерландах. Альштейн, де Би, Иденс и Мильтенбург были студентами, внесшими свой вклад в проект. В ходе проекта членами проектной группы были Р. Р. Баккер, Х. ван ден Берг, К. Хёде, М. У. Хоутсма, Х. Дж. Смит, Ф. Н. Стокман, П. Х. де Врис и М. Виллемс.
  18. ^ Хулпус, Иоана; Прангнаварат, Нарумол (2015). «Семантическая связанность связанных данных на основе пути и ее использование для устранения неоднозначности слов и сущностей». Семантическая сеть – ISWC 2015: 14-я Международная конференция по семантической сети, Вифлеем, Пенсильвания, США, 11–15 октября 2015 г., Материалы, Часть 1 . Международная конференция по семантической сети 2015. Springer International Publishing. п. 444. ИСБН 9783319250076.
  19. ^ Маккаскер, Джеймс П.; Честейн, Кэтрин (апрель 2016 г.). «Что такое граф знаний?». автореа.com . Архивировано из оригинала 17 июня 2021 года . Проверено 15 июня 2016 г. использование [термина «график знаний»] изменилось
  20. ^ Х. Чжуге, Сетка знаний, World Scientific Publishing Co., 2004.
  21. ^ Х. Чжуге, Правила наследования для гибкого поиска моделей. Системы поддержки принятия решений 22(4)(1998)379–390
  22. ^ Х. Чжуге, Активная среда электронного документа ADF: модель и инструмент. Информация и менеджмент 41 (1): 87–97 (2003).
  23. ^ Х.Чжуге и Л.Чжэн, Рейтинговая семантически связанная сеть, WWW 2003 г.
  24. ^ Х.Чжуге, Сеть семантических связей, в «Сетке знаний: на пути к киберфизическому обществу», World Scientific Publishing Co., 2012.
  25. ^ Х. Чжугэ, Л. Чжэн, Н. Чжан и К. Ли, Подход к автоматическому обнаружению семантических связей. WWW 2004: 278–279.
  26. ^ Х. Чжуге, Сообщества и новая семантика в сети семантических связей: открытие и обучение, Транзакции IEEE по знаниям и инженерии данных, 21 (6) (2009) 785–799.
  27. ^ Х.Чжуге, Семантические связи через пространства для кибер-физического-социального интеллекта: методология, Искусственный интеллект, 175 (2011) 988–1019.
  28. ^ Х. Чжуге, Многомерное обобщение в киберфизическом обществе, Морган Кауфманн, 2016.
  29. ^ Х. Чжуге, Модель пространства веб-ресурсов, Springer, 2008.
  30. ^ Х.Чжуге и Ю.Син, Вероятностная модель пространства ресурсов для управления ресурсами в киберфизическом обществе, Транзакции IEEE на сервисных вычислениях, 5(3)(2012)404–421.
  31. ^ X. Сунь и Х. Чжуге, Обобщение научной статьи посредством ранжирования подкрепления в сети семантических связей, IEEE ACCESS, 2018, doi : 10.1109/ACCESS.2018.2856530.
  32. ^ М.Као, X.Сун и Х. Чжуге, Вклад причинно-следственной связи в представление сути научной статьи — Роль сети семантических связей, PLOS ONE, 2018, doi :10.1371/journal.pone.0199303.
  33. ^ Х. Чжуге, Киберфизический и социальный интеллект в симбиозе человека, машины и природы, Springer, 2020.
  34. ^ Бендек, Фаузи (2008). Платформа семантического сопоставления рабочих процессов WSM-P . Мюнхен: Верл. Доктор Хат. ISBN 9783899638547. ОСЛК  501314022.
  35. ^ Сегев, Элад (2022). Семантический сетевой анализ в социальных науках. Лондон: Рутледж. ISBN 9780367636524. Архивировано из оригинала 5 декабря 2021 года . Проверено 5 декабря 2021 г.
  36. ^ Свиггер, Кэтлин. "Семантический.ppt". Архивировано из оригинала 10 мая 2013 года . Проверено 23 марта 2011 г.
  37. ^ Стейверс, М.; Тененбаум, Дж. Б. (2005). «Крупномасштабная структура семантических сетей: статистический анализ и модель семантического роста». Когнитивная наука . 29 (1): 41–78. arXiv : cond-mat/0110012 . дои : 10.1207/s15516709cog2901_3. PMID  21702767. S2CID  6000627.
  38. ^ Воутер Ван Аттевельдт (2008). Анализ семантической сети: методы извлечения, представления и запроса медиаконтента (PDF) . Издательство BookSurge. Архивировано (PDF) из оригинала 28 ноября 2021 года . Проверено 28 ноября 2021 г.
  39. ^ Сегев, Элад (2020). «Текстовый сетевой анализ: выявление преобладающих тем и предубеждений в международных новостях и социальных сетях» . Социологический компас . 14 (4). дои : 10.1111/soc4.12779. S2CID  212890998. Архивировано из оригинала 5 декабря 2021 года . Проверено 5 декабря 2021 г.
  40. ^ Сегев, Элад (2022). Семантический сетевой анализ в социальных науках. Лондон: Рутледж. ISBN 9780367636524. Архивировано из оригинала 5 декабря 2021 года . Проверено 5 декабря 2021 г.
  41. ^ "Стюарт К. Шапиро". Архивировано из оригинала 27 августа 2006 года . Проверено 29 августа 2006 г.
  42. ^ "Герман Хельбиг". Архивировано из оригинала 4 мая 2006 года . Проверено 14 марта 2006 г.
  43. ^ Борд, Антуан; Усунье, Николя; Гарсиа-Дюран, Альберто; Уэстон, Джейсон; Яхненко, Оксана (2013), Берджес, CJC; Ботту, Л.; Веллинг, М.; Гахрамани, З. (ред.), «Перевод вложений для моделирования многореляционных данных» (PDF) , Достижения в области нейронных систем обработки информации 26 , Curran Associates, Inc., стр. 2787–2795, заархивировано (PDF) из оригинала. 20 декабря 2018 г. , дата обращения 29 ноября 2018 г.

дальнейшее чтение

Внешние ссылки