Семантическая сеть

Семантическая сеть или фреймовая сеть — это база знаний , которая представляет семантические отношения между понятиями в сети. Это часто используется как форма представления знаний . Это ориентированный или неориентированный граф, состоящий из вершин , которые представляют понятия , и ребер , которые представляют семантические отношения между понятиями , ^[1] отображающие или соединяющие семантические поля . Семантическая сеть может быть реализована, например, как графовая база данных или концептуальная карта . Типичные стандартизированные семантические сети выражаются в виде семантических троек .

Семантические сети используются в нейролингвистике и приложениях обработки естественного языка , таких как семантический анализ ^[2] и устранение смысловой неоднозначности . ^[3] Семантические сети также можно использовать в качестве метода анализа больших текстов и определения основных тем и тем (например, публикаций в социальных сетях ), выявления предвзятостей (например, в новостях) или даже для картирования всего исследования. поле. ^[4]

История

Примеры использования семантических сетей в логике , направленных ациклических графов в качестве мнемонического инструмента датируются столетиями. Самым ранним документально подтвержденным использованием является комментарий греческого философа Порфирия к категориям Аристотеля в третьем веке нашей эры.

В истории вычислений «Семантические сети» для исчисления высказываний были впервые реализованы для компьютеров Ричардом Х. Риченсом из Кембриджского отдела языковых исследований в 1956 году как « интерлингва » для машинного перевода естественных языков , ^[5] хотя важность этого Работа и Кембриджский отдел языковых исследований были реализованы лишь с опозданием.

Семантические сети были также независимо реализованы Робертом Ф. Симмонсом ^[6] и Шелдоном Кляйном, используя в качестве основы исчисление предикатов первого порядка , вдохновленные демонстрацией Виктора Ингве . Это направление исследований было начато первым президентом Ассоциации компьютерной лингвистики Виктором Ингве, который в 1960 году опубликовал описания алгоритмов использования грамматики фразовой структуры для генерации синтаксически правильно сформированных бессмысленных предложений. Шелдон Кляйн и я около 1962 года. –1964 были очарованы этой техникой и обобщили ее до метода управления смыслом того, что создается, путем уважения семантических зависимостей слов в том виде, в каком они встречаются в тексте». ^[7] Другие исследователи, в первую очередь М. Росс Куиллиан ^[8] и другие из System Development Corporation, внесли свой вклад в их работу в начале 1960-х годов в рамках проекта SYNTHEX. Именно на эти публикации в System Development Corporation большинство современных производных от термина «семантическая сеть» ссылаются в качестве основы. Более поздние выдающиеся работы были сделаны Алланом М. Коллинзом и Куиллианом (например, Коллинз и Куиллиан; ^[9]^[10] Коллинз и Лофтус ^[11] Куиллиан ^[12]^[13]^[14]^[15] ). Еще позже, в 2006 году, Герман Хельбиг полностью описал MultiNet . ^[16]

В конце 1980-х годов два университета в Нидерландах , Гронинген и Твенте , совместно начали проект под названием Графы Знаний , которые представляют собой семантические сети, но с дополнительным ограничением, заключающимся в том, что ребра должны быть из ограниченного набора возможных отношений, чтобы облегчить алгебры на график . ^[17] В последующие десятилетия различие между семантическими сетями и графами знаний было размыто. ^[18]^[19] В 2012 году Google дала своему графику знаний название «График знаний» .

The semantic link network was systematically studied as a semantic social networking method. Its basic model consists of semantic nodes, semantic links between nodes, and a semantic space that defines the semantics of nodes and links and reasoning rules on semantic links. The systematic theory and model was published in 2004.^[20] This research direction can trace to the definition of inheritance rules for efficient model retrieval in 1998^[21] and the Active Document Framework ADF.^[22] Since 2003, research has developed toward social semantic networking.^[23] This work is a systematic innovation at the age of the World Wide Web and global social networking rather than an application or simple extension of the Semantic Net (Network). Its purpose and scope are different from that of the Semantic Net (or network).^[24] The rules for reasoning and evolution and automatic discovery of implicit links play an important role in the Semantic Link Network.^[25]^[26] Recently it has been developed to support Cyber-Physical-Social Intelligence.^[27] It was used for creating a general summarization method.^[28] The self-organised Semantic Link Network was integrated with a multi-dimensional category space to form a semantic space to support advanced applications with multi-dimensional abstractions and self-organised semantic links^[29]^[30] It has been verified that Semantic Link Network play an important role in understanding and representation through text summarisation applications.^[31]^[32] Semantic Link Network has been extended from cyberspace to cyber-physical-social space. Competition relation and symbiosis relation as well as their roles in evolving society were studied in the emerging topic: Cyber-Physical-Social Intelligence^[33]

More specialized forms of semantic networks has been created for specific use. For example, in 2008, Fawsy Bendeck's PhD thesis formalized the Semantic Similarity Network (SSN) that contains specialized relationships and propagation algorithms to simplify the semantic similarity representation and calculations.^[34]

Basics of semantic networks

A semantic network is used when one has knowledge that is best understood as a set of concepts that are related to one another.

Большинство семантических сетей основаны на когнитивных способностях. Они состоят из дуг (спиц) и узлов (концентраторов), которые можно организовать в таксономическую иерархию. Различные семантические сети также могут быть соединены узлами-мостами. Семантические сети способствовали идеям распространения активации , наследования и узлов как прото-объектов.

Один процесс построения семантических сетей, известный также как сети совместного появления , включает в себя идентификацию ключевых слов в тексте, расчет частоты совпадений и анализ сетей для поиска центральных слов и кластеров тем в сети. ^[35]

В лингвистике

В области лингвистики семантические сети представляют собой то, как человеческий разум обрабатывает связанные понятия. Обычно понятия в семантической сети могут иметь одно из двух различных отношений: семантическое или ассоциативное.

В семантическом отношении два понятия связаны любым из следующих семантических отношений: синонимия , антонимия , гиперонимия , гипонимия , холонимия , меронимия , или метонимия , или полисемия . Это не единственные семантические отношения, но одни из наиболее распространенных.

В ассоциативном отношении эти два понятия связаны на основе частоты их совместного появления. Эти ассоциации случайны, а это означает, что ничто в их индивидуальных значениях не требует их связи друг с другом, а только то, что обычно так и есть. Примерами этого могут быть свинья и ферма, свинья и корыто или свинья и грязь. Хотя ничто в значении слова «свинья» не заставляет его ассоциироваться с фермами, поскольку свиньи могут быть дикими, тот факт, что свиньи так часто встречаются на фермах, создает случайную ассоциированную связь. Эти тематические отношения распространены в семантических сетях и являются заметными результатами тестов свободных ассоциаций .

Как только произносится первое слово, начинается активация наиболее тесно связанных концепций, распространяющаяся наружу на менее связанные концепции. Примером этого может быть начальное слово «свинья», подсказывающее «млекопитающее», затем «животное», а затем «дышит». Этот пример показывает, что таксономические отношения присущи семантическим сетям. Наиболее тесно связанные понятия обычно имеют общие семантические характеристики , которые являются определяющими для оценки семантического сходства. Слова с более высоким показателем сходства более тесно связаны и, следовательно, имеют более высокую вероятность оказаться близким словом в семантической сети.

Эти отношения можно внушать мозгу посредством прайминга , когда предыдущие примеры тех же отношений показываются до того, как будет показано целевое слово. Влияние прайминга на семантические сетевые связи можно увидеть по скорости реакции на слово. Прайминг может помочь выявить структуру семантической сети и определить, какие слова наиболее тесно связаны с исходным словом.

Нарушение семантической сети может привести к семантическому дефициту, отличному от семантической деменции .

В мозгу

Физическое проявление семантических отношений существует и в мозге. Семантические схемы, специфичные для каждой категории, показывают, что слова, принадлежащие к разным категориям, обрабатываются в цепях, расположенных по-разному в мозгу. Например, семантические цепи слова, связанного с лицом или ртом (например, «лизать»), расположены в другом месте мозга, чем слова, связанные с ногой или ступней (например, «удар ногой»). Это основной результат исследования 2013 года, опубликованного Фридеманом Пульвермюллером. Эти семантические цепи напрямую связаны с сенсомоторными областями мозга. Это известно как воплощенная семантика, подтема воплощенной языковой обработки .

Если произойдет повреждение мозга, нормальная обработка семантических сетей может быть нарушена, что приведет к предпочтению того, какие отношения доминируют в семантической сети в уме.

Примеры

В Лиспе

Следующий код показывает пример семантической сети на языке программирования Lisp с использованием списка ассоциаций .

( setq *database* ' (( канарейка ( это птица ) ( цвет желтый ) ( маленький размер )) ( пингвин ( это птица ) ( движение плавает )) ( птица ( это позвоночное животное ) ( есть часть крыльев ) ( размножение яйцекладкой ))))

Чтобы извлечь всю информацию о типе «canary», можно использовать функцию assocс ключом «canary». ^[36]

ВордНет

Примером семантической сети является WordNet , лексическая база данных английского языка . Он группирует английские слова в наборы синонимов, называемые синсетами , предоставляет краткие общие определения и записывает различные семантические отношения между этими наборами синонимов. Некоторые из наиболее распространенных определяемых семантических отношений - это меронимия (A является меронимом B, если A является частью B), голонимия (B является холонимом A, если B содержит A), гипонимия (или тропонимия ) (A является подчиненным по отношению к B). ; А — разновидность Б), гипернимия (А — вышестоящий по отношению к Б), синонимия (А означает то же, что и Б) и антонимия (А означает противоположность Б).

Свойства WordNet были изучены с точки зрения теории сетей и сравнены с другими семантическими сетями, созданными на основе тезауруса Роже и задач на ассоциации слов . С этой точки зрения все трое представляют собой небольшую мировую структуру . ^[37]

Другие примеры

Также возможно представить логические описания с использованием семантических сетей, таких как экзистенциальные графы Чарльза Сандерса Пирса или соответствующие концептуальные графы Джона Ф. Совы . ^[1] Они обладают выразительной силой, равной или превосходящей стандартную логику предикатов первого порядка . В отличие от WordNet или других лексических сетей или сетей просмотра, семантические сети, использующие эти представления, могут использоваться для надежного автоматического логического вывода. Некоторые автоматические рассуждения используют теоретико-графовые особенности сетей во время обработки.

Другими примерами семантических сетей являются модели Геллиша . Геллиш-английский со словарем геллиш-английского языка — это формальный язык , который определяется как сеть отношений между понятиями и названиями понятий. Геллский английский является формальным подмножеством естественного английского языка, точно так же, как геллишский голландский является формальным подмножеством голландского языка, тогда как во многих языках используются одни и те же концепции. Другие сети Gellish состоят из моделей знаний и информационных моделей, выраженных на языке Gellish. Сеть Геллиша — это сеть (бинарных) отношений между вещами. Каждое отношение в сети является выражением факта, который классифицируется по типу отношения. Каждый тип отношения сам по себе является концепцией, определенной в словаре языка геллиш. Каждая связанная вещь является либо понятием, либо отдельной вещью, классифицируемой понятием. Определения понятий создаются в форме моделей определений (сетей определений), которые вместе образуют словарь Геллиша. Сеть Геллиша может быть задокументирована в базе данных Геллиша и интерпретируема компьютером.

SciCrunch — это совместно редактируемая база знаний для научных ресурсов. Он предоставляет однозначные идентификаторы (идентификаторы исследовательских ресурсов или RRID) для программного обеспечения, лабораторных инструментов и т. д., а также предоставляет возможности для создания связей между RRID и сообществами.

Другой пример семантических сетей, основанных на теории категорий , — это ологов . Здесь каждый тип — это объект, представляющий набор вещей, а каждая стрелка — это морфизм, представляющий функцию. Коммутативные диаграммы также предписываются для ограничения семантики.

В социальных науках люди иногда используют термин «семантическая сеть» для обозначения сетей совместного возникновения . ^[38]^[39] Основная идея заключается в том, что слова, которые встречаются в единице текста, например, в предложении, семантически связаны друг с другом. Связи, основанные на совместном появлении, могут затем использоваться для построения семантических сетей. Этот процесс включает в себя определение ключевых слов в тексте, построение сетей совместного появления и анализ сетей для поиска центральных слов и групп тем в сети. Это особенно полезный метод для анализа большого текста и больших данных . ^[40]

Программные инструменты

Существуют также сложные типы семантических сетей, связанных с соответствующими наборами программных инструментов, используемых для инженерии лексических знаний , таких как система обработки семантических сетей ( SNePS ) Стюарта К. Шапиро ^[41] или парадигма MultiNet Германа Хельбига, ^[42] особенно подходит для семантического представления выражений естественного языка и используется в нескольких приложениях НЛП .

Семантические сети используются в специализированных задачах поиска информации, таких как обнаружение плагиата . Они предоставляют информацию об иерархических отношениях, чтобы использовать семантическое сжатие для уменьшения языкового разнообразия и позволить системе сопоставлять значения слов независимо от используемых наборов слов.

График знаний , предложенный Google в 2012 году, на самом деле представляет собой применение семантической сети в поисковой системе.

Моделирование многореляционных данных, таких как семантические сети, в маломерных пространствах с помощью форм внедрения имеет преимущества при выражении отношений сущностей, а также при извлечении отношений из таких носителей, как текст. Существует множество подходов к изучению этих вложений, в частности, с использованием структур байесовской кластеризации или структур, основанных на энергии, а в последнее время — TransE ^[43] ( NIPS 2013). Приложения внедрения данных базы знаний включают анализ социальных сетей и извлечение связей .

Смотрите также

Другие примеры

дальнейшее чтение

Аллен Дж. и А. Фриш (1982). «Что находится в семантической сети». В: Записки 20-го числа. ежегодное собрание ACL , Торонто, стр. 19–27.
Джон Ф. Сова, Александр Боргида (1991). Принципы семантических сетей: исследования в области представления знаний .
Сегев, Э. (ред.) (2022). Семантический сетевой анализ в социальных науках . Нью-Йорк: Рутледж.

Внешние ссылки

Викискладе есть медиафайлы, связанные с семантическими сетями .

«Семантические сети» Джона Ф. Сова
«Сеть семантических связей» Хай Чжугэ

Семантическая сеть

История

Basics of semantic networks

В лингвистике

В мозгу

Примеры

В Лиспе

ВордНет

Другие примеры

Программные инструменты

Смотрите также

Другие примеры

Рекомендации

дальнейшее чтение

Внешние ссылки