Семантическая сеть , или сеть фреймов , — это база знаний , которая представляет семантические отношения между концепциями в сети. Это часто используется как форма представления знаний . Это направленный или ненаправленный граф , состоящий из вершин , которые представляют концепции , и ребер , которые представляют семантические отношения между концепциями , [1] отображая или соединяя семантические поля . Семантическая сеть может быть реализована, например, как база данных графов или карта концепций . Типичные стандартизированные семантические сети выражаются в виде семантических троек .
Семантические сети используются в нейролингвистике и приложениях обработки естественного языка , таких как семантический анализ [2] и разрешение неоднозначности смысла слов . [3] Семантические сети также могут использоваться в качестве метода анализа больших текстов и определения основных тем и разделов (например, сообщений в социальных сетях ), для выявления предвзятости (например, в новостном освещении) или даже для картирования целой области исследований. [4]
Примеры использования семантических сетей в логике , направленных ациклических графах как мнемоническом инструменте, датируются веками. Самое раннее задокументированное использование - комментарий греческого философа Порфирия к категориям Аристотеля в третьем веке нашей эры.
В истории вычислительной техники «семантические сети» для исчисления высказываний были впервые реализованы для компьютеров Ричардом Х. Риченсом из Кембриджского исследовательского подразделения языка в 1956 году в качестве « языка-посредника » для машинного перевода естественных языков [5] , хотя важность этой работы и Кембриджского исследовательского подразделения языка была осознана лишь с опозданием.
Семантические сети были также независимо реализованы Робертом Ф. Симмонсом [6] и Шелдоном Кляйном, которые использовали исчисление предикатов первого порядка в качестве основы, вдохновившись демонстрацией Виктора Ингве . «Направление исследований было инициировано первым президентом Ассоциации компьютерной лингвистики Виктором Ингве, который в 1960 году опубликовал описания алгоритмов для использования грамматики фразовой структуры для генерации синтаксически правильно сформированных бессмысленных предложений. Шелдон Кляйн и я примерно в 1962–1964 годах были очарованы этой техникой и обобщили ее до метода управления смыслом того, что было сгенерировано, путем уважения семантических зависимостей слов, встречающихся в тексте». [7] Другие исследователи, в первую очередь М. Росс Куиллиан [8] и другие в System Development Corporation внесли свой вклад в их работу в начале 1960-х годов в рамках проекта SYNTHEX. Именно эти публикации в System Development Corporation большинство современных производных термина «семантическая сеть» ссылаются на их основу. Более поздние выдающиеся работы были сделаны Алланом М. Коллинзом и Куиллианом (например, Коллинз и Куиллиан; [9] [10] Коллинз и Лофтус [11] Куиллиан [12] [13] [14] [15] ). Еще позже, в 2006 году, Герман Хельбиг полностью описал MultiNet . [16]
В конце 1980-х годов два университета в Нидерландах , Гронинген и Твенте , совместно начали проект под названием Knowledge Graphs , который представляет собой семантические сети, но с дополнительным ограничением, заключающимся в том, что ребра должны быть из ограниченного набора возможных отношений, чтобы облегчить алгебру на графе . [17] В последующие десятилетия различие между семантическими сетями и графами знаний было размыто. [18] [19] В 2012 году Google дала своему графу знаний название Knowledge Graph .
Семантическая сеть ссылок была систематически изучена как метод семантической социальной сети . Ее базовая модель состоит из семантических узлов, семантических связей между узлами и семантического пространства, которое определяет семантику узлов и ссылок и правил рассуждения по семантическим связям. Систематическая теория и модель были опубликованы в 2004 году. [20] Это направление исследований можно проследить до определения правил наследования для эффективного поиска модели в 1998 году [21] и Active Document Framework ADF. [22] С 2003 года исследования развивались в направлении социальной семантической сети. [23] Эта работа является систематической инновацией в эпоху Всемирной паутины и глобальных социальных сетей, а не приложением или простым расширением Семантической сети (сети). Ее цель и область применения отличаются от таковых у Семантической сети (или сети). [24] Правила рассуждения и эволюции, а также автоматического обнаружения неявных ссылок играют важную роль в Семантической сети ссылок. [25] [26] Недавно он был разработан для поддержки киберфизического-социального интеллекта. [27] Он использовался для создания общего метода реферирования. [28] Самоорганизующаяся сеть семантических связей была интегрирована с многомерным пространством категорий для формирования семантического пространства для поддержки расширенных приложений с многомерными абстракциями и самоорганизующимися семантическими связями [29] [30] Было подтверждено, что сеть семантических связей играет важную роль в понимании и представлении посредством приложений реферирования текста . [31] [32] Семантическая сеть связей была расширена от киберпространства до киберфизического-социального пространства. Отношения конкуренции и симбиоза, а также их роли в развивающемся обществе изучались в новой теме: киберфизический-социальный интеллект [33]
Для специального использования были созданы более специализированные формы семантических сетей. Например, в 2008 году докторская диссертация Фоси Бендека формализовала Сеть семантического сходства (SSN), которая содержит специализированные отношения и алгоритмы распространения для упрощения представления и вычислений семантического сходства . [34]
Семантическая сеть используется, когда имеются знания, которые лучше всего понимать как набор связанных друг с другом концепций.
Большинство семантических сетей основаны на когнитивных принципах. Они состоят из дуг (спиц) и узлов (концентраторов), которые могут быть организованы в таксономическую иерархию. Различные семантические сети также могут быть соединены мостовыми узлами. Семантические сети способствовали идеям распространения активации , наследования и узлов как протообъектов.
Один из процессов построения семантических сетей, также известный как сети совместной встречаемости , включает в себя определение ключевых слов в тексте, вычисление частот совместной встречаемости и анализ сетей для поиска центральных слов и кластеров тем в сети. [35]
В области лингвистики семантические сети представляют собой то, как человеческий разум обрабатывает связанные концепции. Обычно концепции в семантической сети могут иметь одно из двух различных отношений: либо семантическое, либо ассоциативное.
Если семантические в отношении, два понятия связаны любым из следующих семантических отношений: синонимия , антонимия , гиперонимия , гипонимия , холонимия , меронимия , или метонимия , или полисемия . Это не единственные семантические отношения, но некоторые из наиболее распространенных.
Если они ассоциативны в отношении, то эти два понятия связаны на основе их частоты совместного появления. Эти ассоциации случайны, то есть ничто в их индивидуальных значениях не требует, чтобы они были связаны друг с другом, только то, что они обычно таковыми являются. Примерами этого могут быть свинья и ферма, свинья и корыто или свинья и грязь. Хотя ничто в значении слова свинья не заставляет его ассоциироваться с фермами, поскольку свиньи могут быть дикими, тот факт, что свиньи так часто встречаются на фермах, создает случайную связанную связь. Эти тематические связи распространены в семантических сетях и являются заметными результатами в тестах на свободные ассоциации .
Когда дается начальное слово, начинается активация наиболее тесно связанных понятий, распространяясь наружу к менее связанным понятиям. Примером этого может служить начальное слово свинья, вызывающее млекопитающее, затем животное, а затем дышит. Этот пример показывает, что таксономические отношения присущи семантическим сетям. Наиболее тесно связанные понятия обычно разделяют семантические признаки , которые являются детерминантами оценок семантического сходства. Слова с более высокими оценками сходства более тесно связаны, поэтому имеют более высокую вероятность быть близким словом в семантической сети.
Эти отношения могут быть предложены мозгу посредством прайминга , когда предыдущие примеры тех же отношений показываются до того, как будет показано целевое слово. Влияние прайминга на связь семантической сети можно увидеть через скорость времени реакции на слово. Прайминг может помочь выявить структуру семантической сети и какие слова наиболее тесно связаны с исходным словом.
Нарушение семантической сети может привести к семантическому дефициту, но это не то же самое, что семантическая деменция .
Существует также физическое проявление семантических отношений в мозге. Семантические схемы, специфичные для категорий, показывают, что слова, принадлежащие к разным категориям, обрабатываются в схемах, по-разному расположенных в мозге. Например, семантические схемы для слова, связанного с лицом или ртом (например, лизать), расположены в другом месте мозга, чем слова, связанного с ногой или ступней (например, пнуть). Это основной результат исследования 2013 года, опубликованного Фридеманом Пульвермюллером [ требуется ссылка ] . Эти семантические схемы напрямую связаны с их сенсомоторными областями мозга. Это известно как воплощенная семантика, подтема воплощенной языковой обработки .
При повреждении мозга нормальная обработка семантических сетей может быть нарушена, что приведет к предпочтению относительно того, какие отношения доминируют в семантической сети в сознании.
Следующий код показывает пример семантической сети на языке программирования Lisp с использованием списка ассоциаций .
( setq *database* ' (( канарейка ( это птица ) ( цвет жёлтый ) ( размер маленький )) ( пингвин ( это птица ) ( движение плавание )) ( птица ( это позвоночное ) ( имеет части крыльев ) ( размножение откладывание яиц ))))
Чтобы извлечь всю информацию о типе «канарейка», можно использовать функцию assoc
с ключом «канарейка». [36]
Примером семантической сети является WordNet , лексическая база данных английского языка . Она группирует английские слова в наборы синонимов, называемые синсетами , предоставляет краткие общие определения и записывает различные семантические отношения между этими наборами синонимов. Некоторые из наиболее распространенных определенных семантических отношений — это меронимия (A является меронимом B, если A является частью B), голонимия (B является голонимом A, если B содержит A), гипонимия (или тропонимия ) (A является подчиненным B; A является видом B), гипернимия (A является вышестоящим B), синонимия (A обозначает то же, что и B) и антонимия (A обозначает противоположность B).
Свойства WordNet были изучены с точки зрения теории сетей и сравнены с другими семантическими сетями, созданными на основе тезауруса Роже и задач на ассоциации слов . С этой точки зрения все три из них представляют собой структуру малого мира . [37]
Также возможно представлять логические описания с использованием семантических сетей, таких как экзистенциальные графы Чарльза Сандерса Пирса или связанные с ними концептуальные графы Джона Ф. Совы . [1] Они имеют выразительную силу, равную или превосходящую стандартную предикатную логику первого порядка . В отличие от WordNet или других лексических или просматривающих сетей, семантические сети, использующие эти представления, могут использоваться для надежного автоматизированного логического вывода. Некоторые автоматизированные рассуждения используют графо-теоретические особенности сетей во время обработки.
Другие примеры семантических сетей — модели Gellish . Gellish English со своим словарем Gellish English — это формальный язык , который определяется как сеть отношений между понятиями и названиями понятий. Gellish English — это формальное подмножество естественного английского языка, так же как Gellish Dutch — это формальное подмножество голландского языка, тогда как несколько языков используют одни и те же понятия. Другие сети Gellish состоят из моделей знаний и информационных моделей, которые выражены на языке Gellish. Сеть Gellish — это сеть (бинарных) отношений между вещами. Каждое отношение в сети — это выражение факта, который классифицируется типом отношения. Каждый тип отношения сам по себе — это понятие, которое определяется в словаре языка Gellish. Каждая связанная вещь — это либо понятие, либо отдельная вещь, которая классифицируется понятием. Определения понятий создаются в форме моделей определений (сетей определений), которые вместе образуют словарь Gellish. Сеть Gellish может быть задокументирована в базе данных Gellish и интерпретируется компьютером.
SciCrunch — это совместно редактируемая база знаний для научных ресурсов. Она предоставляет однозначные идентификаторы (идентификаторы исследовательских ресурсов или RRID) для программного обеспечения, лабораторных инструментов и т. д., а также предоставляет возможности для создания связей между RRID и из сообществ.
Другой пример семантических сетей, основанных на теории категорий , — это ологи . Здесь каждый тип — это объект, представляющий набор вещей, а каждая стрелка — это морфизм, представляющий функцию. Коммутативные диаграммы также предписаны для ограничения семантики.
В социальных науках люди иногда используют термин семантическая сеть для обозначения сетей совместной встречаемости . [38] [39] Основная идея заключается в том, что слова, которые встречаются в единице текста, например, в предложении, семантически связаны друг с другом. Связи, основанные на совместной встречаемости, затем могут использоваться для построения семантических сетей. Этот процесс включает в себя определение ключевых слов в тексте, построение сетей совместной встречаемости и анализ сетей для поиска центральных слов и кластеров тем в сети. Это особенно полезный метод для анализа больших текстов и больших данных . [40]
Существуют также сложные типы семантических сетей, связанных с соответствующими наборами программных инструментов, используемых для лексической инженерии знаний , например, система обработки семантических сетей ( SNePS ) Стюарта К. Шапиро [41] или парадигма MultiNet Германа Хельбига [42] , особенно подходящие для семантического представления выражений естественного языка и используемые в нескольких приложениях обработки естественного языка .
Семантические сети используются в специализированных задачах поиска информации, таких как обнаружение плагиата . Они предоставляют информацию об иерархических отношениях, чтобы использовать семантическую компрессию для уменьшения языкового разнообразия и позволить системе сопоставлять значения слов независимо от используемых наборов слов.
Граф знаний , предложенный Google в 2012 году, на самом деле является применением семантической сети в поисковой системе.
Моделирование многореляционных данных, таких как семантические сети в низкоразмерных пространствах посредством форм встраивания имеет преимущества в выражении отношений сущностей, а также в извлечении отношений из таких носителей, как текст. Существует много подходов к изучению этих встраиваний, в частности, с использованием фреймворков байесовской кластеризации или фреймворков на основе энергии, а в последнее время и TransE [43] ( NeurIPS 2013). Приложения встраивания данных базы знаний включают анализ социальных сетей и извлечение отношений .
Первой семантической сетью для компьютеров была Nude, созданная Р. Х. Риченсом из Кембриджского исследовательского отдела языка в 1956 году в качестве языка-посредника для машинного перевода естественных языков.
использование [термина «граф знаний»] изменилось