Семантическая сеть

Семантическая сеть , или сеть фреймов , — это база знаний , которая представляет семантические отношения между концепциями в сети. Это часто используется как форма представления знаний . Это направленный или ненаправленный граф , состоящий из вершин , которые представляют концепции , и ребер , которые представляют семантические отношения между концепциями , ^[1] отображая или соединяя семантические поля . Семантическая сеть может быть реализована, например, как база данных графов или карта концепций . Типичные стандартизированные семантические сети выражаются в виде семантических троек .

Семантические сети используются в нейролингвистике и приложениях обработки естественного языка , таких как семантический анализ ^[2] и разрешение неоднозначности смысла слов . ^[3] Семантические сети также могут использоваться в качестве метода анализа больших текстов и определения основных тем и разделов (например, сообщений в социальных сетях ), для выявления предвзятости (например, в новостном освещении) или даже для картирования целой области исследований. ^[4]

История

Примеры использования семантических сетей в логике , направленных ациклических графах как мнемоническом инструменте, датируются веками. Самое раннее задокументированное использование - комментарий греческого философа Порфирия к категориям Аристотеля в третьем веке нашей эры.

В истории вычислительной техники «семантические сети» для исчисления высказываний были впервые реализованы для компьютеров Ричардом Х. Риченсом из Кембриджского исследовательского подразделения языка в 1956 году в качестве « языка-посредника » для машинного перевода естественных языков ^[5] , хотя важность этой работы и Кембриджского исследовательского подразделения языка была осознана лишь с опозданием.

Семантические сети были также независимо реализованы Робертом Ф. Симмонсом ^[6] и Шелдоном Кляйном, которые использовали исчисление предикатов первого порядка в качестве основы, вдохновившись демонстрацией Виктора Ингве . «Направление исследований было инициировано первым президентом Ассоциации компьютерной лингвистики Виктором Ингве, который в 1960 году опубликовал описания алгоритмов для использования грамматики фразовой структуры для генерации синтаксически правильно сформированных бессмысленных предложений. Шелдон Кляйн и я примерно в 1962–1964 годах были очарованы этой техникой и обобщили ее до метода управления смыслом того, что было сгенерировано, путем уважения семантических зависимостей слов, встречающихся в тексте». ^[7] Другие исследователи, в первую очередь М. Росс Куиллиан ^[8] и другие в System Development Corporation внесли свой вклад в их работу в начале 1960-х годов в рамках проекта SYNTHEX. Именно эти публикации в System Development Corporation большинство современных производных термина «семантическая сеть» ссылаются на их основу. Более поздние выдающиеся работы были сделаны Алланом М. Коллинзом и Куиллианом (например, Коллинз и Куиллиан; ^[9]^[10] Коллинз и Лофтус ^[11] Куиллиан ^[12]^[13]^[14]^[15] ). Еще позже, в 2006 году, Герман Хельбиг полностью описал MultiNet . ^[16]

В конце 1980-х годов два университета в Нидерландах , Гронинген и Твенте , совместно начали проект под названием Knowledge Graphs , который представляет собой семантические сети, но с дополнительным ограничением, заключающимся в том, что ребра должны быть из ограниченного набора возможных отношений, чтобы облегчить алгебру на графе . ^[17] В последующие десятилетия различие между семантическими сетями и графами знаний было размыто. ^[18]^[19] В 2012 году Google дала своему графу знаний название Knowledge Graph .

Семантическая сеть ссылок была систематически изучена как метод семантической социальной сети . Ее базовая модель состоит из семантических узлов, семантических связей между узлами и семантического пространства, которое определяет семантику узлов и ссылок и правил рассуждения по семантическим связям. Систематическая теория и модель были опубликованы в 2004 году. ^[20] Это направление исследований можно проследить до определения правил наследования для эффективного поиска модели в 1998 году ^[21] и Active Document Framework ADF. ^[22] С 2003 года исследования развивались в направлении социальной семантической сети. ^[23] Эта работа является систематической инновацией в эпоху Всемирной паутины и глобальных социальных сетей, а не приложением или простым расширением Семантической сети (сети). Ее цель и область применения отличаются от таковых у Семантической сети (или сети). ^[24] Правила рассуждения и эволюции, а также автоматического обнаружения неявных ссылок играют важную роль в Семантической сети ссылок. ^[25]^[26] Недавно он был разработан для поддержки киберфизического-социального интеллекта. ^[27] Он использовался для создания общего метода реферирования. ^[28] Самоорганизующаяся сеть семантических связей была интегрирована с многомерным пространством категорий для формирования семантического пространства для поддержки расширенных приложений с многомерными абстракциями и самоорганизующимися семантическими связями ^[29]^[30] Было подтверждено, что сеть семантических связей играет важную роль в понимании и представлении посредством приложений реферирования текста . ^[31]^[32] Семантическая сеть связей была расширена от киберпространства до киберфизического-социального пространства. Отношения конкуренции и симбиоза, а также их роли в развивающемся обществе изучались в новой теме: киберфизический-социальный интеллект ^[33]

Для специального использования были созданы более специализированные формы семантических сетей. Например, в 2008 году докторская диссертация Фоси Бендека формализовала Сеть семантического сходства (SSN), которая содержит специализированные отношения и алгоритмы распространения для упрощения представления и вычислений семантического сходства . ^[34]

Основы семантических сетей

Семантическая сеть используется, когда имеются знания, которые лучше всего понимать как набор связанных друг с другом концепций.

Большинство семантических сетей основаны на когнитивных принципах. Они состоят из дуг (спиц) и узлов (концентраторов), которые могут быть организованы в таксономическую иерархию. Различные семантические сети также могут быть соединены мостовыми узлами. Семантические сети способствовали идеям распространения активации , наследования и узлов как протообъектов.

Один из процессов построения семантических сетей, также известный как сети совместной встречаемости , включает в себя определение ключевых слов в тексте, вычисление частот совместной встречаемости и анализ сетей для поиска центральных слов и кластеров тем в сети. ^[35]

В лингвистике

В области лингвистики семантические сети представляют собой то, как человеческий разум обрабатывает связанные концепции. Обычно концепции в семантической сети могут иметь одно из двух различных отношений: либо семантическое, либо ассоциативное.

Если семантические в отношении, два понятия связаны любым из следующих семантических отношений: синонимия , антонимия , гиперонимия , гипонимия , холонимия , меронимия , или метонимия , или полисемия . Это не единственные семантические отношения, но некоторые из наиболее распространенных.

Если они ассоциативны в отношении, то эти два понятия связаны на основе их частоты совместного появления. Эти ассоциации случайны, то есть ничто в их индивидуальных значениях не требует, чтобы они были связаны друг с другом, только то, что они обычно таковыми являются. Примерами этого могут быть свинья и ферма, свинья и корыто или свинья и грязь. Хотя ничто в значении слова свинья не заставляет его ассоциироваться с фермами, поскольку свиньи могут быть дикими, тот факт, что свиньи так часто встречаются на фермах, создает случайную связанную связь. Эти тематические связи распространены в семантических сетях и являются заметными результатами в тестах на свободные ассоциации .

Когда дается начальное слово, начинается активация наиболее тесно связанных понятий, распространяясь наружу к менее связанным понятиям. Примером этого может служить начальное слово свинья, вызывающее млекопитающее, затем животное, а затем дышит. Этот пример показывает, что таксономические отношения присущи семантическим сетям. Наиболее тесно связанные понятия обычно разделяют семантические признаки , которые являются детерминантами оценок семантического сходства. Слова с более высокими оценками сходства более тесно связаны, поэтому имеют более высокую вероятность быть близким словом в семантической сети.

Эти отношения могут быть предложены мозгу посредством прайминга , когда предыдущие примеры тех же отношений показываются до того, как будет показано целевое слово. Влияние прайминга на связь семантической сети можно увидеть через скорость времени реакции на слово. Прайминг может помочь выявить структуру семантической сети и какие слова наиболее тесно связаны с исходным словом.

Нарушение семантической сети может привести к семантическому дефициту, но это не то же самое, что семантическая деменция .

В мозгу

Существует также физическое проявление семантических отношений в мозге. Семантические схемы, специфичные для категорий, показывают, что слова, принадлежащие к разным категориям, обрабатываются в схемах, по-разному расположенных в мозге. Например, семантические схемы для слова, связанного с лицом или ртом (например, лизать), расположены в другом месте мозга, чем слова, связанного с ногой или ступней (например, пнуть). Это основной результат исследования 2013 года, опубликованного Фридеманом Пульвермюллером ^{[ требуется ссылка ]} . Эти семантические схемы напрямую связаны с их сенсомоторными областями мозга. Это известно как воплощенная семантика, подтема воплощенной языковой обработки .

При повреждении мозга нормальная обработка семантических сетей может быть нарушена, что приведет к предпочтению относительно того, какие отношения доминируют в семантической сети в сознании.

Примеры

В Лиспе

Следующий код показывает пример семантической сети на языке программирования Lisp с использованием списка ассоциаций .

( setq *database* ' (( канарейка ( это птица ) ( цвет жёлтый ) ( размер маленький )) ( пингвин ( это птица ) ( движение плавание )) ( птица ( это позвоночное ) ( имеет части крыльев ) ( размножение откладывание яиц ))))

Чтобы извлечь всю информацию о типе «канарейка», можно использовать функцию assocс ключом «канарейка». ^[36]

WordNet

Примером семантической сети является WordNet , лексическая база данных английского языка . Она группирует английские слова в наборы синонимов, называемые синсетами , предоставляет краткие общие определения и записывает различные семантические отношения между этими наборами синонимов. Некоторые из наиболее распространенных определенных семантических отношений — это меронимия (A является меронимом B, если A является частью B), голонимия (B является голонимом A, если B содержит A), гипонимия (или тропонимия ) (A является подчиненным B; A является видом B), гипернимия (A является вышестоящим B), синонимия (A обозначает то же, что и B) и антонимия (A обозначает противоположность B).

Свойства WordNet были изучены с точки зрения теории сетей и сравнены с другими семантическими сетями, созданными на основе тезауруса Роже и задач на ассоциации слов . С этой точки зрения все три из них представляют собой структуру малого мира . ^[37]

Другие примеры

Также возможно представлять логические описания с использованием семантических сетей, таких как экзистенциальные графы Чарльза Сандерса Пирса или связанные с ними концептуальные графы Джона Ф. Совы . ^[1] Они имеют выразительную силу, равную или превосходящую стандартную предикатную логику первого порядка . В отличие от WordNet или других лексических или просматривающих сетей, семантические сети, использующие эти представления, могут использоваться для надежного автоматизированного логического вывода. Некоторые автоматизированные рассуждения используют графо-теоретические особенности сетей во время обработки.

Другие примеры семантических сетей — модели Gellish . Gellish English со своим словарем Gellish English — это формальный язык , который определяется как сеть отношений между понятиями и названиями понятий. Gellish English — это формальное подмножество естественного английского языка, так же как Gellish Dutch — это формальное подмножество голландского языка, тогда как несколько языков используют одни и те же понятия. Другие сети Gellish состоят из моделей знаний и информационных моделей, которые выражены на языке Gellish. Сеть Gellish — это сеть (бинарных) отношений между вещами. Каждое отношение в сети — это выражение факта, который классифицируется типом отношения. Каждый тип отношения сам по себе — это понятие, которое определяется в словаре языка Gellish. Каждая связанная вещь — это либо понятие, либо отдельная вещь, которая классифицируется понятием. Определения понятий создаются в форме моделей определений (сетей определений), которые вместе образуют словарь Gellish. Сеть Gellish может быть задокументирована в базе данных Gellish и интерпретируется компьютером.

SciCrunch — это совместно редактируемая база знаний для научных ресурсов. Она предоставляет однозначные идентификаторы (идентификаторы исследовательских ресурсов или RRID) для программного обеспечения, лабораторных инструментов и т. д., а также предоставляет возможности для создания связей между RRID и из сообществ.

Другой пример семантических сетей, основанных на теории категорий , — это ологи . Здесь каждый тип — это объект, представляющий набор вещей, а каждая стрелка — это морфизм, представляющий функцию. Коммутативные диаграммы также предписаны для ограничения семантики.

В социальных науках люди иногда используют термин семантическая сеть для обозначения сетей совместной встречаемости . ^[38]^[39] Основная идея заключается в том, что слова, которые встречаются в единице текста, например, в предложении, семантически связаны друг с другом. Связи, основанные на совместной встречаемости, затем могут использоваться для построения семантических сетей. Этот процесс включает в себя определение ключевых слов в тексте, построение сетей совместной встречаемости и анализ сетей для поиска центральных слов и кластеров тем в сети. Это особенно полезный метод для анализа больших текстов и больших данных . ^[40]

Программные инструменты

Существуют также сложные типы семантических сетей, связанных с соответствующими наборами программных инструментов, используемых для лексической инженерии знаний , например, система обработки семантических сетей ( SNePS ) Стюарта К. Шапиро ^[41] или парадигма MultiNet Германа Хельбига ^[42] , особенно подходящие для семантического представления выражений естественного языка и используемые в нескольких приложениях обработки естественного языка .

Семантические сети используются в специализированных задачах поиска информации, таких как обнаружение плагиата . Они предоставляют информацию об иерархических отношениях, чтобы использовать семантическую компрессию для уменьшения языкового разнообразия и позволить системе сопоставлять значения слов независимо от используемых наборов слов.

Граф знаний , предложенный Google в 2012 году, на самом деле является применением семантической сети в поисковой системе.

Моделирование многореляционных данных, таких как семантические сети в низкоразмерных пространствах посредством форм встраивания имеет преимущества в выражении отношений сущностей, а также в извлечении отношений из таких носителей, как текст. Существует много подходов к изучению этих встраиваний, в частности, с использованием фреймворков байесовской кластеризации или фреймворков на основе энергии, а в последнее время и TransE ^[43] ( NeurIPS 2013). Приложения встраивания данных базы знаний включают анализ социальных сетей и извлечение отношений .

Смотрите также

Другие примеры

Ссылки

^ ab John F. Sowa (1987). "Семантические сети". В Stuart C Shapiro (ред.). Энциклопедия искусственного интеллекта . Архивировано из оригинала 8 октября 2018 года . Получено 29 апреля 2008 года .
^ Пун, Хойфунг и Педро Домингос. «Неконтролируемый семантический анализ. Архивировано 7 февраля 2019 г. в Wayback Machine ». Труды конференции 2009 г. по эмпирическим методам обработки естественного языка: том 1-том 1. Ассоциация компьютерной лингвистики, 2009.
^ Сусна, Майкл. «Устранение неоднозначности смысла слов для индексации свободного текста с использованием массивной семантической сети. Архивировано 21 сентября 2021 г. в Wayback Machine ». Труды второй международной конференции по управлению информацией и знаниями. ACM, 1993.
^ Сегев, Элад (2022). Семантический сетевой анализ в социальных науках. Лондон: Routledge. ISBN 9780367636524. Архивировано из оригинала 5 декабря 2021 г. . Получено 5 декабря 2021 г. .
^ Леманн, Фриц; Родин, Эрвин Y., ред. (1992). Семантические сети в искусственном интеллекте . Международная серия по современной прикладной математике и информатике. Том 24. Оксфорд; Нью-Йорк: Pergamon Press . С. 6. ISBN 978-0080420127OCLC 26391254. Первой семантической сетью для компьютеров была Nude, созданная Р. Х. Риченсом из Кембриджского исследовательского отдела языка в 1956 году в качестве языка-посредника для машинного перевода естественных языков .
^ Роберт Ф. Симмонс (1963). «Поведение синтетического языка». Управление обработкой данных . 5 (12): 11–18.
↑ Симмонс, «Темы из 1972 года». Архивировано 1 сентября 2019 г. в Wayback Machine , ACL Anthology , 1982 г.
^ Куиллиан, Р. Нотация для представления концептуальной информации: приложение к семантике и механическому парафразированию английского языка. SP-1395, System Development Corporation, Санта-Моника, 1963.
^ Аллан М. Коллинз; М. Р. Куиллиан (1969). «Время извлечения из семантической памяти». Журнал вербального обучения и вербального поведения . 8 (2): 240–247. doi :10.1016/S0022-5371(69)80069-1.
^ Аллан М. Коллинз; М. Росс Куиллиан (1970). «Влияет ли размер категории на время категоризации?». Журнал вербального обучения и вербального поведения . 9 (4): 432–438. doi :10.1016/S0022-5371(70)80084-6.
^ Аллан М. Коллинз; Элизабет Ф. Лофтус (1975). «Теория семантической обработки с распространением активации». Psychological Review . 82 (6): 407–428. doi :10.1037/0033-295x.82.6.407. S2CID 14217893.
^ Куиллиан, М. Р. (1967). Концепции слов: теория и моделирование некоторых основных семантических возможностей. Поведенческая наука, 12(5), 410–430.
^ Куиллиан, М. Р. (1968). Семантическая память. Семантическая обработка информации, 227–270.
^ Куиллиан, MR (1969). «Обучаемый осмыслитель языка: программа моделирования и теория языка». Сообщения ACM . 12 (8): 459–476. doi : 10.1145/363196.363214 . S2CID 15304609.
^ Куиллиан, Р. Семантическая память. Неопубликованная докторская диссертация, Технологический институт Карнеги, 1966.
^ Хельбиг, Х. (2006). Представление знаний и семантика естественного языка (PDF) . ISBN 978-3540244615. Архивировано (PDF) из оригинала 30 августа 2017 г. . Получено 19 марта 2018 г. .
^ Джеймс, П. (1992). "Графы знаний" (PDF) . В Ван де Рит, Р. П. (ред.). Лингвистические инструменты в инженерии знаний . Elsevier Science Publishers. стр. 98. ISBN 978-0444883940. Архивировано из оригинала (PDF) 11 августа 2016 года.Примечание из цитируемой главы: Имя автора P. James является псевдонимом группы исследователей, которые принимали участие или все еще принимают участие в проекте "Knowledge Graphs", который был начат как совместный проект университетов Гронингена и Твенте в Нидерландах. Альштейн, де Бай, Эденс и Мильтенбург были студентами, которые внесли свой вклад в проект. В ходе проекта членами проектной группы были RR Bakker, H. van den Berg, C. Hoede, MAW Houtsma, HJ Smit, FN Stokman, PH de Vries и M. Willems.
^ Хулпус, Иоана; Прангнаварат, Нарумол (2015). «Семантическая связь на основе пути в связанных данных и ее использование для устранения неоднозначности слов и сущностей». Семантическая паутина – ISWC 2015: 14-я Международная конференция по семантической паутине, Бетлехем, Пенсильвания, США, 11–15 октября 2015 г., Труды, часть 1. Международная конференция по семантической паутине 2015 г. Springer International Publishing. стр. 444. ISBN 9783319250076.
^ Маккаскер, Джеймс П.; Честейн, Кэтрин (апрель 2016 г.). «Что такое граф знаний?». authorea.com . Архивировано из оригинала 17 июня 2021 г. . Получено 15 июня 2016 г. . использование [термина «граф знаний»] изменилось
^ Х. Чжугэ, Knowledge Grid, World Scientific Publishing Co. 2004.
^ Х. Чжугэ, Правила наследования для гибкого поиска моделей. Системы поддержки принятия решений 22(4)(1998)379–390
^ Х. Чжугэ, Активная структура электронных документов ADF: модель и инструмент. Информация и менеджмент 41(1): 87–97 (2003)
^ Х. Чжугэ и Л. Чжэн, Ранжирование семантически-связанных сетей, WWW 2003
^ Х. Чжугэ, Семантическая сеть связей, в книге «Сетка знаний: к киберфизическому обществу», World Scientific Publishing Co., 2012.
^ Х. Чжугэ, Л. Чжэн, Н. Чжан и С. Ли, Автоматический подход к обнаружению семантических связей. WWW 2004: 278–279.
^ Х. Чжугэ, Сообщества и возникающая семантика в семантической сети ссылок: открытие и обучение, Труды IEEE по знаниям и инжинирингу данных, 21(6)(2009)785–799.
^ Х. Чжугэ, Семантическая связь через пространства для кибер-физико-социального интеллекта: методология, Искусственный интеллект, 175(2011)988–1019.
^ Х. Чжугэ, Многомерное суммирование в киберфизическом обществе, Морган Кауфманн, 2016.
^ Х. Чжугэ, Модель пространства веб-ресурсов, Springer, 2008.
^ Х. Чжугэ и И. Син, Вероятностная модель пространства ресурсов для управления ресурсами в киберфизическом обществе, Труды IEEE по сервисным вычислениям, 5(3)(2012)404–421.
^ X. Сан и Х. Чжугэ, Резюмирование научных статей посредством ранжирования подкреплений в сети семантических связей, IEEE ACCESS, 2018, doi : 10.1109/ACCESS.2018.2856530.
^ M.Cao, X.Sun и H. Zhuge, Вклад причинно-следственной связи в представление ядра научной статьи — Роль сети семантических связей, PLOS ONE, 2018, doi :10.1371/journal.pone.0199303.
^ Х. Чжугэ, Киберфизико-социальный интеллект в симбиозе человека, машины и природы, Springer, 2020.
^ Bendeck, Fawsy (2008). WSM-P workflow semantic matching platform . Мюнхен: Verl. Dr. Hut. ISBN 9783899638547. OCLC 501314022.
^ Сегев, Элад (2022). Семантический сетевой анализ в социальных науках. Лондон: Routledge. ISBN 9780367636524. Архивировано из оригинала 5 декабря 2021 г. . Получено 5 декабря 2021 г. .
^ Swigger, Kathleen. "Semantic.ppt". Архивировано из оригинала 10 мая 2013 года . Получено 23 марта 2011 года .
^ Стейверс, М.; Тененбаум, Дж. Б. (2005). «Крупномасштабная структура семантических сетей: статистический анализ и модель семантического роста». Cognitive Science . 29 (1): 41–78. arXiv : cond-mat/0110012 . doi :10.1207/s15516709cog2901_3. PMID 21702767. S2CID 6000627.
^ Wouter Van Atteveldt (2008). Semantic Network Analysis: Techniques for Extracting, Representing, and Querying Media Content (PDF) . BookSurge Publishing. Архивировано (PDF) из оригинала 28 ноября 2021 г. . Получено 28 ноября 2021 г. .
^ Сегев, Элад (2020). «Анализ текстовых сетей: выявление преобладающих тем и предубеждений в международных новостях и социальных сетях» . Sociology Compass . 14 (4). doi :10.1111/soc4.12779. S2CID 212890998. Архивировано из оригинала 5 декабря 2021 г. Получено 5 декабря 2021 г.
^ Сегев, Элад (2022). Семантический сетевой анализ в социальных науках. Лондон: Routledge. ISBN 9780367636524. Архивировано из оригинала 5 декабря 2021 г. . Получено 5 декабря 2021 г. .
^ "Stuart C. Shapiro". Архивировано из оригинала 27 августа 2006 года . Получено 29 августа 2006 года .
^ "Hermann Helbig". Архивировано из оригинала 4 мая 2006 года . Получено 14 марта 2006 года .
^ Бордес, Антуан; Усунье, Николя; Гарсия-Дюран, Альберто; Уэстон, Джейсон; Яхненко, Оксана (2013), Берджес, CJC; Ботту, Л.; Веллинг, М.; Гахрамани, З. (ред.), «Трансляция вложений для моделирования многореляционных данных» (PDF) , Достижения в области нейронных систем обработки информации 26 , Curran Associates, Inc., стр. 2787–2795, архивировано (PDF) из оригинала 20 декабря 2018 г. , извлечено 29 ноября 2018 г.

Дальнейшее чтение

Аллен, Дж. и А. Фриш (1982). «Что находится в семантической сети». В: Труды 20-го ежегодного собрания ACL , Торонто, стр. 19–27.
Джон Ф. Сова, Александр Боргида (1991). Принципы семантических сетей: исследования в области представления знаний .
Сегев, Э. (ред.) (2022). Анализ семантических сетей в социальных науках . Нью-Йорк: Routledge.

Внешние ссылки

На Викискладе есть медиафайлы по теме «Семантические сети» .

«Семантические сети» Джона Ф. Совы
«Семантическая сеть связей» Хай Чжугэ