Распространение активации — это метод поиска ассоциативных сетей, биологических и искусственных нейронных сетей или семантических сетей . [1] Процесс поиска инициируется путем маркировки набора исходных узлов (например, концепций в семантической сети) весами или «активацией», а затем итеративного распространения или «распространения» этой активации на другие узлы, связанные с исходными узлами. Чаще всего эти «веса» являются реальными значениями, которые уменьшаются по мере распространения активации по сети. Когда веса дискретны, этот процесс часто называют передачей маркера. Активация может происходить из альтернативных путей, идентифицированных различными маркерами, и прекращаться, когда два альтернативных пути достигают одного и того же узла. Однако исследования мозга показывают, что несколько различных областей мозга играют важную роль в семантической обработке . [2]
Распространение активации в семантических сетях как модель было изобретено в когнитивной психологии [3] [4] для моделирования эффекта разветвления. [ необходима ссылка ]
Распространение активации может также применяться при поиске информации [5] [6] с помощью сети узлов, представляющих документы и термины, содержащиеся в этих документах.
Когнитивная психология
В отношении когнитивной психологии , распространяющаяся активация — это теория того, как мозг перебирает сеть связанных идей для извлечения определенной информации. Теория распространяющейся активации представляет массив концепций в нашей памяти как когнитивные единицы, каждая из которых состоит из узла и связанных с ним элементов или характеристик, все из которых соединены вместе ребрами. [4] Распространяющаяся активационная сеть может быть представлена схематически, в виде своего рода веб-диаграммы с более короткими линиями между двумя узлами, что означает, что идеи более тесно связаны и, как правило, будут быстрее ассоциироваться с исходной концепцией. В психологии памяти модель распространяющейся активации утверждает, что люди организуют свои знания о мире на основе своего личного опыта, который, в свою очередь, формирует сеть идей, которая является знанием человека о мире. [3]
Когда слову (целевому) предшествует связанное слово (прайм) в задачах по распознаванию слов, участники, по-видимому, выполняют лучше количество времени, которое им требуется для ответа. Например, испытуемые реагируют быстрее на слово «доктор», когда ему предшествует «медсестра», чем когда ему предшествует не связанное с ним слово, например «морковь». Этот эффект семантического прайминга со словами, близкими по значению в когнитивной сети, был замечен в широком диапазоне задач, данных экспериментаторами, от проверки предложений до лексического решения и наименования. [7]
В качестве другого примера, если исходное понятие — «красный», а понятие «транспортные средства» праймировано, они с большей вероятностью скажут «пожарная машина» вместо чего-то, не связанного с транспортными средствами, например, «вишни». Если вместо этого праймировано «фрукты», они, скорее всего, назовут «вишни» и продолжат с этого места. Активация путей в сети полностью связана с тем, насколько тесно связаны два понятия по значению, а также с тем, как праймирован субъект.
Алгоритм
Направленный граф заполнен узлами [1...N], каждый из которых имеет связанное значение активации A [i], которое является действительным числом в диапазоне [0,0...1,0]. Связь [i, j] соединяет исходный узел [i] с целевым узлом [j]. Каждое ребро имеет связанный вес W [i, j], который обычно является действительным числом в диапазоне [0,0...1,0]. [8]
Параметры:
Порог срабатывания F, действительное число в диапазоне [0,0 ... 1,0]
Фактор распада D, действительное число в диапазоне [0,0 ... 1,0]
Шаги:
Инициализируйте график, установив все значения активации A [ i ] на ноль. Установите один или несколько исходных узлов на начальное значение активации, большее порога срабатывания F. Типичное начальное значение равно 1,0.
Для каждого неактивированного узла [ i ] в графе, имеющего значение активации A [ i ], превышающее порог активации узла F:
Для каждой связи [i, j], соединяющей исходный узел [i] с целевым узлом [j], отрегулируйте A [j] = A [j] + (A [i] * W [i, j] * D), где D — коэффициент затухания.
Если целевой узел получает корректировку своего значения активации так, что оно превысит 1,0, то установите его новое значение активации на 1,0. Аналогично сохраните 0,0 в качестве нижней границы значения активации целевого узла, если он получит корректировку ниже 0,0.
После срабатывания узла он может не сработать снова, хотя вариации базового алгоритма допускают повторные срабатывания и циклы по графу.
Узлы, получающие новое значение активации, превышающее порог срабатывания F, помечаются для срабатывания в следующем цикле активации распространения.
Если активация происходит из более чем одного узла, вариация алгоритма позволяет передавать маркеры для различения путей, по которым активация распространяется по графу.
Процедура завершается, когда больше нет узлов для активации или в случае прохождения маркера из нескольких источников, когда узел достигается более чем одним путем. Вариации алгоритма, которые допускают повторные активации узлов и циклы активации в графе, завершаются после достижения устойчивого состояния активации относительно некоторой дельты или при превышении максимального числа итераций.
^ Fähndrich, J. (2018). Семантическая декомпозиция и передача маркеров в искусственном представлении смысла. Технический университет Берлина (Германия). [1]
^ Каралин Паттерсон, Питер Дж. Нестор и Тимоти Т. Роджерс: «Откуда вы знаете то, что вы знаете? Представление семантических знаний в человеческом мозге» [2]
^ ab Коллинз, Аллан М.; Лофтус, Элизабет Ф. (1975). «Теория семантической обработки с помощью распространения активации». Psychological Review . 82 (6): 407–428. doi :10.1037/0033-295X.82.6.407. ISSN 0033-295X. S2CID 14217893.
^ ab Андерсон, Джон Р. (1983). «Теория распространяющейся активации памяти». Журнал вербального обучения и вербального поведения . 22 (3): 261–295. doi :10.1016/S0022-5371(83)90201-3. ISSN 0022-5371.
^ S. Preece, Модель сети распространения активации для поиска информации. Кандидатская диссертация, Университет Иллинойса, Урбана-Шампейн, 1981.
^ Фабио Крестани. «Применение методов распространения активации в информационном поиске». Обзор искусственного интеллекта , 1997 г.
^ Чвилла, Дороти Дж.; Хагурт, Питер; Браун, КМ, «Механизм, лежащий в основе обратного прайминга в задаче лексического решения: распространение активации против семантического соответствия», Ежеквартальный журнал экспериментальной психологии, 1998, 51A (3), 531-560 [3]
^ Повышение эффективности поиска ключевых слов с помощью распространения активации Aswath, D.; Ahmed, ST; Dapos;cunha, J.; Davulcu, H., Web Intelligence, 2005. Труды. Международная конференция IEEE/WIC/ACM 2005 года по выпуску, выпуск, 19-22 сентября 2005 г. Страницы: 704 - 707
Ссылки
Нильс Дж. Нильссон. «Искусственный интеллект: новый синтез». Morgan Kaufmann Publishers, Inc., Сан-Франциско, Калифорния, 1998, страницы 121-122
Родригес, МА, «Случайные блуждания на основе грамматики в семантических сетях», Системы, основанные на знаниях , 21(7), 727-739, doi :10.1016/j.knosys.2008.03.030, 2008.
Каралин Паттерсон, Питер Дж. Нестор и Тимоти Т. Роджерс «Откуда вы знаете то, что вы знаете? Представление семантических знаний в человеческом мозге», Nature Reviews Neuroscience 8, 976-987 (декабрь 2007 г.)