stringtranslate.com

CLARION (когнитивная архитектура)

Коннекционистское обучение с адаптивной индукцией правил онлайн ( CLARION ) — это вычислительная когнитивная архитектура , которая использовалась для моделирования многих областей и задач в когнитивной психологии и социальной психологии , а также для реализации интеллектуальных систем в приложениях искусственного интеллекта . Важной особенностью CLARION является различие между неявными и явными процессами и сосредоточение внимания на взаимодействии между этими двумя типами процессов. Система была создана исследовательской группой под руководством Рона Сана .

Кларион Фреймворк

Обзор

CLARION — это интегративная когнитивная архитектура, она используется для объяснения и моделирования когнитивно-психологических явлений, что потенциально может привести к единому объяснению психологических явлений. Теория CLARION состоит из трех слоев: первый уровень — это основная теория разума. Основные теории состоят из ряда отдельных подсистем, которые являются основными структурами CLARION, с двойной репрезентативной структурой в каждой подсистеме (неявное или явное представление; Sun et al., 2005). Его подсистемы включают подсистему, ориентированную на действие, подсистему, не ориентированную на действие, мотивационную подсистему и метакогнитивную подсистему . Второй уровень состоит из вычислительных моделей, реализующих базовую теорию. Он более подробен, чем теория первого уровня, но все же является общим. Третий слой состоит из конкретных реализованных моделей и симуляций психологических процессов или явлений. Модели этого слоя возникают из базовой теории и общих вычислительных моделей.

Двойная репрезентативная структура

Различие между неявными и явными процессами является фундаментальным для когнитивной архитектуры Clarion. [1] Это различие в первую очередь мотивировано доказательствами, подтверждающими имплицитную память и имплицитное обучение . Clarion фиксирует различие между неявной и явной памятью независимо от различия между процедурной и декларативной памятью . Чтобы уловить различие между неявным и явным, Кларион постулирует две параллельные и взаимодействующие репрезентативные системы, фиксирующие неявное и явное знание соответственно. Явные знания связаны с локальным представлением, а неявные знания — с распределенным представлением.

Явные знания находятся на верхнем уровне архитектуры, тогда как неявные знания находятся на нижнем уровне. [1] [2] На обоих уровнях основными репрезентативными единицами являются коннекционистские узлы, и эти два уровня различаются по типу кодирования. На верхнем уровне знания кодируются с использованием узлов локализованных фрагментов, тогда как на нижнем уровне знания кодируются распределенным образом через коллекции узлов (микро)функций. Знания могут избыточно кодироваться между двумя уровнями и могут обрабатываться параллельно внутри этих двух уровней. На верхнем уровне обработка информации включает передачу активаций между узлами фрагментов с помощью правил, а на нижнем уровне обработка информации включает распространение активаций (микро)функций через искусственные нейронные сети . Потоки информации сверху вниз и снизу вверх обеспечиваются связями между двумя уровнями. Такие связи устанавливаются чанками Clarion, каждый из которых состоит из одного узла чанка, набора узлов (микро)функций и связей между узлом чанка и узлами (микро)функций. Таким образом, единый фрагмент знаний может быть выражен как в явной (т. е. локальной), так и в неявной (т. е. распределенной) форме, хотя такое двойное выражение не всегда требуется.

Двойная репрезентативная структура позволяет неявным и явным процессам взаимодействовать и, возможно, избыточно кодировать контент. В результате теория Clarion может объяснить различные явления, такие как эффекты ускорения обучения, повышение производительности, связанное с вербализации, повышение производительности в задачах передачи и способность выполнять рассуждения, основанные на сходстве, с точки зрения синергетического взаимодействия между неявными и явные процессы. [1] [3] [4] [5] Эти взаимодействия включают в себя как поток активаций внутри архитектуры (например, рассуждения на основе сходства поддерживаются путем распространения активации между частями через общие (микро)функции), так и восходящие процессы. , нисходящие и параллельные процессы обучения. При восходящем обучении ассоциации между (микро)признаками нижнего уровня извлекаются и кодируются как явные правила. При нисходящем обучении правила верхнего уровня направляют развитие неявных ассоциаций на нижнем уровне. Кроме того, обучение может осуществляться параллельно, одновременно затрагивая как неявные, так и явные процессы. Благодаря этим процессам обучения знания могут кодироваться избыточно или дополняюще, как того требует история агента. Эффект синергии частично возникает в результате взаимодействия этих процессов обучения. Еще одним важным механизмом объяснения эффектов синергии является сочетание и относительная сбалансированность сигналов разных уровней архитектуры. Например, в одном исследовании по моделированию, проведенном Clarion, было высказано предположение, что вызванный тревогой дисбаланс относительного вклада неявных и явных процессов может быть механизмом, ответственным за ухудшение производительности под давлением. [6]

Подсистемы

Когнитивная архитектура Clarion состоит из четырех подсистем.

Подсистема, ориентированная на действия

Роль подсистемы, ориентированной на действие, заключается в контроле как внешних, так и внутренних действий . Неявный уровень состоит из нейронных сетей, называемых нейронными сетями действий, а явный уровень состоит из правил действий. Между двумя уровнями может быть синергия, например, обучение навыку может быть ускорено, если агенту придется разработать четкие правила для текущей процедуры. Утверждалось, что само по себе неявное знание не может оптимизировать так же хорошо, как сочетание явного и неявного.

Подсистема, не ориентированная на действие

Роль подсистемы, не ориентированной на действие, заключается в поддержании общих знаний. Неявный уровень состоит из ассоциативных нейронных сетей, а нижний уровень — из ассоциативных правил. Знания далее делятся на семантические и эпизодические, где семантические — это обобщенные знания, а эпизодические — это знания, применимые к более конкретным ситуациям. Также важно отметить, что, поскольку существует неявный уровень, не все декларативные знания должны быть явными.

Мотивационная подсистема

Роль мотивационной подсистемы заключается в обеспечении основной мотивации восприятия, действия и познания. Система мотивации в CLARION состоит из побуждений нижнего уровня, и каждое побуждение может иметь разную силу. Существуют стимулы низкого уровня, а также стимулы высокого уровня, направленные на то, чтобы агент оставался устойчивым, целеустремленным, сосредоточенным и адаптивным. Явный слой мотивационной системы составляют цели. Явные цели используются потому, что они более стабильны, чем неявные мотивационные состояния. Согласно теории CLARION, мотивационные процессы человека очень сложны и не могут быть представлены только посредством явного представления.

Примеры некоторых дисков низкого уровня:

Примеры некоторых дисков высокого уровня:

Существует также возможность создания производных побуждений (обычно в результате попытки удовлетворить первичные побуждения), которые могут быть созданы либо путем кондиционирования, либо с помощью внешних инструкций. Каждый необходимый привод будет иметь пропорциональную мощность, возможности также будут приняты во внимание.

Метакогнитивная подсистема

Роль метакогнитивной подсистемы — контролировать, направлять и изменять работу всех остальных подсистем. Действия в метакогнитивной подсистеме включают в себя: постановку целей для подсистемы, ориентированной на действие, установку параметров для подсистем действия и бездействия, а также изменение текущего процесса как в подсистемах действия, так и в подсистемах бездействия.

Обучение

Обучение может быть представлено как явными, так и неявными знаниями по отдельности, а также обучение снизу вверх и сверху вниз. Обучение с использованием неявных знаний представлено посредством Q-обучения, тогда как обучение с использованием только явных знаний представлено однократным обучением , таким как проверка гипотез. Обучение «снизу вверх» (Sun et al., 2001) представлено посредством нейронной сети, распространяющейся до явного уровня посредством алгоритма извлечения и уточнения правил (RER), в то время как обучение сверху вниз может быть представлено различными способами.

Сравнение с другими когнитивными архитектурами

Для сравнения с несколькими другими когнитивными архитектурами (Sun, 2016):

Теоретические приложения

CLARION использовался для учета различных психологических данных (Sun, 2002, 2016), таких как задача на время последовательной реакции, задача искусственного изучения грамматики, задача управления процессом, задача категориального вывода, задача алфавитной арифметики и Задание «Ханойская башня». Задачи на последовательное время реакции и управление процессом являются типичными задачами неявного обучения (в основном с участием неявных реактивных процедур), тогда как Ханойская башня и алфавитная арифметика представляют собой задачи приобретения когнитивных навыков высокого уровня (со значительным присутствием явных процессов). Кроме того, проведена большая работа по сложной задаче навигации по минным полям, предполагающей сложное последовательное принятие решений. Также была начата работа над задачами организационного принятия решений и другими задачами социального моделирования (например, Naveh and Sun, 2006), а также над метакогнитивными задачами.

Другие применения когнитивной архитектуры включают моделирование творчества (Helie and Sun, 2010) и обращение к вычислительной основе сознания (или искусственного сознания ) (Coward and Sun, 2004).

Рекомендации

  1. ^ abc Sun, Рон (01 марта 2016 г.). Анатомия разума: исследование психологических механизмов и процессов с помощью когнитивной архитектуры Clarion. Издательство Оксфордского университета. doi :10.1093/acprof:oso/9780199794553.001.0001. ISBN 978-0-19-979455-3.
  2. ^ Сан, Рон (1 сентября 2001 г.). Двойственность разума: подход к познанию снизу вверх. Психология Пресс. дои : 10.4324/9781410604378. ISBN 978-1-4106-0437-8.
  3. ^ Сан, Рон; Меррилл, Эдвард; Петерсон, Тодд (2001). «От неявных навыков к явным знаниям: восходящая модель обучения навыкам». Когнитивная наука . 25 (2): 203–244. дои : 10.1207/s15516709cog2502_2 . ISSN  1551-6709.
  4. ^ Сан, Рон; Чжан, Си (1 июня 2006 г.). «Учет различных данных рассуждений в когнитивной архитектуре». Журнал экспериментального и теоретического искусственного интеллекта . 18 (2): 169–191. дои : 10.1080/09528130600557713. ISSN  0952-813X. S2CID  29729283.
  5. ^ Доманг, Томас Дж.; Мэтьюз, Роберт С.; Сан, Рон; Руссель, Льюис Г.; Гидри, Клэр Э. (2004). «Влияние обработки на основе моделей и памяти на скорость и точность генерации грамматических строк». Журнал экспериментальной психологии: обучение, память и познание . 30 (5): 1002–1011. дои : 10.1037/0278-7393.30.5.1002. ISSN  1939-1285. ПМИД  15355132.
  6. ^ Уилсон, Николас Р.; Сан, Рон; Мэтьюз, Роберт К. (1 июля 2009 г.). «Мотивационное моделирование снижения производительности под давлением». Нейронные сети . 22 (5–6): 502–508. doi :10.1016/j.neunet.2009.06.022. ISSN  0893-6080. ПМИД  19608380.

Кауард, Лос-Анджелес и Сан, Р. (2004). Критерии эффективной теории сознания и некоторые предварительные попытки. Сознание и познание , 13 , 268-301.

Хели Х. и Сан Р. (2010). Инкубация, понимание и творческое решение проблем: единая теория и коннекционистская модель. Психологический обзор , 117 , 994–1024.

Наве И. и Сан Р. (2006). Когнитивная симуляция академической науки. Теория вычислительной и математической организации , 12 , 313–337.

Сан, Р. (2002). Двойственность разума: подход к познанию снизу вверх. Махва, Нью-Джерси: Lawrence Erlbaum Associates.

Сан, Р. (2016). Анатомия разума: исследование психологических механизмов и процессов с помощью когнитивной архитектуры Clarion. Издательство Оксфордского университета, Нью-Йорк.

Сан, Р. (2003). Учебное пособие по CLARION 5.0. Технический отчет, факультет когнитивных наук, Политехнический институт Ренсселера.

Сан Р., Меррилл Э. и Петерсон Т. (2001). От неявных навыков к явным знаниям: восходящая модель обучения навыкам. Когнитивная наука , 25 , 203–244. https://web.archive.org/web/20191218033659/http://www.cogsci.rpi.edu/~rsun/

Сан Р., Слюсарц П. и Терри К. (2005). Взаимодействие явного и неявного в обучении навыкам: двухпроцессный подход. Психологическое обозрение , 112 , 159–192. https://web.archive.org/web/20191218033659/http://www.cogsci.rpi.edu/~rsun/

Сунь Р. и Чжан X. (2006). Учет различных данных рассуждений в рамках когнитивной архитектуры. Журнал экспериментального и теоретического искусственного интеллекта , 18 , 169-191.

Внешние ссылки