Когнитивная модель — это представление одного или нескольких когнитивных процессов у людей или других животных для целей понимания и прогнозирования. Существует много типов когнитивных моделей , и они могут варьироваться от диаграмм с блоками и стрелками до наборов уравнений и программ, которые взаимодействуют с теми же инструментами, которые люди используют для выполнения задач (например, компьютерная мышь и клавиатура). [1] [ нужна страница ] С точки зрения обработки информации когнитивное моделирование — это моделирование человеческого восприятия, рассуждения, памяти и действия. [2] [3]
Когнитивные модели могут разрабатываться в рамках когнитивной архитектуры или без нее , хотя эти два понятия не всегда легко различимы. В отличие от когнитивных архитектур, когнитивные модели, как правило, фокусируются на одном когнитивном явлении или процессе (например, обучение спискам), на том, как взаимодействуют два или более процессов (например, визуальный поиск bsc1780 принятие решений), или на создании поведенческих прогнозов для конкретной задачи или инструмента (например, как внедрение нового программного пакета повлияет на производительность). Когнитивные архитектуры, как правило, фокусируются на структурных свойствах моделируемой системы и помогают ограничить разработку когнитивных моделей в рамках архитектуры. [4] Аналогичным образом, разработка модели помогает информировать об ограничениях и недостатках архитектуры. Некоторые из самых популярных архитектур для когнитивного моделирования включают ACT-R , Clarion , LIDA и Soar .
Когнитивное моделирование исторически развивалось в рамках когнитивной психологии / когнитивной науки (включая человеческий фактор ) и получило вклад , в частности, из областей машинного обучения и искусственного интеллекта .
Для описания процессов, вовлеченных в восприятие, хранение и производство речи, используется ряд ключевых терминов. Как правило, они используются логопедами при лечении ребенка. Входной сигнал — это речевой сигнал, услышанный ребенком, обычно предположительно исходящий от взрослого говорящего. Выходной сигнал — это произнесенное ребенком высказывание. Невидимые психологические события, происходящие между поступлением входного сигнала и производством речи, находятся в центре внимания психолингвистических моделей. События, которые обрабатывают входной сигнал, называются входными процессами, тогда как события, которые обрабатывают производство речи, называются выходными процессами. Считается, что некоторые аспекты обработки речи происходят онлайн, то есть они происходят во время фактического восприятия или производства речи и, таким образом, требуют доли ресурсов внимания, выделенных на речевую задачу. Другие процессы, которые, как считается, происходят офлайн, происходят как часть фоновой умственной обработки ребенка, а не во время, выделенное на речевую задачу. В этом смысле онлайн-обработка иногда определяется как происходящая в реальном времени, тогда как офлайн-обработка считается не зависящей от времени (Hewlett, 1990). В психолингвистических моделях «ящик и стрелка» каждый предполагаемый уровень представления или обработки может быть представлен на диаграмме «ящиком», а отношения между ними — «стрелками», отсюда и название. Иногда (как в моделях Смита, 1973 и Менна, 1978, описанных далее в этой статье) стрелки представляют процессы, дополнительные к тем, которые показаны в ящиках. Такие модели делают явными предполагаемые действия по обработке информации, выполняемые в определенной когнитивной функции (например, языке), способом, аналогичным компьютерным блок-схемам, которые изображают процессы и решения, выполняемые компьютерной программой. Модели «ящик и стрелка» сильно различаются по количеству невидимых психологических процессов, которые они описывают, и, следовательно, по количеству ящиков, которые они содержат. Некоторые имеют только один или два блока между входными и выходными сигналами (например, Menn, 1978; Smith, 1973), тогда как другие имеют несколько блоков, представляющих сложные отношения между рядом различных событий обработки информации (например, Hewlett, 1990; Hewlett, Gibbon, & Cohen-McKenzie, 1998; Stackhouse & Wells, 1997). Однако наиболее важным блоком и источником многих продолжающихся споров является тот, который представляет базовое представление (или UR). По сути, базовое представление фиксирует информацию, хранящуюся в сознании ребенка о слове, которое он или она знает и использует. Как проиллюстрирует следующее описание нескольких моделей, природа этой информации и, следовательно, тип(ы) представления, присутствующие в базе знаний ребенка, уже некоторое время привлекают внимание исследователей. (Элиза Бейкер и др. Психолингвистические модели развития речи и их применение в клинической практике. Журнал исследований речи, языка и слуха. Июнь 2001 г. 44.стр. 685–702.)
Вычислительная модель — это математическая модель в вычислительной науке , которая требует обширных вычислительных ресурсов для изучения поведения сложной системы с помощью компьютерного моделирования. Изучаемая система часто является сложной нелинейной системой , для которой простые, интуитивно понятные аналитические решения недоступны. Вместо того, чтобы выводить математическое аналитическое решение проблемы, эксперименты с моделью проводятся путем изменения параметров системы на компьютере и изучения различий в результатах экспериментов. Теории работы модели могут быть получены/выведены из этих вычислительных экспериментов. Примерами распространенных вычислительных моделей являются модели прогнозирования погоды , модели имитатора Земли , модели имитатора полета , модели сворачивания молекулярных белков и модели нейронных сетей .
Символическая модель выражается с помощью символов , обычно нечисловых, которые требуют перевода перед использованием.
Когнитивная модель является субсимволической, если она образована составными частями, которые в свою очередь не являются представлениями, например, пикселями, звуковыми образами, воспринимаемыми ухом, образцами сигналов; субсимволические единицы в нейронных сетях можно считать частными случаями этой категории.
Гибридные компьютеры — это компьютеры, которые демонстрируют особенности аналоговых и цифровых компьютеров. Цифровой компонент обычно служит контроллером и обеспечивает логические операции, в то время как аналоговый компонент обычно служит решателем дифференциальных уравнений. Подробнее см. в разделе гибридная интеллектуальная система .
В традиционном вычислительном подходе представления рассматриваются как статические структуры дискретных символов . Познание происходит путем преобразования статических структур символов в дискретные последовательные шаги. Сенсорная информация преобразуется в символические входы, которые производят символические выходы, которые преобразуются в двигательные выходы. Вся система работает в непрерывном цикле.
Чего не хватает в этом традиционном взгляде, так это того, что человеческое познание происходит непрерывно и в реальном времени. Разбиение процессов на дискретные временные шаги может не полностью охватить это поведение. Альтернативный подход заключается в определении системы с (1) состоянием системы в любой момент времени, (2) поведением, определяемым как изменение общего состояния с течением времени, и (3) набором состояний или пространством состояний , представляющим совокупность общих состояний, в которых может находиться система. [5] Система отличается тем, что изменение любого аспекта состояния системы зависит от других аспектов того же или других состояний системы. [6]
Типичная динамическая модель формализуется несколькими дифференциальными уравнениями , которые описывают, как состояние системы изменяется с течением времени. При этом форма пространства возможных траекторий и внутренние и внешние силы, которые формируют определенную траекторию, разворачивающуюся с течением времени, а не физическая природа базовых механизмов , которые проявляют эту динамику, несут объяснительную силу. С этой динамической точки зрения параметрические входы изменяют внутреннюю динамику системы, а не определяют внутреннее состояние, которое описывает некоторое внешнее положение дел.
Ранние работы по применению динамических систем к познанию можно найти в модели сетей Хопфилда . [7] [8] Эти сети были предложены в качестве модели для ассоциативной памяти . Они представляют нейронный уровень памяти , моделируя системы из около 30 нейронов, которые могут находиться как во включенном, так и в выключенном состоянии. Позволяя сети обучаться самостоятельно, естественным образом возникают структура и вычислительные свойства. В отличие от предыдущих моделей, «воспоминания» могут быть сформированы и вызваны путем ввода небольшой части всей памяти. Временной порядок воспоминаний также может быть закодирован. Поведение системы моделируется с помощью векторов , которые могут изменять значения, представляя различные состояния системы. Эта ранняя модель была важным шагом к представлению о динамических системах человеческого познания, хотя еще предстояло добавить много деталей и учесть больше явлений.
Принимая во внимание эволюционное развитие нервной системы человека и сходство мозга с другими органами, Элман предложил рассматривать язык и познание как динамическую систему, а не как цифровой процессор символов. [9] Нейронные сети типа, реализованного Элманом, стали известны как сети Элмана . Вместо того чтобы рассматривать язык как набор статических лексических элементов и правил грамматики , которые изучаются и затем используются в соответствии с фиксированными правилами, представление динамических систем определяет лексикон как области пространства состояний внутри динамической системы. Грамматика состоит из аттракторов и репеллеров, которые ограничивают движение в пространстве состояний. Это означает, что представления чувствительны к контексту, при этом ментальные представления рассматриваются как траектории через ментальное пространство, а не как объекты, которые конструируются и остаются статичными. Сети Элмана обучались с помощью простых предложений, чтобы представлять грамматику как динамическую систему. После того, как базовая грамматика была изучена, сети могли затем анализировать сложные предложения, предсказывая, какие слова появятся следующими в соответствии с динамической моделью. [10]
Классическая ошибка развития была исследована в контексте динамических систем: [11] [12] Предполагается, что ошибка A-not-B не является отдельной ошибкой, возникающей в определенном возрасте (от 8 до 10 месяцев), а является особенностью динамического процесса обучения, которая также присутствует у детей старшего возраста. Было обнаружено, что дети в возрасте 2 лет совершают ошибку, похожую на ошибку A-not-B, при поиске игрушек, спрятанных в песочнице. После наблюдения за игрушкой, спрятанной в месте A, и многократного поиска ее там, двухлетним детям показали игрушку, спрятанную в новом месте B. Когда они искали игрушку, они искали в местах, которые были смещены в сторону места A. Это говорит о том, что существует постоянное представление о местоположении игрушки, которое меняется со временем. Прошлое поведение ребенка влияет на его модель местоположений песочницы, и поэтому описание поведения и обучения должно учитывать, как система песочницы и прошлые действия ребенка меняются со временем. [12]
Один из предлагаемых механизмов динамической системы исходит из анализа непрерывных во времени рекуррентных нейронных сетей (CTRNN). Сосредоточившись на выходных данных нейронных сетей, а не на их состояниях, и изучая полностью взаимосвязанные сети, можно использовать центральный генератор паттернов (CPG) из трех нейронов для представления таких систем, как движения ног во время ходьбы. [13] Этот CPG содержит три двигательных нейрона для управления эффекторами стопы, маха назад и маха вперед ноги. Выходные данные сети представляют, находится ли стопа вверху или внизу, и какая сила прикладывается для создания крутящего момента в суставе ноги. Одной из особенностей этого паттерна является то, что выходы нейронов большую часть времени либо выключены, либо включены . Другой особенностью является то, что состояния являются квазистабильными, что означает, что они в конечном итоге перейдут в другие состояния. Простая схема генератора паттернов, подобная этой, предлагается в качестве строительного блока для динамической системы. Наборы нейронов, которые одновременно переходят из одного квазистабильного состояния в другое, определяются как динамический модуль. Теоретически эти модули можно объединять для создания более крупных схем, которые составляют полную динамическую систему. Однако детали того, как может возникнуть эта комбинация, до конца не проработаны.
Современные формализации динамических систем, применяемые к изучению познания, различаются. Одна из таких формализации, называемая «поведенческой динамикой», [14] рассматривает агента и окружающую среду как пару связанных динамических систем, основанных на классической теории динамических систем. В этой формализации информация из окружающей среды информирует поведение агента, а действия агента изменяют окружающую среду. В конкретном случае циклов восприятия-действия связь окружающей среды и агента формализуется двумя функциями . Первая преобразует представление действий агентов в определенные шаблоны мышечной активации, которые, в свою очередь, производят силы в окружающей среде. Вторая функция преобразует информацию из окружающей среды (т. е. шаблоны стимуляции на рецепторах агента, которые отражают текущее состояние окружающей среды) в представление, которое полезно для управления действиями агентов. Были предложены другие похожие динамические системы (хотя и не развитые в формальную структуру), в которых нервная система агента, тело агента и окружающая среда связаны вместе [15] [16]
Поведенческая динамика была применена к поведению локомотива. [14] [17] [18] Моделирование локомоции с поведенческой динамикой показывает, что адаптивное поведение может возникать из взаимодействия агента и окружающей среды. Согласно этой структуре, адаптивное поведение может быть охвачено двумя уровнями анализа. На первом уровне восприятия и действия агент и окружающая среда могут быть концептуализированы как пара динамических систем, связанных вместе силами, которые агент применяет к окружающей среде, и структурированной информацией, предоставляемой окружающей средой. Таким образом, поведенческая динамика возникает из взаимодействия агента и окружающей среды. На втором уровне временной эволюции поведение может быть выражено как динамическая система, представленная в виде векторного поля. В этом векторном поле аттракторы отражают стабильные поведенческие решения, тогда как бифуркации отражают изменения в поведении. В отличие от предыдущей работы по центральным генераторам шаблонов, эта структура предполагает, что стабильные поведенческие шаблоны являются возникающим, самоорганизующимся свойством системы агент-среда, а не определяются структурой либо агента, либо окружающей среды.
В расширении классической теории динамических систем [19] вместо того, чтобы связывать динамические системы среды и агента друг с другом, «открытая динамическая система» определяет «общую систему», «систему агента» и механизм для связи этих двух систем. Общая система — это динамическая система, которая моделирует агента в среде, тогда как система агента — это динамическая система, которая моделирует внутреннюю динамику агента (т. е. динамику агента в отсутствие среды). Важно, что механизм связи не связывает две системы вместе, а скорее непрерывно модифицирует общую систему в общую систему разъединенного агента. Различая общую и агентную системы, можно исследовать поведение агента, когда он изолирован от среды и когда он встроен в среду. Эту формализацию можно рассматривать как обобщение классической формализации, в соответствии с которой агентную систему можно рассматривать как агентную систему в открытой динамической системе, а агента, связанного с окружающей средой, и окружающую среду можно рассматривать как общую систему в открытой динамической системе.
В контексте динамических систем и воплощенного познания представления могут быть концептуализированы как индикаторы или посредники. С точки зрения индикатора внутренние состояния несут информацию о существовании объекта в среде, где состояние системы во время воздействия объекта является представлением этого объекта. С точки зрения посредника внутренние состояния несут информацию об окружающей среде, которая используется системой для достижения своих целей. В этом более сложном описании состояния системы несут информацию, которая является посредником между информацией, которую агент получает из окружающей среды, и силой, оказываемой на окружающую среду поведением агентов. Применение открытых динамических систем обсуждалось для четырех типов примеров классического воплощенного познания: [20]
Интерпретации этих примеров основаны на следующей логике : (1) вся система охватывает воплощение; (2) одна или несколько систем агентов охватывают внутреннюю динамику отдельных агентов; (3) полное поведение агента можно понимать как изменение внутренней динамики агента по отношению к его ситуации в среде; и (4) пути открытой динамической системы можно интерпретировать как репрезентативные процессы. Эти примеры воплощенного познания показывают важность изучения эмерджентной динамики систем агент-среда, а также внутренней динамики систем агентов. Вместо того чтобы противоречить традиционным подходам когнитивной науки, динамические системы являются естественным продолжением этих методов и должны изучаться параллельно, а не конкурировать.