Когнитивная модель — это аппроксимация одного или нескольких когнитивных процессов у людей или других животных для целей понимания и прогнозирования. Существует много типов когнитивных моделей, и они могут варьироваться от диаграмм в виде прямоугольника и стрелок до набора уравнений и программ, которые взаимодействуют с теми же инструментами, которые люди используют для выполнения задач (например, компьютерной мышью и клавиатурой). [1] [ нужна страница ] С точки зрения обработки информации , когнитивное моделирование — это моделирование человеческого восприятия, рассуждений, памяти и действий. [2] [3]
Когнитивные модели могут разрабатываться в рамках когнитивной архитектуры или без нее , хотя их не всегда легко отличить. В отличие от когнитивных архитектур, когнитивные модели, как правило, фокусируются на одном когнитивном явлении или процессе (например, обучение по спискам), на том, как взаимодействуют два или более процессов (например, визуальный поиск, принятие решений bsc1780), или на поведенческих прогнозах для конкретной задачи. или инструмент (например, как внедрение нового пакета программного обеспечения повлияет на производительность). Когнитивные архитектуры, как правило, фокусируются на структурных свойствах моделируемой системы и помогают ограничить разработку когнитивных моделей внутри архитектуры. [4] Аналогично, разработка модели помогает выявить ограничения и недостатки архитектуры. Некоторые из наиболее популярных архитектур для когнитивного моделирования включают ACT-R , Clarion , LIDA и Soar .
Когнитивное моделирование исторически развивалось в рамках когнитивной психологии / когнитивистики (включая человеческий фактор ) и получило вклад, среди прочего, в области машинного обучения и искусственного интеллекта .
Для описания процессов, связанных с восприятием, хранением и производством речи, используется ряд ключевых терминов. Обычно их используют логопеды при лечении детского пациента. Входной сигнал — это речевой сигнал, который слышит ребенок, обычно предполагается, что он исходит от говорящего взрослого. Выходным сигналом является высказывание ребенка. Невидимые психологические события, которые происходят между поступлением входного сигнала и воспроизведением речи, находятся в центре внимания психолингвистических моделей. События, обрабатывающие входной сигнал, называются входными процессами, тогда как события, обрабатывающие речь, называются выходными процессами. Считается, что некоторые аспекты обработки речи происходят в режиме онлайн, то есть они происходят во время фактического восприятия или производства речи и, таким образом, требуют определенной доли ресурсов внимания, посвященных речевой задаче. Другие процессы, которые, как считается, происходят в автономном режиме, происходят как часть фоновой умственной обработки ребенка, а не во время, посвященное речевому заданию. В этом смысле онлайн-обработку иногда определяют как происходящую в режиме реального времени, тогда как офлайн-обработку называют не требующей времени (Hewlett, 1990). В психолингвистических моделях «коробка и стрелка» каждый предполагаемый уровень репрезентации или обработки может быть представлен на диаграмме «коробкой», а отношения между ними — «стрелками», отсюда и название. Иногда (как в моделях Смита, 1973 г. и Менна, 1978 г., описанных ниже в этой статье) стрелки обозначают процессы, дополнительные к тем, которые показаны в прямоугольниках. Такие модели наглядно демонстрируют гипотетические действия по обработке информации, осуществляемые в рамках конкретной когнитивной функции (например, языка), аналогично компьютерным блок-схемам, которые изображают процессы и решения, выполняемые компьютерной программой. Модели «коробка и стрела» сильно различаются по количеству описываемых ими невидимых психологических процессов и, следовательно, по количеству содержащихся в них коробок. Некоторые имеют только один или два поля между входными и выходными сигналами (например, Menn, 1978; Smith, 1973), тогда как другие имеют несколько блоков, представляющих сложные взаимосвязи между рядом различных событий обработки информации (например, Hewlett, 1990; Hewlett , Гиббон и Коэн-Маккензи, 1998 г.; Однако наиболее важным полем и источником многочисленных непрекращающихся дебатов является поле, представляющее лежащее в его основе представление (или UR). По сути, базовое представление фиксирует информацию, хранящуюся в сознании ребенка, о слове, которое он или она знает и использует. Как покажет следующее описание нескольких моделей, природа этой информации и, следовательно, тип(ы) представления, присутствующие в базе знаний ребенка, на некоторое время привлекли внимание исследователей. (Элиза Бейкер и др. Психолингвистические модели речевого развития и их применение в клинической практике. Журнал исследований речи, языка и слуха. Июнь 2001 г., стр. 44.стр. 685–702.)
Вычислительная модель — это математическая модель в области вычислительной техники , которая требует обширных вычислительных ресурсов для изучения поведения сложной системы посредством компьютерного моделирования. Исследуемая система часто представляет собой сложную нелинейную систему , для которой недоступны простые, интуитивно понятные аналитические решения. Вместо того, чтобы находить математическое аналитическое решение проблемы, эксперименты с моделью проводятся путем изменения параметров системы на компьютере и изучения различий в результатах экспериментов. Теории работы модели могут быть выведены/выведены из этих вычислительных экспериментов. Примерами распространенных вычислительных моделей являются модели прогнозирования погоды , модели симулятора Земли , модели симулятора полета , модели сворачивания молекулярных белков и модели нейронных сетей .
Символическая модель выражается в символах, обычно нечисловых, которые требуют перевода, прежде чем их можно будет использовать .
Когнитивная модель является субсимволической, если она состоит из составляющих ее объектов, не являющихся в свою очередь представлениями, например, пикселей, звуковых образов, воспринимаемых ухом, образцов сигналов; субсимвольные единицы в нейронных сетях можно считать частными случаями этой категории.
Гибридные компьютеры — это компьютеры, обладающие характеристиками аналоговых и цифровых компьютеров. Цифровой компонент обычно служит контроллером и обеспечивает логические операции, а аналоговый компонент обычно служит средством решения дифференциальных уравнений. Более подробную информацию см. в разделе « Гибридная интеллектуальная система» .
В традиционном вычислительном подходе представления рассматриваются как статические структуры дискретных символов . Познание происходит путем преобразования статических структур символов в дискретные , последовательные шаги. Сенсорная информация преобразуется в символические входные данные, которые производят символические выходные данные, которые преобразуются в двигательные выходные данные. Вся система работает в непрерывном цикле.
Чего не хватает этой традиционной точке зрения, так это того, что человеческое познание происходит непрерывно и в реальном времени. Разбиение процессов на дискретные временные этапы может не полностью отразить это поведение. Альтернативный подход состоит в том, чтобы определить систему с помощью (1) состояния системы в любой момент времени, (2) поведения, определяемого как изменение во времени общего состояния, и (3) набора состояний или пространства состояний , представляющего совокупность состояний, в которых может находиться система. [5] Система отличается тем, что изменение любого аспекта состояния системы зависит от других аспектов того же или других состояний системы. [6]
Типичная динамическая модель формализована несколькими дифференциальными уравнениями , которые описывают, как состояние системы меняется с течением времени. При этом объяснительную силу несет форма пространства возможных траекторий , а также внутренние и внешние силы, формирующие конкретную траекторию, разворачивающуюся во времени, а не физическая природа основных механизмов , проявляющих эту динамику. С этой динамической точки зрения параметрические входные данные изменяют внутреннюю динамику системы, а не определяют внутреннее состояние, которое описывает некоторое внешнее положение дел.
Ранние работы по применению динамических систем к познанию можно найти в модели сетей Хопфилда . [7] [8] Эти сети были предложены в качестве модели ассоциативной памяти . Они представляют нейронный уровень памяти , моделируя системы, состоящие примерно из 30 нейронов, которые могут находиться во включенном или выключенном состоянии. Когда сеть обучается самостоятельно, естественным образом возникают ее структура и вычислительные свойства. В отличие от предыдущих моделей, «воспоминания» можно формировать и вызывать, вводя небольшую часть всей памяти. Временной порядок воспоминаний также может быть закодирован. Поведение системы моделируется с помощью векторов , которые могут изменять значения, представляющие различные состояния системы. Эта ранняя модель была важным шагом на пути к динамическому системному взгляду на человеческое познание, хотя еще предстояло добавить много деталей и объяснить больше явлений.
Принимая во внимание эволюционное развитие нервной системы человека и сходство мозга с другими органами, Элман предложил рассматривать язык и познание как динамическую систему, а не как процессор цифровых символов. [9] Нейронные сети типа Элмана стали известны как сети Элмана . Вместо того, чтобы рассматривать язык как совокупность статических лексических элементов и грамматических правил, которые изучаются и затем используются в соответствии с фиксированными правилами, подход динамических систем определяет лексику как области пространства состояний внутри динамической системы. Грамматика состоит из аттракторов и отталкивателей, которые сковывают движение в пространстве состояний. Это означает, что представления чувствительны к контексту, при этом мысленные представления рассматриваются как траектории через мысленное пространство, а не как объекты, которые сконструированы и остаются статичными. Сети Элмана были обучены с помощью простых предложений для представления грамматики как динамической системы. После изучения базовой грамматики сети могли анализировать сложные предложения, предсказывая, какие слова появятся следующими в соответствии с динамической моделью. [10]
Классическая ошибка развития была исследована в контексте динамических систем: [11] [12] Предполагается, что ошибка A-not-B — это не отчетливая ошибка, возникающая в определенном возрасте (от 8 до 10 месяцев), а особенность динамичного процесса обучения, который присутствует и у детей старшего возраста. Установлено, что дети 2 лет допускают ошибку, аналогичную ошибке А-не-Б, при поиске игрушек, спрятанных в песочнице. После наблюдения за игрушкой, спрятанной в месте А, и неоднократного поиска ее там, двухлетним детям показали игрушку, спрятанную в новом месте Б. Когда они искали игрушку, они искали ее в местах, которые были смещены в сторону места А. Это говорит о том, что существует постоянное представление местоположения игрушки, которое меняется со временем. Прошлое поведение ребенка влияет на его модель расположения песочницы, поэтому при учете поведения и обучения необходимо учитывать, как система песочницы и прошлые действия ребенка меняются с течением времени. [12]
Один из предложенных механизмов динамической системы основан на анализе рекуррентных нейронных сетей непрерывного времени (CTRNN). Сосредоточив внимание на результатах работы нейронных сетей, а не на их состояниях, и исследуя полностью взаимосвязанные сети, трехнейронный центральный генератор шаблонов (CPG) можно использовать для представления таких систем, как движения ног во время ходьбы. [13] Этот CPG содержит три мотонейрона, отвечающих за управление ступней, махом назад и эффекторами маха вперед. Выходные данные сети показывают, находится ли ступня вверх или вниз и какая сила прикладывается для создания крутящего момента в суставе ноги. Одной из особенностей этого паттерна является то, что выходы нейронов большую часть времени либо выключены, либо включены . Другая особенность заключается в том, что состояния квазистабильны, то есть со временем они перейдут в другие состояния. Предполагается, что простая схема генератора шаблонов, подобная этой, станет строительным блоком динамической системы. Совокупность нейронов, одновременно переходящих из одного квазистабильного состояния в другое, определяется как динамический модуль. Эти модули теоретически можно комбинировать для создания более крупных схем, составляющих полную динамическую систему. Однако детали того, как могло произойти такое сочетание, до конца не проработаны.
Современные формализации динамических систем, применяемые к изучению познания, различаются. Одна из таких формализаций, называемая «поведенческой динамикой», [14] рассматривает агента и окружающую среду как пару связанных динамических систем, основанную на классической теории динамических систем. В этой формализации информация из окружающей среды определяет поведение агента, а действия агента изменяют среду. В конкретном случае циклов восприятия-действия связь среды и агента формализуется двумя функциями . Первый преобразует представление о действиях агентов в конкретные паттерны мышечной активации, которые, в свою очередь, создают силы в окружающей среде. Вторая функция преобразует информацию из окружающей среды (т. е. шаблоны стимуляции рецепторов агента, которые отражают текущее состояние среды) в представление, полезное для управления действиями агентов. Были предложены и другие подобные динамические системы (хотя и не оформленные в формальную структуру), в которых нервные системы агента, тело агента и окружающая среда связаны вместе [15] [16]
Поведенческая динамика была применена к двигательному поведению. [14] [17] [18] Моделирование передвижения с помощью поведенческой динамики показывает, что адаптивное поведение может возникнуть в результате взаимодействия агента и окружающей среды. Согласно этой схеме, адаптивное поведение можно охватить двумя уровнями анализа. На первом уровне восприятия и действия агент и окружающая среда могут быть концептуализированы как пара динамических систем, связанных между собой силами, которые агент прикладывает к окружающей среде, и структурированной информацией, предоставляемой средой. Таким образом, поведенческая динамика возникает в результате взаимодействия агента и среды. На втором уровне временной эволюции поведение может быть выражено как динамическая система, представленная в виде векторного поля. В этом векторном поле аттракторы отражают устойчивые поведенческие решения, тогда как бифуркации отражают изменения в поведении. В отличие от предыдущих работ по центральным генераторам паттернов, эта концепция предполагает, что стабильные поведенческие паттерны являются возникающим, самоорганизующимся свойством системы агент-среда, а не определяются структурой агента или окружающей среды.
В расширении классической теории динамических систем [19] вместо того, чтобы связывать динамические системы окружающей среды и агента друг с другом, «открытая динамическая система» определяет «полную систему», «систему агентов» и механизм связи . эти две системы. Полная система — это динамическая система, которая моделирует агента в окружающей среде, тогда как система агентов — это динамическая система, которая моделирует внутреннюю динамику агента (т. е. динамику агента в отсутствие среды). Важно отметить, что механизм отношений не связывает две системы вместе, а, скорее, непрерывно модифицирует общую систему в общую систему отделенного агента. Проводя различие между тотальными и агентными системами, можно исследовать поведение агента, когда он изолирован от окружающей среды и когда он встроен в среду. Эту формализацию можно рассматривать как обобщение классической формализации, согласно которой систему агентов можно рассматривать как систему агентов в открытой динамической системе, а агента, связанного со средой и средой, можно рассматривать как полную систему в открытой динамической системе. динамическая система.
В контексте динамических систем и воплощенного познания репрезентации можно концептуализировать как индикаторы или посредники. С точки зрения индикатора внутренние состояния несут информацию о существовании объекта в среде, где состояние системы во время воздействия объекта является представлением этого объекта. С точки зрения посредника, внутренние состояния несут информацию об окружающей среде, которая используется системой для достижения своих целей. В этом более сложном подходе состояния системы несут информацию, которая является посредником между информацией, которую агент получает из окружающей среды, и силой, оказываемой на окружающую среду поведением агентов. Применение открытых динамических систем обсуждалось для четырех типов классических примеров воплощенного познания: [20]
Интерпретации этих примеров основаны на следующей логике : (1) вся система отражает воплощение; (2) одна или несколько агентских систем фиксируют внутреннюю динамику отдельных агентов; (3) полное поведение агента можно понимать как изменение внутренней динамики агента по отношению к его ситуации в окружающей среде; и (4) пути открытой динамической системы можно интерпретировать как процессы представления. Эти воплощенные примеры познания показывают важность изучения возникающей динамики систем агент-среда, а также внутренней динамики систем агентов. Динамические системы не противоречат традиционным подходам когнитивной науки, а являются естественным продолжением этих методов и должны изучаться параллельно, а не конкурируя.