stringtranslate.com

Теория перцептивного контроля

Теория перцептивного управления ( PCT ) — это модель поведения , основанная на свойствах контуров управления с отрицательной обратной связью . Контур управления поддерживает измеренную переменную на уровне эталонного значения или вблизи него посредством воздействия его выходных сигналов на эту переменную, опосредованного физическими свойствами окружающей среды. В теории инженерного управления эталонные значения задаются пользователем вне системы. Пример – термостат. В живом организме эталонные значения контролируемых переменных восприятия поддерживаются эндогенно. Биологический гомеостаз и рефлексы являются простыми примерами низкого уровня. Открытие математических принципов управления позволило смоделировать петлю отрицательной обратной связи, замкнутую в окружающей среде (круговая причинно-следственная связь), что породило теорию перцептивного управления. Он фундаментально отличается от некоторых моделей поведенческой и когнитивной психологии , которые моделируют стимулы как причины поведения (линейная причинность). Исследования РСТ публикуются в области экспериментальной психологии , нейробиологии , этологии , антропологии , лингвистики , социологии , робототехники , психологии развития , организационной психологии и менеджмента и ряда других областей. ПКТ был применен для проектирования и управления образовательными системами и привел к появлению психотерапии, называемой методом уровней .

Принципы и отличия от других теорий

Теория перцептивного управления глубоко укоренена в биологической кибернетике , системной биологии и теории управления , а также в связанной с ними концепции петель обратной связи. В отличие от некоторых моделей поведенческой и когнитивной психологии, она основывается на концепции круговой причинности. Таким образом, он разделяет свою теоретическую основу с концепцией контроля над растениями , но отличается от нее тем, что подчеркивает контроль над внутренним представлением физического мира . [1]

Теория управления растениями фокусируется на нейровычислительных процессах генерации движения после того, как решение о создании движения принято. PCT подчеркивает встроенность агентов в окружающую среду. Следовательно, с точки зрения перцептивного контроля, центральная проблема моторного контроля состоит в поиске сенсорного входа в систему, который соответствует желаемому восприятию. [1]

История

PCT уходит корнями в физиологические идеи Клода Бернара , а также в исследования 20-го века Уолтера Б. Кэннона , а также в области разработки систем управления и кибернетики . Классическое управление с отрицательной обратной связью было разработано инженерами в 1930-х и 1940-х годах [2] [3] и далее развито Винером , [4] Эшби , [5] и другими на заре развития области кибернетики . Начиная с 1950-х годов Уильям Т. Пауэрс применил концепции и методы инженерных систем управления к системам биологического контроля и разработал экспериментальную методологию ПКТ. [6] [7]

Ключевая идея PCT заключается в том, что контролируемая переменная - это не выход системы (поведенческие действия), а ее вход, то есть воспринимаемая и преобразованная функция некоторого состояния окружающей среды, на которую могут влиять выходные данные системы управления. Поскольку эти воспринимаемые и преобразованные входные данные могут проявляться как сознательно воспринимаемые аспекты окружающей среды, Пауэрс назвал контролируемую переменную «восприятием». Эта теория стала известна как «Теория перцептивного контроля» или PCT, а не «Теория контроля в применении к психологии», поскольку теоретики контроля часто утверждают или предполагают, что контролируемыми являются выходные данные системы. [8] В PCT контролируется внутреннее представление состояния некоторой переменной в окружающей среде — «восприятие» на повседневном языке. [9] Основные принципы РСТ были впервые опубликованы Пауэрсом, Кларком и МакФарландом как «общая теория поведения с обратной связью» в 1960 году, [10] при участии авторов-кибернетиков Винера и Эшби . С тех пор она систематически развивалась в сплотившемся вокруг нее исследовательском сообществе. [11] Первоначально она была омрачена когнитивной революцией (позже вытеснена когнитивной наукой ), но теперь стала более известной. [12] [13] [14] [15]

Пауэрс и другие исследователи в этой области указывают на проблемы цели, причинности и телеологии, лежащие в основе психологии, которые решает теория контроля. [16] От Аристотеля до Уильяма Джеймса и Джона Дьюи было признано, что поведение является целенаправленным, а не просто реактивным, но как объяснить это было проблематично, поскольку единственное свидетельство намерений было субъективным. Как указывал Пауэрс, бихевиористы, следуя за Вундтом , Торндайком , Уотсоном и другими, отвергали интроспективные отчеты как данные для объективной науки психологии. В качестве данных можно было принять только наблюдаемое поведение. [17] Такие бихевиористы моделировали события окружающей среды (стимулы) как причины поведенческих действий (реакций). Это причинное предположение сохраняется в некоторых моделях когнитивной психологии , которые вставляют когнитивные карты и другую постулируемую обработку информации между стимулом и реакцией, но в остальном сохраняют предположение о линейной причинной связи от окружающей среды к поведению, которую Ричард Маркен назвал «каузальной моделью поведенческой организации с разомкнутым контуром». «в отличие от модели замкнутого цикла РСТ. [12]

Другая, более конкретная причина, по которой Пауэрс отвергал понятия цели или намерения психологами, заключалась в том, что они не могли понять, как цель (состояние, которого еще не существовало) может вызвать поведение, которое к ней привело. РСТ разрешает эти философские споры о телеологии , поскольку он предоставляет модель функционирования организмов, в которой цель имеет объективный статус без обращения к самоанализу и в которой причинно-следственная связь вращается вокруг петель обратной связи . [18]

Пример

Простая система управления с отрицательной обратной связью – это система круиз-контроля автомобиля. Система круиз-контроля имеет датчик, который «воспринимает» скорость как скорость вращения приводного вала, напрямую связанного с колесами. У него также есть настраиваемая водителем «цель», определяющая определенную скорость. Измеренная скорость постоянно сравнивается с заданной скоростью с помощью устройства (называемого «компаратором»), которое вычитает текущее измеренное входное значение из сохраненного целевого значения. Разница (сигнал ошибки) определяет настройку дроссельной заслонки (нажатие акселератора), так что мощность двигателя постоянно изменяется, чтобы предотвратить увеличение или уменьшение скорости автомобиля по сравнению с желаемой скоростью при изменении условий окружающей среды.

Если скорость автомобиля начинает падать ниже целевой скорости, например, при подъеме на холм, небольшое увеличение сигнала ошибки, усиливаясь, вызывает увеличение мощности двигателя, что удерживает ошибку почти на нулевом уровне. Если скорость начинает превышать целевую, например, при спуске с холма, двигатель дросселируется обратно, чтобы действовать как тормоз, поэтому снова удерживается от отклонения скорости более чем на едва заметное расстояние от целевой скорости (тормоза необходим только в том случае, если холм слишком крутой). В результате система круиз-контроля поддерживает скорость, близкую к заданной, когда автомобиль движется вверх и вниз по склону, а также когда другие помехи, такие как ветер, влияют на скорость автомобиля. Все это происходит без какого-либо планирования конкретных действий и без каких-либо слепых реакций на раздражители. Действительно, система круиз-контроля вообще не воспринимает такие возмущения, как давление ветра, а только регулируемую переменную — скорость. Он также не контролирует мощность, вырабатываемую двигателем, он использует «поведение» мощности двигателя как средство управления измеренной скоростью.

Те же принципы управления с отрицательной обратной связью (включая способность сводить на нет эффекты непредсказуемых внешних или внутренних возмущений) применимы и к живым системам управления. [4] Последствия этого принципа интенсивно изучаются, например, биологической и медицинской кибернетикой и системной биологией .

Тезис ПКТ заключается в том, что животные и люди не контролируют свое поведение; скорее, они меняют свое поведение как средство контроля своего восприятия, с внешними возмущениями или без них. Это гармонично согласуется с историческим и до сих пор широко распространенным предположением, что поведение является конечным результатом воздействия стимулов и когнитивных планов. [12] [19]

Методика моделирования и ПКТ как модель

Теория перцептивного контроля в сравнении с теориями бихевиоризма и когнитивной психологии
Теория перцептивного контроля в сравнении с теориями бихевиоризма и когнитивной психологии

Основными данными в методологии PCT является контролируемая переменная. Фундаментальный этап исследования ПКТ, тест на контролируемые переменные, начинается с медленного и осторожного воздействия возмущающих воздействий на состояние переменной в окружающей среде, которая, как предполагает исследователь, уже находится под контролем наблюдаемого организма. Очень важно не подавлять способность организма контролировать, поскольку именно это и исследуется. Если организм меняет свои действия так, чтобы возмущающее влияние не оказало ожидаемого эффекта на эту переменную, это является убедительным доказательством того, что экспериментальное действие нарушило контролируемую переменную. Крайне важно отличать восприятие и точку зрения наблюдателя от точки зрения наблюдаемого организма. Может потребоваться несколько вариантов теста, чтобы определить, какой именно аспект экологической ситуации находится под контролем, как он воспринимается наблюдаемым организмом. [20] [21]

PCT использует методологию «черного ящика» . Контролируемая переменная, измеренная наблюдателем, количественно соответствует эталонному значению восприятия, которое контролирует организм. Таким образом, контролируемая переменная является объективным показателем цели или намерения этих конкретных поведенческих действий организма — цели, к достижению которой эти действия последовательно стремятся, несмотря на нарушения. За некоторыми исключениями, при нынешнем состоянии нейробиологии это внутренне поддерживаемое эталонное значение редко наблюдается непосредственно как таковое (например, как частота импульсов в нейроне), поскольку лишь немногие исследователи отслеживают соответствующие электрические и химические переменные по их конкретным путям в то время, как живой человек организм участвует в том, что мы внешне наблюдаем как поведение. [22] Однако, когда работающая система отрицательной обратной связи, смоделированная на цифровом компьютере, работает по существу идентично наблюдаемым организмам, тогда хорошо понятная структура отрицательной обратной связи симуляции или модели (белый ящик) понимается как демонстрация невидимой структуры отрицательной обратной связи внутри организм (черный ящик). [6]

Данные по отдельным лицам не агрегируются для статистического анализа; [23] вместо этого строится генеративная модель, которая воспроизводит данные, наблюдаемые для людей, с очень высокой точностью (0,95 или выше) [ необходимы разъяснения ] . Чтобы построить такую ​​модель конкретной поведенческой ситуации, необходимы тщательные измерения трех наблюдаемых переменных:

Четвертое значение, внутренний эталон r (переменная «заданное значение»), выводится из значения, при котором организм поддерживает q i , как это определено тестом для контролируемых переменных (описанным в начале этого раздела). .

При заданных двух переменных, управляемом входе q i и задании r , правильно спроектированная система управления, смоделированная на цифровом компьютере, выдает выходные данные q o , которые почти точно противодействуют непредсказуемым возмущениям d на управляемом входе. Кроме того, отклонения от идеального контроля хорошо согласуются с отклонениями, наблюдаемыми для живых организмов. [24] Идеальный контроль приведет к нулевому эффекту возмущения, но живые организмы не являются идеальными контроллерами, и целью ПКТ является моделирование живых организмов. Когда компьютерное моделирование выполняется с соответствием >95% экспериментально измеренным значениям, противодействуя эффекту непредсказуемых изменений d путем генерации (почти) равных и противоположных значений q o , считается, что оно моделирует поведение и структуру внутреннего контура управления. организма. [18] [10] [25]

В более широком смысле, разработка теории представляет собой общую модель когнитивного процесса и поведения. Каждая конкретная модель или симуляция поведения, построенная и проверенная на основе наблюдаемых данных, представляет собой общую модель, представленную в теории, которая подвергается потенциальному вызову, который может потребовать пересмотра или может привести к опровержению.

Математика

Чтобы проиллюстрировать математические расчеты, используемые в моделировании PCT, рассмотрим задачу отслеживания преследования, в которой участник удерживает курсор мыши на одной линии с движущейся целью на мониторе компьютера.

Модель предполагает, что перцептивный сигнал внутри участника представляет собой величину входной величины q i . (Было продемонстрировано, что это частота импульсов в нейроне, по крайней мере, на самых низких уровнях.) [25] [26] В задаче отслеживания входной величиной является расстояние по вертикали между целевой позицией T и позицией курсора. C , а случайное изменение целевого положения действует как возмущение d этой входной величины. Это предполагает , что перцептивный сигнал p количественно представляет позицию курсора C минус целевую позицию T, как выражено в уравнении p = CT.

Между восприятием цели и курсора и построением сигнала, представляющего расстояние между ними, существует задержка τ миллисекунд, так что рабочий перцептивный сигнал в момент времени t представляет расстояние от цели до курсора в предыдущий момент времени, tτ . Следовательно, уравнение, используемое в модели, имеет вид

1. п ( т ) = C ( т–τ ) – Т ( т–τ )

Система управления с отрицательной обратной связью принимает опорный сигнал r , который определяет величину данного перцептивного сигнала, который в данный момент является предполагаемым или желаемым. (Информацию о происхождении r внутри организма см. ниже в разделе «Иерархия контроля».) И r , и p вводятся в простую нервную структуру, где r возбуждает, а p тормозит. Эта структура называется «компаратором». [25] Эффект заключается в вычитании p из r , что дает сигнал ошибки e , который указывает величину и знак разницы между желаемой величиной r и текущей входной величиной p данного восприятия. Уравнение, представляющее это в модели:

2. е = г–р

Сигнал ошибки e должен быть преобразован в выходную величину q o (представляющую мышечные усилия участника, влияющие на положение мыши). Эксперименты показали, что в лучшей модели для выходной функции скорость мыши V курсора пропорциональна сигналу ошибки e на коэффициент усиления G (то есть V курсор = G * e ). Таким образом, когда перцептивный сигнал p меньше опорного сигнала r , сигнал ошибки e имеет положительный знак, и на его основе модель вычисляет скорость курсора вверх, пропорциональную ошибке.

Следующая позиция курсора C new равна текущей позиции C old плюс скорость курсора V , умноженная на длительность dt одной итерации программы. С помощью простой алгебры мы заменяем G * e (как указано выше) на V курсор , получая третье уравнение:

3. C новый = C старый + G * e * dt

Эти три простых уравнения или шага программы представляют собой простейшую форму модели для задачи отслеживания. Когда эти три одновременных уравнения оцениваются снова и снова с одинаково распределенными случайными возмущениями d целевой позиции, которые испытал участник-человек, выходные положения и скорости курсора дублируют действия участника в приведенной выше задаче отслеживания в пределах 4,0% от их пикового значения. пиковый диапазон, очень подробно.

Эту простую модель можно уточнить с помощью коэффициента демпфирования d , который уменьшает расхождение между моделью и участником-человеком до 3,6%, когда возмущение d установлено на максимальную сложность.

3'. C новый = C старый + [( G * e )–( d * C old )]* dt

Подробное обсуждение этой модели в (Powers 2008) [24] включает как исходный, так и исполняемый код, с помощью которого читатель может проверить, насколько хорошо эта простая программа имитирует реальное поведение. Не требуется учитывать возможные нелинейности, такие как закон Вебера-Фехнера , потенциальный шум в системе, постоянно меняющиеся углы сочленений и многие другие факторы, которые могли бы повлиять на производительность, если бы это была простая линейная модель. Никакой обратной кинематики или прогнозирующих вычислений не требуется. Модель просто непрерывно уменьшает расхождение между входными данными p и эталоном r по мере его возникновения в реальном времени, и это все, что требуется — как и предсказывает теория. [18] [25]

Отличия от инженерной теории управления

В искусственных системах, определенных теорией инженерного управления , опорный сигнал считается внешним входным сигналом для «объекта». [8] В теории инженерного управления опорный сигнал или заданное значение является общедоступным; в PCT это не так, а скорее должно быть выведено из результатов теста контролируемых переменных, как описано выше в разделе методологии. Это связано с тем, что в живых системах опорный сигнал не является доступным извне входом, а возникает внутри системы. В иерархической модели выход ошибки контуров управления более высокого уровня, как описано в следующем разделе ниже, вызывает опорный сигнал r из локальной памяти синапса, а сила r пропорциональна (взвешенной) силе сигнала ошибки. или сигналы от одной или нескольких систем более высокого уровня. [27]

В инженерных системах управления, в случае, когда таких эталонных входов несколько, «Контроллер» предназначен для манипулирования этими входами с целью получения эффекта на выходе системы, желаемого разработчиком системы, и задачи управления. теория управления (понимаемая таким образом) заключается в расчете этих манипуляций таким образом, чтобы избежать нестабильности и колебаний. Разработчик модели или моделирования PCT не указывает никакого конкретного желаемого воздействия на выходные данные системы, за исключением того, что оно должно быть любым, необходимым для приведения входных данных из окружающей среды (перцептуального сигнала) в соответствие с эталоном. В теории перцептивного управления входная функция для опорного сигнала представляет собой взвешенную сумму внутренне сгенерированных сигналов (в каноническом случае сигналов ошибок более высокого уровня), а стабильность контура определяется локально для каждого контура способом, описанным в предыдущем разделе. по математике РСТ (и более подробно описано в указанной литературе). Под взвешенной суммой понимается результат реорганизации.

Теория инженерного управления требует больших вычислительных ресурсов, но, как показано в предыдущем разделе, PCT — нет. Например, сравним реализацию модели перевернутого маятника в инженерной теории управления [28] с реализацией РСТ в виде иерархии пяти простых систем управления. [29]

Иерархия контроля

Организация контуров обратной связи на разных уровнях как основа иерархии управления
Иерархическая организация циклов обратной связи на разных уровнях.

Восприятия в PCT строятся и контролируются в иерархии уровней. Например, зрительное восприятие объекта строится на основе различий в интенсивности света или различий в ощущениях, таких как цвет на его краях. Управление формой или расположением объекта требует изменения восприятия ощущений или интенсивности (которые контролируются системами более низкого уровня). Этот организующий принцип применяется на всех уровнях, вплоть до самых абстрактных философских и теоретических построений.

Русский физиолог Николай Бернштейн [30] независимо пришел к такому же выводу, что поведение должно быть многопорядковым — организованным иерархически, послойно. Простая проблема привела к такому выводу примерно в одно и то же время как в РСТ, так и в работе Бернштейна. Спинальные рефлексы стабилизируют конечности от повреждений. Почему они не мешают центрам, расположенным выше в мозгу, использовать эти конечности для осуществления поведения? Поскольку мозг, очевидно, использует спинальную систему для формирования поведения, должен существовать принцип, позволяющий высшим системам действовать, включая рефлексы, а не просто преодолевая их или отключая. Ответ заключается в том, что эталонное значение (заданное значение) спинномозгового рефлекса не является статичным; скорее, он варьируется системами более высокого уровня как средство перемещения конечностей ( сервомеханизм ). Этот принцип применим к более высоким контурам обратной связи, поскольку каждый контур представляет одну и ту же проблему для подсистем выше него.

В то время как инженерная система контроля имеет контрольное значение или заданное значение , корректируемое каким-либо внешним агентством, контрольное значение для системы биологического контроля не может быть установлено таким образом. Уставка должна исходить из какого-то внутреннего процесса. Если есть способ повлиять на поведение, любое восприятие может быть приведено в состояние, на мгновение заданное более высокими уровнями, а затем поддерживаться в этом состоянии, несмотря на непредсказуемые помехи. В иерархии систем управления более высокие уровни корректируют цели более низких уровней как средства достижения собственных целей, поставленных еще более высокими системами. Это имеет важные последствия для любого предлагаемого внешнего управления автономной системой управления жизнью (организмом). На высшем уровне эталонные ценности (цели) задаются наследственностью или адаптивными процессами.

Реорганизация в эволюции, развитии и обучении

Если организм контролирует неподходящие восприятия или если он контролирует некоторые восприятия в неподходящих значениях, то у него меньше шансов довести потомство до зрелости и он может умереть. Следовательно, в результате естественного отбора последующие поколения организмов развиваются так, что они контролируют те восприятия, которые при контроле с помощью соответствующих установок имеют тенденцию поддерживать критические внутренние переменные на оптимальном уровне или, по крайней мере, в несмертельных пределах. Пауэрс назвал эти критические внутренние переменные «внутренними переменными» («существенными переменными» Эшби).

Механизм, влияющий на развитие структур восприятия, которые необходимо контролировать, называется «реорганизацией»: это процесс внутри индивидуального организма, который подлежит естественному отбору, так же как и развитая структура особей внутри вида. [31]

Эту «систему реорганизации» предлагается рассматривать как часть наследственной структуры организма. Он изменяет базовые параметры и связность иерархии управления случайным образом. Существует базовая непрерывная скорость изменения внутренних переменных, которая происходит со скоростью, заданной общей ошибкой (и останавливается при нулевой ошибке), перемежающаяся случайными изменениями направления в гиперпространстве с таким количеством измерений, сколько имеется критических переменных. Это более или менее прямая адаптация « гомеостата » Эшби , впервые использованного в PCT в статье 1960 года [10] , а затем измененного для использования метода E. coli по восходящему градиенту питательных веществ, как описано Кошландом (1980). [32]

Реорганизация может произойти на любом уровне, когда потеря контроля на этом уровне приводит к отклонению внутренних (основных) переменных от генетически определенных заданных значений. Это основной механизм, участвующий в обучении методом проб и ошибок, который приводит к освоению более систематических видов процессов обучения. [33]

Психотерапия: метод уровней (МОЛ)

Концепция реорганизации привела к появлению метода психотерапии, называемого методом уровней (МОЛ). Используя MOL, терапевт стремится помочь пациенту переключить свое сознание на более высокие уровни восприятия, чтобы разрешить конфликты и позволить произойти реорганизации. [34]

Нейронаука

Обучение

В настоящее время не существует единой теории, объясняющей синаптические, нейрональные или системные основы обучения. Однако с 1973 года стала популярной идея о том, что долговременная потенциация (LTP) популяций синапсов вызывает обучение посредством как пре-, так и постсинаптических механизмов. [35] [36] LTP — это форма обучения Хебба , в которой предполагается, что высокочастотная тоническая активация цепи нейронов увеличивает эффективность, с которой они активируются, и размер их реакции на данный стимул по сравнению с стандартный нейрон (Хебб, 1949). [37] Эти механизмы лежат в основе знаменитого простого объяснения Хебба: «Те, кто стреляют вместе, соединяются вместе». [37]

ЛТП получила широкую поддержку с тех пор, как ее впервые заметил Терье Лёмо в 1966 году, и до сих пор является предметом многих современных исследований и клинических исследований. Однако существуют возможные альтернативные механизмы, лежащие в основе LTP, представленные Эноки, Ху, Гамильтоном и Файном в 2009 году [38] , опубликованные в журнале Neuron . Они признают, что LTP является основой обучения. Однако они сначала предполагают, что ДП возникает в отдельных синапсах, и эта пластичность является градуированной (в отличие от бинарного режима) и двунаправленной. [38] Во-вторых, группа предполагает, что синаптические изменения выражаются исключительно пресинаптически, через изменения вероятности высвобождения медиатора. [38] Наконец, команда прогнозирует, что возникновение ДП может зависеть от возраста, поскольку пластичность неонатального мозга будет выше, чем у зрелого. Таким образом, теории различаются: одна предполагает включение/выключение ДП за счет пре- и постсинаптических механизмов, а другая предполагает только пресинаптические изменения, градацию способностей и возрастную зависимость.

Эти теории сходятся в одном элементе ДП, а именно в том, что она должна происходить посредством физических изменений в синаптических мембранах, то есть синаптической пластичности. Теория перцептивного контроля охватывает обе эти точки зрения. Он предлагает механизм «реорганизации» в качестве основы обучения. Реорганизация происходит внутри внутренней системы управления человека или животного путем реструктуризации взаимо- и внутрисвязей ее иерархической организации, что сродни нейробиологическому феномену нейронной пластичности. Эта реорганизация сначала допускает форму обучения методом проб и ошибок, которая наблюдается у младенцев, а затем переходит к более структурированному обучению посредством ассоциаций, очевидному у младенцев, и, наконец, к систематическому обучению, охватывающему способность взрослых учиться как внутренне, так и самостоятельно. внешние стимулы и события. Таким образом, ПКТ обеспечивает действительную модель обучения, которая сочетает в себе биологические механизмы ДП с объяснением прогрессирования и изменения механизмов, связанных со способностями к развитию. [39] [40] [41] [42] [43]

Пауэрс в 2008 году смоделировал координацию рук. [24] Он предположил, что для перемещения руки задействованы четырнадцать систем управления, которые контролируют четырнадцать углов суставов, и они реорганизуются одновременно и независимо. Было обнаружено, что для оптимальной производительности выходные функции должны быть организованы таким образом, чтобы выходные данные каждой системы управления влияли только на одну воспринимаемую переменную окружающей среды. В этой симуляции процесс реорганизации работает так, как и должен, и точно так же, как предполагает Пауэрс, он работает и на людях, сокращая результаты, вызывающие ошибки, и увеличивая те, которые уменьшают ошибки. Первоначально возмущения оказывают большое влияние на углы суставов, но со временем углы суставов более точно соответствуют опорным сигналам из-за реорганизации системы. Пауэрс предполагает, что для достижения координации углов суставов для выполнения желаемых движений вместо расчета того, как несколько углов суставов должны измениться, чтобы произвести это движение, мозг использует системы отрицательной обратной связи для генерации необходимых углов суставов. Один опорный сигнал, который изменяется в системе более высокого порядка, может генерировать движение, требующее одновременного изменения нескольких углов суставов. [24]

Иерархическая организация

Ботвиник в 2008 году [44] предположил, что одним из основополагающих открытий когнитивной революции было признание иерархической структуры человеческого поведения. Однако, несмотря на десятилетия исследований, вычислительные механизмы, лежащие в основе иерархически организованного поведения, до сих пор полностью не изучены. Бедре, Хоффман, Куни и Д'Эспозито в 2009 году [45] предположили, что фундаментальная цель когнитивной нейронауки состоит в том, чтобы охарактеризовать функциональную организацию лобной коры, которая поддерживает контроль действий.

Недавние данные нейровизуализации подтвердили гипотезу о том, что лобные доли организованы иерархически, так что контроль поддерживается в постепенно каудальных областях по мере того, как контроль переходит к более конкретной спецификации действий. Однако до сих пор неясно, подвергаются ли процессоры управления более низкого порядка дифференцированному влиянию нарушений в управлении более высокого порядка, когда для выполнения задачи требуются межуровневые взаимодействия, или же существуют обратные влияния управления более низкого уровня на управление более высокого уровня. . [45]

Ботвиник в 2008 году [44] обнаружил, что все существующие модели иерархически структурированного поведения разделяют по крайней мере одно общее предположение – что иерархическая, частично-целая организация человеческих действий отражается во внутренних или нейронных представлениях, лежащих в ее основе. В частности, предполагается, что существуют репрезентации не только двигательного поведения низкого уровня, но также и отдельные репрезентации поведенческих единиц более высокого уровня. Последнее поколение моделей дает новое понимание, но также ставит новые или уточненные вопросы для эмпирических исследований, в том числе о том, как абстрактные представления действий возникают в процессе обучения, как они взаимодействуют с различными способами контроля действий и как они сортируются в префронтальной коре (ПФК). ).

Теория перцептивного контроля (PCT) может предоставить объяснительную модель нейронной организации, которая занимается текущими проблемами. ПКТ описывает иерархический характер поведения как определяемый контролем иерархически организованного восприятия. Системы контроля в организме и во внутренней среде, состоящей из миллиардов взаимосвязанных нейронов мозга, отвечают за поддержание сигналов восприятия в пределах выживаемости в непредсказуемо изменяющейся среде, из которой возникают эти восприятия. PCT не предполагает, что существует внутренняя модель, в рамках которой мозг имитирует поведение, прежде чем выдавать команды для выполнения этого поведения. Вместо этого одной из его характерных особенностей является принципиальная неорганизованность мозгового поведения. Скорее, поведение — это изменчивое средство организма, позволяющее уменьшить несоответствие между восприятием и эталонными значениями, основанными на различных внешних и внутренних факторах. [46] Поведение должно постоянно адаптироваться и меняться, чтобы организм мог поддерживать свои цели восприятия. Таким образом, PCT может объяснить абстрактное обучение посредством спонтанной реорганизации иерархии. РСТ предполагает, что конфликт возникает между несопоставимыми эталонными значениями для данного восприятия, а не между различными реакциями [13] и что обучение реализуется как изменение свойств систем управления методом проб и ошибок [27] , а не какой-либо конкретный ответ. усиленный . Таким образом, поведение остается адаптивным к окружающей среде по мере ее развития, а не полагается на заученные модели действий, которые могут не подходить.

Иерархии перцептивного контроля были смоделированы в компьютерных моделях и, как было показано, обеспечивают близкое соответствие поведенческим данным. Например, Маркен [47] провел эксперимент, сравнивая поведение компьютерной модели иерархии перцептивного контроля с поведением шести здоровых добровольцев в трех экспериментах. Участники должны были сохранять расстояние между левой линией и центральной линией, равное расстоянию между центральной линией и правой линией. Им также было поручено сохранять оба расстояния равными 2 см. В руках у них было 2 весла: одно контролировало левую линию, а другое — среднюю. Для этого им пришлось противостоять случайным возмущениям, приложенным к положению линий. Когда участники достигли контроля, им удалось свести на нет ожидаемый эффект возмущений, перемещая весла. Корреляция между поведением испытуемых и моделью во всех экспериментах приближалась к 0,99. Предполагается, что такая организация моделей иерархических систем управления информирует нас об организации человеческих субъектов, поведение которых она так точно воспроизводит.

Текущая ситуация и перспективы

Предыдущее объяснение принципов РСТ дает обоснование того, как эта теория может дать достоверное объяснение нейронной организации и как она может объяснить некоторые текущие проблемы концептуальных моделей.

Теория перцептивного контроля в настоящее время предлагает иерархию из 11 уровней восприятия, контролируемых системами человеческого разума и нейронной архитектурой. Это: интенсивность, ощущение, конфигурация, переход, событие, отношение, категория, последовательность, программа, принцип и системное понятие. Различные сигналы восприятия на более низком уровне (например, зрительное восприятие интенсивности) объединяются во входной функции для создания единого восприятия на более высоком уровне (например, визуальное восприятие цветового ощущения). Восприятия, которые создаются и контролируются на более низких уровнях, передаются как входные данные восприятия на более высокие уровни. Более высокие уровни, в свою очередь, управляют, корректируя эталонные уровни (цели) более низких уровней, фактически сообщая нижним уровням, что им следует воспринимать. [25] [33]

Хотя было разработано множество компьютерных демонстраций принципов, предложенные более высокие уровни трудно смоделировать, поскольку слишком мало известно о том, как мозг работает на этих уровнях. Изолированные процессы управления более высокого уровня можно исследовать, но модели обширной иерархии контроля все еще являются лишь концептуальными или, в лучшем случае, рудиментарными.

Теория перцептивного контроля не получила широкого признания в основной психологии, но эффективно использовалась в значительном диапазоне областей [48] [49] в области человеческого фактора, [50] клинической психологии и психотерапии («Метод уровней »), она является основой для значительного объема исследований в области социологии [51] и сформировала концептуальную основу для эталонной модели, используемой рядом исследовательских исследовательских групп НАТО . [52] Его преподают в нескольких университетах по всему миру, и он является предметом ряда докторских диссертаций. [53]

Последние подходы используют принципы теории перцептивного контроля для обеспечения новых алгоритмических основ искусственного интеллекта и машинного обучения . [54]

Избранная библиография

Социология

Рекомендации

  1. ^ аб Флегель, Марайке; Каспер, Йоханнес; Перье, Паскаль; Келл, Кристиан А. (30 марта 2023 г.). «Как концепция контроля влияет на наше понимание действий». Обзоры природы Неврология . 24 (5): 313–329. doi : 10.1038/s41583-023-00691-z. PMID  36997716. S2CID  257857085.
  2. ^ Гарольд Блэк и усилитель с отрицательной обратной связью, Рональд Клайн, журнал IEEE Control Systems, август 1993 г., том 13, выпуск 4, страницы 82-85
  3. ^ Беннетт, Стюарт (июнь 1996 г.). «Краткая история автоматического управления» (PDF) . Журнал IEEE Control Systems . 16 (3): 17–25. дои : 10.1109/37.506394. Архивировано из оригинала (PDF) 9 августа 2016 года . Проверено 18 июля 2016 г.
  4. ^ ab Кибернетика: или Управление и коммуникация в животном и машине . Париж: Hermann & Cie. 1948.2-е исправленное изд. 1961, MIT Press, Кембридж, Массачусетс. ISBN 978-0-262-73009-9
  5. ^ Эшби, Уильям Росс (1952). Дизайн для мозга. Лондон: Чепмен и Холл.
  6. ^ abc Runkel, Филип Дж. (1990). Забрасывание сетей и тестирование образцов: два великих метода психологии . Нью-Йорк: Прегер. п. 103. ИСБН 978-0-275-93533-7.
  7. ^ Чико, Гэри (2000), Что мы делаем: используя уроки Бернарда и Дарвина, чтобы понять, что, как и почему в нашем поведении, Кембридж, Массачусетс: MIT Press, стр. 9, ISBN 978-0-262-03277-3
  8. ^ аб Астром, Карл Дж.; Мюррей, Ричард М. (2008). Системы обратной связи: введение для ученых и инженеров (PDF) . Издательство Принстонского университета. ISBN 978-0-691-13576-2.
  9. ^ Дополнительную информацию об истории РСТ см.:
    • Интервью с Уильямом Т. Пауэрсом о происхождении и истории ПКТ (Часть первая – 20060722 (58,7M)
    • Интервью с Уильямом Т. Пауэрсом о происхождении и истории РСТ (Часть вторая – 20070728 (57,7M)
  10. ^ abc Powers, Уильям Т.; Кларк, РК; МакФарланд, Р.Л. (1960). «Общая теория человеческого поведения с обратной связью (Часть I)». Перцептивные и моторные навыки . 11 (1): 71–88. дои : 10.2466/pms.1960.11.1.71. S2CID  145256548.и Пауэрс, Уильям Т.; Кларк, РК; МакФарланд, Р.Л. (1960). «Общая теория человеческого поведения с обратной связью (Часть II)». Перцептивные и моторные навыки . 11 (3): 309–323. дои : 10.2466/pms.1960.11.3.309. S2CID  220712715.[Перепечатано в Берталанфи, Людвиг фон; Рапопорт, Анатол (1960), Общие системы: Ежегодник Общества общих системных исследований , том. 5, Анн-Арбор, Мичиган: Общество общих системных исследований., стр. 63-73, 75-83. Частичное переиздание в Smith, AG (1966). Коммуникация и культура . Нью-Йорк: Холт, Райнхарт и Уинстон.]
  11. ^ Архивы группы систем управления (CSG), также на форуме IAPCT Discourse.
  12. ^ abc Маркен, Ричард С. (июнь 2009 г.). «Вы говорите, что у вас произошла революция: Методологические основы замкнутой психологии». Обзор общей психологии . 13 (2): 137–145. дои : 10.1037/a0015106. S2CID  145458091.
  13. ^ Аб Мэнселл, Уоррен (2011). «Контроль восприятия должен быть реализован как фундаментальное свойство нервной системы». Темы когнитивной науки . 3 (2): 257–261. дои : 10.1111/j.1756-8765.2011.01140.x. ПМИД  25164294.
  14. ^ Мэнселл, Уоррен; Кэри, Тимоти А. (28 ноября 2015 г.). «Революция перцептивного контроля?». Психолог . Британское психологическое общество . Проверено 17 июля 2016 г.
  15. ^ Мэнселл, Уоррен, изд. (2020). Междисциплинарный справочник по теории перцептивного управления: Живые системы управления IV . Кембридж: Академическая пресса. ISBN 978-0128189481.
  16. ^ Пауэрс, Уильям Т. (1978). «Количественный анализ целевых систем: некоторые подготовительные работы по основам научной психологии». Психологический обзор . 85 (5): 417–435. дои : 10.1037/0033-295X.85.5.417.
  17. ^ «Бихевиорист спрашивает: почему бы нам не сделать то, что мы можем наблюдать, настоящей областью психологии? Давайте ограничимся вещами, которые можно наблюдать, и сформулируем законы, касающиеся только этих вещей. Что же мы можем наблюдать? Мы можем наблюдать поведение – то, что организм делает или говорит». Уотсон, Дж. Б. (1924). Бихевиоризм . Нью-Йорк: Издательство Народного института.
  18. ^ abc Runkel, Филип Дж. (2003). Люди как живые существа . Хейворд, Калифорния: Издательство Living Control Systems. ISBN 978-0-9740155-0-7.
  19. ^ Миллер, Джордж; Галантер, Юджин; Прибрам, Карл (1960). Планы и структура поведения. Нью-Йорк : Холт, Райнхарт и Уинстон . ISBN 978-0-03-010075-8.
  20. ^ Рункель, Филип Дж. (2003). Люди как живые существа . Хейворд, Калифорния: Издательство Living Control Systems. стр. 77–79. ISBN 978-0-9740155-0-7.
  21. ^ Маркен, Ричард С. (2001). «Контролируемые переменные: психология, как ее видит центральный игрок». Американский журнал психологии . 114 (2): 259–281. CiteSeerX 10.1.1.554.9588 . дои : 10.2307/1423517. JSTOR  1423517. PMID  11430151. 
  22. ^ См., например, работы Генри Иня, перечисленные в Google Scholar.
  23. ^ См. Runkel 1990 [6] об ограничениях статистических методов и ценности индивидуальных данных о производительности.
  24. ^ abcd Powers, Уильям Т. (2008). Живые системы управления III: Факт контроля . Нью-Ханаан, Коннектикут: эталонные публикации. ISBN 978-0-9647121-8-8.[Математическое приложение доктора Ричарда Кеннауэя. Включает компьютерные программы, позволяющие читателю продемонстрировать и экспериментально проверить теорию.]
  25. ^ abcde Powers, Уильям Т. (1973). Поведение: контроль восприятия. ISBN 978-0-7045-0092-1.
  26. Инь, Генри Х. (18 ноября 2014 г.). «Как выходы базальных ганглиев формируют поведение». Достижения в области неврологии . 2014 (768313): 1–28. дои : 10.1155/2014/768313 .
  27. ^ аб Маркен, Ричард С.; Уильям Т., Пауэрс (1989), «Уровни намерения в поведении», в книге Хершбергер, Уэйн (ред.), Волевые действия , Достижения в психологии, том. 62, Амстердам: Elsevier BV, стр. 409–430, ISBN. 978-0-444-88318-6
  28. ^ Задокументировано, например, в Миранде, Хосе Луис Корона. 2009. Миранда, Хосе Луис Корона. 2009. «Применение фильтрации Калмана и ПИД-регулирования для прямого управления обратным маятником». Магистерская диссертация, Государственный университет Чико, Чико, Калифорния. Архивировано 4 марта 2016 г. в Wayback Machine .
  29. ^ Задокументировано у Пауэрса, Уильяма Т. и Ричарда Кеннауэя. (Под редакцией Дага Форсселла.) 2004. «Перевернутый маятник». Хейворд, Калифорния: Living Control Systems., с загружаемым исходным и исполняемым кодом. Более подробное изложение различий между PCT и теорией инженерного контроля с компьютерными демонстрациями и исходным кодом доступно по адресу http://www.livingcontrolsystems.com/demos/multiple_control/multiple_control.zip. Это одна из многих компьютерных демонстраций, которые доступны вместе с исходным кодом на сайте www.livingcontrolsystems.com/demos/tutor_pct.html.
  30. ^ Бернштейн, Николас. 1967. Координация и регулирование движений . Нью-Йорк: Пергамон Пресс.
  31. ^ Введение см. в статьях Byte о робототехнике и статье о происхождении цели в этом сборнике. Архивировано 4 июня 2007 г. в Wayback Machine .
  32. ^ Кошланд, Дэниел. (1980). Бактериальный хемотаксис как модель поведенческой системы . Нью-Йорк: Рэйвен Пресс.
  33. ^ Аб Чико, Гэри (1995). Без чудес. ISBN 978-0-262-03232-2..
  34. ^ Мэнселл, Уоррен; Кэри, Тимоти А; Тай, Сара (2012). Трансдиагностический подход к КПТ с использованием метода уровневой терапии: особенности . Отличительные особенности серии CBT. Милтон-Парк, Абингдон, Оксон; Нью-Йорк: Рутледж . дои : 10.4324/9780203081334. ISBN 9780415507639. OCLC  774499959.
  35. ^ Блисс, ТВП; Лёмо, Т. (1 июля 1973 г.). «Длительное усиление синаптической передачи в зубчатой ​​области анестезированного кролика после стимуляции перфорантного пути». Журнал физиологии . Уайли. 232 (2): 331–356. doi : 10.1113/jphysicalol.1973.sp010273 . ISSN  0022-3751. ПМЦ 1350458 . ПМИД  4727084. 
  36. ^ Блаженство, ТВ; Гарднер-Медвин, Арканзас; Лёмо, Т. (1973). «Синаптическая пластичность в формировании гиппокампа». Макромолекулы и поведение . 193 .
  37. ^ Аб Хебб, Дональд (1949). Организация поведения: Нейропсихологическая теория. Нью-Йорк: Wiley & Sons.
  38. ^ abc Эноки, Рёске; Ху, И-лин; Гамильтон, Дэвид; Хорошо, Алан (2009). «Выражение долгосрочной пластичности в отдельных синапсах гиппокампа является градуированным, двунаправленным и в основном пресинаптическим: оптический квантовый анализ». Нейрон . Эльзевир Б.В. 62 (2): 242–253. дои : 10.1016/j.neuron.2009.02.026 . ISSN  0896-6273. ПМИД  19409269.
  39. ^ Plooij, Франс X. (1984). Поведенческое развитие свободноживущих детенышей и младенцев шимпанзе . Норвуд, Нью-Джерси: Алекс.
  40. ^ ван де Рейт-Плоой, Хетти; Плоой, Франс (1987). «Растущая независимость, конфликтность и обучение в отношениях матери и ребенка у шимпанзе, находящихся на свободном выгуле». Поведение . 101 (1–3): 1–86. дои : 10.1163/156853987x00378.
  41. ^ Plooij, Франс X. (2003), Хейманн, М. (ред.), Трилогия разума , том. Периоды регрессии в младенчестве человека, Махва, Нью-Джерси: Эрлбаум, стр. 185–205.
  42. ^ Плоой, Франс X.; ван де Рейт-Плоой, Хетти (1990). «Переходы развития как последовательные реорганизации иерархии управления». Американский учёный-бихевиорист . 34 : 67–80. дои : 10.1177/0002764290034001007. S2CID  144183592.
  43. ^ ван де Рейт-Плоой, Хетти; Плоой, Франс (22 октября 2013 г.). «Недели чудес: как стимулировать умственное развитие вашего ребенка и помочь ему превратить 10 предсказуемых, замечательных и суетливых фаз в волшебные скачки вперед» . Арнем, Нидерланды: Издательство Kiddy World. п. 480. ИСБН 978-9491882005.
  44. ^ аб Ботвиник, Мэтью М. (2008). «Иерархические модели поведения и префронтальная функция». Тенденции в когнитивных науках . Эльзевир Б.В. 12 (5): 201–208. doi :10.1016/j.tics.2008.02.009. ISSN  1364-6613. ПМЦ 2957875 . ПМИД  18420448. 
  45. ^ аб Бедре, Хоффман, Куни и Д'Эспозито, 2009 г. [ нужна полная ссылка ]
  46. ^ Кулс, Арканзас (1985). «Мозг и поведение: иерархия систем обратной связи и контроль ввода». В Бейтсоне, PPG; Клопфер, Питер Х. (ред.). Перспективы этологии . Бостон, Массачусетс: Springer US. стр. 109–168. дои : 10.1007/978-1-4757-0232-3_5. ISBN 978-1-4757-0234-7.
  47. ^ Маркен, Ричард С. (август 1986 г.). «Перцептивная организация поведения: иерархическая модель управления скоординированными действиями». Журнал экспериментальной психологии: человеческое восприятие и деятельность . 12 (3): 267–276. дои : 10.1037/0096-1523.12.3.267. ПМИД  2943855.
  48. ^ "Революция перцептивного контроля?". Психолог .
  49. ^ Июньский выпуск Международного журнала человеко-компьютерных исследований за 1999 год содержал статьи, начиная от отслеживания компоновки кабины и заканчивая самооценкой и динамикой толпы.
  50. ^ PCT лежит в основе компонентного тестирования юзабилити .
  51. ^ Например: Макклелланд, Кент А. и Томас Дж. Фараро, ред. 2006, Цель, значение и действие: теории систем управления в социологии , Нью-Йорк: Пэлгрейв Макмиллан. (Макклелланд является соавтором главы 1 «Системное мышление в социологической теории» и автором главы 2 «Понимание процессов коллективного контроля»). Макклелланд, Кент, 2004 г., «Коллективный контроль восприятия: построение порядка из конфликта», Международный журнал человеко-компьютерных исследований 60:65-99. Макфейл, Кларк. 1991, Миф о безумной толпе Нью-Йорка: Альдин де Грюйтер.
  52. ^ том-28 ноября 2015 г. Отчеты этих групп доступны на странице публикаций Управления исследований и технологий НАТО: «Научные публикации Организации исследований и технологий НАТО». Архивировано из оригинала 23 июня 2010 г. Проверено 15 мая 2010 г.> под названиями РТО-ТР-030, РТО-ТР-ИСТ-021 и РТО-ТР-ИСТ-059.
  53. ^ Хейлиген, Фрэнсис. «Экономика как распределенная система управления обучением».
  54. ^ Монако, Джозеф Д.; Хван, Грейс М. (27 декабря 2022 г.). «Нейродинамические вычисления на информационных границах интеллектуальных систем». Когнитивные вычисления . дои : 10.1007/s12559-022-10081-9 . S2CID  255222711.

Внешние ссылки

Статьи

Аудио

Видео

Веб-сайты