stringtranslate.com

Распознавание объектов (когнитивная наука)

Визуальное распознавание объектов относится к способности идентифицировать объекты в поле зрения на основе визуального ввода. Одной из важных характеристик визуального распознавания объектов является «инвариантность объекта» или способность идентифицировать объекты при изменениях в подробном контексте, в котором рассматриваются объекты, включая изменения в освещении, позе объекта и фоновом контексте. [1]

Основные этапы распознавания объектов

Нейропсихологические данные подтверждают, что в процессе распознавания объектов выделяют четыре конкретных этапа. [2] [3] [4] Эти этапы следующие:

Этап 1. Обработка основных компонентов объекта, таких как цвет, глубина и форма.
Этап 2. Затем эти базовые компоненты группируются на основе сходства, предоставляя информацию о различных краях визуальной формы. Впоследствии может иметь место разделение фигуры и фона .
Этап 3. Визуальное представление сопоставляется со структурными описаниями в памяти.
Этап 4. К визуальному представлению применяются семантические атрибуты, обеспечивающие смысл и, следовательно, узнаваемость.

В рамках этих этапов существуют более конкретные процессы, которые происходят для завершения различных компонентов обработки. Кроме того, другие существующие модели предложили интегративные иерархии (сверху вниз и снизу вверх), а также параллельную обработку, в отличие от этой общей иерархии снизу вверх.

Иерархическая обработка распознавания

Обработка визуального распознавания обычно рассматривается как иерархия снизу вверх, в которой информация обрабатывается последовательно с возрастающей сложностью. Во время этого процесса корковые процессоры более низкого уровня, такие как первичная зрительная кора , находятся в нижней части иерархии. Корковые процессоры более высокого уровня, такие как нижневисочная кора (IT), находятся наверху, где облегчается визуальное распознавание. [5] Широко признанной иерархической теорией снизу вверх является описание «Распутывания» Джеймса ДиКарло [6], согласно которому каждый этап иерархически организованного вентрального зрительного пути выполняет операции для постепенного преобразования представлений объектов в легко извлекаемый формат. Напротив, все более популярной теорией обработки распознавания является теория обработки сверху вниз. Одна из моделей, предложенная Моше Баром (2003), описывает метод «сокращения», в котором ранние визуальные входы отправляются, частично анализируются, из ранней зрительной коры в префронтальную кору (PFC). Возможные интерпретации грубого визуального ввода генерируются в ПФК, а затем отправляются в нижневисочную кору (ИТ), впоследствии активируя соответствующие представления объектов, которые затем включаются в более медленный, восходящий процесс. Этот «сокращенный путь» призван минимизировать количество представлений объектов, необходимых для сопоставления, тем самым облегчая распознавание объектов. [5] Исследования поражений подтвердили это предложение, обнаружив более медленное время реакции у людей с поражениями ПФК, что предполагает использование только восходящей обработки. [7]

Константность объектов и теории распознавания объектов

Важным аспектом распознавания объектов является постоянство объекта: способность распознавать объект в различных условиях просмотра. Эти изменяющиеся условия включают ориентацию объекта, освещение и изменчивость объекта (размер, цвет и другие различия внутри категории). Чтобы зрительная система достигла постоянства объекта, она должна быть способна извлекать общность в описании объекта с разных точек зрения и описаний сетчатки.[9] Участники, которые выполняли задания по категоризации и распознаванию во время прохождения функционального магнитного поля, обнаружили увеличение притока крови, указывающее на активацию в определенных областях мозга. Задача категоризации состояла в том, что участники помещали объекты из канонических или необычных видов как внутренние или внешние объекты. Задача распознавания выполняется путем представления участникам изображений, которые они видели ранее. Половина этих изображений была в той же ориентации, что и ранее показанные, в то время как другая половина была представлена ​​в противоположной точке зрения. Области мозга, вовлеченные в ментальное вращение, такие как вентральные и дорсальные зрительные пути и префронтальная кора, показали наибольшее увеличение кровотока во время выполнения этих задач, что свидетельствует о том, что они имеют решающее значение для способности рассматривать объекты с разных углов. [8] Было создано несколько теорий, чтобы дать представление о том, как можно достичь постоянства объекта для целей распознавания объектов, включая теории, инвариантные к точке зрения, зависящие от точки зрения и теории множественных видов.

Теории, инвариантные к точке зрения

Теории инвариантности точки зрения предполагают, что распознавание объектов основано на структурной информации, такой как отдельные части, что позволяет распознаванию происходить независимо от точки зрения объекта. Соответственно, распознавание возможно с любой точки зрения, поскольку отдельные части объекта могут быть повернуты, чтобы соответствовать любому конкретному виду.[10] [ необходима цитата ] Эта форма аналитического распознавания требует мало памяти, поскольку необходимо кодировать только структурные части, что может создавать несколько представлений объектов через взаимосвязи этих частей и мысленное вращение.[10] [ необходима цитата ] Участникам исследования было представлено одно кодированное представление от каждого из 24 предварительно выбранных объектов, а также пять изображений-заполнителей. Затем объекты были представлены в центральном поле зрения либо в той же ориентации, либо в другой ориентации, чем исходное изображение. Затем участников попросили назвать, были ли представлены одинаковые или разные виды глубинной ориентации этих объектов. [9] Затем та же процедура была выполнена при представлении изображений в левом или правом поле зрения. Зависимое от точки зрения праймирование наблюдалось, когда тестовые виды предъявлялись непосредственно правому полушарию, но не когда тестовые виды предъявлялись непосредственно левому полушарию. Результаты подтверждают модель, согласно которой объекты хранятся в зависимости от точки зрения, поскольку результаты не зависели от того, можно ли восстановить тот же или другой набор частей из видов с разной ориентацией. [9]

3-D модельное представление

Эта модель, предложенная Марром и Нисихарой ​​(1978), утверждает, что распознавание объекта достигается путем сопоставления представлений трехмерной модели, полученных от визуального объекта, с представлениями трехмерной модели, хранящимися в памяти в качестве вертикальных предписаний формы. [ необходимо разъяснение ] [10] Благодаря использованию компьютерных программ и алгоритмов, И Юнфэн (2009) смог продемонстрировать способность человеческого мозга мысленно конструировать трехмерные изображения, используя только двухмерные изображения, которые появляются на сетчатке. Их модель также демонстрирует высокую степень постоянства формы, сохраняющуюся между двухмерными изображениями, что позволяет распознавать трехмерное изображение. [10] Представления трехмерной модели, полученные от объекта, формируются путем первоначального определения вогнутостей объекта, которые разделяют стимул на отдельные части. Недавние исследования показывают, что область мозга, известная как каудальная интрапариетальная область (CIP), отвечает за хранение наклона и уклона плоской поверхности, что позволяет распознавать вогнутость. [11] Розенбург и др. имплантировали обезьянам склеральную поисковую катушку для контроля положения глаз, одновременно регистрируя активацию отдельных нейронов из нейронов в CIP. Во время эксперимента обезьяны сидели на расстоянии 30 см от ЖК-экрана, на котором отображались визуальные стимулы. Сигналы бинокулярного несоответствия отображались на экране путем визуализации стимулов в виде зелено-красных анаглифов, а кривые наклона-наклона варьировались от 0 до 330. Один эксперимент состоял из точки фиксации, а затем предъявления стимула в течение 1 секунды. Затем активация нейронов регистрировалась с помощью хирургически вставленных микроэлектродов. Эта активация отдельных нейронов для определенных вогнутостей объектов привела к открытию того, что каждая ось отдельной части объекта, содержащей вогнутость, находится в хранилищах памяти. [11] Определение главной оси объекта помогает в процессе нормализации посредством мысленного вращения, которое требуется, поскольку в памяти хранится только каноническое описание объекта. Распознавание приобретается, когда точка зрения наблюдаемого объекта мысленно вращается, чтобы соответствовать сохраненному каноническому описанию. [ необходима цитата ]

Рисунок 1. Это изображение, созданное на основе теории распознавания по компонентам Бидермана (1987), является примером того, как объекты можно разбить на геоны.

Распознавание по компонентам

Расширение модели Марра и Нишихары, теория распознавания по компонентам , предложенная Бидерманом (1987), предполагает, что визуальная информация, полученная от объекта, делится на простые геометрические компоненты, такие как блоки и цилиндры, также известные как « геоны » (геометрические ионы), а затем сопоставляется с наиболее похожим представлением объекта, которое хранится в памяти, чтобы обеспечить идентификацию объекта (см. рисунок 1). [12]

Теории, зависящие от точки зрения

Теории, зависящие от точки зрения, предполагают, что распознавание объекта зависит от точки зрения, с которой он виден, подразумевая, что объекты, увиденные в новых точках зрения, снижают точность и скорость идентификации объекта. [13] Эта теория распознавания основана на более целостной системе, а не на частях, предполагая, что объекты хранятся в памяти с несколькими точками зрения и углами. Эта форма распознавания требует большого объема памяти, поскольку каждая точка зрения должна быть сохранена. Точность распознавания также зависит от того, насколько знакома наблюдаемая точка зрения объекта. [14]

Теория множественных взглядов

Эта теория предполагает, что распознавание объектов лежит в континууме точек зрения, где каждая точка зрения задействована для различных типов распознавания. На одном полюсе этого континуума механизмы, зависящие от точки зрения, используются для внутрикатегорийных различий, в то время как на другом полюсе механизмы, не зависящие от точки зрения, используются для категоризации объектов. [13]

Нейронные субстраты

альтернативный текст
Дорсальный поток показан зеленым цветом, а вентральный поток — фиолетовым.

Дорсальный и вентральный поток

Визуальную обработку объектов в мозге можно разделить на два пути обработки: дорсальный поток (как/где), который простирается от зрительной коры до теменных долей , и вентральный поток (что), который простирается от зрительной коры до нижневисочной коры (IT). Существование этих двух отдельных путей визуальной обработки было впервые предложено Унгерлейдером и Мишкиным (1982), которые на основе своих исследований повреждений предположили, что дорсальный поток участвует в обработке визуальной пространственной информации, такой как локализация объекта (где), а вентральный поток участвует в обработке визуальной информации об идентификации объекта (что). [15] После этого первоначального предложения было альтернативно предложено, что дорсальный путь должен быть известен как путь «Как», поскольку визуальная пространственная информация, обрабатываемая здесь, предоставляет нам информацию о том, как взаимодействовать с объектами, [16] Для целей распознавания объектов нейронный фокус находится на вентральном потоке .

Функциональная специализация в вентральном потоке

В вентральном потоке различные регионы предполагаемой функциональной специализации были обнаружены в исследованиях функциональной визуализации. Наиболее последовательно обнаруживаемые регионы мозга, демонстрирующие функциональную специализацию, — это веретенообразная область лица (FFA), которая показывает повышенную активацию для лиц по сравнению с объектами, парагиппокампальная область (PPA) для сцен по сравнению с объектами, экстрастриарная область тела (EBA) для частей тела по сравнению с объектами, MT+/V5 для движущихся стимулов по сравнению со статическими стимулами и латеральный затылочный комплекс (LOC) для различимых форм по сравнению с перемешанными стимулами. [17] (См. также: Нейронная обработка для отдельных категорий объектов )

Структурная обработка: латеральный затылочный комплекс

Было обнаружено, что латеральный затылочный комплекс (LOC) особенно важен для распознавания объектов на перцептивном структурном уровне. В исследовании, связанном с событиями [fMRI-en], в котором рассматривалась адаптация нейронов, активированных при визуальной обработке объектов, было обнаружено, что сходство формы объекта необходимо для последующей адаптации в LOC, но определенные характеристики объекта, такие как края и контуры, не являются таковыми. Это говорит о том, что активация в LOC представляет собой информацию о форме объекта более высокого уровня, а не простые характеристики объекта. [18] В связанном исследовании [fMRI-en] активация LOC, которая произошла независимо от визуальных сигналов представленного объекта, таких как движение, текстура или контрасты яркости, говорит о том, что различные визуальные сигналы низкого уровня, используемые для определения объекта, сходятся в «областях, связанных с объектом», чтобы помочь в процессе восприятия и распознавания. [19] Ни одна из упомянутых высокоуровневых данных о форме объекта, по-видимому, не предоставляет никакой [семантической] информации об объекте, поскольку LOC демонстрирует нейронную реакцию на различные формы, включая незнакомые, абстрактные объекты. [20]

Дальнейшие эксперименты предположили, что LOC состоит из иерархической системы избирательности формы, указывающей на большую селективную активацию в задних областях для фрагментов объектов, тогда как [передние-en] области показывают большую активацию для полных или частичных объектов. [21] Это согласуется с предыдущими исследованиями, которые предполагают иерархическое представление в вентральной височной коре, где первичная обработка признаков происходит в задних областях, а интеграция этих признаков в целый и значимый объект происходит в [передних-en] областях. [22]

Семантическая обработка

Семантические ассоциации позволяют быстрее распознавать объекты. Когда объект ранее был связан с каким-либо семантическим значением, люди более склонны правильно идентифицировать объект. Исследования показали, что семантические ассоциации позволяют гораздо быстрее распознавать объект, даже когда объект рассматривается под разными углами. Когда объекты рассматриваются под все более отклоняющимися углами от традиционной плоскости зрения, объекты, которые содержали усвоенные семантические ассоциации, имели более низкое время отклика по сравнению с объектами, которые не содержали никаких усвоенных семантических ассоциаций. [23] Таким образом, когда распознавание объектов становится все более трудным, семантические ассоциации позволяют распознавать намного легче. Аналогичным образом, субъект может быть подготовлен к распознаванию объекта, наблюдая за действием, которое просто связано с целевым объектом. Это показывает, что объекты имеют набор сенсорных, моторных и семантических ассоциаций, которые позволяют человеку правильно распознавать объект. [24] Это подтверждает утверждение о том, что мозг использует несколько частей при попытке точно идентифицировать объект.

Благодаря информации, предоставленной от [нейропсихологических-en] пациентов, была выявлена ​​диссоциация обработки распознавания между структурной и [семантической-en] обработкой, поскольку структурная, цветовая и ассоциативная информация могут быть выборочно нарушены. В одном исследовании ПЭТ были обнаружены области, которые участвуют в ассоциативной семантической обработке, включая левую переднюю верхнюю/ среднюю височную извилину и левый височный полюс по сравнению со структурной и цветовой информацией, а также правый височный полюс по сравнению только с задачами на принятие решения о цвете. [25] Эти результаты указывают на то, что сохраненные перцептивные знания и семантические знания включают отдельные корковые области в распознавании объектов, а также указывают на то, что существуют полушарные различия в височных областях.

Исследования также предоставили доказательства, указывающие на то, что визуальная семантическая информация сходится в веретенообразной извилине нижневисочных долей. В исследовании, в котором сравнивались семантические знания категории и атрибутов, было обнаружено, что они играют разные роли в том, как они способствуют распознаванию. Для категориальных сравнений боковые области веретенообразной извилины активировались живыми объектами, в сравнении с неживыми объектами, которые активировали медиальные области. Для сравнений атрибутов было обнаружено, что правая веретенообразной извилина активировалась глобальной формой, в сравнении с локальными деталями, которые активировали левую веретенообразной извилину. Эти результаты предполагают, что тип категории объекта определяет, какой регион веретенообразной извилины активируется для обработки семантического распознавания, тогда как атрибуты объекта определяют активацию либо в левой, либо в правой веретенообразной извилине в зависимости от того, обрабатывается ли глобальная форма или локальная деталь. [26]

Кроме того, было высказано предположение, что активация в [передних-en] областях веретенообразных извилин указывает на успешное распознавание. [27] Однако было обнаружено, что уровни активации зависят от семантической релевантности объекта. Термин семантическая релевантность здесь относится к «мере вклада семантических признаков в основное значение концепции». [28] Результаты показали, что объекты с высокой семантической релевантностью, такие как артефакты , создавали увеличение активации по сравнению с объектами с низкой семантической релевантностью, такими как природные объекты. [28] Это связано с предполагаемой повышенной сложностью различения природных объектов, поскольку они имеют очень похожие структурные свойства, что затрудняет их идентификацию по сравнению с артефактами. [27] Следовательно, чем легче идентифицировать объект, тем больше вероятность того, что он будет успешно распознан.

Другим условием, влияющим на успешное распознавание объектов, является контекстное облегчение . Считается, что во время задач по распознаванию объектов объект сопровождается «контекстной рамкой», которая предлагает семантическую информацию о типичном контексте объекта. [29] Было обнаружено, что когда объект находится вне контекста, распознавание объектов затрудняется более медленным временем реакции и большими неточностями по сравнению с задачами по распознаванию, когда объект находился в соответствующем контексте. [29] На основании результатов исследования с использованием [фМРТ-en] было высказано предположение, что в мозге существует «контекстная сеть» для контекстно-ассоциированных объектов с активностью, в основном обнаруженной в парагиппокампальной коре (ПГК) и ретроспленальном комплексе (РСК). [30] В ПГК активность в области парагиппокампального места (ППА) была обнаружена как предпочтительная для сцен, а не для объектов; Однако было высказано предположение, что активность в PHC для одиночных объектов в задачах контекстной фасилитации может быть обусловлена ​​последующим обдумыванием пространственной сцены, в которой объект контекстуально представлен. Дальнейшие эксперименты показали, что активация была обнаружена как для непространственных, так и для пространственных контекстов в PHC, хотя активация из непространственных контекстов была ограничена [передней-en] PHC и задней PHC для пространственных контекстов. [30]

Память узнавания

Когда кто-то видит объект, он знает, что это за объект, потому что он видел его в прошлом; это память распознавания . Не только аномалии вентрального (что) потока зрительного пути влияют на нашу способность распознавать объект, но и на то, как объект нам представляется. Одной из примечательных характеристик памяти визуального распознавания является ее замечательная емкость: даже после просмотра тысяч изображений в отдельных попытках люди с высокой точностью выполняют последующие тесты на память и помнят значительные детали об изображениях, которые они видели [31]

Контекст

Контекст позволяет добиться гораздо большей точности распознавания объектов. Когда идентифицируемый объект размыт, точность распознавания намного выше, когда объект помещен в знакомый контекст. В дополнение к этому, даже незнакомый контекст позволяет добиться более точного распознавания объектов по сравнению с объектом, показанным изолированно. [32] Это можно объяснить тем фактом, что объекты обычно видны в какой-то обстановке, а не без нее вообще. Когда обстановка, в которой находится объект, знакома зрителю, становится намного проще определить, что это за объект. Хотя контекст не требуется для правильного распознавания, он является частью ассоциации, которую человек создает с определенным объектом.

Контекст становится особенно важным при распознавании лиц или эмоций. Когда эмоции лица представлены без какого-либо контекста, способность, с которой кто-то может точно описать показываемую эмоцию, значительно ниже, чем когда контекст указан. Это явление остается верным для всех возрастных групп и культур, что означает, что контекст имеет важное значение для точного определения эмоций лица для всех людей. [33]

Знакомство

Знакомство — это механизм, который не зависит от контекста в том смысле, что то, что человек узнает, просто ощущается знакомым, не тратя время на то, чтобы выяснить, в каком контексте он знает объект. [34] Вентро-латеральная область лобной доли участвует в кодировании памяти во время случайного обучения, а затем в поддержании и извлечении семантических воспоминаний. [34] Знакомство может вызывать перцептивные процессы, отличные от процессов незнакомых объектов, что означает, что наше восприятие конечного числа знакомых объектов уникально. [35] Отклонения от типичных точек зрения и контекстов могут влиять на эффективность, с которой объект распознается наиболее эффективно. [35] Было обнаружено, что не только знакомые объекты распознаются более эффективно, если смотреть с знакомой точки зрения, а не с незнакомой, но этот принцип также применим к новым объектам. Это приводит к мысли, что представления объектов в нашем мозге организованы в более знакомой манере объектов, наблюдаемых в окружающей среде. [35] Распознавание в значительной степени обусловлено не только формой объекта и/или видом, но и динамической информацией. [36] Знакомство может способствовать восприятию динамических точечных световых дисплеев, движущихся объектов, пола лиц и распознаванию лиц. [35]

Воспоминание

Воспоминание имеет много общего со знакомством; однако оно зависит от контекста и требует конкретной информации из исследуемого инцидента. [34]

Нарушения

Потеря распознавания объектов называется зрительной агнозией объектов . Существует две основные категории зрительной агнозии объектов : апперцептивная и ассоциативная. Когда объектная агнозия возникает из-за поражения в доминирующем полушарии, часто наблюдается глубокое связанное с этим нарушение языка, включая потерю значения слов.

Эффекты поражений в вентральном потоке

Распознавание объектов — сложная задача, которая затрагивает несколько различных областей мозга, а не только одну. Если повреждена одна область, то распознавание объектов может быть нарушено. Основная область распознавания объектов находится в височной доле . Например, было обнаружено, что поражения околоносовой коры у крыс вызывают нарушения распознавания объектов, особенно при увеличении неоднозначности признаков. [37] Неонатальные аспирационные поражения миндалевидного комплекса у обезьян, по-видимому, приводят к большей потере памяти об объектах, чем ранние поражения гиппокампа. Однако у взрослых обезьян нарушение памяти об объектах лучше объясняется повреждением околоносовой и энторинальной коры , чем повреждением миндалевидных ядер. [38] Комбинированные поражения миндалевидной и гиппокампальной областей (A + H) у крыс ухудшают выполнение задачи по распознаванию объектов, когда интервалы удержания увеличиваются за пределы 0 с и когда тестовые стимулы повторяются в течение сеанса. Повреждение [амигдалы-en] или [гиппокампа-en] не влияет на распознавание объектов, тогда как повреждение A + H вызывает явные дефициты. [39] В задаче на распознавание объектов уровень различения был значительно ниже при электролитических поражениях бледного шара (часть базальных ганглиев ) у крыс по сравнению с Substantia-Innominata/Ventral Pallidum, который, в свою очередь, был хуже по сравнению с контрольной группой и медиальной перегородкой/вертикальной диагональной полосой Брока; однако, только бледный шар не различал новые и знакомые объекты. [40] Эти поражения повреждают вентральный (что) путь визуальной обработки объектов в мозге.

Зрительные агнозии

Агнозия встречается редко и может быть результатом инсульта, слабоумия, черепно-мозговой травмы, инфекции мозга или наследственной. [41] Апперцептивная агнозия — это дефицит восприятия объектов, создающий неспособность понимать значение объектов. [34] Аналогично, ассоциативная зрительная агнозия — это неспособность понимать значение объектов; однако на этот раз дефицит заключается в семантической памяти. [34] Обе эти агнозии могут влиять на путь распознавания объектов, как в теории зрения Марра. Более конкретно, в отличие от апперцептивной агнозии, пациенты с ассоциативной агнозией более успешны в задачах рисования, копирования и сопоставления; однако эти пациенты демонстрируют, что они могут воспринимать, но не распознавать. [41] Интегративная агнозия (подтип ассоциативной агнозии) — это неспособность интегрировать отдельные части для формирования цельного изображения. [34] При этих типах агнозии происходит повреждение вентрального (что) потока пути обработки зрительной информации. Объектно-ориентационная агнозия — это неспособность извлечь ориентацию объекта, несмотря на адекватное распознавание объекта. [34] При этом типе агнозии происходит повреждение дорсального (где) потока пути обработки зрительной информации. Это может повлиять на распознавание объектов с точки зрения знакомства и, тем более, незнакомых объектов и точек зрения. Трудность распознавания лиц можно объяснить прозопагнозией . Человек с прозопагнозией не может идентифицировать лицо, но все еще способен воспринимать возраст, пол и эмоциональное выражение. [41] Область мозга, которая отвечает за распознавание лиц, — это веретенообразная область лица . Прозопагнозия также может быть разделена на апперцептивный и ассоциативный подтипы. Распознавание отдельных стульев, автомобилей, животных также может быть нарушено; поэтому эти объекты имеют схожие перцептивные черты с лицом, которые распознаются в веретенообразной области лица. [41]

болезнь Альцгеймера

Различие между категорией и атрибутом в семантическом представлении может информировать о нашей способности оценивать семантическую функцию при старении и болезненных состояниях, влияющих на семантическую память, таких как болезнь Альцгеймера (БА). [42] Из-за дефицита семантической памяти люди с болезнью Альцгеймера испытывают трудности с распознаванием объектов, поскольку семантическая память , как известно, используется для извлечения информации для наименования и категоризации объектов. [43] Фактически, широко обсуждается, отражает ли дефицит семантической памяти при БА потерю семантических знаний для определенных категорий и концепций или потерю знаний перцептивных особенностей и атрибутов. [42]

Смотрите также

Ссылки

  1. ^ Ульман, С. (1996) Видение высокого уровня, MIT Press
  2. ^ Хамфрис Г., Прайс К., Риддок Дж. (1999). «От объектов к именам: подход когнитивной нейронауки». Психологические исследования . 62 (2–3): 118–130. doi :10.1007/s004260050046. PMID  10472198. S2CID  13783299.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  3. ^ Риддок, М. и Хамфрис, Г. (2001). Распознавание объектов. В B. Rapp (ред.), Справочник по когнитивной нейропсихологии. Hove: Psychology Press.
  4. ^ Уорд, Дж. (2006). Руководство для студентов по когнитивной нейронауке. Нью-Йорк: Psychology Press.
  5. ^ ab Bar M (2003). «Кортикальный механизм запуска нисходящего упрощения распознавания визуальных объектов». Журнал когнитивной нейронауки . 15 (4): 600–609. CiteSeerX 10.1.1.296.3039 . doi :10.1162/089892903321662976. PMID  12803970. S2CID  18209748. 
  6. ^ DiCarlo JJ, Cox DD (2007). «Распутывание инвариантного распознавания объектов». Trends Cogn Sci . 11 (8): 333–41. doi :10.1016/j.tics.2007.06.010. PMID  17631409. S2CID  11527344.
  7. ^ Richer F., Boulet C. (1999). "Frontal injury and variations in response preparation" (PDF) . Brain and Cognition . 40 (1): 234–238. doi :10.1006/brcg.1998.1067. PMID  10373286. Архивировано из оригинала (PDF) 2018-01-18 . Получено 2018-01-17 .
  8. ^ Шенден, Халин (2008). «Там, где зрение встречается с памятью: префронтально-задние сети для постоянства визуального объекта во время категоризации и распознавания». Нейропсихология и невролог . 18 (7): 1695–1711.
  9. ^ ab Burgund, E. Darcy; Marsolek, Chad J. (2000). «Инвариантное и зависимое от точки зрения распознавание объектов в диссоциируемых нейронных подсистемах». Psychonomic Bulletin & Review . 7 (3): 480–489. doi : 10.3758/BF03214360 . ISSN  1069-9384. PMID  11082854.
  10. ^ ab Yunfeng, Yi (2009). «Вычислительная модель, которая восстанавливает трехмерную форму объекта из одного двухмерного ретинального представления». Vision Research . 49 (9): 979–991. doi : 10.1016/j.visres.2008.05.013 . PMID  18621410.
  11. ^ ab Розенберг, Ари (2013). «Визуальное представление ориентации трехмерных объектов в теменной коре». Журнал нейронауки . 33 (49): 19352–19361. doi :10.1523/jneurosci.3174-13.2013. PMC 3850047. PMID 24305830  . 
  12. ^ Бидерман И (1987). «Распознавание по компонентам: теория понимания человеческого образа». Psychological Review . 94 (2): 115–147. CiteSeerX 10.1.1.132.8548 . doi :10.1037/0033-295x.94.2.115. PMID  3575582. S2CID  8054340. 
  13. ^ ab Tarr M., Bulthoff H. (1995). «Лучше ли описывать человеческое распознавание объектов с помощью геоструктурных описаний или с помощью множественных представлений? Комментарий к Biederman и Gerhardstein (1993)». Журнал экспериментальной психологии: восприятие и производительность человека . 21 (6): 1494–1505. doi :10.1037/0096-1523.21.6.1494. PMID  7490590.
  14. ^ Петерсон, М.А. и Роудс, Г. (ред.). (2003). Восприятие лиц, объектов и сцен: аналитические и целостные процессы. Нью-Йорк: Oxford University Press.
  15. ^ Унгерлейдер, LG, Мишкин, M., 1982. Две корковые зрительные системы. В: Ingle, DJ, Goodale, MA, Mansfield, RJW (ред.), Анализ визуального поведения. InMIT Press, Кембридж, стр. 549–586.
  16. ^ Гудейл М., Милнер А. (1992). «Раздельные зрительные пути для восприятия и действия». Тенденции в нейронауках . 15 (1): 20–25. CiteSeerX 10.1.1.207.6873 . doi :10.1016/0166-2236(92)90344-8. PMID  1374953. S2CID  793980. 
  17. ^ Спиридон М., Фишль Б., Канвишер Н. (2006). «Расположение и пространственный профиль категорийно-специфических регионов в экстрастриарной коре человека». Картирование человеческого мозга . 27 (1): 77–89. doi :10.1002/hbm.20169. PMC 3264054 . PMID  15966002. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  18. ^ Куртци З., Канвишер Н. (2001). «Представление воспринимаемой формы объекта латеральным затылочным комплексом человека». Science . 293 (5534): 1506–1509. Bibcode :2001Sci...293.1506K. doi : 10.1126/science.1061133 . PMID  11520991. S2CID  2942593.
  19. ^ Grill-Spector K.; Kushnir T.; Edelman S.; Itzchak Y.; Malach R. (1998). «Cue-invariant activation in object-related areas of the human occipital lobe». Neuron . 21 (1): 191–202. doi : 10.1016/s0896-6273(00)80526-7 . PMID  9697863.
  20. ^ Malach R.; Reppas J.; Benson R.; Kwong K.; Jiang H.; Kennedy W.; et al. (1995). «Объектно-связанная активность, выявленная с помощью функциональной магнитно-резонансной томографии в затылочной коре человека». Труды Национальной академии наук США . 92 (18): 8135–8139. Bibcode : 1995PNAS...92.8135M. doi : 10.1073 /pnas.92.18.8135 . PMC 41110. PMID  7667258. 
  21. ^ Grill-Spector K., Kourtzi Z., Kanwisher N. (2001). «Боковой затылочный комплекс и его роль в распознавании объектов». Vision Research . 42 (10–11): 1409–1422. doi : 10.1016/s0042-6989(01)00073-6 . PMID  11322983.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  22. ^ Ungerleider, LG, Mishkin, M., 1982. Две корковые зрительные системы. В: Ingle, DJ, Goodale, MA, Mansfield, RJW (ред.), Анализ визуального поведения. InMIT Press, Кембридж, стр. 549–586.
  23. ^ Коллинз и Керби (2013). «Концептуальное знание ослабляет зависимость от точки зрения при визуальном распознавании объектов». Visual Cognition . 21 (8): 945–960. doi :10.1080/13506285.2013.836138. S2CID  144846924.
  24. ^ Хельбиг и др. (2009). «Наблюдение за действием может способствовать визуальному распознаванию объектов». Exp Brain Res . 200 (3–4): 251–8. doi :10.1007/s00221-009-1953-8. PMC 2820217. PMID  19669130 . 
  25. ^ Келленбах М., Ховиус М., Паттерсон К. (2005). «Исследование визуального и семантического знания об объектах с помощью ПЭТ». Cortex . 41 (2): 121–132. doi :10.1016/s0010-9452(08)70887-6. PMID  15714895. S2CID  4476793.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  26. ^ Wierenga C., Perlstein W., Benjamin M., Leonard C., Rothi L., Conway T.; et al. (2009). «Нейронные субстраты идентификации объектов: Функциональные магнитно-резонансные доказательства того, что категория и визуальный атрибут вносят вклад в семантическое знание». Журнал Международного нейропсихологического общества . 15 (2): 169–181. doi :10.1017/s1355617709090468. PMID  19232155. S2CID  9987685.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  27. ^ ab Gerlach C (2009). «Категорийная специфичность в распознавании визуальных объектов». Cognition . 111 (3): 281–301. doi :10.1016/j.cognition.2009.02.005. PMID  19324331. S2CID  13572437.
  28. ^ ab Mechelli A., Sartori G., Orlandi P., Price C. (2006). «Семантическая релевантность объясняет эффекты категорий в медиальных веретенообразных извилинах». NeuroImage . 30 (3): 992–1002. doi :10.1016/j.neuroimage.2005.10.017. hdl : 11577/1565416 . PMID  16343950. S2CID  17635735.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  29. ^ ab Bar M., Ullman S. (1996). «Пространственный контекст в распознавании». Восприятие . 25 (3): 343–352. doi :10.1068/p250343. PMID  8804097. S2CID  10106848.
  30. ^ ab Bar M., Aminoff E. (2003). «Кортикальный анализ визуального контекста». Neuron . 38 (2): 347–358. doi : 10.1016/s0896-6273(03)00167-3 . PMID  12718867.
  31. ^ Брэди ТФ, Конкл Т, Альварес ГА, Олива А (2008). «Визуальная долговременная память имеет огромную емкость для хранения деталей объекта». Proc Natl Acad Sci USA . 105 (38): 14325–9. Bibcode : 2008PNAS..10514325B. doi : 10.1073/pnas.0803390105 . PMC 2533687. PMID  18787113 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  32. ^ Баренхольц и др. (2014). «Количественная оценка роли контекста в распознавании визуальных объектов». Visual Cognition . 22 : 30–56. doi :10.1080/13506285.2013.865694. S2CID  144891703.
  33. ^ Theurel; et al. (2016). «Интеграция визуальной контекстной информации в распознавание эмоций на лице у детей в возрасте от 5 до 15 лет». Журнал экспериментальной детской психологии . 150 : 252–271. doi : 10.1016/j.jecp.2016.06.004. PMID  27367301.
  34. ^ abcdefg Уорд, Дж. (2006). Руководство для студентов по когнитивной нейронауке. Нью-Йорк: Psychology Press
  35. ^ abcd Bulthoff I., Newell F. (2006). "Роль знакомства в распознавании статических и динамических объектов". Визуальное восприятие - Основы зрения: низко- и среднеуровневые процессы восприятия . Прогресс в исследовании мозга. Том 154. С. 315–325. doi :10.1016/S0079-6123(06)54017-8. hdl :21.11116/0000-0004-9C5A-8. ISBN 9780444529664. PMID  17010720.
  36. ^ Vuong, Q., & Tarr, M. (2004). Направление вращения влияет на распознавание объектов
  37. ^ Норман Г., Икотт М. (2004). «Нарушение распознавания объектов с увеличением уровня неоднозначности признаков у крыс с поражениями периринальной коры». Behavioural Brain Research . 148 (1–2): 79–91. doi :10.1016/s0166-4328(03)00176-1. PMID  14684250. S2CID  42296072.
  38. ^ Башевалье, Ж., Борегард, М. и Альварадо, М. К. (1999). Долгосрочные эффекты неонатального повреждения гиппокампа и миндалевидного комплекса на различение и распознавание объектов у макак-резусов. Поведенческая нейронаука , 113.
  39. ^ Aggleton JP, Blindt HS, Rawlins JNP (1989). «Влияние поражений миндалевидного тела и миндалевидно-гиппокампального пространства на распознавание объектов и пространственную рабочую память у крыс». Behavioral Neuroscience . 103 (5): 962–974. doi :10.1037/0735-7044.103.5.962. PMID  2803563. S2CID  18503443.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  40. ^ Эннасер А. (1998). «Влияние поражений субстанции Innominata/вентрального бледного шара, бледного шара и медиальной перегородки на выполнение крысами задач по распознаванию объектов и радиальному лабиринту: лечение физостигмином и амфетамином». Фармакологические исследования . 38 (4): 251–263. doi :10.1006/phrs.1998.0361. PMID  9774488.
  41. ^ abcd Бауэр, Р. М. (2006). Агнозии. DC, США: Американская психологическая ассоциация: Вашингтон
  42. ^ ab Hajilou BB, Done DJ (2007). «Доказательства диссоциации структурного и семантического знания при деменции альцгеймеровского типа (DAT)». Neuropsychologia . 45 (4): 810–816. doi :10.1016/j.neuropsychologia.2006.08.008. PMID  17034821. S2CID  21628550.
  43. ^ Laatu S., Jaykka H., Portin R., Rinne J. (2003). «Визуальное распознавание объектов при ранней болезни Альцгеймера: дефициты семантической обработки». Acta Neurologica Scandinavica . 108 (2): 82–89. doi : 10.1034/j.1600-0404.2003.00097.x . PMID  12859283. S2CID  22741928.{{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )