stringtranslate.com

Геон (психология)

Геоны — это простые 2D- или 3D-формы, такие как цилиндры , кирпичи , клинья , конусы , круги и прямоугольники, соответствующие простым частям объекта в теории распознавания по компонентам Бидермана . [1] Теория предполагает, что визуальный ввод сопоставляется со структурными представлениями объектов в мозге . Эти структурные представления состоят из геонов и их отношений (например, рожок мороженого можно разбить на сферу, расположенную над конусом ). Предполагается лишь скромное количество геонов (<40). При объединении в различных отношениях друг к другу (например, сверху, больше, чем, конец к концу, конец к середине) и грубой метрической вариации, такой как соотношение сторон и 2D-ориентация, могут быть сгенерированы миллиарды возможных 2- и 3-геонных объектов. Два класса визуальной идентификации на основе формы, которые не осуществляются посредством геонных представлений, это те, которые участвуют в: a) различении похожих лиц и b) классификациях, которые не имеют определенных границ, таких как кусты или мятая одежда. Обычно такие идентификации не являются инвариантными относительно точки зрения.

Свойства геонов

Два случая двух взаимосвязанных геонов. Что представляет себе читатель в каждом случае?

Существует 4 основных свойства геонов:

  1. Инвариантность вида: Каждый геон можно отличить от других практически с любой точки зрения, за исключением «случайностей» под очень ограниченными углами, в которых один геон проецирует изображение, которое может быть другим геоном, как, например, когда вид цилиндра с торца может быть сферой или кругом. Объекты, представленные как расположение геонов, будут, аналогично, инвариантны относительно точки зрения.
  2. Стабильность или устойчивость к визуальному шуму: поскольку геоны просты, они легко поддерживаются свойством гештальта плавного продолжения, что делает их идентификацию устойчивой к частичной окклюзии и ухудшению качества изображения визуальным шумом, например, когда цилиндр можно увидеть за кустом.
  3. Инвариантность к направлению освещения, маркировке и текстуре поверхности.
  4. Высокая различимость: Геоны различаются качественно, только двумя или тремя уровнями атрибутов, такими как прямой против изогнутого, параллельный против непараллельного, положительная против отрицательной кривизны. Эти качественные различия можно легко различить, таким образом делая геоны легко различимыми, а объекты, составленные таким образом, легко различимыми.

Вывод инвариантных свойств геонов

Инвариантность точки зрения: Инвариантность точки зрения геонов вытекает из того, что они отличаются тремя неслучайными свойствами (NAP) контуров, которые не меняются с ориентацией по глубине:

  1. Независимо от того, является ли контур прямым или изогнутым,
  2. Вершина, которая образуется, когда два или три контура совпадают (то есть заканчиваются вместе в одной точке) на изображении, т. е. L (2 контура), вилка (3 контура со всеми углами < 180°) или стрелка (3 контура с одним углом > 180°), и
  3. Является ли пара контуров параллельной или нет (с учетом перспективы). Если контуры не параллельны, они могут быть прямыми (сходящимися или расходящимся) или криволинейными, с положительной или отрицательной кривизной, образующей выпуклую или вогнутую огибающую соответственно (см. рисунок ниже).

NAP можно отличить от метрических свойств (MP), таких как степень ненулевой кривизны контура или его длина, которые изменяются при изменении ориентации по глубине.

Инвариантность к направлению освещения и характеристикам поверхности

Геоны можно определить по контурам, которые отмечают края на разрывах ориентации и глубины изображения объекта, т. е. контурам, которые задают хороший линейный рисунок формы или объема объекта. Разрывы ориентации определяют те края, где есть резкое изменение ориентации нормали к поверхности объема, как это происходит на контуре на границах разных сторон кирпича. Разрыв глубины - это то место, где линия зрения наблюдателя перескакивает с поверхности объекта на фон (т. е. касается поверхности), как это происходит на сторонах цилиндра. Один и тот же контур может отмечать как разрыв ориентации, так и разрыв глубины, как в случае с задним краем кирпича. Поскольку геоны основаны на этих разрывах, они инвариантны к изменениям в направлении освещения, теней, текстуры поверхности и маркировки.

Геоны и обобщенные конусы

Геоны составляют раздел набора обобщенных конусов, [2] , которые являются объемами, созданными при пересечении поперечного сечения вдоль оси. Например, круг, пересеченный вдоль прямой оси, будет определять цилиндр (см. рисунок). Прямоугольник, пересеченный вдоль прямой оси, будет определять «кирпич» (см. рисунок). Четыре измерения с контрастными значениями (т. е. взаимоисключающими значениями) определяют текущий набор геонов (см. рисунок):

  1. Форма поперечного сечения: круглая или прямая. Например, как указано выше, прямоугольник, развернутый вдоль прямой оси, будет определять «кирпич», а поперечное сечение будет прямым.
  2. Ось: прямая или изогнутая.
  3. Размер поперечного сечения, когда оно распространяется вдоль оси: постоянный против расширяющегося (или сжимающегося) против расширяющегося и сжимающегося против сжимающегося и расширяющегося. Размер поперечного сечения "кирпича" будет постоянным.
  4. Окончание геона с постоянными по размеру поперечными сечениями: усеченное против сходящегося в точку против закругленного.

Эти вариации в генерации геонов создают формы, которые различаются в NAP.

Экспериментальные проверки инвариантности точки зрения геонов

В настоящее время существует значительная поддержка основных предположений теории геонов (см. Теория распознавания по компонентам ). Одним из вопросов, вызвавших некоторую дискуссию, было открытие [3] , что геоны были инвариантны к точке зрения с небольшими или нулевыми затратами на скорость или точность распознавания или сопоставления геона из ориентации по глубине, ранее не испытанной. В некоторых исследованиях [4] сообщалось о скромных затратах на сопоставление геонов при новых ориентациях по глубине, но эти исследования имели несколько методологических недостатков. [5] [6]

Исследования геонов

Существует много исследований о геонах и о том, как они интерпретируются. Ким Киркпатрик-Стегер, Эдвард А. Вассерман и Ирвинг Бидерман обнаружили, что отдельные геоны вместе с их пространственным составом важны для распознавания. [7] Более того, результаты этого исследования, по-видимому, указывают на то, что неслучайная чувствительность может быть обнаружена у всех видов, различающих форму. [8]

Примечания

  1. ^ Бидерман, Ирвинг (1987). «Распознавание по компонентам: теория понимания человеческого образа» (PDF) . Psychological Review . 94 (2): 115–47. doi :10.1037/0033-295X.94.2.115. PMID  3575582.
  2. ^ Неватия, Р. (1982) Машинное восприятие. Prentice-Hall. [ нужна страница ]
  3. ^ Бидерман, Ирвинг; Герхардштейн, Питер К. (1993). «Распознавание объектов, вращающихся по глубине: доказательства и условия трехмерной инвариантности точки зрения» (PDF) . Журнал экспериментальной психологии: восприятие и производительность человека . 19 (6): 1162–82. doi :10.1037/0096-1523.19.6.1162. PMID  8294886.
  4. ^ Тарр, Майкл Дж.; Уильямс, Пеппер; Хейворд, Уильям Г.; Готье, Изабель (1998). «Распознавание трехмерных объектов зависит от точки зрения». Nature Neuroscience . 1 (4): 275–7. doi :10.1038/1089. PMID  10195159. S2CID  14389169.
  5. ^ Бидерман, И; Бар, М (1999). «Инвариантность точки зрения одного выстрела при сопоставлении новых объектов». Vision Research . 39 (17): 2885–99. doi : 10.1016/S0042-6989(98)00309-5 . PMID  10492817. S2CID  2494577.
  6. ^ Дилл, Маркус; Эдельман, Шимон (2001). «Несовершенная инвариантность к трансляции объектов при различении сложных форм». Восприятие . 30 (6): 707–24. doi :10.1068/p2953. PMID  11464559. S2CID  12607120.
  7. ^ Бидерман, Ирвинг; Киркпатрик-Стегер, Ким; Вассерман, Эдвард (1998). «Влияние удаления, перемешивания и движения Геона на распознавание изображений у голубей». Журнал экспериментальной психологии: процессы поведения животных . 24 (1): 34–46. doi :10.1037/0097-7403.24.1.34. PMID  9438964.
  8. ^ Бидерман, Ирвинг; Киркпатрик-Стегер, Ким; Вассерман, Эдвард (1998). «Влияние удаления, перемешивания и движения Геона на распознавание изображений у голубей». Журнал экспериментальной психологии: процессы поведения животных . 24 (1): 34–46. doi :10.1037/0097-7403.24.1.34. PMID  9438964.