stringtranslate.com

Гипотеза значимости V1

Гипотеза заметности V1 , или V1SH (произносится как «виш») — это теория [1] [2] о V1, первичной зрительной коре (V1) . Она предполагает, что V1 у приматов создает карту заметности поля зрения для управления зрительным вниманием или смещением взгляда экзогенно.

Важность

V1SH — единственная теория на сегодняшний день, которая не только наделила V1 очень важной когнитивной функцией, но и предоставила несколько нетривиальных теоретических предсказаний, которые впоследствии были экспериментально подтверждены. [2] [3] Согласно V1SH, V1 создает карту значимости из ретинальных входов для управления визуальным вниманием или сдвигами взгляда. [1] Анатомически V1 является воротами для ретинальных визуальных входов, поступающих в неокортекс , а также является крупнейшей корковой областью, посвященной зрению. В 1960-х годах Дэвид Хьюбел и Торстен Визель обнаружили, что нейроны V1 активируются крошечными участками изображения, которые достаточно велики, чтобы изобразить небольшую полосу [4], но не различимое лицо. Эта работа привела к Нобелевской премии, [5] и с тех пор V1 рассматривается как просто выполняющая функцию бэк-офиса (обработки изображений) для последующей когнитивной обработки в мозге за пределами V1. Однако прогресс в исследовании понимания последующей обработки оказался намного сложнее или медленнее, чем ожидалось (например, Хьюбелом и Визелем [6] ). Выходя за рамки традиционных взглядов, V1SH катализирует изменение фреймворка [7] , чтобы обеспечить новый прогресс в понимании зрения.

Видеть

Первичная зрительная кора
Первичная зрительная кора

для определения того, где в мозге находится первичная зрительная кора и относительно глаз.

V1SH утверждает, что V1 преобразует визуальные входы в карту заметности визуального поля для управления визуальным вниманием или направлением взгляда. [2] [1] Люди по сути слепы к визуальным входам за пределами их окна внимания. Таким образом, внимание управляет визуальным восприятием и осознанием , и теории визуального внимания являются краеугольными камнями теорий зрительных функций в мозге.

Карта заметности по определению вычисляется или вызывается внешним визуальным входом, а не внутренними факторами, такими как ожидания или цели животного (например, прочитать книгу). Поэтому говорят, что карта заметности направляет внимание экзогенно, а не эндогенно. Соответственно, эта карта заметности также называется картой заметности снизу вверх, чтобы направлять рефлекторные или непроизвольные переключения внимания. Например, она направляет наш взгляд на насекомое, летящее в нашем периферическом поле зрения, когда мы читаем книгу. Обратите внимание, что эта карта заметности, которая создается биологическим или естественным мозгом, не является тем же самым, что и вид карты заметности , которая создается в искусственном или компьютерном зрении, отчасти потому, что искусственные карты заметности часто включают факторы управления вниманием, которые являются эндогенными по своей природе.

На этой (биологической) карте заметности поля зрения каждое визуальное местоположение имеет значение заметности. Это значение определяется как сила этого местоположения, чтобы привлекать внимание экзогенно. [2] Таким образом, если местоположение A имеет более высокое значение заметности, чем местоположение B, то местоположение A с большей вероятностью привлечет визуальное внимание или взгляд сместится в его сторону, чем в сторону местоположения B. В V1 каждый нейрон может быть активирован только визуальными входами в небольшой области поля зрения. Эта область называется рецептивным полем этого нейрона и обычно охватывает не более размера монеты на расстоянии вытянутой руки. [8] Соседние нейроны V1 имеют соседние и перекрывающиеся рецептивные поля. [8] Следовательно, каждое визуальное местоположение может одновременно активировать много нейронов V1. Согласно V1SH, наиболее активированный нейрон среди этих нейронов сигнализирует о значении заметности в этом месте своей нейронной активностью. [1] [2] Реакция нейрона V1 на визуальные входы в пределах его рецептивного поля также зависит от визуальных входов за пределами рецептивного поля. [9] Следовательно, значение заметности в каждом месте зависит от контекста визуального входа. [1] [2] Так и должно быть, поскольку заметность зависит от контекста. Например, вертикальная полоса заметна на изображении, на котором все остальные визуальные элементы, окружающие ее, являются горизонтальными полосами, но эта же вертикальная полоса не заметна, если все эти другие элементы являются вертикальными полосами.

Нейронные механизмы в V1 для создания карты значимости

Карта заметности: представлена ​​картой максимальных нейронных реакций V1 на визуальные входы, одна максимальная реакция на визуальное местоположение

На рисунке выше представлена ​​схема нейронных механизмов в V1 для создания карты заметности. В этом примере изображение сетчатки имеет много фиолетовых полос, все они однородно ориентированы (наклонены вправо), за исключением одной полосы, которая ориентирована уникально (наклонена влево). Эта ориентация синглтона является наиболее заметной на этом изображении, поэтому она привлекает внимание или взгляд, как это наблюдается в психологических экспериментах. [10] В V1 многие нейроны имеют свои предпочтительные ориентации для визуальных входов. [8] Например, реакция нейрона на полосу в его рецептивном поле выше, когда эта полоса ориентирована в своей предпочтительной ориентации. Аналогично, многие нейроны V1 имеют свои предпочтительные цвета. [8] В этой схеме каждая входная полоса на сетчатке активирует два (группы) нейронов V1, один из которых предпочитает свою ориентацию, а другой предпочитает свой цвет. Ответы нейронов, активированных их предпочтительными ориентациями в рецептивных полях, визуализируются на схемах черными точками на плоскости, представляющей нейронные ответы V1. Аналогично, ответы нейронов, активированных их предпочтительными цветами в рецептивных полях, визуализируются фиолетовыми точками. Размеры точек визуализируют силу нейронных ответов V1. В этом примере наибольший ответ исходит от нейронов, предпочитающих и реагирующих на уникально ориентированный брусок. Это происходит из-за подавления изоориентации: когда два нейрона V1 находятся рядом друг с другом и имеют одинаковые или похожие предпочтительные ориентации, они имеют тенденцию подавлять активность друг друга. [9] [11] Таким образом, среди группы нейронов, которые предпочитают и реагируют на однородно ориентированные фоновые бруски, каждый нейрон получает подавление изоориентации от других нейронов этой группы. [1] [9] Между тем, нейрон, реагирующий на ориентационный синглтон, не принадлежит к этой группе и, таким образом, избегает этого подавления, [1] следовательно, его реакция выше, чем у других нейронных реакций. Изоцветное подавление [12] аналогично изоориентационному подавлению, поэтому все нейроны, предпочитающие и реагирующие на фиолетовые цвета входных полос, находятся под изоцветным подавлением. Согласно V1SH, максимальный ответ в месте расположения каждого столбца представляет собой значение заметности в месте расположения каждого столбца. [1] [2] Таким образом, это значение заметности является самым высоким в месте расположения ориентационного синглтона и представлено ответом от нейронов, предпочитающих и реагирующих на ориентацию этого синглтона. Эти значения заметности отправляются в верхний холмик , [13] область среднего мозга , для выполнения смещения взгляда на рецептивное поле наиболее активированного нейрона, реагирующего на визуальное входное пространство. [13]Таким образом, для этого входного изображения на рисунке выше ориентационный синглтон, который вызывает самую высокую реакцию V1 на это изображение, привлекает визуальное внимание или взгляд.

V1SH объясняет поведенческие данные о визуальном поиске/сегментации

V1SH может объяснить данные визуального поиска , такие как короткое время отклика для поиска уникального красного элемента среди зеленых элементов, или уникальной вертикальной полосы среди горизонтальных полос, или элемента, уникально движущегося вправо среди элементов, движущихся влево. Эти виды визуального поиска называются поиском признаков, когда цель поиска уникальна по базовому значению признака, такому как ориентация, цвет или направление движения. [10] [14] Краткость времени отклика поиска демонстрирует более высокое значение заметности в месте расположения цели поиска для привлечения внимания. V1SH также объясняет, почему требуется больше времени, чтобы найти уникальную красно-вертикальную полосу среди красно-горизонтальных полос и зеленых вертикальных полос. Это пример поиска по конъюнктуре, когда цель поиска уникальна только по конъюнктуре двух признаков, каждый из которых присутствует в визуальной сцене. [10]

Маскировка выступающей границы между двумя текстурами путем добавления однородной текстуры
Маскировка выступающей границы между двумя текстурами путем добавления однородной текстуры

Кроме того, V1SH объясняет данные, которые трудно объяснить с помощью альтернативных фреймворков. [10] [15] На рисунке выше показан пример: две соседние текстуры в A, одна из которых состоит из равномерно наклоненных влево полос, а другая из равномерно наклоненных вправо полос, очень легко сегментировать друг от друга человеческим зрением. Это связано с тем, что текстурные полосы на границе между двумя текстурами вызывают самые высокие нейронные реакции V1 (поскольку они меньше всего подавляются подавлением изоориентации), поэтому пограничные полосы являются наиболее заметными на изображении, привлекая внимание к границе. Однако сегментация становится намного сложнее, если текстура в B накладывается на исходное изображение в A (результат изображен в C). Это связано с тем, что в местах текстуры, не являющихся границей, нейронные реакции V1 на горизонтальные и вертикальные полосы (из B) выше, чем на наклонные полосы (из A); Эти более высокие ответы диктуют и повышают значения заметности в этих неграничных местах, делая границу более не столь конкурентоспособной в плане заметности. [16]

Влияние

Захват взгляда окулярным синглтоном
Захват взгляда окулярным синглтоном

V1SH был предложен в конце 1990-х годов [17] [18] Ли Чжаопином . Первоначально он не имел никакого влияния, поскольку в течение десятилетий считалось, что управление вниманием в основном или только контролируется областями мозга более высокого уровня. Эти области мозга более высокого уровня включают лобное поле глаза и теменные корковые области [19] в лобной и более передней части мозга, и они, как полагают, обладают интеллектом для управления вниманием и исполнительными функциями . Кроме того, первичная зрительная кора, V1, расположенная в затылочной доле в задней или задней части мозга, традиционно считалась зрительной областью низкого уровня, которая в основном играет вспомогательную роль для других областей мозга для их более важных зрительных функций. [8] Мнения начали меняться из-за удивительного фрагмента поведенческих данных: предмет, показанный одному глазу — одиночный предмет — среди похожих предметов, показанных другому глазу (например, с помощью очков для просмотра 3D-фильмов ), может автоматически привлекать взгляд или внимание. [20] [21] Пример проиллюстрирован на этом рисунке. Здесь изображение, содержащее одну букву «X», показано правому глазу, а другое изображение, содержащее массив тех же «X» и букву «O», показано левому глазу. В такой ситуации люди-наблюдатели обычно воспринимают изображение, напоминающее суперпозицию двух монокулярных изображений, так что они видят массив всех «X» и одну «O». «X», возникающий из изображения для правого глаза, не будет казаться отличительным. Тем не менее, даже когда они выполняют задачу поиска (в своем воспринимаемом изображении) уникальной и перцептивно отличительной «О» как можно быстрее, их взгляд автоматически или непроизвольно переключается на «Х», возникающий из изображения правого глаза, часто до того, как их взгляд переключается на «О». Захват внимания таким глазным синглтоном происходит даже тогда, когда наблюдатели не могут угадать, присутствует ли этот синглтон (если бы он отсутствовал на этом примере, все «Х» и один «О» были бы показаны только левому глазу). [20] Это наблюдение было контринтуитивным, [22] было легко воспроизведено другими исследователями зрения и было однозначно предсказано V1SH. Поскольку V1 является единственной зрительной корковой областью с нейронами, настроенными на глаз источника визуальных входов, [4] это наблюдение убедительно подтверждает роль V1 в управлении вниманием.

Последовали дополнительные эксперименты для дальнейшего изучения V1SH, [2] и подтверждающие данные, полученные с помощью функциональной визуализации мозга, [23] визуальной психофизики, [24] [25] и электрофизиологии обезьян [3] [26] [27] [28] (хотя см. некоторые противоречивые данные [29] ). С тех пор V1SH стал более популярным. [30] [31] V1 теперь рассматривается как один из краеугольных камней в сети механизмов внимания мозга, [32] [33] и его функциональная роль в управлении зрительным вниманием упоминается в справочниках [34] [35] и учебниках. [36] [37] Чжаопин утверждает, что если V1SH верна, то идеи [38] [39] о том, как работает зрительная система , и, следовательно, вопросы, которые следует задать для будущих исследований зрения, должны быть принципиально изменены. [7]

Ссылки

  1. ^ abcdefgh Ли, Чжаопин (2002-01-01). "Карта значимости в первичной зрительной коре". Тенденции в когнитивных науках . 6 (1): 9–16. doi :10.1016/S1364-6613(00)01817-9. ISSN  1364-6613. PMID  11849610. S2CID  13411369.
  2. ^ abcdefgh Чжаопин, Ли (2014). Гипотеза V1 — создание карты заметности снизу вверх для преаттентивного выбора и сегментации. Oxford University Press. ISBN 978-0-19-177250-4.
  3. ^ ab Янь, Инь; Чжаопин, Ли; Ли, У (2018-10-09). «Восходящая заметность и нисходящее обучение в первичной зрительной коре обезьян». Труды Национальной академии наук . 115 (41): 10499–10504. Bibcode : 2018PNAS..11510499Y. doi : 10.1073/pnas.1803854115 . ISSN  0027-8424. PMC 6187116. PMID 30254154  . 
  4. ^ ab Hubel, DH; Wiesel, TN (январь 1962). «Рецептивные поля, бинокулярное взаимодействие и функциональная архитектура зрительной коры кошки». Журнал физиологии . 160 (1): 106–154.2. doi :10.1113/jphysiol.1962.sp006837. ISSN  0022-3751. PMC 1359523. PMID 14449617  . 
  5. ^ "Нобелевская премия по физиологии и медицине 1981 года". NobelPrize.org . Получено 10 октября 2021 г. .
  6. ^ Хьюбел, Дэвид; Визель, Торстен (2012-07-26). «Дэвид Хьюбел и Торстен Визель». Neuron . 75 (2): 182–184. doi : 10.1016/j.neuron.2012.07.002 . ISSN  0896-6273. PMID  22841302. S2CID  12766897.
  7. ^ ab Zhaoping, Li (2019-10-01). «Новая структура для понимания зрения с точки зрения первичной зрительной коры». Current Opinion in Neurobiology . Computational Neuroscience. 58 : 1–10. doi :10.1016/j.conb.2019.06.001. ISSN  0959-4388. PMID  31271931. S2CID  195806018.
  8. ^ abcde "Первичная зрительная кора Мэтью Шмолески – Webvision" . Получено 2020-07-05 .
  9. ^ abc Knierim, JJ; van Essen, DC (апрель 1992 г.). «Нейрональные реакции на статические текстурные узоры в области V1 бдительной макаки». Журнал нейрофизиологии . 67 (4): 961–980. doi :10.1152/jn.1992.67.4.961. ISSN  0022-3077. PMID  1588394.
  10. ^ abcd Трейсман, Энн М.; Гелад, Гарри (1980-01-01). "Теория внимания как интеграции признаков". Когнитивная психология . 12 (1): 97–136. doi :10.1016/0010-0285(80)90005-5. ISSN  0010-0285. PMID  7351125. S2CID  353246.
  11. ^ Allman, J.; Miezin, F.; McGuinness, E. (1985). «Специфические реакции на стимулы за пределами классического рецептивного поля: нейрофизиологические механизмы локально-глобальных сравнений в зрительных нейронах». Annual Review of Neuroscience . 8 : 407–430. doi :10.1146/annurev.ne.08.030185.002203. ISSN  0147-006X. PMID  3885829.
  12. ^ Wachtler, Thomas; Sejnowski, Terrence J.; Albright, Thomas D. (2003-02-20). «Представление цветовых стимулов в первичной зрительной коре бодрствующих макак». Neuron . 37 (4): 681–691. doi :10.1016/s0896-6273(03)00035-7. ISSN  0896-6273. PMC 2948212 . PMID  12597864. 
  13. ^ ab Schiller, Peter H. (1988), Held, Richard (ред.), "Colliculus, Superior", Сенсорная система I: Зрение и визуальные системы , Материалы энциклопедии нейронауки, Бостон, Массачусетс: Birkhäuser, стр. 9, doi :10.1007/978-1-4899-6647-6_6, ISBN 978-1-4899-6647-6, получено 2020-07-05
  14. ^ Вулф, Джереми. «Визуальный поиск». psycnet.apa.org . Получено 11 июля 2020 г.
  15. ^ Itti, L.; Koch, C. (март 2001 г.). «Вычислительное моделирование визуального внимания» (PDF) . Nature Reviews. Neuroscience . 2 (3): 194–203. doi :10.1038/35058500. ISSN  1471-003X. PMID  11256080. S2CID  2329233.
  16. ^ Чжаопин, Ли; Мэй, Кит А. (2007-04-06). "Психофизические тесты гипотезы карты значимости снизу вверх в первичной зрительной коре". PLOS Computational Biology . 3 (4): e62. Bibcode : 2007PLSCB...3...62Z. doi : 10.1371/journal.pcbi.0030062 . ISSN  1553-7358. PMC 1847698. PMID 17411335  . 
  17. ^ Ли, Чжаопин (1999-08-31). «Контекстные влияния в V1 как основа для выскакивания и асимметрии в визуальном поиске». Труды Национальной академии наук . 96 (18): 10530–10535. Bibcode : 1999PNAS...9610530L. doi : 10.1073/pnas.96.18.10530 . ISSN  0027-8424. PMC 17923. PMID 10468643  . 
  18. ^ Ли, Чжаопин (1998). «Первичная корковая динамика для визуальной группировки» как глава книги в «Теоретических аспектах нейронных вычислений», редакторы К. М. Вонг, И. Кинг и Д. Янг . Springer-verlag. стр. 155–164.
  19. ^ Десимоне, Роберт; Дункан, Джон (март 1995). «Нейронные механизмы избирательного зрительного внимания» . Ежегодный обзор нейронауки . 18 (1): 193–222. doi :10.1146/annurev.ne.18.030195.001205. ISSN  0147-006X. PMID  7605061.
  20. ^ ab Zhaoping, Li (2008-05-01). «Захват внимания исходными одиночными точками глаза даже без осознания — признак восходящей карты заметности в первичной зрительной коре». Journal of Vision . 8 (5): 1.1–18. doi : 10.1167/8.5.1 . ISSN  1534-7362. PMID  18842072.
  21. ^ Чжаопин, Ли (2012-02-01). «Захват взгляда одиночными объектами исходного глаза: взаимозависимость с осознанием». Журнал Vision . 12 (2): 17. doi : 10.1167/12.2.17 . ISSN  1534-7362. PMID  22344346.
  22. ^ Чжаопин, Ли (21.08.2014). «Мы слишком «умны», чтобы понимать, как мы видим?». OUPblog . Получено 11.07.2020 .
  23. ^ Чжан, Силин; Чжаопин, Ли; Чжоу, Тяньган; Фан, Фан (2012-01-12). «Нейронная активность в V1 создает карту значимости снизу вверх». Neuron . 73 (1): 183–192. doi : 10.1016/j.neuron.2011.10.035 . ISSN  0896-6273. PMID  22243756. S2CID  9767861.
  24. ^ Koene, Ansgar R.; Zhaoping, Li (2007-05-23). ​​"Взаимодействия, специфичные для признаков, в заметности из комбинированных контрастов признаков: доказательства восходящей карты заметности в V1" (PDF) . Journal of Vision . 7 (7): 6.1–14. doi : 10.1167/7.7.6 . ISSN  1534-7362. PMID  17685802.
  25. ^ Кеннетт, Мэтью Дж.; Уоллис, Гай (01.07.2019). «Эффект лица в толпе: обнаружение угроз против подавления изопризнаков и коллинеарного упрощения». Journal of Vision . 19 (7): 6. doi : 10.1167/19.7.6 . ISSN  1534-7362. PMID  31287860. S2CID  195871013.
  26. ^ Вагацума, Нобухико; Хидака, Акинори; Тамура, Хироши (12.01.2021). «Соответствие между зрительной корой обезьян и слоями модели карты заметности на основе глубокой сверточной нейронной сети для представления естественных изображений». eNeuro . 8 (1). doi :10.1523/ENEURO.0200-20.2020. ISSN  2373-2822. PMC 7890521 . PMID  33234544. 
  27. ^ Клинк, П. Кристиан; Тиувен, Роб РМ; Лортейе, Жанетт А.М.; Рулфсема, Питер Р. (28.02.2023). «Инверсия выскакивания для измерения отвлекающих признаков в зрительной коре обезьян». Труды Национальной академии наук . 120 (9). doi :10.1073/pnas.2210839120. ISSN  0027-8424. PMC 9992771. PMID 36812207  . 
  28. ^ Вестерберг, Якоб А.; Шалл, Джеффри Д.; Вудман, Джеффри Ф.; Майер, Александр (2023-09-26). "Отбор внимания с прямой связью в сенсорной коре". Nature Communications . 14 (1): 5993. doi : 10.1038/s41467-023-41745-1 . ISSN  2041-1723. PMC 10522696 . 
  29. ^ Уайт, Брайан Дж.; Кан, Дженис Й.; Леви, Рон; Итти, Лоран; Муньос, Дуглас П. (2017-08-29). «Верхний холмик кодирует зрительную заметность до первичной зрительной коры». Труды Национальной академии наук Соединенных Штатов Америки . 114 (35): 9451–9456. doi :10.1073/pnas.1701003114. ISSN  1091-6490. PMC 5584409. PMID 28808026  . 
  30. ^ "Визуальное восприятие встречает вычислительную нейронауку | www.ecvp.uni-bremen.de". www.ecvp.uni-bremen.de . Получено 11 июля 2020 г.
  31. ^ "CNS 2020". www.cnsorg.org . Получено 2021-06-27 .
  32. ^ Бисли, Джеймс У.; Голдберг, Майкл Э. (июнь 2010 г.). «Внимание, намерение и приоритет в теменной доле». Annual Review of Neuroscience . 33 (1): 1–21. doi :10.1146/annurev-neuro-060909-152823. ISSN  0147-006X. PMC 3683564. PMID 20192813  . 
  33. ^ Шипп, Стюарт (2004-05-01). "Мозговая схема внимания" . Тенденции в когнитивных науках . 8 (5): 223–230. doi :10.1016/j.tics.2004.03.004. ISSN  1364-6613. PMID  15120681. S2CID  459078.
  34. ^ Nobre, Anna C. (Kia); Kastner, Sabine, ред. (2014-01-01). Оксфордский справочник внимания. Oxford University Press. doi :10.1093/oxfordhb/9780199675111.001.0001. ISBN 978-0-19-175301-5.
  35. ^ Вулф, Джереми М. (2018), «Визуальный поиск» , Справочник Стивенса по экспериментальной психологии и когнитивной нейронауке , Американское онкологическое общество, стр. 1–55, doi : 10.1002/9781119170174.epcn213, ISBN 978-1-119-17017-4, получено 2021-06-24
  36. ^ "Визуальное внимание и сознание". Routledge & CRC Press . Получено 24.06.2021 .
  37. ^ Чжаопин, Ли (2014-05-08). Понимание зрения: теория, модели и данные. Оксфорд, Нью-Йорк: Oxford University Press. ISBN 978-0-19-956466-8.
  38. ^ "Webvision – Организация сетчатки и зрительной системы" . Получено 2020-07-05 .
  39. Стоун, Джеймс (14 сентября 2012 г.). Зрение и мозг. MIT Press. ISBN 9780262517737. Получено 2020-07-05 .