Гипотеза заметности V1 , или V1SH (произносится как «виш») — это теория [1] [2] о V1, первичной зрительной коре (V1) . Она предполагает, что V1 у приматов создает карту заметности поля зрения для управления зрительным вниманием или смещением взгляда экзогенно.
V1SH — единственная теория на сегодняшний день, которая не только наделила V1 очень важной когнитивной функцией, но и предоставила несколько нетривиальных теоретических предсказаний, которые впоследствии были экспериментально подтверждены. [2] [3] Согласно V1SH, V1 создает карту значимости из ретинальных входов для управления визуальным вниманием или сдвигами взгляда. [1] Анатомически V1 является воротами для ретинальных визуальных входов, поступающих в неокортекс , а также является крупнейшей корковой областью, посвященной зрению. В 1960-х годах Дэвид Хьюбел и Торстен Визель обнаружили, что нейроны V1 активируются крошечными участками изображения, которые достаточно велики, чтобы изобразить небольшую полосу [4], но не различимое лицо. Эта работа привела к Нобелевской премии, [5] и с тех пор V1 рассматривается как просто выполняющая функцию бэк-офиса (обработки изображений) для последующей когнитивной обработки в мозге за пределами V1. Однако прогресс в исследовании понимания последующей обработки оказался намного сложнее или медленнее, чем ожидалось (например, Хьюбелом и Визелем [6] ). Выходя за рамки традиционных взглядов, V1SH катализирует изменение фреймворка [7] , чтобы обеспечить новый прогресс в понимании зрения.
Видеть
для определения того, где в мозге находится первичная зрительная кора и относительно глаз.
V1SH утверждает, что V1 преобразует визуальные входы в карту заметности визуального поля для управления визуальным вниманием или направлением взгляда. [2] [1] Люди по сути слепы к визуальным входам за пределами их окна внимания. Таким образом, внимание управляет визуальным восприятием и осознанием , и теории визуального внимания являются краеугольными камнями теорий зрительных функций в мозге.
Карта заметности по определению вычисляется или вызывается внешним визуальным входом, а не внутренними факторами, такими как ожидания или цели животного (например, прочитать книгу). Поэтому говорят, что карта заметности направляет внимание экзогенно, а не эндогенно. Соответственно, эта карта заметности также называется картой заметности снизу вверх, чтобы направлять рефлекторные или непроизвольные переключения внимания. Например, она направляет наш взгляд на насекомое, летящее в нашем периферическом поле зрения, когда мы читаем книгу. Обратите внимание, что эта карта заметности, которая создается биологическим или естественным мозгом, не является тем же самым, что и вид карты заметности , которая создается в искусственном или компьютерном зрении, отчасти потому, что искусственные карты заметности часто включают факторы управления вниманием, которые являются эндогенными по своей природе.
На этой (биологической) карте заметности поля зрения каждое визуальное местоположение имеет значение заметности. Это значение определяется как сила этого местоположения, чтобы привлекать внимание экзогенно. [2] Таким образом, если местоположение A имеет более высокое значение заметности, чем местоположение B, то местоположение A с большей вероятностью привлечет визуальное внимание или взгляд сместится в его сторону, чем в сторону местоположения B. В V1 каждый нейрон может быть активирован только визуальными входами в небольшой области поля зрения. Эта область называется рецептивным полем этого нейрона и обычно охватывает не более размера монеты на расстоянии вытянутой руки. [8] Соседние нейроны V1 имеют соседние и перекрывающиеся рецептивные поля. [8] Следовательно, каждое визуальное местоположение может одновременно активировать много нейронов V1. Согласно V1SH, наиболее активированный нейрон среди этих нейронов сигнализирует о значении заметности в этом месте своей нейронной активностью. [1] [2] Реакция нейрона V1 на визуальные входы в пределах его рецептивного поля также зависит от визуальных входов за пределами рецептивного поля. [9] Следовательно, значение заметности в каждом месте зависит от контекста визуального входа. [1] [2] Так и должно быть, поскольку заметность зависит от контекста. Например, вертикальная полоса заметна на изображении, на котором все остальные визуальные элементы, окружающие ее, являются горизонтальными полосами, но эта же вертикальная полоса не заметна, если все эти другие элементы являются вертикальными полосами.
На рисунке выше представлена схема нейронных механизмов в V1 для создания карты заметности. В этом примере изображение сетчатки имеет много фиолетовых полос, все они однородно ориентированы (наклонены вправо), за исключением одной полосы, которая ориентирована уникально (наклонена влево). Эта ориентация синглтона является наиболее заметной на этом изображении, поэтому она привлекает внимание или взгляд, как это наблюдается в психологических экспериментах. [10] В V1 многие нейроны имеют свои предпочтительные ориентации для визуальных входов. [8] Например, реакция нейрона на полосу в его рецептивном поле выше, когда эта полоса ориентирована в своей предпочтительной ориентации. Аналогично, многие нейроны V1 имеют свои предпочтительные цвета. [8] В этой схеме каждая входная полоса на сетчатке активирует два (группы) нейронов V1, один из которых предпочитает свою ориентацию, а другой предпочитает свой цвет. Ответы нейронов, активированных их предпочтительными ориентациями в рецептивных полях, визуализируются на схемах черными точками на плоскости, представляющей нейронные ответы V1. Аналогично, ответы нейронов, активированных их предпочтительными цветами в рецептивных полях, визуализируются фиолетовыми точками. Размеры точек визуализируют силу нейронных ответов V1. В этом примере наибольший ответ исходит от нейронов, предпочитающих и реагирующих на уникально ориентированный брусок. Это происходит из-за подавления изоориентации: когда два нейрона V1 находятся рядом друг с другом и имеют одинаковые или похожие предпочтительные ориентации, они имеют тенденцию подавлять активность друг друга. [9] [11] Таким образом, среди группы нейронов, которые предпочитают и реагируют на однородно ориентированные фоновые бруски, каждый нейрон получает подавление изоориентации от других нейронов этой группы. [1] [9] Между тем, нейрон, реагирующий на ориентационный синглтон, не принадлежит к этой группе и, таким образом, избегает этого подавления, [1] следовательно, его реакция выше, чем у других нейронных реакций. Изоцветное подавление [12] аналогично изоориентационному подавлению, поэтому все нейроны, предпочитающие и реагирующие на фиолетовые цвета входных полос, находятся под изоцветным подавлением. Согласно V1SH, максимальный ответ в месте расположения каждого столбца представляет собой значение заметности в месте расположения каждого столбца. [1] [2] Таким образом, это значение заметности является самым высоким в месте расположения ориентационного синглтона и представлено ответом от нейронов, предпочитающих и реагирующих на ориентацию этого синглтона. Эти значения заметности отправляются в верхний холмик , [13] область среднего мозга , для выполнения смещения взгляда на рецептивное поле наиболее активированного нейрона, реагирующего на визуальное входное пространство. [13]Таким образом, для этого входного изображения на рисунке выше ориентационный синглтон, который вызывает самую высокую реакцию V1 на это изображение, привлекает визуальное внимание или взгляд.
V1SH может объяснить данные визуального поиска , такие как короткое время отклика для поиска уникального красного элемента среди зеленых элементов, или уникальной вертикальной полосы среди горизонтальных полос, или элемента, уникально движущегося вправо среди элементов, движущихся влево. Эти виды визуального поиска называются поиском признаков, когда цель поиска уникальна по базовому значению признака, такому как ориентация, цвет или направление движения. [10] [14] Краткость времени отклика поиска демонстрирует более высокое значение заметности в месте расположения цели поиска для привлечения внимания. V1SH также объясняет, почему требуется больше времени, чтобы найти уникальную красно-вертикальную полосу среди красно-горизонтальных полос и зеленых вертикальных полос. Это пример поиска по конъюнктуре, когда цель поиска уникальна только по конъюнктуре двух признаков, каждый из которых присутствует в визуальной сцене. [10]
Кроме того, V1SH объясняет данные, которые трудно объяснить с помощью альтернативных фреймворков. [10] [15] На рисунке выше показан пример: две соседние текстуры в A, одна из которых состоит из равномерно наклоненных влево полос, а другая из равномерно наклоненных вправо полос, очень легко сегментировать друг от друга человеческим зрением. Это связано с тем, что текстурные полосы на границе между двумя текстурами вызывают самые высокие нейронные реакции V1 (поскольку они меньше всего подавляются подавлением изоориентации), поэтому пограничные полосы являются наиболее заметными на изображении, привлекая внимание к границе. Однако сегментация становится намного сложнее, если текстура в B накладывается на исходное изображение в A (результат изображен в C). Это связано с тем, что в местах текстуры, не являющихся границей, нейронные реакции V1 на горизонтальные и вертикальные полосы (из B) выше, чем на наклонные полосы (из A); Эти более высокие ответы диктуют и повышают значения заметности в этих неграничных местах, делая границу более не столь конкурентоспособной в плане заметности. [16]
V1SH был предложен в конце 1990-х годов [17] [18] Ли Чжаопином . Первоначально он не имел никакого влияния, поскольку в течение десятилетий считалось, что управление вниманием в основном или только контролируется областями мозга более высокого уровня. Эти области мозга более высокого уровня включают лобное поле глаза и теменные корковые области [19] в лобной и более передней части мозга, и они, как полагают, обладают интеллектом для управления вниманием и исполнительными функциями . Кроме того, первичная зрительная кора, V1, расположенная в затылочной доле в задней или задней части мозга, традиционно считалась зрительной областью низкого уровня, которая в основном играет вспомогательную роль для других областей мозга для их более важных зрительных функций. [8] Мнения начали меняться из-за удивительного фрагмента поведенческих данных: предмет, показанный одному глазу — одиночный предмет — среди похожих предметов, показанных другому глазу (например, с помощью очков для просмотра 3D-фильмов ), может автоматически привлекать взгляд или внимание. [20] [21] Пример проиллюстрирован на этом рисунке. Здесь изображение, содержащее одну букву «X», показано правому глазу, а другое изображение, содержащее массив тех же «X» и букву «O», показано левому глазу. В такой ситуации люди-наблюдатели обычно воспринимают изображение, напоминающее суперпозицию двух монокулярных изображений, так что они видят массив всех «X» и одну «O». «X», возникающий из изображения для правого глаза, не будет казаться отличительным. Тем не менее, даже когда они выполняют задачу поиска (в своем воспринимаемом изображении) уникальной и перцептивно отличительной «О» как можно быстрее, их взгляд автоматически или непроизвольно переключается на «Х», возникающий из изображения правого глаза, часто до того, как их взгляд переключается на «О». Захват внимания таким глазным синглтоном происходит даже тогда, когда наблюдатели не могут угадать, присутствует ли этот синглтон (если бы он отсутствовал на этом примере, все «Х» и один «О» были бы показаны только левому глазу). [20] Это наблюдение было контринтуитивным, [22] было легко воспроизведено другими исследователями зрения и было однозначно предсказано V1SH. Поскольку V1 является единственной зрительной корковой областью с нейронами, настроенными на глаз источника визуальных входов, [4] это наблюдение убедительно подтверждает роль V1 в управлении вниманием.
Последовали дополнительные эксперименты для дальнейшего изучения V1SH, [2] и подтверждающие данные, полученные с помощью функциональной визуализации мозга, [23] визуальной психофизики, [24] [25] и электрофизиологии обезьян [3] [26] [27] [28] (хотя см. некоторые противоречивые данные [29] ). С тех пор V1SH стал более популярным. [30] [31] V1 теперь рассматривается как один из краеугольных камней в сети механизмов внимания мозга, [32] [33] и его функциональная роль в управлении зрительным вниманием упоминается в справочниках [34] [35] и учебниках. [36] [37] Чжаопин утверждает, что если V1SH верна, то идеи [38] [39] о том, как работает зрительная система , и, следовательно, вопросы, которые следует задать для будущих исследований зрения, должны быть принципиально изменены. [7]