Восприятие движения — это процесс определения скорости и направления элементов в сцене на основе визуальных , вестибулярных и проприоцептивных входов. Хотя этот процесс кажется простым большинству наблюдателей, он оказался сложной проблемой с вычислительной точки зрения и его трудно объяснить с точки зрения нейронной обработки.
Восприятие движения изучается многими дисциплинами, включая психологию (т. е. зрительное восприятие ), неврологию , нейрофизиологию , инженерию и информатику .
Неспособность воспринимать движение называется акинетопсией и может быть вызвана поражением кортикальной области V5 в экстрастриарной коре . Нейропсихологические исследования пациента, который не мог видеть движение, а видел мир в серии статических «кадров», предположили, что визуальная область V5 у людей [1] гомологична области обработки движения V5/MT у приматов. [2] [3] [4]
Когда два или более стимулов попеременно включаются и выключаются, они могут производить два различных восприятия движения. Первое, известное как бета-движение , демонстрируется на рисунке желтого шара и составляет основу для электронных новостных лент . Однако при более высоких скоростях чередования и когда расстояние между стимулами оптимально, иллюзорный «объект» — соответствующий цвету фона — кажется движущимся между стимулами, попеременно заслоняя их. Это явление называется феноменом фи и часто описывается как пример «чистого» обнаружения движения, не загрязненного формальными сигналами, в отличие от бета-движения. [5] Тем не менее, это описание несколько парадоксально, поскольку создание такого движения без фигуральных восприятий невозможно.
Феномен фи называют восприятием движения «первого порядка». Вернер Э. Райхардт и Бернард Хассенштейн смоделировали его в терминах относительно простых «датчиков движения» в зрительной системе, которые эволюционировали, чтобы обнаруживать изменение яркости в одной точке сетчатки и коррелировать его с изменением яркости в соседней точке сетчатки после небольшой задержки. Датчики, которые, как предполагается, работают таким образом, называются либо детекторами Хассенштейна-Райхардта в честь ученых Бернхарда Хассенштейна и Вернера Райхардта , которые первыми их смоделировали, [6] датчиками энергии движения, [7] или усовершенствованными детекторами Райхардта. [8] Эти датчики описываются как обнаруживающие движение с помощью пространственно-временной корреляции и считаются некоторыми правдоподобными моделями того, как зрительная система может обнаруживать движение. (Хотя, опять же, понятие детектора «чистого движения» страдает от проблемы, заключающейся в том, что не существует стимула «чистого движения», т. е. стимула, лишенного воспринимаемых свойств фигуры/фона). До сих пор ведутся серьезные споры относительно точности модели и точной природы этого предлагаемого процесса. Неясно, как модель различает движения глаз и движения объектов в поле зрения, оба из которых вызывают изменения яркости в точках на сетчатке.
Движение второго порядка — это когда движущийся контур определяется контрастом , текстурой, мерцанием или каким-либо другим качеством, которое не приводит к увеличению яркости или энергии движения в спектре Фурье стимула. [9] [10] Существует много свидетельств того, что ранняя обработка движения первого и второго порядка осуществляется отдельными путями. [11] Механизмы второго порядка имеют худшее временное разрешение и являются низкочастотными с точки зрения диапазона пространственных частот , на которые они реагируют. (Представление о том, что нейронные реакции настроены на частотные компоненты стимуляции, страдает от отсутствия функционального обоснования и в целом подвергалось критике Г. Вестхаймера (2001) в статье под названием «Теория Фурье зрения».) Движение второго порядка производит более слабый эффект движения, если только не тестируется с динамически мерцающими стимулами. [12]
Направление движения контура неоднозначно, поскольку компонент движения, параллельный линии, не может быть выведен на основе визуального ввода. Это означает, что множество контуров разной ориентации, движущихся с разной скоростью, могут вызывать идентичные реакции в нейроне, чувствительном к движению, в зрительной системе.
Некоторые предполагают, что, извлекая предполагаемые сигналы движения (первого или второго порядка) из изображения на сетчатке, зрительная система должна интегрировать эти отдельные локальные сигналы движения в различных частях поля зрения в двумерное или глобальное представление движущихся объектов и поверхностей. (Неясно, как это двумерное представление затем преобразуется в воспринимаемое трехмерное восприятие). Для обнаружения когерентного движения или «глобального движения», присутствующего в сцене, требуется дальнейшая обработка. [13]
Способность субъекта обнаруживать когерентное движение обычно проверяется с помощью задач на различение когерентности движения. Для этих задач используются динамические случайные точечные паттерны (также называемые кинематограммами случайных точек ), которые состоят из «сигнальных» точек, движущихся в одном направлении, и «шумовых» точек, движущихся в случайных направлениях. Чувствительность к когерентности движения оценивается путем измерения соотношения «сигнальных» и «шумовых» точек, необходимых для определения направления когерентного движения. Требуемое соотношение называется порогом когерентности движения .
Как и в других аспектах зрения, визуальный вход наблюдателя, как правило, недостаточен для определения истинной природы источников стимула, в данном случае их скорости в реальном мире. Например, в монокулярном зрении визуальный вход будет представлять собой 2D-проекцию 3D-сцены. Сигналы движения, присутствующие в 2D-проекции, по умолчанию будут недостаточны для реконструкции движения, присутствующего в 3D-сцене. Иными словами, многие 3D-сцены будут совместимы с одной 2D-проекцией. Проблема оценки движения обобщается на бинокулярное зрение , когда мы рассматриваем окклюзию или восприятие движения на относительно больших расстояниях, где бинокулярная диспаратность является плохим сигналом глубины. Эта фундаментальная трудность называется обратной проблемой . [14]
Тем не менее, некоторые люди воспринимают движение в глубину. Есть указания на то, что мозг использует различные сигналы, в частности временные изменения диспаратности, а также монокулярные соотношения скоростей, для создания ощущения движения в глубину. [15] Выдвинуты гипотезы о двух различных бинокулярных сигналах восприятия движения в глубину: межглазная разница скоростей (IOVD) и изменяющаяся с течением времени диспаратность (CD). Движение в глубину, основанное на межглазных различиях скоростей, можно проверить с помощью специальных бинокулярно некоррелированных случайных точечных кинематограмм. [16] Результаты исследования показывают, что обработка этих двух бинокулярных сигналов – IOVD и CD – может использовать принципиально разные низкоуровневые стимульные характеристики, которые могут обрабатываться совместно на более поздних стадиях. [17] [18] Кроме того, как монокулярный сигнал, также изменение размера изображений сетчатки способствует обнаружению движения в глубину.
Обнаружение и различение движения можно улучшить с помощью тренировок с долгосрочными результатами. Участники, обученные обнаруживать движения точек на экране только в одном направлении, становятся особенно хороши в обнаружении небольших движений в направлениях вокруг того, в котором они были обучены. Это улучшение все еще присутствовало 10 недель спустя. Однако перцептивное обучение весьма специфично. Например, участники не показывают никаких улучшений при тестировании вокруг других направлений движения или для других видов стимулов. [19]
Когнитивная карта — это тип ментального представления, который служит человеку для получения, кодирования, хранения, вспоминания и декодирования информации об относительном местоположении и атрибутах явлений в его пространственной среде. [20] [21] Клетки места работают с другими типами нейронов в гиппокампе и окружающих областях мозга для выполнения этого вида пространственной обработки, [22] но способы, которыми они функционируют в гиппокампе, все еще изучаются. [23]
Многие виды млекопитающих могут отслеживать пространственное местоположение даже при отсутствии визуальных, слуховых, обонятельных или тактильных сигналов, интегрируя свои движения — способность делать это упоминается в литературе как интеграция пути . Ряд теоретических моделей исследовали механизмы, с помощью которых интеграция пути может быть выполнена нейронными сетями . В большинстве моделей, таких как модели Самсоновича и Макнотона (1997) [24] или Бурака и Фите (2009), [25] основными ингредиентами являются (1) внутреннее представление положения, (2) внутренние представления скорости и направления движения и (3) механизм смещения закодированного положения на нужную величину при движении животного. Поскольку клетки медиальной энторинальной коры (MEC) кодируют информацию о положении ( клетки сетки [26] ) и движении ( клетки направления головы и конъюнктивные клетки положения по направлению [27] ), эта область в настоящее время рассматривается как наиболее перспективный кандидат на место в мозге, где происходит интеграция путей.
Ощущение движения с помощью зрения имеет решающее значение для обнаружения потенциального партнера, добычи или хищника, и поэтому оно встречается как у позвоночных, так и у беспозвоночных, у самых разных видов, хотя оно не всегда встречается у всех видов. У позвоночных этот процесс происходит в сетчатке, а точнее в ганглиозных клетках сетчатки , которые представляют собой нейроны, получающие входные данные от биполярных и амакриновых клеток о зрительной информации и обрабатывающие выходные данные в более высоких областях мозга, включая таламус, гипоталамус и средний мозг.
Изучение направленно-селективных единиц началось с открытия таких клеток в коре головного мозга кошек Дэвидом Хьюбелом и Торстеном Визелем в 1959 году. После первоначального отчета попытка понять механизм направленно-селективных клеток была предпринята Хорасом Б. Барлоу и Уильямом Р. Левиком в 1965 году. [28] Их глубокие эксперименты на сетчатке кролика расширили анатомическое и физиологическое понимание зрительной системы позвоночных и разожгли интерес к этой области. Многочисленные исследования, которые последовали за этим, раскрыли механизм восприятия движения в зрении по большей части. Обзорная статья Александра Борста и Томаса Эйлера 2011 года «Видеть вещи в движении: модели, схемы и механизмы» [29] обсуждает некоторые важные выводы от ранних открытий до недавних работ по этой теме, приходя к выводу о текущем состоянии знаний.
Клетки направленности (DS) в сетчатке определяются как нейроны, которые реагируют по-разному на направление зрительного стимула. Согласно Барлоу и Левику (1965), этот термин используется для описания группы нейронов, которые «выдают мощный разряд импульсов, когда объект-стимул перемещается через его рецептивное поле в одном направлении». [28] Это направление, на которое набор нейронов реагирует наиболее сильно, является их «предпочтительным направлением». Напротив, они вообще не реагируют на противоположное направление, «нулевое направление». Предпочтительным направлением не является стимул, то есть, независимо от размера, формы или цвета стимула, нейроны реагируют, когда он движется в их предпочтительном направлении, и не реагируют, если он движется в нулевом направлении. Существует три известных типа клеток DS в сетчатке позвоночных мышей: ганглиозные клетки ON/OFF DS, ганглиозные клетки ON DS и ганглиозные клетки OFF DS. Каждый из них имеет отличительную физиологию и анатомию. Аналогичные направленно-селективные клетки, как полагают, не существуют в сетчатке приматов. [30]
Ганглиозные клетки ON/OFF DS действуют как локальные детекторы движения. Они активируются при начале и смещении стимула (источника света). Если стимул движется в направлении предпочтения клетки, он активируется на переднем и заднем крае. Их паттерн активации зависит от времени и поддерживается моделью Райхардта - Хассенштейна , которая обнаруживает пространственно-временную корреляцию между двумя соседними точками. Подробное объяснение модели Райхардта-Хассенштейна будет дано далее в этом разделе. Анатомия клеток ON/OFF такова, что дендриты простираются до двух субламин внутреннего плексиформного слоя и образуют синапсы с биполярными и амакриновыми клетками. Они имеют четыре подтипа, каждый из которых имеет собственное предпочтение по направлению.
В отличие от ON/OFF DS ганглиозных клеток, которые реагируют как на передний, так и на задний фронт стимула, ON DS ганглиозные клетки реагируют только на передний фронт. Дендриты ON DS ганглиозных клеток моностратифицированы и простираются во внутреннюю субламину внутреннего плексиформного слоя. Они имеют три подтипа с различными направленными предпочтениями.
Ганглиозные клетки OFF DS действуют как центростремительный детектор движения и реагируют только на задний фронт стимула. Они настроены на восходящее движение стимула. Дендриты асимметричны и разветвляются в направлении своего предпочтения. [29]
Первые клетки DS у беспозвоночных были обнаружены у мух в структуре мозга, называемой дольчатой пластинкой . Дольчатая пластинка является одним из трех стеков нейропилей в зрительной доле мухи . «Тангенциальные клетки» дольчатой пластинки состоят примерно из 50 нейронов, и они интенсивно разветвляются в нейропиле. Известно, что тангенциальные клетки являются направленно-избирательными с отличительным направленным предпочтением. Одними из них являются горизонтально-чувствительные (HS) клетки, такие как нейрон H1 , которые деполяризуются сильнее всего в ответ на стимул, движущийся в горизонтальном направлении (предпочтительное направление). С другой стороны, они гиперполяризуются, когда направление движения противоположно (нулевое направление). Вертикально-чувствительные (VS) клетки являются еще одной группой клеток, которые наиболее чувствительны к вертикальному движению. Они деполяризуются, когда стимул движется вниз, и гиперполяризуются, когда он движется вверх. Как клетки HS, так и клетки VS реагируют фиксированным предпочтительным направлением и нулевым направлением независимо от цвета или контрастности фона или стимула.
Теперь известно, что обнаружение движения в зрении основано на модели детектора Хассенштейна-Райхардта. [31] Это модель, используемая для обнаружения корреляции между двумя соседними точками. Она состоит из двух симметричных субъединиц. Обе субъединицы имеют рецептор, который может стимулироваться входом (светом в случае зрительной системы). В каждой субъединице, когда получен вход, сигнал отправляется в другую субъединицу. В то же время сигнал задерживается во времени внутри субъединицы, и после временного фильтра затем умножается на сигнал, полученный от другой субъединицы. Таким образом, внутри каждой субъединицы два значения яркости, одно полученное непосредственно от ее рецептора с задержкой по времени, а другое полученное от соседнего рецептора, умножаются. Затем умноженные значения от двух субъединиц вычитаются для получения выходного сигнала. Направление селективности или предпочтительное направление определяется тем, является ли разница положительной или отрицательной. Направление, которое дает положительный результат, является предпочтительным направлением.
Для того чтобы подтвердить, что модель Райхардта-Хассенштейна точно описывает направленную селективность в сетчатке, исследование было проведено с использованием оптических записей уровней свободного цитозольного кальция после загрузки флуоресцентного индикаторного красителя в тангенциальные клетки мухи. Мухе предъявляли равномерно движущиеся решетки, в то время как измерялась концентрация кальция в дендритных кончиках тангенциальных клеток. Тангенциальные клетки показывали модуляции, которые соответствовали временной частоте решеток, а скорость движущихся решеток, при которой нейроны реагируют сильнее всего, показывала тесную зависимость от длины волны паттерна. Это подтвердило точность модели как на клеточном, так и на поведенческом уровне. [32]
Хотя детали модели Хассенштейна-Райхардта не были подтверждены на анатомическом и физиологическом уровне, место вычитания в модели теперь локализуется в тангенциальных клетках. Когда деполяризующий ток вводится в тангенциальную клетку при предъявлении визуального стимула, реакция на предпочтительное направление движения уменьшается, а реакция на нулевое направление увеличивается. Противоположное наблюдалось при гиперполяризующем токе. Клетки T4 и T5, которые были выбраны в качестве сильных кандидатов для обеспечения входа в тангенциальные клетки, имеют четыре подтипа, каждый из которых проецируется в один из четырех слоев пластинки дольки, которые отличаются предпочтительной ориентацией. [29]
Одна из ранних работ по DS-клеткам у позвоночных была проведена на сетчатке кролика Х. Барлоу и У. Левиком в 1965 году. Их экспериментальные методы включают вариации щелевых экспериментов и регистрацию потенциалов действия в сетчатке кролика. Основная установка щелевого эксперимента заключалась в том, что они представляли движущуюся черно-белую решетку через щель различной ширины кролику и регистрировали потенциалы действия в сетчатке. Это раннее исследование оказало большое влияние на изучение DS-клеток, заложив основу для более поздних исследований. Исследование показало, что ганглиозные клетки DS выводят свое свойство из основы последовательности-различающей активности субъединиц, и что эта активность может быть результатом тормозного механизма в ответ на движение изображения в нулевом направлении. Оно также показало, что свойство DS ганглиозных клеток сетчатки распределено по всему рецептивному полю, а не ограничивается определенными зонами. Избирательность направления сохраняется для двух соседних точек в рецептивном поле, разделенных всего лишь на 1/4°, но избирательность снижается при большем разделении. Они использовали это для подтверждения своей гипотезы о том, что дискриминация последовательностей приводит к избирательности направления, поскольку нормальное движение активирует соседние точки в последовательности. [28]
Ганглиозные клетки ON/OFF DS можно разделить на 4 подтипа, различающихся по их направленному предпочтению: вентральное, дорсальное, назальное или височное. Клетки разных подтипов также различаются по своей дендритной структуре и синаптическим мишеням в мозге. Было обнаружено, что нейроны, которые были идентифицированы как предпочитающие вентральное движение, также имеют дендритные проекции в вентральном направлении. Кроме того, нейроны, которые предпочитают носовое движение, имели асимметричные дендритные расширения в носовом направлении. Таким образом, наблюдалась сильная связь между структурной и функциональной асимметрией в вентральном и носовом направлении. С учетом различных свойств и предпочтений для каждого подтипа ожидалось, что они могут быть выборочно помечены молекулярными маркерами. Нейроны, которые преимущественно реагировали на вертикальное движение, действительно были показаны выборочно экспрессированными определенным молекулярным маркером. Однако молекулярные маркеры для других трех подтипов пока не были найдены. [33]
Ганглиозные клетки с селективным направлением (DS) получают входные сигналы от биполярных клеток и звездчатых амакриновых клеток . Ганглиозные клетки DS реагируют на свое предпочтительное направление большим возбуждающим постсинаптическим потенциалом, за которым следует небольшой ингибирующий ответ. С другой стороны, они реагируют на свое нулевое направление одновременно небольшим возбуждающим постсинаптическим потенциалом и большим ингибирующим постсинаптическим потенциалом. Звездчатые амакриновые клетки рассматривались как сильный кандидат на селективность направления в ганглиозных клетках, поскольку они могут высвобождать как ГАМК, так и АХ. Их дендриты радиально разветвляются от сомы, и наблюдается значительное перекрытие дендритов. Оптические измерения концентрации Ca 2+ показали, что они сильно реагируют на центробежное движение (движение наружу от сомы к дендритам), в то время как они плохо реагируют на центростремительное движение (движение внутрь от дендритных кончиков к соме). Когда звездчатые клетки были удалены токсинами, селективность направления была устранена. Более того, их высвобождение нейротрансмиттеров, в частности ионов кальция, отражает избирательность направления, которая, предположительно, может быть отнесена к синаптической схеме. Схема ветвления организована таким образом, что определенный пресинаптический вход будет иметь большее влияние на данный дендрит, чем другие, создавая полярность в возбуждении и торможении. Дополнительные данные свидетельствуют о том, что клетки звездообразования высвобождают ингибирующие нейротрансмиттеры, ГАМК, друг на друга в отсроченной и продолжительной манере. Это объясняет временное свойство торможения. [29]
В дополнение к пространственному смещению из-за ГАМКергических синапсов, начали обсуждать важную роль переносчиков хлорида. Популярная гипотеза заключается в том, что звездчатые амакриновые клетки дифференциально экспрессируют переносчики хлорида вдоль дендритов. Учитывая это предположение, некоторые области вдоль дендрита будут иметь положительный равновесный потенциал хлорид-иона относительно потенциала покоя, в то время как другие будут иметь отрицательный равновесный потенциал. Это означает, что ГАМК в одной области будет деполяризующей, а в другой области гиперполяризующей, что объясняет пространственное смещение, присутствующее между возбуждением и торможением. [34]
Недавние исследования (опубликованные в марте 2011 г.), основанные на последовательной блок-лицевой электронной микроскопии (SBEM), привели к идентификации схемы, которая влияет на направленную селективность. Эта новая техника обеспечивает детальные изображения потока кальция и анатомии дендритов как звездчатых амакриновых (SAC), так и ганглиозных клеток DS. Сравнивая предпочтительные направления ганглиозных клеток с их синапсами на SAC, Бриггман и др. предоставляют доказательства механизма, в первую очередь основанного на ингибирующих сигналах от SAC [35] на основе исследования сверхвыбранной последовательной блок-лицевой сканирующей электронной микроскопии одной из отобранных сетчаток, что ретинальные ганглиозные клетки могут получать асимметричные ингибирующие входы непосредственно от звездчатых амакриновых клеток, и, следовательно, вычисление направленной селективности также происходит постсинаптически. Такие постсинаптические модели неэкономны, и поэтому, если любые заданные амакриновые клетки звездчатого взрыва передают информацию о движении ганглиозным клеткам сетчатки, то любое вычисление «локальной» избирательности направления постсинаптически ганглиозными клетками сетчатки является избыточным и дисфункциональным. Модель передачи ацетилхолина (ACh) направленно-избирательных амакриновых клеток звездчатого взрыва обеспечивает надежную топологическую основу для обнаружения движения в сетчатке. [36]