Движение глаз при чтении музыки — это сканирование партитуры глазами музыканта. Обычно это происходит во время чтения музыки во время исполнения, хотя музыканты иногда сканируют музыку молча, чтобы изучить ее. Это явление изучалось исследователями из разных областей, включая когнитивную психологию и музыкальное образование . Эти исследования, как правило, отражают любопытство музыкантов-исполнителей к центральному процессу в их ремесле и надежду на то, что исследование движения глаз может помочь в разработке более эффективных методов обучения музыкантов навыкам чтения с листа .
Центральным аспектом чтения нот является последовательность чередующихся саккад и фиксаций , как и для большинства глазодвигательных задач. Саккады — это быстрые «щелчки», которые перемещают глаза из одного места в другое по музыкальной партитуре. Саккады отделены друг от друга фиксациями, во время которых глаза относительно неподвижны на странице. Хорошо известно, что восприятие визуальной информации происходит почти полностью во время фиксаций и что во время саккад улавливается лишь малая часть информации, если она вообще улавливается. [1] Фиксации составляют около 90% времени чтения нот, обычно их средняя продолжительность составляет 250–400 мс. [2]
Движение глаз при чтении музыки — чрезвычайно сложный феномен, который включает в себя ряд нерешенных вопросов в психологии и который требует сложных экспериментальных условий для получения значимых данных. Несмотря на около 30 исследований в этой области за последние 70 лет, мало что известно о базовых моделях движения глаз при чтении музыки.
Движение глаз при чтении музыки может на первый взгляд показаться похожим на движение при чтении языка , поскольку в обоих видах деятельности глаза перемещаются по странице в фиксациях и саккадах, улавливая и обрабатывая закодированные значения. Однако на этом очевидные сходства заканчиваются. Система кодирования музыки не только нелингвистична; она включает в себя то, что, по-видимому, является уникальным сочетанием особенностей среди видов человеческой деятельности: строгое и непрерывное ограничение по времени на вывод, который генерируется непрерывным потоком закодированных инструкций. Даже чтение языка вслух, которое, как и музыкальное исполнение, включает в себя превращение закодированной информации в мышечно-скелетную реакцию, относительно свободно от временных ограничений — пульс при чтении вслух — это текучее, импровизированное дело по сравнению с его жестким присутствием в большинстве западных музыкальных произведений. Именно это уникально строгое временное требование в музыкальном исполнении сделало наблюдение за движением глаз при чтении музыки более сложным, чем при чтении языка.
Другим важным различием между чтением нот и чтением языка является роль навыка. Большинство людей становятся достаточно эффективными в чтении языка к взрослому возрасту, хотя почти все чтение языка — это чтение с листа . [3] Напротив, некоторые музыканты считают себя плохими читателями музыки с листа даже после многих лет обучения. Таким образом, улучшение чтения музыки с листа и различия между опытными и неопытными читателями всегда имели первостепенное значение для исследования движения глаз при чтении музыки, тогда как исследование движения глаз при чтении языка было больше связано с разработкой единой психологической модели процесса чтения. [4] Поэтому неудивительно, что большинство исследований движения глаз при чтении музыки были направлены на сравнение моделей движения глаз опытных и неопытных.
С самого начала существовали основные проблемы с оборудованием для отслеживания движения глаз . Пять самых ранних исследований [5] использовали фотографические методы. Эти методы включали либо обучение непрерывного луча видимого света на глазе для получения непрерывной линии на фотобумаге, либо мигающий свет для получения серии белых пятен на фотобумаге с интервалом выборки около 25 мс (т. е. 40 выборок в секунду). Поскольку пленка катилась через устройство вертикально, вертикальное движение глаз в их путешествии по странице либо не регистрировалось [6], либо регистрировалось с помощью второй камеры и впоследствии объединялось для предоставления данных по обоим измерениям, что было громоздким и неточным решением.
Эти системы были чувствительны даже к небольшому движению головы или тела, что, по-видимому, значительно загрязняло данные. В некоторых исследованиях использовались такие устройства, как подголовник и прикусная пластина, чтобы минимизировать это загрязнение, с ограниченным успехом, а в одном случае камера, прикрепленная к шлему мотоцикла весом около 3 кг, который поддерживался системой уравновешивающих грузов и шкивов, прикрепленных к потолку. [7] Помимо посторонних движений головы, исследователи столкнулись с другими физическими, телесными проблемами. Реакция опорно-двигательного аппарата, необходимая для игры на музыкальном инструменте, включает в себя существенное движение тела, обычно рук и туловища. Это может нарушить тонкий баланс отслеживающего оборудования и затруднить регистрацию данных. Еще одна проблема, которая затрагивает почти всех неквалифицированных клавишников и значительную часть квалифицированных клавишников, — это общая тенденция часто поглядывать на руки и обратно на партитуру во время выступления. Недостатком такого поведения является то, что оно вызывает выпадение сигнала в данных каждый раз, когда это происходит, что иногда происходит до нескольких раз за такт. [8] Когда участникам не дают смотреть на свои руки, качество их выступления обычно ухудшается. Рейнер и Поллацек (1997:49) писали, что:
Начиная с Ланга (1961), все опубликованные исследования движения глаз при чтении музыки, за исключением Смита (1988), по-видимому, использовали технологию инфракрасного отслеживания. Однако исследования в этой области в основном проводились с использованием не самого оптимального оборудования. Это имело всеобъемлющее негативное влияние почти на все исследования вплоть до нескольких недавних исследований. Подводя итог, можно сказать, что четыре основные проблемы оборудования заключались в том, что устройства отслеживания:
Только недавно движение глаз при чтении музыки было исследовано с помощью более удовлетворительного оборудования. Кинслер и Карпентер (1995) смогли определить положение глаз с точностью до 0,25º, то есть размер отдельных музыкальных нот, с интервалом в 1 мс. Труитт и др. (1997) использовали похожую точную инфракрасную систему, способную отображать окно движения и интегрированную в контролируемую компьютером музыкальную клавиатуру. Уотерс и Андервуд (1998) использовали машину с точностью плюс-минус один пробел между символами и интервалом выборки всего 4 мс.
Большинство исследований движения глаз при чтении музыки в первую очередь были направлены на сравнение моделей движения глаз опытных и неопытных исполнителей. [9] Неявное предположение, по-видимому, состояло в том, что это может заложить основу для разработки лучших способов обучения музыкантов. Однако существуют значительные методологические проблемы при попытке такого сравнения. Опытные и неопытные исполнители обычно читают с листа один и тот же отрывок в разном темпе и/или с разной степенью точности. При достаточно медленном темпе исполнители с большим диапазоном уровней мастерства способны к точному исполнению, но опытные будут иметь избыточную емкость в своем восприятии и обработке информации на странице. Есть доказательства того, что избыточная емкость загрязняет данные о движении глаз эффектом «блуждания», при котором глаза имеют тенденцию отклоняться от хода музыки. Уивер (1943:15) подразумевал существование эффекта блуждания и его сбивающего с толку влияния, как и Труитт и др. (1997:51), которые подозревали, что в медленном темпе глаза их участников «болтались, а не извлекали информацию». Эффект блуждания нежелателен, поскольку он представляет собой не поддающееся количественной оценке и, возможно, случайное искажение нормальных моделей движения глаз.
Саутер (2001:81) утверждал, что идеальный темп для наблюдения за движением глаз — это диапазон, лежащий между тем, который не настолько быстр, чтобы производить значительный уровень пропусков действий, и тем, который не настолько медлен, чтобы производить значительный эффект блуждания. Опытные и неопытные имеют совершенно разные диапазоны для чтения с листа одной и той же музыки. С другой стороны, более быстрый темп может минимизировать избыточную емкость у опытных, но будет иметь тенденцию вызывать неточное исполнение у неопытных; неточности лишают нас единственного доказательства того, что исполнитель обработал информацию на странице, и нельзя сбрасывать со счетов опасность того, что обратная связь от пропусков действий загрязняет данные о движении глаз.
Почти все исследования сравнивали временные переменные среди участников, в основном продолжительность их фиксаций и саккад. В этих случаях самоочевидно, что полезные сравнения требуют последовательности в темпе исполнения и точности внутри и между выступлениями. Однако большинство исследований учитывали различные способности участников к исполнению при чтении одного и того же стимула, позволяя им выбирать свой собственный темп или не контролируя этот темп строго. Теоретически существует относительно узкий диапазон, называемый здесь «оптимальным диапазоном», в котором емкость соответствует поставленной задаче; по обе стороны этого диапазона лежат два проблемных диапазона темпа, в которых емкость исполнителя является избыточной или недостаточной соответственно. Расположение границ оптимального диапазона зависит от уровня мастерства отдельного исполнителя и относительной сложности чтения/исполнения стимула. [10]
Таким образом, если только участники не будут выбираться из узкого диапазона уровней навыков, их оптимальные диапазоны будут взаимоисключающими, и наблюдения в едином контролируемом темпе, скорее всего, приведут к значительному загрязнению данных о движении глаз. Большинство исследований стремились сравнить опытных и неопытных в надежде получить педагогически полезные данные; за исключением Смита (1988), в котором темп сам по себе был независимой переменной, Поланки (1995), который анализировал только данные из молчаливых подготовительных чтений, и Соутера (2001), который наблюдал только за высококвалифицированными, никто не ставил перед собой задачу строго контролировать темп. Исследователи, по-видимому, пытались преодолеть последствия этого заблуждения, идя на компромиссы, такие как (1) осуществление небольшого или никакого контроля над темпами, в которых участники выступали в испытаниях, и/или (2) допущение значительного различия в уровне промахов между опытными и неопытными группами.
Эта проблема является частью более широкого заблуждения о темпе/навыке/промахах в действиях, которое касается взаимосвязи между темпом, навыком и уровнем промахов в действиях (ошибок исполнения). [11] Заблуждение заключается в том, что можно достоверно сравнить модели движения глаз опытных и неопытных исполнителей в одних и тех же условиях.
Многие исследователи интересовались, влияет ли сложность музыки на длительность фиксации. При чтении музыки необходимо учитывать по крайней мере три типа сложности: визуальную сложность нотной записи ; сложность обработки визуального ввода в опорно-двигательные команды; и сложность выполнения этих команд. Например, визуальная сложность может быть в форме плотности нотных символов на странице или наличия знаков альтерации, триолей, лиг и других маркировок выражения. Сложность обработки визуального ввода в опорно-двигательные команды может включать в себя отсутствие «фрагментируемости» или предсказуемости в музыке. Сложность выполнения опорно-двигательных команд можно рассматривать с точки зрения требований аппликатуры и положения руки. Именно в изоляции и учете взаимодействия между этими типами заключается трудность понимания музыкальной сложности. По этой причине мало полезной информации получено в результате исследования связи между музыкальной сложностью и движением глаз.
Якобсен (1941:213) пришел к выводу, что «сложность материала для чтения влияла на количество и продолжительность [фиксаций]»; там, где текстура, ритм, тональность и знаки альтерации были «более сложными», в среднем наблюдалось замедление темпа и увеличение как продолжительности, так и количества фиксаций у его участников. Однако темпы исполнения не контролировались в этом исследовании, поэтому данные, на которых основывался этот вывод, вероятно, были загрязнены более медленными темпами, которые были зарегистрированы для чтения более сложных стимулов. [12] Уивер (1943) утверждал, что продолжительность фиксаций, которая варьировалась от 270 до 530 мс, удлинялась, когда нотация была более компактной и/или сложной, как обнаружил Якобсен, но не раскрыл, использовались ли более медленные темпы. Халверсон (1974), который контролировал темп более тщательно, наблюдал легкий противоположный эффект. Участники Шмидта (1981) использовали более длительные фиксационные продолжительности при чтении более легких мелодий (согласуясь с данными Халверсона); данные Гулсби (1987) в некоторой степени подтверждают выводы Халверсона, но только для опытных чтецов. Он писал: «И Якобсен, и Уивер... позволяя участникам выбирать свой собственный темп, обнаружили противоположный эффект сложности нотации». [13]
В целом, кажется вероятным, что в контролируемых временных условиях более плотная и сложная музыка связана с большим количеством фиксаций, с меньшей средней продолжительностью. Это можно объяснить попыткой процесса чтения музыки обеспечить более частое «освежение» материала, удерживаемого в рабочей памяти, и может компенсировать необходимость удерживать больше информации в рабочей памяти. [14]
Среди основных исследований, от Якобсена (1941) до Смита (1988), нет разногласий в том, что опытные читатели, по-видимому, используют больше и более короткие фиксации во всех условиях, чем неопытные. Гулсби (1987) обнаружил, что средняя «прогрессивная» (движущаяся вперед) продолжительность фиксации была значительно больше (474 против 377 мс), а средняя длина саккады значительно больше для менее опытных. Хотя Гулсби не сообщал общую продолжительность чтения своих испытаний, ее можно вывести из средних темпов его 12 опытных и 12 неопытных участников для каждого из четырех стимулов. [15] Его данные, по-видимому, показывают, что неопытные читатели играли в 93,6% от темпа опытных, и что их средняя продолжительность фиксации была на 25,6% больше.
Это поднимает вопрос о том, почему опытные читатели должны распределять более многочисленные и короткие фиксации по партитуре, чем неопытные. В литературе появляется только одно правдоподобное объяснение. Кинслер и Карпентер (1995) предложили модель обработки нотной записи, основанную на их данных чтения ритмических рисунков, в которой иконическое представление каждого зафиксированного изображения сканируется «процессором» и интерпретируется с заданным уровнем точности. Сканирование заканчивается, когда этот уровень не может быть достигнут, его конечная точка определяет положение предстоящей фиксации. Время, необходимое до этого решения, зависит от сложности ноты и, предположительно, короче для опытных читателей, тем самым способствуя более многочисленным фиксациям меньшей продолжительности. Эта модель не была дополнительно исследована и не объясняет, какое преимущество дает использование коротких, многочисленных фиксаций. Другое возможное объяснение заключается в том, что опытные читатели поддерживают больший охват глаза и руки и, следовательно, хранят больший объем информации в своей рабочей памяти ; Таким образом, им необходимо чаще обновлять эту информацию из музыкальной партитуры, и они могут делать это путем более частой рефиксации. [16]
Чем больше читатели знакомятся с музыкальным отрывком, тем меньше они полагаются на визуальный ввод из партитуры и, соответственно, больше полагаются на сохраненную память о музыке. По логическим соображениям можно было бы ожидать, что этот сдвиг приведет к меньшему количеству и большей продолжительности фиксаций. Данные всех трех исследований движения глаз при чтении все более знакомой музыки подтверждают это рассуждение. Участники Йорка (1952) читали каждый стимул дважды, причем каждому чтению предшествовал 28-секундный безмолвный просмотр. В среднем как опытные, так и неопытные читатели использовали меньше и более продолжительные фиксации во время второго чтения. Участники Гулсби (1987) наблюдались во время трех последовательных чтений одного и того же музыкального стимула. Знакомство в этих испытаниях, по-видимому, увеличивало продолжительность фиксации, но не так сильно, как можно было бы ожидать. Второе чтение не дало существенной разницы в средней продолжительности фиксации (с 422 до 418 мс). При третьей встрече средняя продолжительность фиксации была выше для обеих групп (437 мс), но на едва значимую величину, таким образом, слегка поддерживая более ранние выводы Йорка. Незначительность этих изменений может быть объяснена несложными условиями чтения в испытаниях. Темп MM120, предложенный в начале каждого из испытаний Гулсби, кажется медленным для решения заданных мелодий, которые содержали много полубрев и миним, и, возможно, просто было недостаточно давления для получения значимых результатов. Более вероятное объяснение заключается в том, что участники проигрывали стимулы в более быстром темпе, поскольку они все больше знакомились с ними в ходе трех чтений. (Изначально метроном звучал, но молчал во время выступлений, позволяя чтецам изменять свой темп по своему желанию.) Таким образом, возможно, что два влияния противоречили друг другу: растущее знакомство могло способствовать низкому количеству фиксаций и большой продолжительности фиксаций, в то время как более быстрый темп мог способствовать низкому количеству и короткой продолжительности. Это может объяснить, почему средняя продолжительность фиксации снизилась в противоположном направлении по сравнению с прогнозом для второй встречи, а к третьей встрече выросла всего на 3,55% в обеих группах. [17] (Результаты Смита (1988), подкрепленные результатами Кинслера и Карпентера (1995), предполагают, что более быстрый темп, вероятно, снижает как количество, так и продолжительность фиксаций при чтении однострочной мелодии. Если эта гипотеза верна, она может быть связана с возможностью того, что чем более знаком стимул, тем меньше нагрузка на память читателя.)
С 1950-х по 1970-е годы велись жаркие дебаты по поводу того, влияют ли на движение глаз при чтении текста исключительно или в основном (1) уже существующие (сверху вниз) поведенческие модели техники чтения человека, (2) природа стимула (снизу вверх) или (3) оба фактора. Рейнер и др. (1971) дают обзор соответствующих исследований.
За десятилетия до этого спора Уивер (1943) намеревался определить (снизу вверх) влияние музыкальной текстуры на движение глаз. Он выдвинул гипотезу, что вертикальные композиционные паттерны в двухнотной клавиатурной партитуре будут способствовать вертикальным саккадам, а горизонтальные композиционные паттерны — горизонтальным саккадам. Участники Уивера читали двухчастный полифонический стимул, в котором музыкальные паттерны были строго горизонтальными, и четырехчастный гомофонический стимул, включающий простые, похожие на гимны аккорды, в которых композиционные паттерны были строго вертикальными. Уивер, по-видимому, не осознавал сложности доказательства этой гипотезы в свете постоянной необходимости сканировать вверх и вниз между нотными станами и двигаться вперед по партитуре. Таким образом, неудивительно, что гипотеза не подтвердилась.
Четыре десятилетия спустя, когда были обнаружены доказательства влияния снизу вверх на движение глаз при чтении языка, Слобода (1985) заинтересовался возможностью того, что может быть эквивалентное влияние на движение глаз при чтении музыки, и, по-видимому, предположил, что гипотеза Уивера была подтверждена. «Уивер обнаружил, что [вертикальный] рисунок действительно использовался, когда музыка была гомофонической и аккордовой по своей природе. Однако, когда музыка была контрапунктической, он обнаружил последовательности фиксаций, которые были сгруппированы в горизонтальные размахи вдоль одной строки, с возвратом к другой строке впоследствии». [18] Чтобы подтвердить это утверждение, Слобода процитировал два однотактных фрагмента, взятых из иллюстраций Уивера, которые, по-видимому, не являются репрезентативными для всех примеров. [19]
Хотя утверждение Слободы может быть сомнительным, и несмотря на неспособность Уивера найти размерные связи между движением глаз и стимулом, движение глаз при чтении музыки демонстрирует четкие доказательства в большинстве исследований — в частности, Труит и др. (1997) и Гулсби (1987) — влияния восходящих графических особенностей и нисходящих глобальных факторов, связанных со значением символов.
Роль периферического визуального ввода в языковом чтении остается предметом многих исследований. Периферийный ввод при чтении музыки был в центре внимания Труитта и др. (1997). Они использовали парадигму контингентности взгляда для измерения степени периферического восприятия справа от фиксации. Эта парадигма включает в себя спонтанную манипуляцию дисплеем в прямой реакции на то, куда смотрят глаза в любой момент времени. Производительность ухудшалась лишь незначительно, когда в качестве текущего предварительного просмотра предъявлялись четыре четверти справа, но значительно, когда предъявлялись только две четверти. В этих условиях периферический ввод в среднем распространялся на немного более чем четырехтактный такт. Для менее опытных полезное периферическое восприятие распространялось от половины такта до двух-четырех тактов. Для более опытных полезное периферическое восприятие распространялось до пяти тактов.
Периферийный визуальный вход при чтении музыки явно нуждается в более глубоком изучении, особенно сейчас, когда эта парадигма стала более доступной для исследователей. Можно привести доводы в пользу того, что западная нотная запись развивалась таким образом, чтобы оптимизировать использование периферийного входа в процессе чтения. Нотные головки, штили, ребра, тактовые черты и другие символы нотации достаточно жирные и отличительные, чтобы быть полезными при периферическом восприятии, даже если они находятся на некотором расстоянии от фовеа. Предстоящий контур высоты тона и преобладающие ритмические значения музыкальной строки обычно можно определить до фовеолярного восприятия. Например, серия непрерывных шестнадцатых нот, объединенных двумя толстыми, примерно горизонтальными лучами, передаст потенциально ценную информацию о ритме и текстуре, будь то справа на текущем фиксированном нотном стане или выше, или выше или ниже на соседнем нотном стане. Это достаточная причина для подозрения, что периферическая предварительная обработка нотной информации является фактором беглого чтения музыки, так же как это было обнаружено в случае чтения языка. Это согласуется с выводами Смита (1988) и Кинслера и Карпентера (1995), которые сообщили, что глаза не фиксируются на каждой ноте при чтении мелодий.
Рефиксация — это фиксация на информации, которая уже была зафиксирована во время того же чтения. При чтении двухнотной клавиатурной музыки существует две формы рефиксации: (1) вверх или вниз в пределах аккорда, после того как аккорд уже был осмотрен на обоих нотных станах (вертикальная рефиксация), и (2) левосторонняя рефиксация на предыдущий аккорд (либо обратно горизонтально на тот же нотный стан, либо по диагонали на другой нотный стан). Они аналогичны двум категориям рефиксации Поллацека и Рейнера при чтении языка: (1) «правосторонняя рефиксация того же слова», т. е. на разных слогах в том же слове, и (2) «левосторонняя рефиксация» на ранее прочитанные слова (также известная как «регрессия»). [20]
Левосторонняя рефиксация происходит при чтении музыки на всех уровнях мастерства. [21] Она включает в себя саккаду назад к предыдущей ноте/аккорду (иногда даже на две ноты/аккорда назад), за которой следует по крайней мере одна возвратная саккада вправо, чтобы вернуть утраченные позиции. Уивер сообщил, что левосторонняя регрессия составляет от 7% до существенных 23% всех саккад при чтении с листа клавиатурной музыки. Гулсби и Смит сообщили о значительных уровнях левосторонней рефиксации на всех уровнях мастерства при чтении с листа мелодий. [21]
Просмотр одной и той же информации более одного раза, на первый взгляд , является дорогостоящим поведением, которое должно быть сопоставлено с необходимостью идти в ногу с темпом музыки. Левая рефиксация требует больших временных затрат, чем вертикальная рефиксация, и по логическим соображениям, вероятно, будет значительно менее распространена. По той же причине скорости обеих форм рефиксации, вероятно, будут чувствительны к темпу, с более низкими скоростями при более высокой скорости, чтобы удовлетворить потребность в более быстром прогрессе по партитуре. Саутер подтвердил оба эти предположения в квалифицированном чтении с листа клавиатурной музыки. Он обнаружил, что в медленном темпе (один аккорд в секунду) 23,13% (SD 5,76%) саккад были вовлечены в вертикальную рефиксацию по сравнению с 5,05% (4,81%) при левой рефиксации ( p < 0,001). В быстром темпе (два аккорда в секунду) показатели составили 8,15% (SD 4,41%) для вертикальной рефиксации по сравнению с 2,41% (2,37%) для левосторонней рефиксации ( p = 0,011). Эти значимые различия наблюдались даже при том, что восстановительные саккады были включены в подсчеты для левосторонних рефиксаций, что фактически удвоило их количество. Снижение скорости вертикальной рефиксации при удвоении темпа было весьма значимым ( p < 0,001), но для левосторонней рефиксации не было ( p = 0,209), возможно, из-за низкого базового уровня. [22]
Расстояние между глазами и рукой — это расстояние на партитуре между тем местом, куда смотрят глаза на партитуре, и тем местом, где играют руки на партитуре. Его можно измерить двумя способами: в нотах (количество нот между рукой и глазом; «индекс ноты») или во времени (продолжительность времени между фиксацией и исполнением; «индекс времени»). Основные выводы относительно расстояния между глазами и голосом при чтении вслух языка заключались в том, что (1) больший промежуток времени связан с более быстрыми, более опытными читателями [23] (2) более короткий промежуток времени связан с большей сложностью стимула [24] и (3) промежуток времени, по-видимому, варьируется в зависимости от лингвистической фразировки. [25] По крайней мере восемь исследований движения глаз при чтении музыки изучали аналогичные вопросы. Например, Якобсен (1941) измерил средний диапазон справа при пении мелодий с листа до двух нот для неквалифицированных и от одной до четырех нот для квалифицированных, чей более быстрый средний темп в этом исследовании вызывает сомнения относительно того, было ли это различие обусловлено только навыком. В работе Уивера (1943:28) диапазон глаз-рука сильно варьировался, но никогда не превышал «разделения в восемь последовательных нот или аккордов, цифра, которая кажется невозможно большой для чтения партитур на клавиатуре. Янг (1971) обнаружил, что и квалифицированные, и неквалифицированные участники предварительно просматривали примерно один аккорд впереди своих рук, что является неопределенным выводом ввиду методологических проблем в этом исследовании. Гулсби (1994) обнаружил, что глаза квалифицированных певцов с листа в среднем опережали их голос примерно на четыре такта, а у неквалифицированных — меньше. Он утверждал, что при пении с листа «квалифицированные чтецы нот смотрят дальше вперед в нотной записи, а затем возвращаются к точке исполнения» (стр. 77). Другими словами, опытные чтецы музыки поддерживают больший диапазон глаз-рука и более склонны к повторной фиксации в нем. Эта связь между размером диапазона и левой повторной фиксацией может возникнуть из-за большей потребности в обновлении информации в рабочей памяти . Furneax & Land (1999) обнаружили, что диапазоны профессиональных пианистов значительно больше, чем у любителей. Временной индекс значительно зависел от темпа исполнения: когда на исполнение накладывался быстрый темп, все участники показали снижение временного индекса (примерно до 0,7 с), а медленный темп увеличивал временной индекс (примерно до 1,3 с). Это означает, что продолжительность хранения информации в буфере связана с темпом исполнения, а не со способностью, но профессионалы могут вместить больше информации в свои буферы. [26]
Слобода (1974, 1977) искусно применил метод «выключения света» Левина и Каплина (1970) в эксперименте, разработанном для измерения размера диапазона чтения нот. Слобода (1977) попросил своих участников прочитать мелодию с листа и выключил свет в непредсказуемый момент во время каждого чтения. Участникам было поручено продолжать играть правильно «без угадывания» так долго, как они могли после того, как визуальный ввод был эффективно удален, что дало представление о том, насколько далеко впереди их рук они воспринимали в тот момент. Здесь диапазон определялся как включающий периферический ввод. Участникам было разрешено выбирать собственную скорость исполнения для каждого произведения, что вносило слой неопределенности в интерпретацию результатов. Слобода сообщил, что существует тенденция совпадения диапазона с музыкальной фразировкой, так что «граница, выходящая за пределы среднего диапазона, «растягивает» диапазон, а граница, выходящая за пределы среднего диапазона, «сужает» его» (как сообщается в Sloboda 1985:72). Он обнаружил, что хорошие читатели поддерживают больший размер диапазона (до семи нот), чем плохие читатели (до четырех нот).
Truitt et al. (1997) обнаружили, что при чтении мелодий с листа на электронной клавиатуре средний размер промежутка составлял чуть больше одного удара и варьировался от двух ударов позади текущей фиксированной точки до невероятно больших 12 ударов впереди. Нормальный диапазон размера промежутка был несколько меньше: от одного удара позади до трех ударов впереди рук в течение 88% общей продолжительности чтения и от 0 до 2 ударов впереди в течение 68% продолжительности. Такие большие диапазоны, в частности, те, которые простираются влево от точки фиксации, могли быть вызваны «эффектом блуждания». Для менее опытных средний диапазон составлял около половины четвертного удара. Для опытных средний диапазон составлял около двух ударов, а полезное периферическое восприятие распространялось до пяти ударов. Это, по мнению Rayner & Pollatsek (1997:52), предполагает, что:
Рейнер и Поллацек (1997:52) объяснили размер промежутка глаз-рука как непрерывное перетягивание каната, как это было между двумя силами: (1) потребность в том, чтобы материал удерживался в рабочей памяти достаточно долго, чтобы быть преобразованным в опорно-двигательные команды, и (2) необходимость ограничить требования к размеру промежутка и, следовательно, нагрузку на систему памяти. Они утверждали, что большая часть музыкальной педагогики поддерживает первый аспект [советуя] ученику, что глаза должны быть намного впереди рук для эффективного чтения с листа. Они считали, что, несмотря на такой совет, для большинства чтецов преобладает второй аспект; то есть необходимость ограничить нагрузку на систему памяти . Это, как они утверждали, приводит к очень маленькому промежутку в нормальных условиях.
Смит (1988) обнаружил, что при увеличении темпа фиксаций становится меньше, а их средняя продолжительность короче, и что фиксации, как правило, располагаются дальше друг от друга в партитуре. Кинслер и Карпентер (1995) исследовали влияние увеличенного темпа на чтение ритмической нотации, а не реальных мелодий. Они также обнаружили, что увеличенный темп приводит к уменьшению средней продолжительности фиксации и увеличению средней амплитуды саккад (т. е. расстояния на странице между последовательными фиксациями). Саутер (2001) использовал новую теорию и методологию для исследования влияния темпа на ключевые переменные при чтении с листа высококвалифицированными клавишниками. Исследования движения глаз обычно измеряли продолжительность саккад и фиксаций как отдельные переменные. Саутер (2001) использовал новую переменную: продолжительность паузы. Это мера продолжительности между окончанием одной фиксации и окончанием следующей; то есть сумма продолжительности каждой саккады и фиксации, к которой она приводит. Использование этой составной переменной приводит в действие простую связь между количеством пауз, их средней продолжительностью и темпом: количество пауз, умноженное на их среднюю продолжительность, равно общей продолжительности чтения. Другими словами, время, необходимое для прочтения отрывка, равно сумме продолжительностей отдельных пауз, или nd = r, где n — количество пауз, d — их средняя продолжительность, а r — общее время чтения. Поскольку общая продолжительность чтения обратно пропорциональна темпу (удвойте темп, и общее время чтения уменьшится вдвое), связь можно выразить как nd пропорционально r, где t — темп.
В этом исследовании наблюдалось влияние изменения темпа на количество и среднюю продолжительность пауз; таким образом, теперь, используя буквы для представления пропорциональных изменений значений,
nd = 1 ⁄ t , где n — пропорциональное изменение числа пауз, d — пропорциональное изменение их средней длительности, а t — пропорциональное изменение темпа. Это выражение описывает кривую «число–длительность», в которой число и средняя длительность пауз образуют гиперболическую зависимость (поскольку ни n, ни d никогда не достигают нуля). Кривая представляет собой диапазон возможных соотношений для использования этих переменных для адаптации к изменению темпа. В работе Souter (2001) темп был удвоен от первого до второго показания, с 60 до 120 ММ; таким образом, t = 2, а кривая «число–длительность» описывается как nd = 0,5 (рисунок 2). Другими словами, факторизация пропорционального изменения числа и средней длительности пауз между этими показаниями всегда будет равна ½. Таким образом, два показания каждого участника соответствовали точке на этой кривой.
Независимо от значения t, все кривые число-длительность проходят через три точки теоретического интереса: две точки «единственного вклада» и одну точку «равного вклада». В каждой точке единственного вклада читатель полностью полагался на одну из двух переменных, чтобы адаптироваться к новому темпу. В исследовании Саутера, если участник адаптировался к удвоению темпа, используя то же количество пауз и вдвое уменьшая их среднюю длительность, показания попадали бы в точку единственного вклада (1,0,0,5). И наоборот, если участник адаптировался, вдвое уменьшая количество пауз и сохраняя их среднюю длительность, показания попадали бы в другую точку единственного вклада (0,5,1,0). Эти две точки представляют собой полностью одностороннее поведение. С другой стороны, если адаптация читателя опиралась на обе переменные в равной степени, и их факторизация дает 0,5, они обе должны быть равны квадратному корню из t (поскольку t = 2 в этом случае, квадратный корень из 2 ). Таким образом, адаптация попала в точку равного вклада:
( , ), что эквивалентно (0,707,0,707).
Прогнозирование того, где исполнители попадут на кривую, включало рассмотрение возможных преимуществ и недостатков использования этих двух адаптивных ресурсов. Стратегия, полностью полагающаяся на изменение длительности паузы для адаптации к новому темпу — попадание на (1.0,0.5) — позволила бы использовать то же количество пауз независимо от темпа. Теоретически это позволило бы чтецам использовать стандартизированный путь сканирования по всей партитуре, тогда как если бы они изменили количество своих пауз для адаптации к новому темпу, их путь сканирования пришлось бы перепроектировать, пожертвовав преимуществами стандартизированного подхода. Нет сомнений, что чтецы способны изменять свою длительность и количество пауз как от момента к моменту, так и в среднем за более длительные отрезки чтения. Музыканты обычно используют большой диапазон длительностей фиксации в пределах одного чтения, даже при стабильном темпе. [27] Действительно, последовательные длительности фиксации, по-видимому, значительно различаются и, по-видимому, случайным образом; Одна фиксация может длиться 200 мс, следующая — 370 мс, а следующая — 240 мс. (В литературе нет данных о продолжительности последовательных пауз, поэтому здесь в качестве приблизительного эквивалента приводится средняя продолжительность фиксации.)
В свете этой гибкости в изменении длительности фиксации, и поскольку процесс сбора, обработки и представления информации на странице сложен, можно представить, что читатели предпочитают использовать стандартизированный scanpath. Например, в четырехчастных текстурах в стиле гимна для клавиатуры, таких как те, что использовались в Souter (2001), информация о партитуре представлена как серия двухнотных оптически разделенных единиц — две назначены на верхний нотный стан и две на нижний нотный стан для каждого аккорда. Стандартизированный scanpath может состоять из последовательности «пилообразных» движений от верхнего нотного стана к нижнему нотному стану для аккорда, затем по диагонали к верхнему нотному стану и вниз к нижнему нотному стану следующего аккорда и так далее. Однако многочисленные исследования [28] показали, что scanpaths при чтении ряда музыкальных текстур, включая мелодию, четырехчастные гимны и контрапункт, не являются предсказуемыми и упорядоченными, а по своей сути изменчивы, с определенным рваным, случайным качеством. Музыкальные чтецы, похоже, отворачиваются от теоретического преимущества стандартизированного scanpath: они либо гибки, либо случайны, когда дело касается количества пауз, — так же, как и в отношении их длительности, — и не сканируют партитуру в строгой, предопределенной манере.
Саутер предположил, что наиболее вероятным сценарием является то, что и длительность паузы, и число используются для адаптации к темпу, и что соотношение числа и длительности, которое находится близко к точке равного вклада, позволяет аппарату с наибольшей гибкостью адаптироваться к дальнейшим изменениям условий чтения. Он рассудил, что может быть дисфункциональным использовать только один из двух доступных адаптивных ресурсов, поскольку это затруднит последующее использование этого направления для дальнейшей адаптации. Эта гипотеза — что при увеличении темпа среднее соотношение числа и длительности будет находиться вблизи точки равного вклада — была подтверждена данными с точки зрения среднего результата: когда темп удваивался, как среднее количество пауз на аккорд, так и средняя длительность пауз в целом пауз снизились таким образом, что среднее соотношение числа и длительности составило (0,705, 0,709), близко к точке равного вклада (0,708, 0,708), со стандартным отклонением (0,138, 0,118). Таким образом, стабильность пути сканирования, приемлемая только при соотношении (0,5,1,0), была принесена в жертву поддержанию относительно стабильной средней длительности паузы. [29]
Это поставило под сомнение представление о том, что скан-траектория (в основном или исключительно) отражает горизонтальный или вертикальный акцент музыкальной фактуры, как предполагали Слобода (1985) и Уивер (1943), поскольку эти измерения существенно зависят от темпа.
Как логический вывод, так и доказательства в литературе указывают на тот факт, что в задаче движения глаз при чтении музыки есть три окуломоторных императива. Первый императив кажется очевидным: глаза должны поддерживать темп по странице, соответствующий темпу музыки, и они делают это, манипулируя количеством и продолжительностью фиксаций, и, таким образом, траекторией сканирования по партитуре. Второй императив заключается в обеспечении соответствующей скорости обновления информации, хранящейся и обрабатываемой в рабочей памяти, путем манипулирования количеством и продолжительностью фиксаций. Эта рабочая нагрузка, по-видимому, связана с темпом, сложностью стимула и знакомостью стимула, и есть веские доказательства того, что способность к высокой рабочей нагрузке по отношению к этим переменным также связана с навыками чтеца. Третий императив заключается в поддержании размера диапазона, соответствующего условиям чтения. Диапазон не должен быть настолько малым, чтобы не было достаточно времени для восприятия визуального ввода и его переработки в мышечно-скелетные команды; он не должен быть настолько большим, чтобы не превысить возможности системы памяти по хранению и обработке информации. Музыканты, по-видимому, используют окуломоторные команды для решения всех трех императивов одновременно, которые фактически накладываются друг на друга в процессе чтения. Таким образом, движение глаз воплощает собой текучий набор характеристик, которые не только тесно связаны с разработкой оптимального визуального ввода в аппарат, но и с обслуживанием процесса этой информации в системе памяти. [30]