Чтение по губам , также известное как чтение речи , представляет собой технику понимания ограниченного диапазона речи путем визуальной интерпретации движений губ, лица и языка без звука. Оценки диапазона чтения по губам различаются, некоторые цифры составляют всего 30%, поскольку чтение по губам зависит от контекста, знания языка и любого остаточного слуха. [1] Хотя чтение по губам наиболее широко используется глухими и слабослышащими людьми, большинство людей с нормальным слухом обрабатывают некоторую речевую информацию, видя движущийся рот. [2]
Хотя восприятие речи считается слуховым навыком, оно по своей сути является мультимодальным, поскольку для произнесения речи требуется, чтобы говорящий совершал движения губ, зубов и языка, которые часто видны при личном общении. Информация от губ и лица поддерживает слуховое понимание [3] , и большинство бегло говорящих на языке людей чувствительны к видимым речевым действиям (см. эффект Мак-Герка ). Степень, в которой люди используют видимые речевые действия, зависит от видимости речевого действия, а также от знаний и навыков воспринимающего.
Фонема — это наименьшая обнаруживаемая единица звука в языке, которая служит для различения слов друг от друга. /pit/ и /pik/ отличаются одной фонемой и относятся к разным концепциям. В разговорном английском языке около 44 фонем. При чтении по губам количество визуально различающихся единиц — визем — намного меньше, поэтому несколько фонем сопоставляются с несколькими виземами. Это связано с тем, что многие фонемы воспроизводятся во рту и горле и их трудно увидеть. К ним относятся гортанные согласные и большинство жестов языка. Звонкие и глухие пары выглядят одинаково, например, [p] и [b], [k] и [g], [t] и [d], [f] и [v], а также [s] и [z]; то же самое касается назализации (например, [m] против [b]). Омофены — это слова, которые выглядят одинаково при чтении по губам, но содержат разные фонемы. Поскольку в английском языке фонем примерно в три раза больше, чем визем, часто утверждается, что только 30% речи можно прочитать по губам. Омофены являются важнейшим источником неправильного чтения по губам.
Виземы можно запечатлеть как неподвижные изображения, но речь разворачивается во времени. Плавная артикуляция звуков речи в последовательности может означать, что паттерны рта могут быть «сформированы» соседней фонемой: звук «th» в словах «tooth» и «teeth» выглядит очень по-разному из-за вокального контекста. Эта особенность динамического чтения речи влияет на чтение по губам «за пределами виземы». [5]
Хотя виземы предлагают полезную отправную точку для понимания чтения по губам, разговорные различия внутри виземы могут быть различимы и могут помочь в идентификации. [6] Более того, статистическое распределение фонем в лексиконе языка неравномерно. Хотя есть кластеры слов, которые фонемически похожи друг на друга («лексические соседи», такие как spit/sip/sit/stick... и т. д.), другие не похожи на все остальные слова: они «уникальны» с точки зрения распределения своих фонем (например, «зонтик»). Опытные пользователи языка используют эти знания при интерпретации речи, поэтому, как правило, сложнее идентифицировать услышанное слово со многими лексическими соседями, чем слово с несколькими соседями. Применяя это понимание к видимой речи, некоторые слова в языке можно однозначно прочитать по губам, даже если они содержат мало визем — просто потому, что никакие другие слова не могут «подойти». [7]
На видимость говорящего лица влияют многие факторы, включая освещение, движение головы/камеры, частоту кадров движущегося изображения и расстояние от зрителя (см., например, [8] ). Движение головы, сопровождающее обычную речь, также может улучшить чтение по губам, независимо от оральных действий. [9] Однако при чтении по губам связной речи знание зрителем разговорного языка, знакомство с говорящим и стилем речи, а также контекст материала для чтения по губам [10] так же важны, как и видимость говорящего. Хотя большинство слышащих людей чувствительны к видимой речи, существует большая изменчивость в индивидуальных навыках чтения по губам. Хорошие читатели по губам часто точнее плохих при определении фонем из визуальной речи.
Простая виземическая мера «читаемости по губам» была подвергнута сомнению некоторыми исследователями. [11] Мера «класса эквивалентности фонем» учитывает статистическую структуру лексикона и может также учитывать индивидуальные различия в способности читать по губам. [12] [13] В соответствии с этим, отличное чтение по губам часто связано с более широкими когнитивными навыками, включая общее владение языком, исполнительную функцию и рабочую память . [14] [15]
Видение рта играет роль в ранней чувствительности младенца к речи и готовит его к тому, чтобы стать говорящим в возрасте 1–2 лет. Чтобы подражать, младенец должен научиться формировать губы в соответствии со звуками, которые он слышит; наблюдение за говорящим может помочь ему в этом. [16] Новорожденные подражают движениям рта взрослых, таким как высовывание языка или открывание рта, что может быть предшественником дальнейшего подражания и последующего изучения языка. [17] Младенцы испытывают беспокойство, когда аудиовизуальная речь знакомого говорящего десинхронизирована [18] и, как правило, демонстрируют разные шаблоны взгляда для знакомых и незнакомых лиц при сопоставлении с (записанными) голосами. [19] Младенцы чувствительны к иллюзиям Мак-Гурка за несколько месяцев до того, как они научатся говорить. [20] [21] Эти и многие другие исследования указывают на роль зрения в развитии чувствительности к (слуховой) речи в течение первого полугодия жизни.
До шестимесячного возраста большинство слышащих младенцев чувствительны к широкому спектру речевых жестов, включая те, которые можно увидеть на губах, которые могут или не могут быть позже частью фонологии их родного языка. Но во вторые шесть месяцев жизни слышащий младенец демонстрирует сужение восприятия фонетической структуры своего собственного языка и может потерять раннюю чувствительность к бесполезным моделям рта. Речевые звуки /v/ и /b/, которые являются виземически отличительными в английском языке, но не в кастильском испанском, точно различаются у детей, подвергавшихся воздействию испанского и английского языков, до возраста около 6 месяцев. Однако дети старшего возраста, подвергавшиеся воздействию испанского языка, теряют способность «видеть» это различие, в то время как оно сохраняется у детей, подвергавшихся воздействию английского языка. [22] Такие исследования показывают, что вместо того, чтобы слух и зрение развивались независимым образом в младенчестве, мультимодальная обработка является правилом, а не исключением, в (языковом) развитии мозга младенца. [23]
Учитывая многочисленные исследования, указывающие на роль зрения в развитии языка у доязыкового младенца, влияние врожденной слепоты на развитие языка на удивление невелико. 18-месячные дети легче усваивают новые слова, когда слышат их, и не усваивают их, когда им показывают речевые движения без слуха. [24] Однако дети, слепые от рождения, могут путать /m/ и /n/ в своем собственном раннем произношении английских слов — путаница, редко встречающаяся у зрячих слышащих детей, поскольку /m/ и /n/ визуально различимы, но на слух их можно спутать. [25] Роль зрения у детей в возрасте 1–2 лет может быть менее критичной для воспроизведения их родного языка, поскольку к этому возрасту они уже достигли навыков, необходимых для распознавания и имитации звуков речи. Однако, слушание неродного языка может переключить внимание ребенка на визуальное и слуховое взаимодействие посредством чтения по губам и слушания для обработки, понимания и воспроизведения речи. [26]
Исследования с младенцами и детьми, не умеющими говорить, используют косвенные, невербальные меры для определения чувствительности к видимой речи. Явное чтение по губам можно надежно проверить у слышащих дошкольников, попросив их «произнести вслух то, что я говорю молча». [27] У детей школьного возраста чтение по губам знакомых закрытых слов, таких как числительные, может быть легко выявлено. [28] Индивидуальные различия в навыке чтения по губам, которые проверяются путем просьбы к ребенку «произнести слово, которое он читает по губам», или путем сопоставления прочитанного по губам высказывания с картинкой [29] , показывают связь между навыком чтения по губам и возрастом. [30] [31]
В то время как чтение по губам беззвучной речи представляет собой проблему для большинства слышащих людей, добавление зрения говорящего к слышимой речи улучшает обработку речи во многих условиях. Механизмы этого и точные способы, которыми помогает чтение по губам, являются темами текущих исследований. [32] Видение говорящего помогает на всех уровнях обработки речи от фонетического различения признаков до интерпретации прагматических высказываний. [33] Положительные эффекты добавления зрения к слышимой речи сильнее в шумной, чем в тихой обстановке, [34] где, облегчая восприятие речи, видение говорящего может высвободить когнитивные ресурсы, обеспечивая более глубокую обработку речевого содержания.
Поскольку слух становится менее надежным в пожилом возрасте , люди могут больше полагаться на чтение по губам, и их поощряют делать это. Однако большая зависимость от чтения по губам не всегда может компенсировать последствия возрастной потери слуха. Когнитивное снижение при старении может предшествовать и/или быть связано с измеримой потерей слуха. [35] [36] Таким образом, чтение по губам не всегда может полностью компенсировать комбинированное слуховое и когнитивное возрастное снижение.
В ряде исследований сообщается об аномалиях чтения по губам у групп населения с характерными нарушениями развития. Аутизм : люди с аутизмом могут демонстрировать сниженные способности к чтению по губам и сниженную зависимость от зрения при восприятии аудиовизуальной речи. [37] [38] Это может быть связано с аномалиями взгляда в лицо у этих людей. [39] Синдром Уильямса : люди с синдромом Уильямса демонстрируют некоторые нарушения чтения по губам, которые могут быть независимы от их зрительно-пространственных трудностей. [40] Специфические нарушения языка : дети с SLI, как сообщается, также демонстрируют сниженную чувствительность к чтению по губам, [41] как и люди с дислексией . [42]
Дебаты бушуют уже сотни лет по поводу роли чтения по губам (« орализм ») по сравнению с другими методами общения (в последнее время — полной коммуникацией ) в образовании глухих людей. Степень, в которой тот или иной подход полезен, зависит от ряда факторов, включая уровень потери слуха глухого человека, возраст потери слуха, родительское участие и родительский язык(и). Затем возникает вопрос о целях глухого человека и его сообщества и опекунов. Является ли целью образования улучшение общения в целом, развитие языка жестов как первого языка или развитие навыков разговорного языка слышащего сообщества? Исследователи теперь сосредотачиваются на том, какие аспекты языка и общения могут быть лучше всего доставлены, какими средствами и в каких контекстах, учитывая статус слуха ребенка и его семьи, а также их образовательные планы. [43] Бимодальный билингвизм (владение как речью, так и языком жестов) является одним из доминирующих современных подходов в языковом образовании глухого ребенка. [44]
Глухие люди часто лучше читают по губам, чем люди с нормальным слухом. [45] Некоторые глухие люди практикуют как профессиональные читатели по губам, например, в судебной экспертизе . У глухих людей, имеющих кохлеарный имплант , предимплантационный навык чтения по губам может предсказать постимплантную (слуховую или аудиовизуальную) обработку речи. [46] У взрослых, чем позже возраст имплантации, тем лучше способности к визуальному чтению речи у глухого человека. [47] Для многих глухих людей доступ к устной коммуникации может быть облегчен, когда устное сообщение передается через обученного профессионального диктора по губам . [48] [49]
В связи с чтением по губам и развитием грамотности, дети, рожденные глухими, обычно демонстрируют задержку развития навыков грамотности [50] , что может отражать трудности в приобретении элементов разговорной речи. [51] В частности, надежное сопоставление фонем и графем может быть более сложным для глухих детей, которым необходимо быть опытными чтецами речи, чтобы освоить этот необходимый шаг в приобретении грамотности. Навык чтения по губам связан со способностями к грамотности у глухих взрослых и детей [52] [53] , и обучение чтению по губам может помочь развить навыки грамотности. [54]
Cued Speech использует чтение по губам с сопровождающими формами рук, которые устраняют неоднозначность виземической (согласной) формы губ. Говорят, что родителям, которые слышат речь с подсказками, легче выучить ее, чем язык жестов, и исследования, в основном из Бельгии, показывают, что глухой ребенок, подвергавшийся воздействию речи с подсказками в младенчестве, может добиться более эффективного прогресса в изучении разговорного языка, чем при одном лишь чтении по губам. [55] Использование речи с подсказками при кохлеарной имплантации для глухоты, вероятно, будет положительным. [56] Похожий подход, включающий использование форм рук, сопровождающих видимую речь, называется Visual Phonics, который используется некоторыми педагогами для поддержки обучения письменному и устному языку.
Цель обучения и тренировки чтению по губам — развить понимание природы чтения по губам и практиковать способы улучшения способности воспринимать речь «на глаз». [57] Хотя ценность обучения чтению по губам в улучшении «слуха на глаз» не всегда была ясна, особенно для людей с приобретенной потерей слуха, есть доказательства того, что систематическое обучение по привлечению внимания учащихся к видимым речевым действиям может быть полезным. [58] Занятия чтением по губам, часто называемые занятиями по чтению по губам и управлению потерей слуха , в основном нацелены на взрослых с потерей слуха. Самая большая доля взрослых с потерей слуха имеет возрастную или связанную с шумом потерю ; при обеих этих формах потери слуха сначала теряются высокочастотные звуки. Поскольку многие согласные в речи являются высокочастотными звуками, речь искажается. Слуховые аппараты помогают, но не могут вылечить это. Занятия чтением по губам, как было показано, приносят пользу в британских исследованиях, заказанных благотворительной организацией Action on Hearing Loss [59] (2012).
Тренеры признают, что чтение по губам — неточное искусство. Студентов учат следить за движениями губ, языка и челюсти, следить за ударением и ритмом языка, использовать остаточный слух, со слуховыми аппаратами или без них, следить за выражением лица и языком тела, а также использовать свою способность рассуждать и делать выводы. Их обучают алфавиту чтения по губам, группам звуков, которые выглядят одинаково на губах (виземы), например, п, б, м или ф, в. Цель состоит в том, чтобы уловить суть, чтобы иметь уверенность, чтобы присоединиться к разговору и избежать разрушительной социальной изоляции, которая часто сопровождает потерю слуха. Занятия по чтению по губам рекомендуются всем, кто испытывает трудности с восприятием в шуме, и помогают приспособиться к потере слуха.
Большинство тестов чтения по губам были разработаны для измерения индивидуальных различий в выполнении определенных задач по обработке речи и для обнаружения изменений в производительности после обучения. Тесты чтения по губам использовались с относительно небольшими группами в экспериментальных условиях или в качестве клинических показателей с отдельными пациентами и клиентами. То есть, большинство тестов чтения по губам на сегодняшний день имеют ограниченную валидность в качестве маркеров навыка чтения по губам в общей популяции. [60]
Автоматическое чтение по губам было темой интереса в вычислительной технике, а также в научно-фантастических фильмах. Инженер-вычислитель Стив Омохундро , среди прочих, был пионером его разработки. В анимации лица цель состоит в том, чтобы генерировать реалистичные движения лица, особенно движения рта, которые имитируют действия человеческой речи. Компьютерные алгоритмы для деформации или манипулирования изображениями лиц могут управляться услышанным или написанным языком. Системы могут быть основаны на подробных моделях, полученных из движений лица ( захват движения ); на анатомическом моделировании действий челюсти, рта и языка; или на отображении известных свойств виземы-фонемы. [61] [62] Анимация лица использовалась в обучении чтению речи (демонстрируя, как «выглядят» разные звуки). [63] Эти системы являются подмножеством моделирования синтеза речи , которое направлено на предоставление надежных выходных данных «текст-в-(видимую)-речь». Дополнительная цель — обратная тому, чтобы заставить лица двигаться в речи — заключается в разработке компьютерных алгоритмов, которые могут предоставлять реалистичные интерпретации речи (т. е. письменную стенограмму или аудиозапись) из естественных видеоданных лица в действии: это распознавание речи по лицу. Эти модели также могут быть получены из различных данных. [64] Автоматическое визуальное распознавание речи по видео было довольно успешным в различении разных языков (из корпуса данных разговорного языка). [65] Демонстрационные модели, использующие алгоритмы машинного обучения, имели определенный успех в чтении по губам речевых элементов, таких как определенные слова, из видео [66] и для определения трудночитаемых по губам фонем из виземически похожих увиденных действий рта. [67] Машинное чтение речи теперь успешно использует алгоритмы на основе нейронных сетей, которые используют большие базы данных говорящих и речевого материала (следуя успешной модели для слухового автоматического распознавания речи ). [68]
Использование машинного чтения по губам может включать автоматическое чтение по губам только видеозаписей, автоматическое чтение по губам ораторов с поврежденными голосовыми трактами и обработку речи в видео лицом к лицу (т. е. с данных видеофона). Автоматическое чтение по губам может помочь в обработке шумной или незнакомой речи. [69] Автоматическое чтение по губам может способствовать биометрической идентификации личности, заменив идентификацию на основе пароля. [70] [71]
После открытия того, что слуховые области мозга , включая извилину Гешля , активируются видимой речью, [72] было показано, что нейронная схема для чтения речи включает супрамодальные области обработки, особенно верхнюю височную борозду (все части), а также задние нижние затылочно-височные области, включая области, специализированные для обработки лиц и биологического движения . [73] В некоторых, но не во всех исследованиях сообщается об активации области Брока для чтения речи, [74] [75] предполагая, что артикуляционные механизмы могут быть активированы при чтении речи. [76] Исследования временного хода аудиовизуальной обработки речи показали, что вид речи может подготавливать слуховые области обработки до акустического сигнала. [77] [78] Лучший навык чтения по губам связан с большей активацией в (левой) верхней височной борозде и смежных нижних височных (зрительных) областях у слышащих людей. [79] [80] У глухих людей схема, отвечающая за чтение речи, по-видимому, очень похожа на схему у слышащих людей, с похожими ассоциациями активации верхней височной доли (левой) и навыка чтения по губам. [81]
{{cite journal}}
: CS1 maint: числовые имена: список авторов ( ссылка ){{cite journal}}
: CS1 maint: числовые имена: список авторов ( ссылка ){{cite journal}}
: CS1 maint: числовые имена: список авторов ( ссылка )