Эмоциональная просодия или аффективная просодия — это различные паралингвистические аспекты использования языка , которые передают эмоции . [1] Она включает в себя тон голоса человека в речи , который передается посредством изменений высоты тона , громкости , тембра , скорости речи и пауз . Она может быть изолирована от семантической информации и взаимодействует с вербальным содержанием (например, сарказмом ). [2]
Эмоциональная просодия в речи воспринимается или декодируется немного хуже, чем выражения лица , но точность меняется в зависимости от эмоций. Гнев и печаль воспринимаются легче всего, за ними следуют страх и счастье, а отвращение воспринимается хуже всего. [3] [ нужен лучший источник ]
Исследования показали, что некоторые эмоции , такие как страх, радость и гнев, изображаются с большей частотой, чем такие эмоции, как грусть. [4]
Декодирование эмоций в речи включает три этапа: определение акустических признаков, создание значимых связей с этими признаками и обработка акустических моделей в отношении установленных связей. На этапе обработки связи с базовыми эмоциональными знаниями хранятся отдельно в сети памяти, специфичной для ассоциаций. Эти ассоциации могут быть использованы для формирования базовой линии для эмоциональных выражений, встречающихся в будущем. Эмоциональные значения речи неявно и автоматически регистрируются после того, как обстоятельства, важность и другие окружающие детали события были проанализированы. [6]
В среднем слушатели способны воспринимать предполагаемые эмоции, демонстрируемые им, со скоростью, значительно лучшей, чем случайность (шанс = приблизительно 10%). [5] Однако уровень ошибок также высок. Это отчасти связано с наблюдением, что слушатели более точны в эмоциональных выводах из определенных голосов и воспринимают некоторые эмоции лучше, чем другие. [4] Голосовые выражения гнева и печали воспринимаются легче всего, страх и счастье воспринимаются лишь умеренно хорошо, а отвращение имеет низкую воспринимаемость. [3] [ самоопубликованный источник? ]
Язык можно разделить на два компонента: вербальный и вокальный каналы. Вербальный канал — это семантическое содержание, создаваемое выбранными говорящим словами. В вербальном канале семантическое содержание слов говорящего определяет значение предложения. Однако то, как произносится предложение, может изменить его значение, которое является вокальным каналом. Этот канал языка передает эмоции, испытываемые говорящим, и дает нам, слушателям, лучшее представление о предполагаемом значении. Нюансы в этом канале выражаются через интонацию , интенсивность, ритм, которые объединяются для просодии . Обычно эти каналы передают одну и ту же эмоцию, но иногда они различаются. Сарказм и ирония — это две формы юмора, основанные на этом несовместимом стиле. [7]
Нейрологические процессы, объединяющие вербальные и вокальные (просодические) компоненты, относительно неясны. Однако предполагается, что вербальное содержание и вокальное обрабатываются в разных полушариях мозга . Вербальное содержание, состоящее из синтаксической и семантической информации, обрабатывается в левом полушарии . Синтаксическая информация обрабатывается в основном в лобных областях и небольшой части височной доли мозга, в то время как семантическая информация обрабатывается в основном в височных областях с включением меньшей части лобных долей . Напротив, просодия обрабатывается в основном тем же путем, что и вербальное содержание, но в правом полушарии . Нейровизуализационные исследования с использованием аппаратов функциональной магнитно-резонансной томографии (фМРТ) предоставляют дополнительную поддержку этой латерализации полушария и височно-фронтальной активации. Однако некоторые исследования показывают доказательства того, что восприятие просодии не исключительно латерализовано в правое полушарие и может быть более двусторонним. Есть некоторые доказательства того, что базальные ганглии также могут играть важную роль в восприятии просодии. [7]
Дефицит выражения и понимания просодии, вызванный поражениями правого полушария, известен как апросодии . Они могут проявляться в разных формах и при различных психических заболеваниях или болезнях. Апросодия может быть вызвана инсультом и злоупотреблением алкоголем . Типы апросодии включают: моторную (неспособность производить голосовую интонацию), экспрессивную (когда ограничения мозга, а не моторные функции являются причиной этой неспособности) и рецептивную (когда человек не может расшифровать эмоциональную речь). [8]
Было обнаружено, что с возрастом становится все труднее распознавать голосовые выражения эмоций. Пожилые люди испытывают немного больше трудностей с маркировкой голосовых выражений эмоций, особенно грусти и гнева, чем молодые люди, но испытывают гораздо большие трудности с интеграцией голосовых эмоций и соответствующих выражений лица. Возможным объяснением этой трудности является то, что объединение двух источников эмоций требует большей активации областей мозга, отвечающих за эмоции, в которых взрослые демонстрируют снижение громкости и активности. Другое возможное объяснение заключается в том, что потеря слуха могла привести к неправильному восприятию голосовых выражений. Известно, что потеря слуха на высоких частотах начинается примерно в возрасте 50 лет, особенно у мужчин. [9]
Поскольку правое полушарие мозга связано с просодией, у пациентов с поражением правого полушария возникают трудности с изменением речевых моделей для передачи эмоций. Поэтому их речь может звучать монотонно. Кроме того, было изучено, что люди с поражением правого полушария имеют проблемы с определением эмоций в интонированных предложениях.
Трудности в расшифровке как синтаксической, так и аффективной просодии также встречаются у людей с расстройством аутистического спектра и шизофренией , где «у пациентов наблюдается дефицит во многих функциональных областях, включая социальные навыки и социальное познание. Эти социальные нарушения состоят из трудностей в восприятии, понимании, предвосхищении и реагировании на социальные сигналы, которые имеют решающее значение для нормального социального взаимодействия». Это было определено в многочисленных исследованиях, таких как исследование Hoekert et al. 2017 года эмоциональной просодии при шизофрении, которое проиллюстрировало, что необходимо провести больше исследований, чтобы полностью подтвердить корреляцию между болезнью и эмоциональной просодией. Однако у людей с шизофренией нет проблем с расшифровкой неэмоциональной просодии. [10]
Эмоциональные состояния, такие как счастье, печаль, гнев и отвращение, можно определить исключительно на основе акустической структуры неязыкового речевого акта. Эти акты могут быть хрюканьем, вздохами , восклицаниями и т. д. Есть некоторые исследования, которые поддерживают идею о том, что эти неязыковые акты универсальны, вызывая одни и те же предположения даже у носителей разных языков.
Кроме того, было доказано, что эмоции могут быть выражены в неязыковых вокализациях иначе, чем в речи. Как утверждают Лаукка и др.: Речь требует высокоточного и скоординированного движения артикуляторов (например, губ , языка и гортани ) для передачи языковой информации, тогда как неязыковые вокализации не ограничены языковыми кодами и, таким образом, не требуют таких точных артикуляций. Это подразумевает, что неязыковые вокализации могут демонстрировать более широкие диапазоны для многих акустических характеристик, чем просодические выражения.
В своем исследовании актеры должны были озвучивать ряд различных эмоций без слов. Исследование показало, что слушатели могли идентифицировать широкий спектр положительных и отрицательных эмоций выше случайности. Однако такие эмоции, как вина и гордость, были распознаны сложнее. [11]
В исследовании 2015 года Верены Керскен, Клауса Зубербюлера и Хуана-Карлоса Гомеса неязыковые вокализации младенцев были представлены взрослым, чтобы проверить, могут ли взрослые отличить их от вокализации младенцев, указывающей на просьбы о помощи, указывающей на объект или указывающей на событие. Младенцы демонстрируют различные просодические элементы в плаче в зависимости от того, о чем они плачут. У них также есть различные вспышки для положительных и отрицательных эмоциональных состояний. Было установлено, что способность расшифровки этой информации применима к разным культурам и не зависит от уровня опыта взрослого с младенцами.
Мужчины и женщины различаются как в том, как они используют язык, так и в том, как они его понимают. Известно, что существует разница в скорости речи, диапазоне высоты тона, продолжительности речи и наклоне высоты тона (Фицсиммонс и др.). Например, «В исследовании взаимосвязи спектральных и просодических знаков было установлено, что зависимость высоты тона от продолжительности различалась у мужчин и женщин, произносящих предложения с утвердительной и вопросительной интонацией. Темп речи , диапазон высоты тона и крутизна высоты тона различаются между полами» (Несич и др.). Одной из таких иллюстраций является то, как женщины более склонны говорить быстрее, удлинять концы слов и повышать тон в конце предложений.
Женщины и мужчины также различаются в том, как они неврологически обрабатывают эмоциональную просодию. В исследовании фМРТ мужчины показали более сильную активацию в большем количестве областей коры, чем женщины, при обработке значения или манеры эмоциональной фразы. В задании на манеру у мужчин была более сильная активация в билатеральной средней височной извилине . Для женщин единственной значимой областью была правая задняя доля мозжечка . Мужчины-испытуемые в этом исследовании показали более сильную активацию в префронтальной коре и в среднем нуждались в более длительном времени ответа, чем женщины-испытуемые. Этот результат был интерпретирован как означающий, что мужчинам необходимо делать осознанные выводы о действиях и намерениях говорящего, в то время как женщины могут делать это подсознательно. Следовательно, мужчинам необходимо интегрировать лингвистическую семантику и эмоциональное намерение «на более высокой стадии, чем стадия семантической обработки». [12]
Большинство исследований, касающихся вокального выражения эмоций, были проведены с использованием синтетической речи или изображений эмоций профессиональными актерами. Мало исследований было проведено с использованием спонтанных, «естественных» речевых образцов. Эти искусственные речевые образцы считались близкими к естественной речи, но в частности изображения актерами могут быть подвержены влиянию стереотипов эмоционального вокального выражения и могут демонстрировать усиленные характеристики речи, искажающие восприятие слушателей. Другое соображение заключается в индивидуальном восприятии слушателей. Исследования обычно берут среднее значение ответов, но немногие изучают индивидуальные различия глубоко. Это может обеспечить лучшее понимание вокального выражения эмоций. [5]