В акустике громкость — это субъективное восприятие звукового давления . Более формально она определяется как «атрибут слухового ощущения, в терминах которого звуки могут быть упорядочены по шкале от тихого до громкого». [ 1] Связь физических атрибутов звука с воспринимаемой громкостью состоит из физических, физиологических и психологических компонентов. Изучение кажущейся громкости входит в тему психоакустики и использует методы психофизики .
В разных отраслях громкость может иметь разное значение и разные стандарты измерения. Некоторые определения, такие как ITU-R BS.1770, относятся к относительной громкости различных сегментов электронно воспроизводимых звуков, например, для вещания и кино. Другие, такие как ISO 532A (громкость Стивенса, измеряемая в сонах ), ISO 532B ( громкость Цвикера ), DIN 45631 и ASA/ANSI S3.4, имеют более общую область применения и часто используются для характеристики громкости окружающего шума. Более современные стандарты, такие как Nordtest ACOU112 и ISO/AWI 532-3 (в процессе разработки), учитывают другие компоненты громкости, такие как скорость начала, изменение во времени и спектральное маскирование.
Громкость, субъективная мера, часто путается с физическими мерами силы звука, такими как звуковое давление, уровень звукового давления (в децибелах ), интенсивность звука или звуковая мощность . Взвешивающие фильтры, такие как A-взвешивание и LKFS, пытаются компенсировать измерения, чтобы они соответствовали громкости, воспринимаемой типичным человеком.
Восприятие громкости связано с уровнем звукового давления (SPL), частотным содержанием и длительностью звука. [2] Связь между SPL и громкостью одного тона можно приблизительно описать с помощью степенного закона Стивенса , в котором SPL имеет показатель степени 0,67. [a] Более точная модель, известная как функция наклонной экспоненты , [3] показывает, что громкость увеличивается с более высоким показателем на низких и высоких уровнях и с более низким показателем на умеренных уровнях. [4]
Чувствительность человеческого уха изменяется в зависимости от частоты, как показано на графике равной громкости . Каждая линия на этом графике показывает SPL, необходимый для того, чтобы частоты воспринимались как одинаково громкие, и разные кривые относятся к разным уровням звукового давления. Он также показывает, что люди с нормальным слухом наиболее чувствительны к звукам около 2–4 кГц, причем чувствительность снижается по обе стороны от этого диапазона. Полная модель восприятия громкости будет включать интеграцию SPL по частоте. [5]
Исторически громкость измерялась с помощью метода балансировки уха с помощью аудиометра , в котором амплитуда синусоидальной волны настраивалась пользователем так, чтобы она равнялась воспринимаемой громкости оцениваемого звука. [6] Современные стандарты измерения громкости основаны на суммировании энергии в критических полосах . [7]
При нейросенсорной потере слуха ( повреждении улитки или мозга) восприятие громкости изменяется. Звуки на низких уровнях (часто воспринимаемые людьми без потери слуха как относительно тихие) больше не слышны для людей с нарушением слуха, но звуки на высоких уровнях часто воспринимаются как имеющие ту же громкость, что и для слушателя без нарушений. Это явление можно объяснить двумя теориями, называемыми набором громкости и невосприятием мягкости .
Loudness recruitment утверждает, что громкость растет быстрее для определенных слушателей, чем для обычных слушателей с изменениями уровня. Эта теория была принята в качестве классического объяснения.
Невосприятие мягкости, термин, введенный Мэри Флорентайн около 2002 года, [8] предполагает, что некоторые слушатели с сенсоневральной потерей слуха могут демонстрировать нормальную скорость роста громкости, но вместо этого имеют повышенную громкость на своем пороге. То есть, самый тихий звук, который слышен этим слушателям, громче, чем самый тихий звук, слышимый обычными слушателями.
Управление громкостью , связанное с функцией компенсации громкости на некоторых бытовых стереосистемах, изменяет кривую частотной характеристики , чтобы она примерно соответствовала характеристике равной громкости уха. [9] Компенсация громкости предназначена для того, чтобы записанная музыка звучала более естественно при воспроизведении на более низких уровнях громкости за счет усиления низких частот, к которым ухо менее чувствительно при более низких уровнях звукового давления.
Нормализация громкости — это особый тип нормализации звука , который выравнивает воспринимаемый уровень, так что, например, реклама не звучит громче телевизионных программ. Схемы нормализации громкости существуют для ряда аудиоприложений.
Исторически для измерения громкости использовались единицы сон (громкость N ) и фон (уровень громкости L N ). [11]
А-взвешивание учитывает человеческую чувствительность к звуку и описывает относительную воспринимаемую громкость для тихих и умеренных уровней речи, около 40 фонов .
Относительный мониторинг громкости в производстве измеряется в соответствии с ITU-R BS.1770 в единицах LKFS. [12] Работа над ITU-R BS.1770 началась в 2001 году после того, как искажения уровня 0 dBFS+ в преобразователях и кодеках с потерями стали очевидными; и исходная метрика громкости Leq(RLB) [ необходимо разъяснение ] была предложена Жильбером Соулодром в 2003 году. [13] На основе данных субъективных тестов прослушивания Leq(RLB) выгодно отличается от многочисленных других алгоритмов. CBC , Dolby и TC Electronic , а также многочисленные вещатели внесли свой вклад в тесты прослушивания. Уровни громкости, измеренные в соответствии с Leq(RLB), указанным в ITU-R BS.1770, сообщаются в единицах LKFS .
Система измерения ITU-R BS.1770 была улучшена для многоканальных приложений ( от монофонического до объемного звука 5.1 ). Чтобы сделать метрику громкости кросс-жанровой, был добавлен относительный измерительный шлюз . Эта работа была выполнена в 2008 году EBU. Улучшения были возвращены в BS.1770-2. Впоследствии ITU обновил метрику истинного пика (BS.1770-3) и добавил положение для еще большего количества аудиоканалов, например, объемного звука 22.2 (BS.1770-4).