Сжатие динамического диапазона ( DRC ) или просто сжатие — это операция обработки аудиосигнала , которая уменьшает громкость громких звуков или усиливает тихие звуки, тем самым уменьшая или сжимая динамический диапазон аудиосигнала . Сжатие обычно используется в звукозаписи и воспроизведении , вещании , [1] живом звукоусилении и некоторых инструментальных усилителях .
Специализированное электронное аппаратное устройство или аудиопрограммное обеспечение, которое применяет сжатие, называется компрессором . В 2000-х годах компрессоры стали доступны в виде программных плагинов, которые работают в программном обеспечении цифровой звуковой рабочей станции . В записанной и живой музыке параметры сжатия могут быть скорректированы для изменения способа их воздействия на звуки. Сжатие и ограничение идентичны по процессу, но различаются по степени и воспринимаемому эффекту. Ограничитель — это компрессор с высоким отношением и, как правило, коротким временем атаки.
Сжатие используется для улучшения производительности и ясности в системах оповещения , как эффект и для улучшения согласованности при микшировании и мастеринге . Оно используется для голоса, чтобы уменьшить шипение, а также в вещании и рекламе, чтобы сделать аудиопрограмму выделяющейся. Это неотъемлемая технология в некоторых системах шумоподавления .
Существует два типа сжатия: нисходящее и восходящее. Оба типа сжатия уменьшают динамический диапазон аудиосигнала. [2]
Нисходящая компрессия уменьшает громкость громких звуков выше определенного порога. Тихие звуки ниже порога остаются нетронутыми. Это наиболее распространенный тип компрессора. Ограничитель можно рассматривать как экстремальную форму нисходящей компрессии, поскольку он особенно сильно сжимает звуки выше порога.
Сжатие вверх увеличивает громкость тихих звуков ниже определенного порога. Более громкие звуки выше порога остаются неизменными.
Некоторые компрессоры также обладают способностью делать противоположное сжатию, а именно расширение . Расширение увеличивает динамический диапазон аудиосигнала. [3] Как и сжатие, расширение бывает двух типов: вниз и вверх.
Расширение вниз делает тихие звуки ниже порога еще тише. Шумоподавитель можно рассматривать как крайнюю форму расширения вниз, поскольку шумоподавитель делает тихие звуки (например, шум) тише или даже тихими, в зависимости от настройки пола. [2]
Расширение вверх делает громкие звуки выше порога еще громче.
Сигнал, поступающий в компрессор, разделяется; одна копия отправляется на усилитель с переменным коэффициентом усиления , а другая — на боковую цепь , где измеряется уровень сигнала, а схема, управляемая измеренным уровнем сигнала, применяет требуемое усиление к усилителю. Такая конструкция, известная как тип прямой связи , сегодня используется в большинстве компрессоров. Более ранние конструкции были основаны на схеме обратной связи , где уровень сигнала измерялся после усилителя. [4]
Существует ряд технологий, используемых для усиления с переменным коэффициентом усиления, каждая из которых имеет свои преимущества и недостатки. Электронные лампы используются в конфигурации, называемой variable-mu, где напряжение между сеткой и катодом изменяется для изменения коэффициента усиления. [5] Оптические компрессоры используют фоторезистор, стимулируемый небольшой лампой ( накаливание , светодиод или электролюминесцентная панель ) [6] для создания изменений в усилении сигнала. Другие используемые технологии включают полевые транзисторы и диодный мост . [7]
При работе с цифровым аудио, методы цифровой обработки сигнала (DSP) обычно используются для реализации сжатия в виде аудиоплагинов , в микшерных пультах и в цифровых аудиорабочих станциях . Часто алгоритмы используются для эмуляции вышеуказанных аналоговых технологий. [ необходима цитата ]
Для настройки алгоритмов и компонентов обработки сигнала сжатия динамического диапазона используется ряд настраиваемых пользователем параметров и функций управления.
Компрессор снижает уровень аудиосигнала, если его амплитуда превышает определенный порог . Порог обычно устанавливается в децибелах ( dBFS для цифровых компрессоров и dBu для аппаратных компрессоров), [8] , где более низкий порог (например, −60 дБ) означает, что обрабатывается большая часть сигнала. Когда уровень сигнала ниже порога, обработка не выполняется, и входной сигнал передается на выход без изменений. Таким образом, более высокий порог, например, −5 дБ, приводит к меньшей обработке, меньшему сжатию.
Поведение порогового времени зависит от настроек атаки и восстановления (см. ниже). Когда уровень сигнала превышает пороговое значение, работа компрессора задерживается настройкой атаки . В течение времени, определяемого восстановлением после того, как входной сигнал упал ниже порогового значения, компрессор продолжает применять компрессию динамического диапазона.
Степень снижения усиления определяется соотношением : соотношение 4:1 означает, что если уровень входного сигнала на 4 дБ превышает пороговое значение, уровень выходного сигнала уменьшается до 1 дБ сверх порогового значения. Уровень усиления и выходного сигнала был уменьшен на 3 дБ. Другими словами, любой уровень входного сигнала сверх порогового значения в этом случае будет выведен на уровне, который всего на 25% (т. е. 1 на 4) превышает пороговое значение, каков был его входной уровень.
Наибольшее отношение :1 часто называют ограничением , и оно фактически означает, что любой сигнал выше порогового значения снижается до порогового уровня по истечении времени атаки .
Компрессор может обеспечить определенную степень контроля над тем, как быстро он действует. Атака — это период, когда компрессор уменьшает усиление в ответ на повышенный уровень на входе, чтобы достичь усиления, определяемого соотношением. Выпуск — это период, когда компрессор увеличивает усиление в ответ на пониженный уровень на входе, чтобы достичь выходного усиления, определяемого соотношением, или до единицы, как только уровень на входе упал ниже порогового значения. Поскольку шаблон громкости исходного материала изменяется изменяющейся во времени работой компрессора, он может изменить характер сигнала от едва заметного до весьма заметного способа в зависимости от используемых настроек атаки и выпуска.
Длина каждого периода определяется скоростью изменения и требуемым изменением усиления. Для более интуитивной работы элементы управления атакой и восстановлением компрессора обозначены как единица времени (часто миллисекунды). Это количество времени, необходимое для изменения усиления на заданное количество дБ или заданный процент по отношению к целевому усилению. Не существует отраслевого стандарта для точного значения этих временных параметров. [9]
Во многих компрессорах время атаки и релиза регулируется пользователем. Однако в некоторых компрессорах время атаки и релиза определяется конструкцией схемы и не может быть изменено. Иногда время атаки и релиза является автоматическим или программно-зависимым , что означает, что поведение может меняться в зависимости от входного сигнала.
Другим элементом управления, который может предложить компрессор, является выбор жесткого или мягкого колена. Это определяет, будет ли изгиб кривой отклика между значениями ниже порогового значения и выше порогового значения резким (жестким) или постепенным (мягким). Мягкое колено медленно увеличивает степень сжатия по мере увеличения уровня и в конечном итоге достигает степени сжатия, установленной пользователем. Мягкое колено уменьшает потенциально слышимый переход от несжатого к сжатому и особенно применимо для более высоких настроек соотношения, где переход на пороговом значении будет более заметным. [10]
Компрессор с пиковым датчиком реагирует на пиковый уровень входного сигнала. Обеспечивая более жесткий контроль пикового уровня, пиковый датчик не обязательно связан с человеческим восприятием громкости. Некоторые компрессоры применяют функцию измерения мощности (обычно среднеквадратичное значение или RMS) к входному сигналу перед сравнением его уровня с пороговым значением. Это обеспечивает более расслабленную компрессию, которая более тесно связана с человеческим восприятием громкости.
Компрессор в режиме стереосвязывания применяет одинаковое количество снижения усиления как к левому, так и к правому каналу. Это делается для предотвращения смещения изображения, которое может произойти, если каждый канал сжимается индивидуально. [11]
Поскольку нисходящий компрессор только снижает уровень сигнала, обычно предусмотрена возможность добавления фиксированного количества дополнительного усиления на выходе, что позволяет получить оптимальный уровень выходного сигнала.
Функция упреждения предназначена для преодоления проблемы вынужденного компромисса между медленными скоростями атаки, которые производят плавно звучащие изменения усиления, и быстрыми скоростями атаки, способными улавливать переходные процессы. Упреждение реализуется путем разделения входного сигнала и задержки одной стороны (аудиосигнала) на время упреждения. Незадержанная сторона (сигнал управления усилением) используется для управления сжатием задержанного сигнала, который затем появляется на выходе. Таким образом, плавно звучащая более медленная скорость атаки может использоваться для улавливания переходных процессов. Стоимость этого решения — добавленная задержка звука через процессор.
Сжатие часто применяется в аудиосистемах для ресторанов, магазинов и аналогичных общественных мест, где фоновая музыка воспроизводится на относительно низкой громкости и требуется ее сжатие не только для поддержания постоянной громкости, но и для того, чтобы тихие части музыки были слышны на фоне окружающего шума.
Сжатие может увеличить средний выходной коэффициент усиления усилителя мощности на 50–100 % при уменьшении динамического диапазона. [ необходима ссылка ] Для систем оповещения и эвакуации это добавляет четкости в шумных условиях и экономит количество необходимых усилителей.
Сжатие часто используется в музыкальном производстве, чтобы сделать инструменты более согласованными в динамическом диапазоне, чтобы они лучше «сидели» в миксе с другими инструментами (не исчезали в течение коротких промежутков времени и не перегружали другие инструменты в течение коротких промежутков времени). [12] Вокальные исполнения в рок-музыке или поп-музыке сжимаются по той же причине.
Компрессию можно также использовать для звуков инструментов, чтобы создавать эффекты, не ориентированные в первую очередь на стабилизацию громкости. Например, звуки барабанов и тарелок имеют тенденцию быстро затухать, но компрессор может сделать звук с более длительным хвостом. Звуки гитары часто сжимаются, чтобы получить более полный и продолжительный звук.
Большинство устройств, способных сжимать звуковую динамику, также можно использовать для уменьшения громкости одного источника звука, когда другой источник звука достигает определенного уровня; это называется сайд-чейн. [13] В электронной танцевальной музыке сайд-чейн часто используется на басовых линиях , управляемых бас-бочкой или аналогичным ударным триггером, чтобы предотвратить конфликт двух источников и придать звуку пульсирующую, ритмичную динамику.
Компрессор можно использовать для уменьшения шипящих звуков (звуков «эсс») в вокале ( де-эссинг ), подавая на боковую цепь компрессора выровненную версию входного сигнала, так что определенные частоты, связанные с шипящими звуками (обычно от 4000 до 8000 Гц), активируют компрессор сильнее. [14]
Сжатие используется в голосовой связи в любительском радио , которое использует однополосную (SSB) модуляцию , чтобы сделать сигнал конкретной станции более читаемым для удаленной станции или чтобы выделить передаваемый сигнал своей станции на фоне других. Это особенно применимо в DXing . Сила сигнала SSB зависит от уровня модуляции . Компрессор увеличивает средний уровень сигнала модуляции, тем самым увеличивая силу передаваемого сигнала. Большинство современных любительских радиоприемопередатчиков SSB имеют встроенные речевые компрессоры. Сжатие также используется в наземной мобильной радиосвязи , особенно в передаваемом аудио профессиональных раций и пультов дистанционного управления диспетчерскими пультами . [15]
Сжатие широко используется в вещании для повышения воспринимаемой громкости звука при одновременном уменьшении динамического диапазона исходного аудио. Чтобы избежать перемодуляции , вещатели в большинстве стран имеют правовые ограничения на мгновенную пиковую громкость, которую они могут транслировать. Обычно эти ограничения соблюдаются с помощью постоянно вставленного оборудования для сжатия в эфирную цепь.
Вещатели используют компрессоры, чтобы их станция звучала громче, чем сопоставимые станции. Эффект заключается в том, что более сильно сжатая станция выделяется на слушателе при заданной настройке громкости. [12] Это не ограничивается межканальными различиями; они также существуют между программным материалом в пределах одного канала. Различия в громкости являются частым источником жалоб аудитории, особенно телевизионной рекламы и промо, которые кажутся слишком громкими.
Европейский вещательный союз (EBU) занимается этой проблемой в группе EBU PLOUD, которая состоит из более чем 240 профессионалов в области звука, многие из которых являются представителями вещательных компаний и производителей оборудования. В 2010 году EBU опубликовал EBU R 128 , который вводит новый способ измерения и нормализации звука . Рекомендация использует измерение громкости ITU-R BS.1770 . По состоянию на 2016 год [обновлять]несколько европейских телеканалов объявили о своей поддержке нового стандарта [16] [17] и более 20 производителей объявили о продуктах, поддерживающих новые измерители громкости EBU Mode . [18] [ проверка не удалась ]
Чтобы помочь звукорежиссерам понять, из какого диапазона громкости состоит их материал (например, чтобы проверить, может ли потребоваться некоторая компрессия для его размещения в канале конкретной платформы доставки), EBU также ввел дескриптор диапазона громкости (LRA). [19]
Большинство телевизионных рекламных роликов сильно сжаты, чтобы достичь почти максимальной воспринимаемой громкости, оставаясь при этом в допустимых пределах. Это вызывает проблему, которую часто замечают телезрители: когда станция переключается с минимально сжатого программного материала на сильно сжатую рекламу, громкость иногда кажется резко возрастающей. Пиковая громкость может быть одинаковой — в соответствии с буквой закона — но высокая компрессия помещает гораздо больше звука в рекламе на уровень, близкий к максимально допустимому, из-за чего реклама кажется намного громче. [20]
Звукозаписывающие компании, инженеры по сведению и мастерингу постепенно увеличивают общую громкость коммерческих альбомов. Это достигается за счет использования более высоких степеней сжатия и ограничения во время сведения и мастеринга ; алгоритмы сжатия были разработаны специально для выполнения задачи максимизации уровня звука в цифровом потоке. Может возникнуть жесткое ограничение или клиппинг , влияющее на тон и тембр музыки. Усилия по увеличению громкости были названы войной за громкость .
Системы шумоподавления используют компрессор для уменьшения динамического диапазона сигнала для передачи или записи, расширяя его впоследствии, процесс, называемый компандированием . Это уменьшает эффекты канала или носителя записи с ограниченным динамическим диапазоном.
Инструментальные усилители часто включают в себя схему компрессии для предотвращения внезапных пиков высокой мощности, которые могут повредить динамики. Электробасисты часто используют эффекты компрессии, либо блоки эффектов, доступные в педалях, стоечных блоках, либо встроенные устройства в басовых усилителях, чтобы выровнять уровни звука своих басовых линий .
Gain pumping , когда регулярный амплитудный пик (например, бас-бочка) заставляет остальную часть микса изменять громкость из-за компрессора, обычно избегается в музыкальном производстве. Однако многие танцевальные и хип-хоп музыканты намеренно используют это явление, заставляя микс изменять громкость ритмично в такт биту. [21]
Слуховые аппараты используют компрессор, чтобы довести громкость звука до диапазона слышимости слушателя. Чтобы помочь пациенту определить направление, откуда идет звук, некоторые слуховые аппараты используют бинауральную компрессию. [22]
Компрессоры также используются для защиты слуха в некоторых электронных активных наушниках и берушах для защиты слуха , чтобы звуки обычной громкости были слышны нормально, при этом более громкие звуки ослаблялись, возможно, также усиливались более тихие звуки. Это позволяет, например, стрелкам, носящим средства защиты слуха на стрельбище, нормально разговаривать, при этом резко ослабляя гораздо более громкие звуки выстрелов, [23] и аналогично музыкантам, чтобы слышать тихую музыку, но быть защищенными от громких звуков, таких как удары барабанов или тарелок. [ необходима цитата ]
В приложениях машинного обучения, где алгоритм обучается на аудиообразцах, сжатие динамического диапазона является способом расширения выборок для большего набора данных. [24]
Компрессия и ограничение идентичны по процессу, но различаются по степени и воспринимаемому эффекту. Ограничитель — это компрессор с высоким отношением и, как правило, быстрым временем атаки. Компрессия с отношением 10:1 или более обычно считается ограничивающей. [25]
Ограничение кирпичной стены имеет очень высокое отношение и очень быстрое время атаки. В идеале это гарантирует, что аудиосигнал никогда не превысит амплитуду порога. Отношения от 20:1 вплоть до ∞:1 считаются кирпичной стеной . [25] Звуковые результаты более чем кратковременного и редкого ограничения кирпичной стены резкие и неприятные, поэтому оно более распространено как устройство безопасности в приложениях живого звука и вещания.
Некоторые басовые усилители и усилители систем звукоусиления оснащены ограничителями, которые не допускают возникновения искажений или повреждения динамиков из-за резких скачков громкости.
Компрессор с входом боковой цепи управляет усилением от основного входа к выходу на основе уровня сигнала на входе боковой цепи. [26] Ранним новатором компрессии боковой цепи в блоке эффектов был Eventide Omnipressor 1974 года. [27] При боковой цепи компрессор ведет себя обычным образом, когда на оба входа — основной и боковой цепи — подается один и тот же сигнал. Вход боковой цепи используется диск-жокеями для приглушения — автоматического понижения громкости музыки во время речи. Сигнал микрофона диджея направляется на вход боковой цепи, так что всякий раз, когда диджей говорит, компрессор уменьшает громкость музыки. Боковая цепь с элементами управления эквалайзером может использоваться для уменьшения громкости сигналов, которые имеют сильный спектральный состав в определенном диапазоне частот: он может действовать как де-эссер , снижая уровень вокального сибилянта в диапазоне 6–9 кГц. [28] Другое применение боковой цепи в музыкальном производстве служит для поддержания громкого басового трека без басового барабана , вызывающего чрезмерные пики, которые приводят к потере общего запаса по громкости . [26]
Вставка компрессора в параллельный путь сигнала известна как параллельная компрессия . Это форма восходящей компрессии, которая облегчает динамический контроль без существенных слышимых побочных эффектов, пока соотношение относительно низкое, а звук компрессора относительно нейтральный. С другой стороны, высокое соотношение сжатия со значительными слышимыми артефактами может быть выбрано в одном из двух параллельных путей сигнала. Это используется некоторыми концертными микшерами и звукорежиссерами в качестве художественного эффекта, называемого компрессией New York или компрессией Motown . Объединение линейного сигнала с компрессором и последующее уменьшение выходного усиления цепи компрессии приводит к улучшению детализации на низком уровне без какого-либо снижения пиков; компрессор значительно увеличивает комбинированное усиление только на низких уровнях.
Многополосные компрессоры могут действовать по-разному на разных частотных диапазонах. Преимущество многополосного сжатия перед полнополосным сжатием заключается в том, что проблемы, связанные с определенным частотным диапазоном, могут быть устранены без ненужного сжатия в других, не связанных частотах. Недостатком является то, что частотно-специфическое сжатие является более сложным и требует большей вычислительной мощности, чем полнополосное сжатие, и может привести к фазовым проблемам. [29]
Многополосные компрессоры работают, сначала разделяя сигнал через некоторое количество полосовых фильтров , кроссоверных фильтров или банков фильтров . Затем каждый разделенный сигнал проходит через свой собственный компрессор и независимо регулируется по порогу, соотношению, атаке и восстановлению. Затем сигналы рекомбинируются, и может быть использована дополнительная ограничивающая схема, чтобы гарантировать, что объединенные сигналы не создают нежелательных пиковых уровней.
В музыкальном производстве многополосные компрессоры в первую очередь являются инструментом аудиомастеринга , но их включение в наборы плагинов для цифровых аудиостанций увеличивает их использование среди звукорежиссеров. TC Electronic Finalizer включал трехполосный компрессор и был популярным инструментом аудиомастеринга около 2000 года. [30]
В эфирных сигнальных цепях радиостанций обычно используются многополосные компрессоры для увеличения громкости , избегая при этом перемодуляции . Наличие более громкого звука часто считается преимуществом в коммерческом вещании.
Последовательное сжатие — это метод, используемый при записи и микшировании звука . Последовательное сжатие достигается путем использования двух довольно разных компрессоров в цепочке сигнала. Один компрессор обычно стабилизирует динамический диапазон , в то время как другой агрессивно сжимает более сильные пики. Это обычная внутренняя маршрутизация сигнала в обычных комбинированных устройствах, продаваемых как компрессоры-ограничители , где за компрессором RMS (для общего управления усилением) следует быстрый пиковый считывающий ограничитель (для защиты от перегрузки). При правильном выполнении даже сильное последовательное сжатие может звучать естественно, что невозможно с одним компрессором. Чаще всего его используют для выравнивания неравномерного вокала и гитар .
Некоторые программные аудиоплееры поддерживают плагины , реализующие сжатие. Они могут увеличить громкость аудиодорожек или выровнять громкость сильно изменчивой музыки (например, классической музыки или плейлиста, охватывающего несколько типов музыки). Это улучшает прослушиваемость аудио, воспроизводимого через некачественные динамики или при воспроизведении в шумной обстановке (например, в машине или на вечеринке).
В статье, опубликованной в январе 2014 года в журнале Journal of the Audio Engineering Society , Эммануэль Дерути и Дэмьен Тардье провели систематическое исследование, описывающее влияние компрессоров и ограничителей brickwall на музыкальный аудиосигнал. В эксперименте участвовали четыре программных ограничителя: Waves L2, Sonnox Oxford Limiter, Thomas Mundt's Loudmax, Blue Cat's Protector, а также четыре программных компрессора: Waves H-Comp, Sonnox Oxford Dynamics, Sonalksis SV-3157 и URS 1970. Исследование предоставляет объективные данные о том, что делают ограничители и компрессоры с аудиосигналом. [31]
Были рассмотрены пять дескрипторов сигнала: мощность RMS , интегрированная громкость EBU R 128 , [18] пик-фактор , R 128 LRA, [19] и плотность отсеченных образцов. Мощность RMS учитывает физический уровень сигнала, громкость R 128 — воспринимаемый уровень. [18] Пик-фактор, который является разницей между пиком сигнала и его средней мощностью, [31] иногда рассматривается как основа для измерения микродинамики, например, в плагине TT Dynamic Range Meter . [32] Наконец, R 128 LRA неоднократно рассматривался как мера макродинамики или динамики в музыкальном смысле. [31] [33] [34] [35] [36]
Испытуемые ограничители оказали следующее влияние на сигнал:
Другими словами, ограничители увеличивают как физический, так и перцептивный уровни, увеличивают плотность отсеченных сэмплов, уменьшают пик-фактор и уменьшают макродинамику (LRA), учитывая, что величина ограничения существенна.
Что касается компрессоров, авторы провели два сеанса обработки, используя в одном случае быструю атаку (0,5 мс), а в другом — медленную атаку (50 мс). Make-up gain деактивирован, но полученный файл нормализован.
Испытуемые компрессоры, настроенные на быструю атаку, оказали следующее влияние на сигнал:
Другими словами, компрессоры с быстрой атакой увеличивают как физические, так и перцептивные уровни, но лишь незначительно. Они уменьшают плотность обрезанных сэмплов и уменьшают как пик-фактор, так и макродинамику.
Испытуемые компрессоры, настроенные на медленную атаку, оказали следующее влияние на сигнал:
Другими словами, компрессоры с медленной атакой снижают как физический, так и перцептивный уровень, уменьшают макродинамику, но не оказывают влияния на пик-фактор и плотность отсеченных сэмплов.
Отраслевого стандарта нет, и разные производители определяют [время выпуска] по-разному.
удобны в течение многих часов благодаря своим гелевым колпачкам, имеют легкодоступные кнопки управления, отличное звукоотсечение и компрессию, а также позволяют использовать беруши, если приличный уровень шума в 22 дБ не справляется.
{{cite journal}}
: Цитировать журнал требует |journal=
( помощь )