звукозапись

Громкость и уровни

Громкость звука зависит не только от его уровня, но и от его спектрально-временного состава. Если частотный баланс фонограммы уже определен и менять его нежелательно, то для увеличения ее громкости нужно повысить уровень.

Зачем повышать громкость? На это есть две причины. Первая из них заключается в том, что громкая музыка чаще всего «эффектнее», чем тихая, и больше привлекает внимание. Поэтому большинство продюсеров всеми силами стремятся повысить уровень фонограммы при мастеринге: ведь от этого может зависеть ее коммерческий успех. Вторая причина повышения громкости — желание наиболее полно использовать динамический диапазон современной цифровой техники. Также важно максимально использовать динамический диапазон воспроизводящего устройства, чтобы запись не тонула в шумах.

При записи звука носители обычно ограничивают величиной перегрузки пиковый уровень мощности фонограммы, а не ее среднеквадратичную мощность (это несколько упрощенная, но близкая к реальности модель для большинства аналоговых и цифровых носителей звука). Отношение пиковой мощности фонограммы к ее среднеквадратичной мощности (RMS) называется кросс-фактором (crest-factor). Прямоугольная волна имеет единичный кросс-фактор 0 дБ. Кросс-фактор синусоиды равен 3 дБ. Фонограммы с широкой динамикой или резкими пиками обладают высоким кросс-фактором (20 дБ и более), а сильно компрессированные фонограммы — низким (10…15 дБ). Ясно, что при ограниченной пиковой мощности фонограмма с меньшим кросс-фактором может достичь более высокой громкости.

С целью уменьшения кросс-фактора фонограммы ее пропускают через устройства динамической обработки (рисунок 1).

Рис. 1. Фонограмма до динамической обработки и после. Уменьшение кросс-фактора. Клиппинга здесь нет, и звук вполне приемлем для радио

Сначала рассмотрим принципы работы динамических процессоров.

Устройства динамической обработки

Основными устройствами для работы с уровнями фонограммы являются устройства динамической обработки. Принцип действия этих устройств заключается в анализе уровня входящего в них аудиосигнала и изменении этого уровня по некоторому закону. Основными параметрами устройств динамической обработки являются передаточная характеристика и время атаки/восстановления.

Передаточная характеристика (не путать с амплитудно-частотной характеристикой) — это зависимость требуемого выходного уровня звука от входного уровня. В соответствии с передаточной характеристикой устройство динамической обработки определяет тот коэффициент усиления, который нужно применить к входному сигналу в каждый момент времени. Пример передаточной характеристики показан на рисунке 2. Такое устройство динамической обработки называется компрессором; оно пропускает без изменения звуки с амплитудой до -20 дБ и уменьшает амплитуду всех звуков выше -20 дБ. Таким образом, компрессор делает громкие звуки тише, сужая динамический диапазон фонограммы.

Рис. 2. Передаточная характеристика компрессора. Порог равен -20 дБ, степень компрессии 2:1

Перелом в передаточной характеристике называется коленом (knee). Входной уровень, соответствующий колену, называется порогом (threshold). Угол наклона передаточной характеристики выше порога определяет степень компрессии (ratio). Степень компрессии 2:1 означает, что при увеличении входного уровня на 2 дБ выше порога выходной уровень вырастет лишь на 1 дБ. Если степень компрессии равна единице, то уровень звука при прохождении через прибор не изменится. Если она стремится к бесконечности, то устройство будет ограничивать амплитуду выходного звука значением порога.

Такие устройства называются лимитерами, поскольку они они ограничивают динамический диапазон. Если же степень компрессии меньше единицы, например 1:1,5, то это значит, что когда входной уровень превышает порог, устройство будет повышать выходной уровень по сравнению с входным. Такие устройства называются экспандерами, и они расширяют динамический диапазон. Существуют и другие типы устройств динамической обработки: гейты, дакеры, левелеры и пр., со своими специфическими передаточными характеристиками и параметрами работы.

Рис. 3. Мягкий порог

Иногда передаточная характеристика сглаживается, чтобы в ней не было острых углов (рисунок 3). Этот режим называется soft knee или soft threshold (мягкий порог). Компрессор с мягким порогом начинает немного уменьшать уровень сигнала еще до достижения им величины порога.

Работу устройства динамической обработки можно описать следующей схемой. Устройство следит за входным уровнем и в соответствии с ним регулирует выходной уровень, т.е. применяет к входному сигналу некоторую амплитудную огибающую (коэффициент усиления), меняющуюся со временем. Для хорошего звучания результирующего сигнала нужно соблюсти несколько условий. Самое главное из них таково: амплитудная огибающая должна быть гладкой, без разрывов и, по возможности, без изломов. Действительно, если амплитудная огибающая имеет разрывы, то выходной звук тоже будет иметь разрывы в форме волны, слышимые как щелчки и треск. Изломы в амплитудной огибающей также будут приводить к искажениям выходного сигнала.

Для сглаживания амплитудной огибающей в устройствах динамической обработки имеются два параметра: время атаки (attack, время срабатывания) и время восстановления (release). Они определяют скорость реакции устройства на изменения входного уровня. Время атаки показывает, за какое время устройство реагирует на превышение порога (атаку), а время восстановления показывает, за какое время устройство реагирует на возвращение входного уровня обратно под порог.

Рис. 4. Звук до (а) и после (б) обработки компрессором

Пусть на вход компрессора подается сначала слабый сигнал, не превышающий порог, а затем — атака, превышающая порог (рисунок 4). В соответствии с передаточной характеристикой, компрессор должен пропустить слабый сигнал без изменения, а уровень громкого сигнала (атаки) — ослабить. Время атаки указывает, за какое время компрессор изменит свой коэффициент усиления от единичного до результирующего, предписанного передаточной характеристикой. Если вслед за громким сигналом входной уровень снова опускается ниже порога, то компрессор переходит в стадию восстановления и снова увеличивает свой коэффициент усиления до единичного. Время, за которое коэффициент усиления вернется к единичному значению, и будет временем восстановления. Определения времени атаки и затухания могут различаться у разных производителей. В некоторых устройствах под временем восстановления понимается не полное время возвращения коэффициента усиления, а время его возвращения, скажем, до половины обратного пути. Часто коэффициент усиления возвращается к исходному значению по экспоненте, и в этом случае лишь второе определение имеет смысл.

Время атаки и время восстановления измеряются в миллисекундах и могут меняться в широких пределах для различных приборов динамической обработки и в зависимости от конкретных задач. Так, например, в компрессорах обычное время атаки — порядка 10…100 мс, а типичное время восстановления — порядка 100…1000 мс. Ясно, что чем больше время атаки и восстановления, тем медленнее будет меняться во времени амплитудная огибающая, тем более гладкой она будет. Однако при большом времени атаки компрессор будет пропускать короткие атаки, превышающие порог, так как не будет успевать на них реагировать. Это может быть нежелательным, например, для лимитеров.

Еще один параметр, встречающийся в процессорах динамической обработки, это — задержка перед восстановлением (release delay или hold). Этот параметр задает время, через которое начинается стадия восстановления после спада входного уровня ниже порога. Другими словами, этот параметр позволяет отложить восстановление на некоторое время. Это может быть полезно, когда превышения порога в сигнале идут периодически, друг за другом. В этом случае задержка восстановления поможет избежать постоянного переключения компрессора между режимами атаки и восстановления и уменьшить изломанность амплитудной огибающей.

Теперь о том, каким образом приборы динамической обработки определяют уровень входного сигнала. Обычно это делается одним из двух способов и похоже на функционирование индикаторов уровня: пиковых и среднеквадратичных. Первый способ — детектирование мгновенных пиковых значений во входном сигнале. Второй — усреднение мощности во времени, то есть вычисление RMS. Пиковый способ часто применяется в лимитерах, где бывает необходимо ограничить пиковые значения сигнала каким-то порогом (например, перед выдачей сигнала в радиовещательный тракт или записью на мастер-носитель). RMS-способ чаще применяется в компрессорах для выравнивания громкости аудио, т.к. громкость сильнее связана со среднеквадратичной мощностью, нежели с пиковой.

Пиковая мощность превышает RMS, и это нужно учитывать при настройке прибора. Также ясно, что вычисление RMS-мощности требует некоторого временного интервала для интегрирования мощности, и поэтому время реакции устройства на изменения входного уровня не может быть намного меньше, чем это время интегрирования. Другими словами, RMS-компрессор может пропустить кратковременные пики сигнала, практически не успев снизить коэффициент передачи.

Еще одна часто встречающаяся возможность процессоров динамической обработки — это side-chain — дополнительный управляющий вход для звукового сигнала. Когда эта функция задействована, прибору на вход подаются два сигнала: через основной и управляющий входы. При этом «управляющий» сигнал используется только для определения по нему входного уровня и управления уровнем основного сигнала в соответствии с передаточной характеристикой.

С помощью side-chain можно достигнуть некоторых интересных эффектов. Если на side-chain подать тот же сигнал, что и на основной вход, то устройство будет вести себя как обычно, без side-chain. Если же на side-chain подать другой сигнал, то устройство будет обрабатывать основной сигнал, руководствуясь амплитудным профилем управляющего сигнала. Например, если на side-chain подать сигнал, пропущенный через эквалайзер с частотной характеристикой, обратной кривым Флетчера-Менсона (кривые равной громкости слуха), то амплитуда управляющего сигнала будет более правильно отражать реальную громкость основного сигнала. И устройство динамической обработки будет при обработке основного сигнала руководствоваться реальной громкостью исходного сигнала, а не его амплитудой. С помощью такого приема можно более точно выравнивать громкость вместо амплитуды.

Подчеркнем, что сигнал, подаваемый на side-chain, никак не влияет на тембр (частотный баланс) основного обрабатываемого сигнала. Он только управляет амплитудной огибающей.

При работе со стереозаписями процессоры динамической обработки обычно действуют в режиме linked channels, т. е. применяют одинаковые амплитудные огибающие к левому и правому каналам. В противном случае нарушается стереопанорама.

В заключение общей части о динамической обработке отмечу, что хотя с помощью компрессоров были созданы лучшие записи мировой звукорежиссуры, неосторожное обращение с компрессором способно безвозвратно испортить хорошую запись. Ошибочно считать, что действие компрессора можно отменить экспандером. Если динамика потеряна, то расширять уже нечего. Кроме того, и компрессоры, и экспандеры обладают некоторой инерционностью, что делает невозможным точное восстановление динамики.

Максимайзеры

Максимайзер — это прибор динамической обработки, повышающий уровень фонограммы при мастеринге. (Иногда максимайзерами называют другие типы приборов, например психоакустическую обработку типа BBE Sonic Maximizer, — их мы здесь рассматривать не будем).

Итак, наша задача — повысить уровень готовой фонограммы до предельно возможных величин, не внося в него существенных искажений. Самый простой способ достичь этого — всем известная нормализация уровня, когда ищется пик максимального уровня в фонограмме и вся фонограмма усиливается на величину этого пика, так чтобы пик принял значение 0 дБ. (Нормализация не обязательно означает достижение уровня 0 дБ. Обычно уровень нормализации задается вручную в децибелах или процентах, например, -0,1 дБ, -0,2 дБ или 99%, 98% и т. п. — прим. ред.). Дальнейшее увеличение уровня фонограммы приведет к клиппингу (clipping, ограничение амплитуды) — перегрузке, влекущей нежелательные искажения.

Очевидно, что для дальнейшего повышения уровня фонограммы можно применять динамическую обработку. Если пропустить фонограмму через компрессор или лимитер, то пиковые значения фонограммы уменьшатся и можно будет еще поднять общий уровень без возникновения перегрузки.

Компрессор или лимитер использовать для повышения громкости? Известный инженер мастеринга Боб Кац рекомендует использовать компрессор, когда требуется изменение характера звука - заметное на слух уменьшение его динамики. Лимитеры же используют, когда нежелательно вносить какие-либо изменения в звук, за исключением громкости.

Максимайзер — это прибор динамической обработки, который состоит из лимитера и последующего усилителя сигнала. (Часто в максимайзеры также встраивается система снижения разрядности, но здесь мы эту часть рассматривать не будем).

Основные управляющие элементы максимайзера — порог срабатывания (threshold) и настройки лимитера (attack, release). В некоторых максимайзерах есть также регулятор ceiling, позволяющий после лимитирования усилить сигнал не до 0 дБ, а чуть слабее, чтобы оставить немного «свободного места» (headroom) на случай небольшой дальнейшей обработки. Например, если фонограмма будет после максимайзера закодирована в МР3, то при раскодировании форма волны немного изменится и может произойти клиппирование (превышение нуля). Даже если сигнал не предполагается далее обрабатывать или сжимать с потерями качества, то немного свободного места может потребоваться для шума диттеринга, добавляемого при последующем снижении разрядности.

Чем ниже устанавливается порог срабатывания, тем сильнее лимитер ограничивает динамический диапазон и тем сильнее можно будет поднять громкость после лимитера. Таким образом, более низкие значения порога приводят к более громкому звучанию на выходе прибора.

Усилитель вопросов не вызывает, поэтому остановимся на устройстве лимитера. Задача максимайзера — максимально повысить уровень фонограммы, но не допустить клиппинга, т. е. не позволить мгновенной мощности выйти за пределы уровня 0 дБ. Из этого следует, что в качестве метода определения входного уровня для максимайзеров подходит только пиковый метод. Максимайзер должен отслеживать пики сигнала и строить амплитудную огибающую так, чтобы после ее применения к сигналу пики оказались ниже уровня порога. Когда входной уровень ниже порога, лимитер максимайзера пропускает сигнал без изменений. А когда входной уровень превышает порог, лимитер должен ослабить сигнал так, чтобы превышения порога не было.

Так как мы хотим, чтобы амплитудная огибающая была плавной, без разрывов и изломов, то мы приходим к заключению, что лимитер должен знать, какой амплитудный профиль будет у звуковой волны в ближайшие моменты времени. Действительно, если бы такой возможности у лимитера не было, то при возникновении на входе резкой атаки, превышающей порог, лимитеру пришлось бы мгновенно понизить уровень усиления, чтобы предотвратить превышение порога. Мгновенное понижение уровня усиления — это и есть разрыв или излом в амплитудной огибающей, которого желательно избежать.

Итак, для построения плавной амплитудной огибающей лимитеру необходимо знать значения сигнала с некоторым опережением. Так как надежно предсказать сигнал по прошедшим значениям возможности нет, то функция «заглядывания вперед» (look-ahead) реализуется с помощью небольшой задержки выходного сигнала относительно входного. Таким образом, при выдаче выходного сигнала, соответствующего моменту времени t, у лимитера на самом деле уже есть входной сигнал для моментов времени вплоть до t+T, где T — время задержки. О задержке следует помнить, когда требуется синхронизация сигналов в программах, обрабатывающих сигнал в реальном времени. Если же обработка осуществляется не в реальном времени, то программа, выполняющая обработку (host-приложение), чаще всего может скомпенсировать задержку, т. е. «выровнять» выходной сигнал максимайзера по времени. Обычно задержки, вносимые максимайзерами, невелики, до 10 мс, но бывают и исключения.

Рис. 5. Исходный звук (показан порог лимитера) и амплитудные огибающие, построенные различными максимайзерами. Сверху — быстрые восстановления, в середине — медленные, снизу — алгоритм автоконтроля восстановлений

Руководствуясь будущими значениями пиковых уровней, лимитер может построить плавную амплитудную огибающую, начав ослаблять усиление заранее, до начала атаки во входном сигнале. Другими словами, лимитер должен построить амплитудную огибающую вокруг пиков в виде ямок, где глубина ямок будет определяться величиной превышения порога пиковым уровнем, а ширина — временем атаки и восстановления (рисунок 5). Ясно, что чем шире ямки, тем большие участки сигнала будут подавлены и тем меньше будет окончательная громкость фонограммы. Таким образом, громкость фонограммы зависит не только от установленного значения порога, но и от времени атаки/восстановления, а также от формы амплитудной огибающей во время атаки и восстановления.

Управление временем атаки и восстановления

Когда сигнал умножается на амплитудную огибающую, в спектре сигнала могут появляться дополнительные гармоники. Чем меньше время атаки и восстановления максимайзера, тем громче получается результирующий звук, но тем более изломанной становится амплитудная огибающая и тем больше возникает интермодуляционных искажений.

Рис. 6. Интермодуляционные искажения, возникающие при пропускании двух гармоник через максимайзеры. На первом рисунке агрессивность максимайзеров выше

При малом времени атаки и восстановления интермодуляционные искажения становятся особенно заметными, когда в сигнале присутствуют басовые тона большой амплитуды с периодом, меньшим или равным времени атаки/восстановления. Это можно продемонстрировать на тестовых сигналах, являющихся суммами синусоид с различными частотами (стандартный тест интермодуляционных искажений, рисунок 6).

При большом времени атаки и восстановления начинает проявляться эффект «проваливания» громкости (pumping). Провалы громкости возникают вокруг кратковременных пиков в сигнале (рисунок 5). Вокруг каждого из таких пиков амплитудная огибающая имеет форму широкой ямы, проваливая по громкости весь сигнал. На слух это воспринимается как выпадение, дрожание громкости.

Таким образом, выбор времени атаки/восстановления — это компромисс между интермодуляционными искажениями и эффектом проваливания громкости. Для дальнейших рассмотрений введем понятие агрессивности максимайзера. Будем говорить, что один максимайзер агрессивнее другого, если при равных значениях порога первый максимайзер дает более громкий (по RMS) звук на выходе. Понятно, что агрессивность зависит от времени атаки/восстановления и от формы амплитудной огибающей во время атак/восстановлений.

У большинства максимайзеров пользователь устанавливает время атаки и восстановления вручную, после установки величины порога. Если слышны интермодуляционные искажения, то агрессивность уменьшается (время атаки/восстановления увеличивается). Если не слышны — то можно попытаться увеличить агрессивность в надежде достичь большей громкости и уменьшения эффекта проваливания громкости. Обычно глубокое лимитирование требует большего времени атаки/восстановления.

Существует способ автоматического адаптивного управления агрессивностью максимайзера на основании анализа входного сигнала. Действительно, если в фонограмме присутствуют резкие пики, то желательно повысить агрессивность, чтобы не возникло эффекта проваливания громкости. Интермодуляционных искажений в данном случае не возникнет, так как если пики единичны, то в амплитудной огибающей не будет существенных периодичностей, приводящих к интермодуляционным искажениям. Кроме того, наше ухо обладает свойством пониженной чувствительности к кратковременным, до 6 мс, искажениям. Таким образом, максимайзер будет быстро реагировать на единичные пики, сразу возвращаясь к единичному коэффициенту усиления.

Если же на вход поступает периодический сигнал, с постоянными, периодично следующими превышениями порога, то желательно понизить агрессивность максимайзера (т. е. увеличить время атаки/восстановления), чтобы не возникло интермодуляционных искажений.

Если осуществлять такое регулирование адаптивно, постоянно подстраиваясь под входной сигнал, то это позволит заметно повысить среднюю агрессивность максимайзера (т. е. громкость выходного сигнала) без увеличения искажений.

Один из первых максимайзеров, реализующих такую стратегию, — Waves L2 в режиме ARC (Auto Release Control). Следует отметить, что дословное понимание термина «автоматическое управление временем восстановления» не совсем точно описывает принцип работы Waves L2. В этом максимайзере используется несколько более сложный метод построения амплитудной огибающей, основанный на комбинировании двух видов амплитудных огибающих: агрессивной и неагрессивной. При единичных пиках входного сигнала применяется агрессивная огибающая, а при периодических, групповых превышениях порога — определенная комбинация двух огибающих. Таким образом достигается более громкое и качественное звучание, чем при простом управлении временем восстановления. Похожий алгоритм реализован в максимайзере iZotope Ozone.

Тест

Чтобы проверить наличие функции автоконтроля агрессивности, проведем несложный тест. В левом канале тестового файла создадим следующий тестовый сигнал. В первую секунду пусть там будет один кратковременный импульсный пик. Во вторую секунду поместим туда синусоиду с частотой 100 Гц и оставим в конце немного тишины. В правый же канал поместим постоянный ток (DC) на протяжении всего файла. Амплитуду сигналов выберем так, чтобы и импульс, и синусоида превышали порог максимайзера, а постоянный ток — не превышал.

Пропустим наш тестовый сигнал через максимайзер, обратив внимание на то, чтобы он работал в режиме linked channels, то есть применял одну и ту же амплитудную огибающую к обоим каналам. Тогда на выходе максимайзера в правом канале будет содержаться амплитудная огибающая, которую максимайзер построил по левому каналу (рисунок 5). Посмотрев на форму волны амплитудной огибающей, можно сделать много полезных выводов о функционировании максимайзера. Если время восстановления после пика существенно меньше времени восстановления после синусоиды, то максимайзер использует автоконтроль времени восстановления.

Перегрузка между отсчетами

Подавляющее большинство максимайзеров — цифровые приборы. Действительно, в аналоге практически невозможно сделать «заглядывание вперед», и поэтому аналоговые пиковые лимитеры обречены либо на мгновенное время атаки (что приводит к изломам амплитудной огибающей), либо на пропуск некоторой перегрузки (клиппирование). Цифровые максимайзеры способны «заглядывать вперед» и заранее реагировать на атаку, за миллисекунды до наступления пика.

Цель большинства цифровых максимайзеров — не допустить превышения порога цифровой волной, то есть ограничить значения всех отсчетов сигнала величиной порога. Однако такое цифровое ограничение не обеспечивает отсутствие превышения порога в аналоговой волне, восстановленной по цифровому сигналу. Действительно, аналоговая волна, плавно осциллируя между дискретными отсчетами, может превышать уровень цифровых отсчетов на величину до 3 дБ (рисунок 7).

Рис. 7. Аналоговые и цифровые пиковые уровни могут не совпадать. Разница может составлять до 3 дБ

Как это может сказаться на звуке? Во-первых, может произойти перегрузка ЦАП. Обычно ЦАП используют передискретизацию — цифровое повышение частоты дискретизации сигнала. В этом случае восстановленные цифровые значения волны между отсчетами исходной цифровой волны могут переполнить разрядную сетку ЦАП (что часто и происходит). Таким образом, клиппирование «аналоговой» волны привело к искажениям звука еще до того, как сигнал стал аналоговым. Но даже если ЦАП правильно восстановил волну выше уровня 0 дБ FS, то остальные компоненты аудиоцепи (например, операционные усилители) могут оказаться не столь устойчивыми к перегрузкам.

Тест

Вот простой тест, позволяющий определить работоспособность функции устранения аналогового клиппирования у максимайзера. Сгенерируем в цифровом файле синусоиду с частотой, равной четверти частоты дискретизации, и начальной фазой 45° (рис. 1). Для такой синусоиды аналоговая волна превышает значения цифровых отсчетов на 3 дБ. Пропустим эту синусоиду через максимайзер. Установим порог как можно ниже. Если максимайзер не позволяет разогнать уровень цифровых отсчетов сколько-нибудь заметно выше, чем -3 дБ, то он правильно определяет пики аналоговой волны. Если же он привычно разогнал цифровые отсчеты до 0 дБ, то детектирование пиков в нем осуществляется по цифровой волне.

Оказывается, можно осуществить лимитирование в цифровом формате так, чтобы в восстановленной аналоговой волне также не содержалось превышений порога. Для этого достаточно с помощью передискретизации алгоритмически восстановить аналоговую волну и провести детектирование пиков не по цифровым отсчетам, а по аналоговой волне. Дальнейшее лимитирование цифровой волны осуществляется как обычно, но с использованием новой, «аналоговой» информации о пиках сигнала.

Традиционное средство для борьбы с проблемой аналогового клиппирования — это занижение параметра ceiling (коэффициента усиления после лимитирования) на доли децибела. Как теперь очевидно, такая мера совершенно недостаточна. Для реального аудио аналоговое превышение порога часто составляет 1…1,5 дБ, а не доли децибела.

Сглаживание амплитудной огибающей

Тест

Для иллюстрации этих искажений проведем следующий простой эксперимент. Возьмем любую аудиозапись и отфильтруем в ней все частоты выше 3 кГц. После этого пропустим запись через максимайзер. Установим порог так, чтобы лимитер не бездействовал, и будем слушать результат. Если мы выбрали максимайзер с разрывами или изломами амплитудной огибающей, то в записи будет слышен заметный треск (рис. 8).

Разрывы и изломы амплитудной огибающей — обычное явление для подавляющего большинства максимайзеров. Они приводят к соответствующим разрывам и изломам в форме волны выходного звука. В терминах спектра это означает, что спектр возникающих интермодуляционных искажений становится широким, охватывающим все частоты. При этом слышимость искажений многократно возрастает. Действительно, при гладкой амплитудной огибающей интермодуляционные искажения обычно группируются вокруг пиков в спектре сигнала, где они с большой вероятностью будут психоакустически замаскированы этими пиками. При наличии же изломов и разрывов амплитудной огибающей спектр искажений расширяется и может выйти за порог маскировки. Искажения становятся слышны как треск.

Рис. 8. Сонограмма треска, появляющегося в записи, после обработки максимайзером. Верхний отрывок был обработан максимайзером без сглаживания амплитудной огибающей. Снизу — тот же отрывок, но обработанный более точным максимайзером (и с большей агрессивностью)

Зачем мы отфильтровали все выше 3 кГц? Чтобы треск стал заметнее. Если бы мы не отфильтровывали ВЧ, то треск был бы тот же самый, только он бы несколько маскировался высокими частотами исходного звука.

Операция сглаживания амплитудной огибающей невозможна без «заглядывания вперед» (look-ahead). Рассмотрим еще раз, как реализуется функция look-ahead в приборах. Так как невозможно надежно предсказать сигнал по его прошедшим значениям, то функция look-ahead осуществляется с помощью небольшой задержки выходного сигнала относительно входного. Таким образом, при выдаче выходного сигнала, соответствующего моменту времени t, у лимитера, на самом деле, уже есть входной сигнал для моментов времени вплоть до t + T, где T — время задержки. Это похоже на канал новостей, который ретранслирует другое новостное агентство с задержкой в 10 минут. В каждый момент времени сотрудники канала уже знают, что будет через 10 минут, и могут соответственно модифицировать выдаваемые зрителям новости, достигая лучшего качества материала за счет задержки.

Следует помнить, что задержка, вносимая лимитером, может быть в некоторых ситуациях нежелательной. Например, если в разрыв линейки пульта вставить лимитер, то эта линейка будет задержана по времени относительно других, что может привести к искажению тембра при микшировании. К счастью, максимайзером обычно обрабатывается уже готовый микс в процессе мастеринга, и в этом случае задержка роли не играет. (О задержке следует помнить, когда требуется синхронизация сигналов по времени в приложениях обработки реального времени. Если же обработка осуществляется не в реальном времени, то приложение, выполняющее обработку (host-приложение) чаще всего может скомпенсировать задержку, т. е. выровнять выходной сигнал максимайзера по времени. Обычно задержки, вносимые максимайзерами, невелики, до 10 мс).

Если же максимайзер, работающий в реальном времени, не вносит задержки в сигнал, то это значит, что он либо допускает превышения порога, либо его амплитудная огибающая — изломанная. Третьего не дано…

Советы по использованию максимайзеров

Максимайзер должен быть последним звеном в цепи мастеринга. После него осуществляется только снижение разрядности аудио (часто оно совмещено с максимизацией). Все остальные обработки и преобразования звука, в том числе преобразование частоты дискретизации, должны выполняться до максимизации уровня, поскольку они могут изменить пиковые значения звуковой волны и привести к клиппированию или неполному использованию динамического диапазона.

При настройке параметров максимайзера следует отталкиваться от уровня громкости фонограммы, который нужно получить. Установите порог максимайзера в соответствии c желаемым увеличением громкости, и после этого переходите к настройке агрессивности. Если заметны интермодуляционные искажения (например, хрип на басовых нотах), уменьшите агрессивность (например, увеличивая время восстановления). Если искажения не заметны — попробуйте увеличить агрессивность, чтобы уменьшить эффект проваливания громкости (pumping).

Если порог максимайзера уже очень низко, а громкости все равно недостаточно — обратитесь к другим приборам динамической обработки. Обработайте звук компрессором. Если даже после компрессора и максимайзера «разгон» не тот — попробуйте многополосный компрессор. Если и этого мало — проверьте, не превратилась ли уже фонограмма в розовый шум.

Лимитеры и максимайзеры легко могут «убить» микродинамику фонограммы. Если компрессия обычно является художественным приемом, то лимитирование — скорее, технологическим решением. А технологию лучше оставить для специалистов по мастерингу, которые чаще всего обладают более качественной аппаратурой и средствами контроля результата.

22 сентября 2015

Алексей Лукин

Пока никто еще не оставлял комментарии. Вы можете быть первым.

Возможность оставлять комментарии доступна только для зарегистрированных пользователей.

Максимайзеры и их использование

Новые статьи

Итоги XIX Конкурса имени Бабушкина

Церемония награждения лауреатов

Участники XIX Всероссийского Конкурса творческих работ студентов-звукорежиссеров им. Виктора Бабушкина

Положение о Девятнадцатом Всероссийском конкурсе творческих работ студентов-звукорежиссеров имени В.Б. Бабушкина

149 конгресс AES – научные результаты

Звукорежиссеры на Национальном открытом чемпионате творческих компетенций Artmasters

148 конгресс AES - научные результаты

Стереофонические микрофонные системы

Аналоговые системы шумоподавления

Результаты XVIII Всероссийского Конкурса творческих работ студентов-звукорежиссеров им. В.Б. Бабушкина

Люди

Теория

История

События

Технология

Практика

О журнале