Стиснення динамічного діапазону

Замислимося над питанням - а навіщо нам піднімати гучність? Для того щоб чути тихі звуки, які не можна почути в наших умовах (наприклад, якщо не можна слухати голосно, якщо є сторонні шуми в кімнаті і т.д.). А чи можна посилити тихі звуки, а голосні не чіпати? Виявляється можна. Ця техніка називається стисненням динамічного діапазону (компресія, Dynamic Range Compression, DRC). Для цього необхідно змінювати поточну гучність постійно - тихі звуки посилювати, гучні - немає. Найпростіший закон зміни гучності - лінійний, тобто гучність змінюється за законом output_loudness = k * input_loudness, де k - коефіцієнт стиснення динамічного діапазону:

При k = 1 ніяких змін немає (вихідна гучність дорівнює вхідний). при k <1 громкость будет увеличиваться, а динамический диапазон - сужаться. Посмотрим на график (k=1/2) - тихий звук, имевший громкость -50дБ станет громче на 25дБ, что значительно громче, но при этом громкость диалогов (-27дБ) повысится всего лишь на 13.5дБ, а громкость самых громких звуков (0дБ) вообще не изменится. При k> 1 - гучність буде зменшуватися, а динамічний діапазон - збільшуватися.

Подивимося на графіки гучності (k = 1/2: стиснення ДД в два рази):

Як видно в оригіналі були присутні як дуже тихі звуки, на 30дБ нижче рівня діалогів, так і дуже гучні - на 30дБ вище рівня діалогів. Т.ч. динамічний діапазон становив 60дБ. Після компресії гучні звуки всього лише на 15дБ вище, а тихі - на 15дБ нижче рівня діалогів (динамічний діапазон тепер становить 30дБ). Таким чином, гучні звуки стали значно тихіше, а тихі - значно голосніше. При цьому переповнення не відбувається!

Тепер звернемося до гістограми:

Як добре видно - при посиленні до + 30дБ форма гістограми добре зберігається, що означає, що гучні звуки залишаються добре вираженими (не йдуть в максимум і не обрізаються, як це відбувається при простому посиленні). При цьому виділяються тихі звуки. Гістограма це показує погано, проте різниця дуже помітна на слух. Недолік методу - ті ж самі стрибки гучності. Однак механізм їх виникнення відрізняється від стрибків гучності виникають при обрізанні, а їх характер відрізняється - вони проявляються в основному при дуже сильному посиленні тихих звуків (а не при обрізанні гучних, як при звичайному посиленні). Надмірний рівень компресії призводить до сплощення звукової картини - все звуки прагнуть до однакової гучності і невиразності.

Сильне посилення тихих звуків може привести до того, що стануть чутні шуми записи. Тому в фільтрі застосований трохи модифікований алгоритм, щоб рівень шумів піднімався менше:

Тобто на рівні гучності -50дБ відбувається перегин передавальної функції, і шуми будуть посилюватися менше (жовта лінія). При відсутності такого перегину шуми будуть значно голосніше (сіра лінія). Така проста модифікація значно знижує рівень шумів навіть при дуже сильних рівнях стиснення (на малюнку - стиснення 1: 5). Рівень "DRC" в фільтрі задає рівень посилення для тихих звуків (на рівні -50dB), таким чином рівень компресії 1/5, показаний на малюнку, відповідає рівню + 40дБ в настройках фільтра.

8 Микширование і гучність

Є ще одна далеко неочевидна тонкість, яка може сильно вплинути на гучність при програванні багатоканальних записів на стереосистеми (або в навушниках). Нехай ми маємо вихідну запис в форматі 5.1, а на виході необхідно отримати 2 каналу. У кожен з вихідних каналів мікшується один фронтальний канал, один тиловий, канал LFE, і частина центрального каналу:

L '= L + 0.7 * C + SL + LFE

R '= R + 0.7 * C + SR + LFE

Припустимо, що по всіх вхідних каналах відразу запущений звук максимальної гучності (хоча це і не дуже ймовірно). Тоді амплітуда в вихідному каналі буде перевищувати максимум в 3.7 рази (на 11дБ), тобто відбудеться сильне переповнення. Щоб переповнення не допустити формули мікшування повинні бути переписані таким чином:

L '= (L + 0.7 * C + SL + LFE) / 3.7

R '= (R + 0.7 * C + SR + LFE) / 3.7

Це нормалізоване мікшування (не плутати з нормалізацією самого запису!) - переповнення гарантовано не відбувається. Однак, змікшованого таким чином звук на цілих 11дБ тихіше! Чи можна не проводити нормалізацію? Можна, можливо. Однак в такому випадку можливо переповнення і відповідні спотворення. Переповнення відбувається тільки тоді, коли по всіх вхідних каналах одночасно відтворюється гучний звук. Це не характерно для фільмів (зазвичай тилові канали тихіше фронтальних, так і канал LFE не завжди задіяний), але характерно для багатоканальних музичних записів. Тому для фільмів можна залишити мікшування ненормалізованих, а для музики нормалізацію краще включати. (В фільтрі за нормалізацію мікшування відповідає опція "Normalize matrix").

9 Рекомендації

Рекомендації по настройці сильно залежать від конкретних умов прослуховування

• Хороша акустика, але наявність зовнішнього шуму. Можна застосувати невелике посилення і невеликий рівень компресії.

• Не можна шуміти самим (ніч, сусіди / діти) або посередня акустика (дешеві навушники, слабкі колонки). Необхідно сильний рівень компресії плюс підвищення рівня або однопрохідне нормалізація.

Посилення також може застосовуватися для обмеження гучності сигналу (наприклад, для прослуховування вночі). При рівні діалогів рівному -27дБ і посилення + 17дБ рівень діалогів після посилення становитиме -10дБ, а самого гучного звуку, як завжди, 0дБ, що всього лише на + 10дБ вище рівня діалогів. Т.ч. встановивши в фільтрі посилення + 17dB, і відрегулювати системну гучність так, щоб діалоги відтворювалися з прийнятною абсолютної гучністю, ми отримаємо гарантію, що найгучніші звуки не перевищуватимуть рівень діалогів більше, ніж на 10дБ (хоча, звичайно, в цьому випадку для гучних звуків буде застосовано обмеження сигналу).

Компресія ( "DRC"). Межі застосування компресії визначити набагато складніше, оскільки чутність дефектів компресії сильно залежить від акустичної системи, умов прослуховування і самого слухача. Якщо підійти до питання з точки зору гістограм, то верхня межа застосовності компресії можна оцінити як +20 .. + 30дБ (див. Гістограми). В цьому випадку гучні звуки ще залишаються виділеними по гучності від слабких. Таким чином, рівень компресії підбирається тільки на слух - до тих пір, поки не буде досягнута необхідна гучність, і дефекти будуть залишатися непомітними.

Необхідно враховувати, що компресія і посилення діють одночасно, тому при рівні посилення + 20дБ і компресії в два рази (+ 25дБ) реальний рівень посилення становитиме + 10дБ. Це нормально, оскільки потреба в посиленні також зменшується зі збільшенням компресії.

Однопрохідне нормалізація ( "One-pass normalize"). Чи можна застосувати практично завжди. Для високоякісних систем з невеликим рівнем посилення дозволить зменшити кількість переповнень, а в інших випадках в комбінації з компресією дозволить домогтися максимальної гучності знову ж з мінімумом спотворень по переповнення. Початковий рівень посилення (рівень "Master") для нормалізації вибирається виходячи з цілей - якщо великого посилення не потрібно - встановлюється бажане, а для досягнення максимальної гучності можна встановити + 20дБ.

Стиснення динамічного діапазону

8 Микширование і гучність

9 Рекомендації

Схожі статті