Мастеринг в обратную сторону: можно ли увеличить динамический диапазон сжатых записей? Динамический звук в разрушаемых уровнях Rainbow Six: Siege

ВОЛОГДИН Э.И.

ДИНАМИЧЕСКИЙ ДИАПАЗОН

ЦИФРОВЫХ АУДИО ТРАКТОВ

Конспект лекций

Санкт Петербург

	Динамический диапазон звуков и музыки......................................................................
	Динамический диапазон фонограмм.................................................................................
	Динамический диапазон цифрового аудио тракта.........................................................
	Расширение динамического диапазона c использованием технологии Dithering .....
	Расширение динамического диапазона с использованием технологии Noise Shaping
.......................................................................................................................................................
Список литературы...............................................................................................................

1. Динамический диапазон звуков и музыки

Человек слышит звук в чрезвычайно широком диапазоне звуковых давлений. Этот диапазон простирается от абсолютного порога слышимости до болевого порога 140 дБ SPL относительно нулевого уровня, за который принято давление 0,00002 Па (рис.1 .). Зона риска на этом рисунке обозначает область звуковых давлений, которые при

Абсолютный порог слышимости

Частота тональных звуков, кГц

Рис. 1. Области слышимости слуха

длительном воздействии могут привести к полной потери слуха. Болевой порог для тональных звуков зависит от частоты, для звуков с произвольным спектром за болевой порог принят уровень давления 120 дБ SPL. График абсолютного порога слышимости достаточно точно описывается эмпирическим равенством

В тишине чувствительность слуха человека повышается, а в атмосфере громких звуков – понижается, слух адаптируется к окружающей звуковой среде, поэтому динамический диапазон слуха не такой большой – около 70..80 дБ. Сверху он ограничен давлением 100 дБ SPL, а снизу шумом с уровнем -30…35 дБ SPL. Этот динамический диапазон может сдвигаться вверх и вниз до 20 дБ. Для комфортного восприятия музыки рекомендуется, чтобы звуковое давление не превышало 104 дБ SPL в домашних условиях и 112 дБ SPL, в специально оборудованных помещениях.

Динамический диапазон музыки определяется отношением в децибелах самого громкого звука (фортиссимо) и самого тихого звука (пианиссимо ).Динамический диапазон симфонической музыки составляет 65…75 дБ, а на концертах рок-музыки он возрастает

до 105 дБ, при этом пики звуковых давлений могут достигать 122…130 дБ SPL.

Динамический диапазон вокальных исполнителей - не превышает 35…45 дБ (табл.1 ).

Динамический диапазон музыки существенно зависит от выбора максимального

звукового давления P max , так как он ограничивается снизу абсолютным порогом

слышимости. Эта зависимость наиболее сильно выражена на краях звукового диапазона.

На рис. 2

приведены примеры изменения динамического диапазона тональных звуков. В

120dB Болевой порог

P max

80dB

DR 40 dB

50dB

80dB

50dB

Абсолютный порог

слышимости

Частота тональных звуков, кГц

Рис. 2. Динамический диапазон музыки и пороги слышимости слуха

зависимости от выбора P max

и частоты тональных звуков

динамический

диапазон

80 дБ уменьшается на краях

звукового диапазона до 40

Именно поэтому

принято измерять динамический диапазон звуков на частоте 1 кГц, на которой он может

достигать 117 дБ.

помещения маскирует звук и этим уменьшает его динамический диапазон

музыки снизу . Нарис.3 . показано как при уменьшении звукового давления от 120 до 80 дб

SPL динамический диапазон музыки из-за шума помещения уменьшается с 90 до 50 дБ.

120 dB SPL

DR 90 dB

Влиянием

полностью

пренебречь

только при

90dB

минимального уровня музыкальных звуков.

70dB

В студиях звукозаписи уровень шума не

90dB

превышает

квартирах

50dB

разговор

увеличивает уровень

шума до 60дБ SPL.

Именно поэтому тихая музыка часто тонет

Шум в квартире

помещения

прослушивания

невольно

возникает

увеличить

громкость.

Шум квантования, являющийся белым

шумом, заметен на слух при его

Шум в студии

интенсивности всего 4 дБ SPL, даже когда

общий шум аудио аппаратуры в помещении

достигает

Рис. 3. Динамический диапазон музыки в

необходимо сопоставить с тем, что полной

шкале FS цифрового измерителя уровня

соответствуют уровень между 105 и 112 дБ SPL. Поэтому для

бытовых помещений

динамический диапазон музыки не должен превышать 101 - 108 дБ.

Динамический диапазон микрофонов определяется так же, как это обычно делается в электрических трактах. Верхняя граница ограничивается допустимой величиной нелинейных искажений, а нижняя - уровнем собственных шумов. Современные студийные микрофоны допускают максимальное звуковое давление 125…145 дБ SPL, при этом нелинейные искажения не превышают 0,5% … 3%. Уровень собственных шумов микрофонов составляет 15…20 дБА, динамический диапазон – от 90 до 112 дБА, а отношение сигнал/шумот 70 до 80 дБА. Эти микрофоны с запасом перекрывают весь диапазон слуха человека от 120 дБ SPL до уровня шума студии 20 дБ SPL. В современных студиях запись производится с использованием 22 или 24 разрядных АЦП, иногда используется квантование с плавающей запятой, поэтому проблем с динамическим диапазоном не возникает. Стоит такая аппаратура крайне дорого.

2. Динамический диапазон фонограмм

Музыкальный и речевой сигналы представляют собой последовательность быстро нарастающих и более медленно затухающих звуковых импульсов (рис.4 .). Такой сигнал характеризуетсясреднеквадратическим и пиковым значениями уровней , разность этих уровней называется пик-фактором . Прямоугольная волна (меандр) имеет единичный пик-фактор 0 дБ, пик-фактор синусоиды равен 3 дБ. Фонограммы музыкальных и речевых сигналов имеют пик-фактор до 20 дБ и более.Время определения пик-фактора связано временем интегрирования при вычислении среднеквадратического значения сигнала, и обычно, оно равно 50 мс.

Динамический диапазон и пик-фактор музыкальной фонограммы определяют путем статистической обработкимгновенных значений сигналов. Наиболее подробно статистические характеристики рассчитываются в звуковом редакторе Audition 3 (рис.4 ).

Рис.4. Фрагменты фонограмм музыкальных отрывков различной длительности

Из них основными являются следующие: Peak Amplitude (L pic ), Maximum RMS Power (L max ), Minimum RMS Power (L min )и Average RMS Power (L avr ) (уровни максимального,

минимального и среднего среднеквадратического (эффективного) значения мощности сигнала).

Динамический диапазон фонограммы по данным этой таблицы определяется как

DR mL picL min ,

пик-фактор рассчитывается по формуле

PF mL picL avr

Динамический диапазон может быть также определен по гистограмме распределения уровней фонограммы, приведенной на рис.5. Такие операции удобно быстро делать до и после динамической обработки фонограммы.

Рис.4. Статистические характеристики фонограмммы музыки Бетховена «Элизе»

Рис.5. Гистограмма распределения музыки Бетховена «Элизе»

зависимости от задачи исследования. Если, например, важным является динамический диапазон мгновенных значений уровней фонограммы, то время интеграции должно быть 1-5 мс. Если измеряется динамический диапазон музыки с учетом слухового восприятия, то время интеграции выбирается равным 60 мс, это постоянная времени слуха.

позволяет определять динамический диапазон и пик-фактор с заданной вероятностью при выбранном времени интеграции. В звуковом редакторе Adobe Audition 3 используется нормализация гистограммы, при которой максимальной вероятности событий всегда соответствует значение 100. Такая гистограмма описывает распределение вероятностей уровней сигналов фонограммы относительно максимального значения. При ее построении автоматически подбирается масштаб по оси Х, поэтому затруднительно сравнивать гистограммы различных фонограмм.

Практическое применение. Кому и зачем нужна статистическая информация и гистограмма фонограммы. Эти данные прежде всего оказывают неоценимую помощь при динамической обработке фонограммы, так как они позволяются обоснованно выбрать характеристики компрессора и экспандера. Статистические результаты обработки фонограмм с музыкой различных жанров позволяют определить необходимый динамический диапазон электроакустического тракта, сформировать требования по пиковой и средней мощности головок акустических система. Они играют существенную роль при разработке алгоритмов компрессии звуковых сигналов.

Эмоциональную музыку с широким динамическим диапазоном и большим пик-
фактором можно слушать только на высококачественной дорогой аппаратуре с хорошими
		акустическими	агрегатами.
		наушниками и в автомобилях из-за шумов динамический
	15 диапазон сокращается и она			просто отвратительно.
		Поэтому широким спросом такие записи не пользуются и,
		неизбежно, с каждым годом динамический диапазон и пик-






		Рис.7. Фонограмма песни “I`ll Be There For You”
		Рис.7. Фонограмма песни “I`ll Be There For You”
Рис. 6. Пик-фактор CD дисков

фонограмм преднамеренно изготовителями уменьшается (рис.6 .). На современных CD

дисках в большинстве случаев динамический диапазон не превышает 20 дБ, а пик-фактор-

чуть больше 3 дБ, что вполне достаточно для танцевальной музыки. На рис.7. приведена

картинка современной фонограммы с компакт диска.

3. Динамический диапазон цифрового аудио тракта

Обычный цифровой тракт

включает в себя АЦП и ЦАП.

Первый осуществляет

квантование аналоговых сигналов, и преобразование их в цифровой поток. Второй

производит обратное преобразование цифрового потока в аналоговый сигнал.

Квантование

округление

последовательности выборок

до целого двоичного

значения. При импульсно-кодовой модуляции (ИКМ) такая

операция

осуществляется

линейного

квантователя, называемого в технической литературе Mid-

Tread . У

него передаточная

имеет форму

«лестницы» с одинаковыми ступеньками

обязательно,

нечетное число уровней квантования. Округление

цифровых данных в этом квантователе производиться

ближайшего

двоичного значения (рис.8 ).

Этот алгоритм

принято называть rounding.

алгоритме

выходной

квантователя

симметричен относительно оси времени, и квантование

Рис. 8. Передаточные

осуществляется с порогом, равным

0,5 шага квантования

функции квантователей

Пока входной сигнал меньше этого порога выходной

Mid-Tread и Mid-Riser

сигнал квантователя равен нулю, это значит, что

квантование осуществляется с центральной отсечкой.

входном сигнале несколько выше порога квантования выходной сигнал имеет вид

последовательности импульсов со скважностью, зависящей

от уровня

дальнейшем увеличении уровня ЗС формируется выходной сигнал ступенчатой формы.

Округление цифровых данных в квантователе Mid-Riser производится до ближайшей меньшей величины (рис.8 ), поэтому данный алгоритм принято называть- truncating . Квантователь Mid-Riser отличается тем, что у него отсутствует порог квантования, поэтому он передает звуковые сигналы очень маленьких уровней, даже ниже уровня

шума. Однако, при отсутствии ЗС любой ничтожный шум порождает на выходе последовательность случайных импульсов с амплитудой 1 квант, это значит, что такой квантователь усиливает шумы.

Динамический диапазон АЦП с квантователем Mid-Tread определяется через логарифм отношения максимального и минимального значений сигнала синусоидальной формы на входе квантователя

DR А 20 logA max ,

A min

Q 2 (q 1), A		Q – шаг квантования,q - число разрядов. Поэтому
Q 2 (q 1), A		Q – шаг квантования,q - число разрядов. Поэтому


	DRА		Q 2 (q 1)	) 6.02q (1)
	DRА			) 6.02q (1)
			Q / 2

При q = 8 этот динамический диапазон равен 48 дБ, а приq = 16 он увеличивается до 96 дБ. ЗначениеDR A определяет нижнюю границу динамического диапазона по уровню входных сигналов квантователя типа Mid-Tread.

Динамический диапазон ЦАПа измеряется в соответствии с рекомендациями стандартаEIAJ через отношение максимального среднеквадратического значения сигнала

синусоидальной формы A max на его выходе к среднеквадратическому значению шума квантования, измеренному в полосе от 0 до частоты НайквистаF N

A max

Q 2 (q 1)

A max

q 1, 76;q

При q = 16

DR R = 98 дБ, что

децибела

динамического диапазона

квантователя, определяемого формулой (1). Измеренный таким образом динамический диапазон ЦАПа отождествляется со значением его SNR .

Если верхний диапазон частот ограничивается значением F max F N , то расчетная формула дляSNR иDR R принимает вид

	SNR R DR R 6.02q 1,76 10 log
		2 F max

где f s - частота дискретизации,F max - максимальная частота звукового диапазона. При

f s = 44,1 кГц иF max = 20 кГц иSNR R =DR R = 98,5 дБ. Как видно, отношение сигнал/шум лишь на 2 децибела больше динамического диапазона. Надо обратить внимание на то, что величинаSNR зависит от частотf s иF max , тогда какDR от этих параметров не зависит.

Тем не менее, в большинстве технических публикаций динамический диапазон отождествляется с отношением сигнал/шум. Это подтверждается и стандартами AES 17 и

IEC 61606.

В стандарте IEC 61606 рекомендуется измерятьSNR иDR при подаче на вход АЦП синусоидального сигнала с частотой 997 Гц и уровнем минус 60 дБ FS c обязательным использованием технологииTPDF Dithering . При этом расчетное соотношение дляSNR из-за вносимого дополнительного шума предлагается в виде

	SNR T DR T 6.02q 3,01 10 log
		2 F max

При прежних условиях DR =SNR = 93,7 дБ, а не 96 дБ, как это часто встречается в технической литературе. Следовательно, уменьшается и расчетный динамический диапазон. ВместоSNR часто используется его обратная величина, определяющая интегральный уровень шума квантования

L nTSNR T.

В соответствии со стандартом IEC 61606 измерение динамического диапазонаDR R производится в соответствии со схемой, приведенной нарис.9. В этой схеме тестовый

Рис..9. Схема измерения динамического диапазона ЦАП

цифровой сигнал с частотой 1 кГц, и уровнем минус 60 дБ, сформированный с использованием технологии TPDF Dithering , подается на вход ЦАПа. Аналоговый сигнал с ЦАПа поступает на вход ФНЧ с частотой среза 20 кГц, ограничивающий спектр шума квантования. Далее производится фильтрация с помощью взвешивающего фильтра типаА , учитывающего особенности слухового восприятия шума квантования, что увеличивает динамический диапазон на 2-3 дБ. Тестовый сигнал и шум усиливаются на 60 дБ и подаются на измеритель уровняTHD+N . В этом измерителе тональный сигнал подавляется режекторным фильтром и вольтметром эффективных значений измеряется уровень шума в децибелах. Это измеренное значение уровня шума отождествляется, с обратным знаком, с динамическим диапазоном ЦАПа.

При квантовании сигналов минимального уровня возникают громадные искажения, достигающие 100% (рис.10 ). В связи с этим на практике приходиться руководствоватьсяреальным динамическим диапазоном АЦП. При определении этого диапазона необходимо учитывать: пик-фактор музыкальных сигналов, достигающий 12…20 дБ, необходимость поднимать уровень нижней границы динамического диапазона над уровнем шума квантования хотя бы на 20 дБ и иметь дополнительный запас в верхней части динамического диапазона около 10…12 дБ для предотвращения случайной перегрузки.

В результате реальный динамический диапазон			записи 16-ти разрядного АЦП ИКМ
			не превышает 48…54 дБ. Этого
			не превышает 48…54 дБ. Этого
	даже близко не хватает для хорошей
	студийной			звукозаписи.
	автоматической регулировке уровней, что
	имеет место при записи компакт-дисков,
		диапазон может быть расширен до 74
16 бит,1000 Гц, 93 дБ				заметным	ухудшением
16 бит,1000 Гц, 93 дБ	качества звука сигналов низкого уровня.
	качества звука сигналов низкого уровня.
Рис.10. Последовательность выборок искаженной	Запас динамического диапазона сверху
формы синусоидального сигнала	предохраняет от возможности перегрузки,
					превышают

ожидаемое значение. При записи танцевальной музыки вполне достаточно запаса в 6 дБ.

При записи симфонической музыки иногда приходиться иметь запас до 20…30 дБ. Запас динамического диапазона снизу предотвращает возможность тихих пассажей оказаться ниже уровня шума и, тем более, ниже порога слышимости.

В цифровых трактах верхняя граница динамического диапазонаограничивается уровнем сигнала 0 дБ FS . Без использования технологии Dithering нижняя граница динамического диапазонаограничивается уровнем

LA 1 / DRA .

При q = 8 бит он равен минус 48 дБ, а приq = 16 бит – минус 96 дБ. Неизбежный шум тракта повышает этот уровень.

Интегральный уровень шума минус 93,7 дБ – это много или мало. Важно насколько этот уровень превышает порог слышимости. С использованием технологии Dithering шум

Рис.11. Пороги слышимости шума квантования в зависимости от числа разрядов

квантования становится белым шумом, порог слышимости которого равен 4 дБ SPL . Это значит, что вблизи 3 кГц шум квантования при q = 16 бит будет превышать порог слышимости на 22,3 дБ (рис.11). Как видно из этого рисунка, для того чтобы шум квантования был не слышен требуется использовать 20-разрядное квантование.

4. Расширение динамического диапазона c использованием технологии Dithering

Для расширения динамического диапазона ИКМ тракта с квантователем типа MeadTread без увеличения числа разрядов и частоты дискретизации разработано множество

аналоговых сигналов к ЗС добавляется небольшой аналоговый шум. Более часто эта технология используется при реквантовании цифровых ЗС , когда производится

осуществляется с 24 разрядами, а затем производиться реквантование, обычно до 16 разрядов, как это принято в стандарте CD. При этом качество такого CD по шумам соответствует 20разрядной записи.

В процессе реквантования чаще применяют операцию truncating , при которой просто отбрасываются младшие разряды кодовых слов. В этом случае в выходном сигнале

Люди, увлеченные домашним звуком, демонстрируют интересный парадокс. Они готовы перелопатить комнату прослушивания, соорудить колонки с экзотическими излучателями, но смущенно отступают перед музыкальной консервой, будто волк перед красным флажком. А собственно, почему нельзя за флажок заступить, а из консервы попытаться приготовить что-то более съедобное?

Периодически на форуме возникают жалобные вопросы: «Посоветуйте хорошо записанные альбомы». Оно и понятно. Специальные аудиофильские издания хоть и порадуют слух первую минуту, но до конца их никто не слушает, уж больно уныл репертуар. Что же касается всей остальной фонотеки, то проблема, кажется, очевидна. Можно экономить, а можно не экономить и вбухать прорву денег в компоненты. Все равно мало кому нравится слушать свою любимую музыку на высокой громкости и возможности усилителя здесь ни при чем.

Сегодня даже в Hi-Res альбомах срезаны пики фонограммы и громкость загнана в клиппинг. Считается, что большинство слушает музыку на всяком барахле, а потому надо «поддать газку», сделать своего рода тонкомпенсацию.

Разумеется, делается это не специально, чтобы расстроить аудиофилов. О них вообще мало кто вспоминает. Вот разве что догадались сбагривать им мастер-файлы, с которых копируется основной тираж - компакт-диски, MP3 и прочее. Разумеется, мастер уже давно сплющен компрессором, никто сознательно не будет готовить специальные версии для HD Tracks. Разве что выполняется определенная процедура для винилового носителя, который по этой причине и звучит более гуманно. А для цифрового пути все заканчивается одинаково - большим толстым компрессором.

Итак, в настоящее время все 100% издаваемых фонограмм, за вычетом классической музыки, подвергаются компрессии при мастеринге. Кто-то выполняет эту процедуру более-менее умело, а кто-то совсем по-дурацки. В результате мы имеем пилигримов на форумах с линейкой плагина DR за пазухой, мучительные сравнения изданий, бегство в винил, где тоже нужно майнить первопресссы.

Самые отмороженные при виде всех этих безобразий превратились буквально в аудиосатанистов. Без шуток, они читают звукорежиссерское святое писание задом наперед! Современные программы редактирования звука имеют кое-какой инструмент восстановления звуковой волны, подвергшейся клиппингу.

Изначально этот функционал предназначался для студий. При микшировании бывают ситуации, когда клиппинг попал на запись, а переделать сессию по ряду причин уже невозможно, и здесь приходит на помощь арсенал аудиоредактора - деклиппер, декомпрессор и т.п.

И вот уже к подобному софту все смелее тянут ручки обычные слушатели, у которых идет кровь из ушей после очередной новинки. Кто-то предпочитает iZotope, кто-то Adobe Audition, кто-то операции разделяет между несколькими программами. Смысл восстановления прежней динамики заключается в программном исправлении клиппированных пиков сигнала, которые, упираясь в 0 дБ, напоминают шестеренку.

Да, о 100%-м возрождении исходника речи не идет, поскольку имеют место процессы интерполяции по довольно умозрительным алгоритмам. Но все-таки некоторые результаты обработки мне показались интересными и достойными изучения.

Например, альбом Ланы Дель Рей «Lust For Life», стабильно погано матерящейся, тьфу, мастерящейся! В оригинале песни «When the World Was at War We Kept Dancing» было вот так.

А после череды деклипперов и декомпрессоров стало вот так. Коэффициент DR изменился с 5 на 9. Скачать и послушать образец до и после обработки можно .

Не могу сказать, что метод универсальный и годится для всех угробленных альбомов, но в данном случае я предпочел сохранить в коллекции именно этот вариант, обработанный активистом рутрекера, взамен официального издания в 24 бит.

Даже если искусственное вытягивание пиков из звукового фарша не вернет истинную динамику музыкального исполнения, ваш ЦАП все равно скажет спасибо. Ему ведь так тяжело было работать без ошибок на предельных уровнях, где велика вероятность возникновения так называемых межсемпловых пиков (ISP) . А теперь до 0 дБ будут допрыгивать лишь редкие сполохи сигнала. Кроме того, притихшая фонограмма при сжатии во FLAC или другой lossless-кодек теперь будет меньше по размеру. Больше «воздуха» в сигнале экономит пространство хард-драйва.

Попробуйте оживить свои самые ненавистные альбомы, убитые на «войне громкости». Для запаса динамики сначала нужно понизить уровень трека на -6 дБ, а затем запустить деклиппер. Те, кто не верит компьютерам, могут просто воткнуть между CD-плеером и усилителем студийный экспандер. Данное устройство по сути занимается тем же самым - как может восстанавливает и вытягивает пики сжатого по динамике аудиосигнала. Стоят подобные устройства из 80-90-х не сказать чтобы очень дорого, и в качестве эксперимента попробовать их будет весьма интересно.

Контроллер динамического диапазона DBX 3BX обрабатывает сигнал раздельно в трех полосах - НЧ, СЧ и ВЧ

Когда-то эквалайзеры были само собой разумеющимся компонентом аудиосистемы, и никто их не боялся. Сегодня не требуется выравнивать завал высоких частот магнитной ленты, но с безобразной динамикой надо что-то решать, братцы.

Что такое динамический диапазон?

Динамический диапазон можно определить как расстояние между уровнями самого тихого и самого громкого сигналов из возможных. К примеру, если в инструкции к процессору указано, что максимальный входной уровень сигнала до искажения равен +24 дБ, а шумовой порог на выходе равен -92 дБ, значит суммарный динамический диапазон процессора равен 24 + 92 = 116 дБ.

Динамический диапазон оркестра в среднем находится в пределах от -50 дБ до +10 дБ. Что в сумме даёт 60 дБ. Хотя вам может показаться, что динамический диапазон в 60 дБ - это мало, проведя простые расчёты, оказывается, что +10 дБ - это в 1000 раз громче, чем -50 дБ!

Динамический диапазон в рок музыке намного меньше, обычно от -10 dдБ до +10 Дб, или 20 дБ в сумме. Поэтому смешивание разных сигналов в рок музыке в единый микс довольно занудное занятие.

Для чего нам компрессия?

Допустим, вы работаете над сведением роковой записи, средний динамический диапазон у нее 20 дБ. И вы хотите добавить в микс необработанный компрессором вокал. Средний динамический диапазон у вокала равен примерно 40 дБ. Чем это чревато для микса? Слишком тихие вокальные куски будут просто не слышны, а слишком громкие будут выпирать из общей картины. В данной ситуации компрессор необходим для уменьшения (компрессии) динамического диапазона вокала в пределах 10 дБ.

В данном случае вокал будет находиться примерно на уровне +5 дБ. Диапазон - от 0 дБ до +10 дБ. Тихие фразы теперь будут выше самого низкого уровня сигнала в миксе, а громкие фразы не будут выпирать. Получается, что вокал занимает своё место в миксе.

Тот же самый принцип работает для любого инструмента в миксе. У каждого инструмента есть свое место в миксе, а хороший компрессор помогает звукорежиссеру правильно их смешать.

Разве компрессор нужен для всего?

Обычно в ответ на этот вопрос вы слышите: "Конечно же, нет! Перекомпрессированные треки звучат ужасно.” Это утверждение верно лишь в одном случае - если вы отчетливо слышите как работает компрессор на записи. Качественный дорогой компрессор, будучи правильно настроенным, звучит незаметно! Перекомпрессированный звук - это следствие ошибок в обработке конкретных инструментов, если конечно это не сделано умышленно с целью получить спецэффект.

Как вы думаете, зачем на всех дорогих микшерных пультах на каждом канале есть свой компрессор? Ответ прост - большинство инструментов нуждается в компрессии, пусть даже едва заметной. Это помогает им быть слышимыми в миксе.

Зачем нам нойз-гейты?

Давайте рассмотрим пример с вокалом. Допустим, вы установили для него диапазон в 20 дБ. Проблемы начинаются, когда компрессор усиливает самые тихие сигналы в вокальном треке. Всплывают всякие нежелательные шумы на заднем плане, куски фонограммы, попавшей в микрофон из наушников и т.п. Вы можете попробовать просто убрать громкость в паузах, но это обычно заканчивается полным провалом. Намного лучший способ - использовать нойз-гейт. Мы можем установить порог срабатывания нойз-гейта, к примеру, на -10 дБ, что соответствует нижней границе динамического диапазона вокала в нашем случае. Таким образом гейт будет автоматически убирать в ноль все нежелательные сигналы между фразами.

Если вы когда-либо пробовали сводить живую запись, вы знаете сколько проблем возникает с ударной установкой, а именно с железом, которое проникает в микрофоны, установленные на томах. Как только вы добавляете верхов на эквалайзере, чтобы сделать томы более яркими, начинают лезть наверх тарелки. И это особенно хорошо слышно через ВЧ громкоговорители в мониторах. Если же мы используем гейты на микрофонах, записывающих томы, так что железо больше не будет звучать через них в паузах, мы очень сильно прочистим общий микс и сделаем его в разы разборчивее.

Типы динамической обработки

Динамическая обработка - это процесс изменения динамического диапазона сигнала, позволяющий расширить возможности оборудования, через которое записывается или воспроизводится этот сигнал. Иными словами, мы получаем возможность записывать или проигрывать записанный сигнал без искажений и/или шума, тем самым упрощая себе задачу сведения.

Компрессор и лимитер

Пробивной, хорошо слышимый, с хорошим презенсом - это все описания звуковых сигналов, полученных при помощи их обработки компрессорами и лимитерами.

Компрессия и лимитирование - это формы управления динамическим диапазоном (громкостью) сигнала. Аудио сигналы имеют довольно большой разброс по уровням громкости. Пиковый сигнал может вызвать перегрузку в звукозаписывающей цепи, что в свою очередь вызовет искажение сигнала.

Компрессор/лимитер - это своего рода усилитель, в котором уровень громкости зависит от уровня проходящего через него аудиосигнала. Выбрав определённое значение компрессора/лимитера, сигнал будет автоматически ослабляться выше заданного уровня или порогового уровня.

В сущности, компрессия - это процесс ослабления входного сигнала в заданной пропорции. Используется для сужения динамического диапазона голоса или музыкального инструмента, позволяет производить запись без искажений. Также применяется при создании микса, уменьшая разницу частот каждой дорожки.

Вокалист, допустим, постоянно перемещается перед микрофоном и сигнал на выходе колеблется вверх-вниз, что звучит странно. В данном случае компрессор решит проблему, ослабив громкость отдельных фраз так, что в результате будет ровный вокал.

Степень ослабления сигнала зависит от соотношения компрессии и порогового уровня. Соотношение 2:1 или меньше считается слабой компрессией, при которой сигнал на выходе, превышающий пороговый уровень, уменьшается в два раза. Соотношения выше 10:1 можно называть сильным лимитированием.

Чем ниже пороговый уровень, тем большая часть сигнала подвергается компрессии (при определённом уровне входного сигнала). Важно знать меру, так как слишком сильная компрессия убивает динамику записи (при этом некоторые звукорежиссёры убивают её специально в качестве эффекта)!

Лимитирование - вид обработки сигнала, при котором подавляются всплески громкости (скачки амплитуды).

Компрессор/лимитер используется при выполнении многих задач при обработке звука, например:

Звук бочки ударной установки может затеряться среди электрогитар. И не важно, как громко звучит дорожка, бочка звучит “грязно”. Компрессия выправит звук бочки на фоне гитар.

Диапазон голоса на записи достаточно широк. Пики громкости могут сильно выпирать из общего звучания. Таких пиков может быть много, и они все разные, так что почти невозможно их выровнять через микшер. Компрессор/лимитер автоматически контролирует громкость, не искажая тонкостей вокала.

Соло гитара глушится ритмом. Не выкручивайте фейдер до предела, компрессия поставит ведущую гитару на своё место в миксе.

Бас-гитару сложно записывать. Ровный звук с хорошей атакой достигается за счёт правильной компрессии. И не нужно обрезать низы микса - компрессор/лимитер позволит басу проявиться на любых частота

Экспандер

Существует два основных вида экспансии: динамическая и нисходящая. Экспансия расширяет динамический диапазон сигнала, когда он выше порогового значения. Динамическая экспансия - это, по сути, компрессия наоборот.Динамическая экспансия применяется на ТВ и радио, чтобы отменить компрессию непосредственно до передачи аудио сигнала. Компрессию с последующей экспансией называют компандированием.На данный момент чаще всего применяют нисходящую экспансию. В отличие от компрессии, которая понижает сигнал выше порогового значения, экспансия понижает сигнал ниже порога экспансии. Степень понижения определяется соотношением экспансии. Например, соотношение 2:1 понижает сигнал вдвое (это значит, что если сигнал ниже порогового значения на 5дБ, экспандер понизит его до 10дБ).Экспансию часто используют для уменьшения шумов, это очень мощный и простой нойз-гейт. Главное различие между экспандером и нойз-гейтом в том, что экспансия зависит от того, насколько сильно сигнал ушёл “под порог”, тогда как при работе нойз-гейта это не имеет значения.

Шумоподавление

Шумоподавление - процесс устранения нежелательного шума из записи посредством ограничения сигнала ниже заданного порогового значения. Как было написано выше, работа нойз-гейта не зависит от уровня сигнала ниже порога. Выход устройства открыт, пока сигнал находится выше порога.

Длительность открытия выхода определяется скоростью атаки. Длительность работы устройства, когда сигнал ниже порогового называется временем удержания. Скорость закрывания выхода определяется временем возврата. Уровень подавления нежелательного сигнала в закрытом положении определяется диапазоном.

Краткий словарь терминов

Научно доказано, что если вы хотите быстро изучить какой-то предмет, вы должны для начала разобраться с основными понятиями. Тот же принцип действует и в звукозаписи и в дальнейшей работе со звуком. Большинство инструкций и учебников предполагают наличие базовых знаний, без которых читать их затруднительно. Надеюсь, что следующий раздел поможет вам навести порядок в голове и окончательно разобраться с основами.

Компрессоры

Атака (Attack).

Атака определяет скорость действия компрессора на входной сигнал. Долгая атака (регулятор по часовой стрелке до упора) вначале позволяет сигналу (т.н. начальный переходный процесс) проходить необработанным через компрессор, тогда как короткая атака (против часовой стрелки до упора) сразу же обрабатывает сигнал согласно соотношению компрессии и установленному пороговому уровню.

Авто (Auto).

Компрессор работает в режиме автоматической атаки и возврата. Регуляторы в этом случае не влияют на процесс, а используются запрограммированные значения параметров.

Боковой канал компрессора (Compressor Sidechain).

Вход бокового канала прерывает сигнал, с помощью которого компрессор определяет необходимой уровень компрессии. При отключенном боковом канале, входной сигнал идёт сразу на главную схему компрессора. При его включении, сигнал на главную схему не поступает. Теперь можно обрабатывать управляющий сигнал эквалайзером, например, применив де-эссинг (частотная коррекция голоса). После обработки управляющий сигнал поступает обратно в компрессор через выход канала. Типичное применение бокового канала - использование компрессора для приглушения фоновой музыки во время выступления ведущего или снижения громкости ритм-гитары на фоне вокала. Теперь голос легко различим. В этом случае голосовая дорожка идёт в боковой канал, в то время как фоновая музыка - на основную схему компрессора. Теперь компрессор понижает уровень фоновой музыки (процесс называется дакинг), когда вокалист начинает петь или говорить.

Жёсткая и мягкая компрессия (Hard/Soft Knee)

При жёсткой компрессии ослабление сигнала происходит максимально быстро в момент превышения пороговой величины. При мягкой, сигнал ослабляется более плавно, после того, как он превысил заданный порог, что обеспечивает более естественное для музыки звучание.

Лимитеры.

Лимитер - это компрессор, не допускающий увеличения сигнала выше уровня порога. Например, если порог установить на 0 дБ, параметр “Ratio” выкрутить полностью по часовой стрелке, то компрессор начнёт работу в режиме лимитера при 0 дБ, и выходной сигнал никогда не превысит этого значения.

Компенсирующее усиление (Makeup Gain).

При компрессии, сжатие сигнала обычно влияет на общий уровень громкости. Регулятор усиления позволяет восстановить утерянный при компрессии уровень.

Соотношение (Ratio).

Соотношение - это зависимость между выходным и входным сигналами, этот параметр устанавливает крутизну компрессии. Например, установив соотношение 2:1, любой сигнал выше порогового подвергнется компрессии в соотношении 2:1. На каждый децибел на входе компрессора приходится 0.5 дБ на выходе, таким образом образуется компрессия, сжимающая сигнал в два раза. При увеличении соотношения, компрессор постепенно переходит в режим работы лимитера.

Время возврата (Release).

Время возврата - это время, которое проходит между тем, как уровень входного сигнала упал ниже порога, и моментом, когда уровень компрессии вернулся на нулевой (компрессор перестал ослаблять сигнал). Короткий возврат создаёт неровный, “рубленый” звук, особенно у бас-гитары. Долгий возврат слишком “пережимает” звук, расплющивая его. Любому значению времени возврата найдётся применение - подбирайте на слух.

Threshold.

Пороговый уровень компрессии (порог компрессии) определяет значение, выше которого начинается ослабление сигнала. Обычно поворот регулятора порога влево увеличивает сигнал, который подвергается компрессии (при соотношении выше, чем 1:1).

Экспандеры

Нисходящая экспансия (Downward Expansion).

Нисходящая экспансия чаще всего применяется в профессиональной звукозаписи. Сигнал ослабляется ниже порогового значения. Это стандартный способ подавления шумов.

Соотношение (Ratio).

Соотношение экспансии определяет уровень ослабления сигнала, когда он опустился ниже порога. К примеру, при соотношении экспансии 2:1 каждый децибел ниже порогового значения ослабляется в два раза. При соотношении 4:1 и выше экспандер работает почти как нойз-гейт, только без возможности регулирования времени атаки, задержки и возврата.

Нойз гейты (Noise Gate)

Атака (Attack).

Параметр "время атаки" устанавливает величину, при которой открывается гейт. Быстрая атака подходит для перкуссивных инструментов, в то время как вокал и бас-гитара требуют плавного открытия. Применение к ним слишком быстрой атаки приведёт к появлению ощутимого “шёлкания” при сведении. Щелчок при открытии присущ любому гейту, но при правильной настройке его не слышно.

Время удержания (Hold).

Время удержания - фиксированный период времени, при котором гейт находится в открытом состоянии при уровне сигнала ниже порогового. Значение этого параметра играет роль при гейтировании, например, малого барабана - после удара по нему проходит определённое время, после которого гейт резко закрывается.

Диапазон (Range).

Диапазон гейта - величина ослабления сигнала, когда гейт закрыт. Таким образом, при значении этого параметра 0 дБ ослабления сигнала вообще не происходит. Значение -60 дБ означает, что при закрытом гейте сигнал будет ослаблен (гейтирован) на 60 дБ и т.д.

Время возврата (Release).

Время возврата гейта определяет скорость, с которой гейт переходит из открытого в полностью закрытое состояние. Время возврата обычно настраивают так, чтобы сохранить естественное затухание звука инструмента или вокала. Высокая скорость возврата убирает шумы, но может вызвать “заикание” ударных инструментов, которое устраняется низкой скоростью возврата. Внимательно настраивайте этот параметр для наиболее естественного эффекта.

Пороговый уровень (Threshold).

Пороговый уровень гейта устанавливает значение, при котором гейт открывается. Принцип прост - любой сигнал выше порогового проходит нетронутым, а сигнал ниже ослабляется на величину, зависящую от настроек диапазона. Если выкрутить регулятор влево до упора - гейт будет отключен (т.е. всегда открыт), и любой сигнал проходит без ослабления.

Ниже приведены пресеты компрессии, используемые в PreSonus BlueMax. Данные пресеты - стандартные установки, своего рода отправные точки для работы со звуком.

Вокал

Тёплый вокал. Это параметры для лёгкой компрессии с низким соотношением и расширенным диапазоном, в основном для лирических песен в живом исполнении. Вокал “на своём месте”.

Кричащий. Параметры для громкого вокала. Довольно жёсткая компрессия для вокалистов, которые не следят за расстоянием до микрофона. Голос сильно выступает из микса, создавая эффект присутствия.

Левый/правый (стерео) оверхэды. Параметры «соотношение» и «порог» здесь низкие, что даёт широкий диапазон, в который помещаются даже тарелки. Глубокие низы, общее звучание живое с невысокой реверберацией. Более пробивной звук, меньше эффекта комнаты.

Акустическая гитара. Пресет подчёркивает атаку акустической гитары и обеспечивает ровность звучания, что позволят гитаре оставаться слышимой.

Клавишные инструменты

Фортепиано. Особый пресет для выравнивания всего диапазона фортепиано - от нижнего звука до пятой октавы. Чётко слышны партии обеих рук.

Оркестр. Настройки подходят как для струнных, так и других оркестровых “наборов” синтезатора. Общий динамический диапазон снижен для удобного добавления в микс.

Контур. Настройки расширяют диапазон основного микса.

Threshold (порог)	Ratio (соотношение)	Attack (атака)	Release (возврат)
-13.4 дБ	1.2:1	0.002 мс	182 мс

Эммануэль Дерюти

«Почему музыка стала звучать хуже». «Поклонники жалуются, что Death Magnetic в Guitar Hero звучит лучше, чем на CD». «Даже фанаты хеви-метала считают, что сегодняшняя музыка слишком громкая!» «Dynamic Range Day объявляет новое движение против громкости». «Смерть Hi-Fi»… В прессе и сети растёт движение против «войны за громкость», практики, когда люди пытаются получить максимально возможную громкость в своих треках, чтобы заставить слушателей ощущать их более «горячими» по сравнению с конкурирующими релизами. Согласно этим статьям, неблагоразумные методы мастеринга и, более конкретно, злоупотребление brickwall-ограничителями, ставят музыку под угрозу. В современном производстве не хватает детальности, и оно жертвует качеством ради уровня. Боб Дилан в 2006 году в своём интервью заявил, что «Вы слушаете эти современные альбомы, и они звучат просто по-зверски. У них один звук везде. Нет никакой чёткости и детальности, ни в вокале, ни в чём-то другом. Всё статично».

Но не является ли замечание Дилана отражением извечного конфликта между отцами и детьми? Это был бы не первый случай, когда старая гвардия презирает то, что делает новое поколение. Хотя, верно и то, что многие звукоинженеры присоединяются к обществу, предпочитающему «более динамичную» музыку. Но объективно ли они говорят о том, что такая музыка лучше, или они просто предпочитают какой-то определённый тип звучания? Моё исследование постарается дать ответы на эти вопросы. Мы узнаем, действительно ли стала громче современная музыка, и стало ли в ней меньше динамики. Мы также рассмотрим гипотезу, что громкость может быть стилистическим признаком специфических музыкальных жанров, а не «дурной манерой», мотивированной презренными коммерческими интересами. И, наконец, мы пристально поглядим на печально известный альбом Death Magnetic группы Metallica и выясним, почему многим людям кажется, что он звучит плохо.

Действительно ли теперь музыка стала громче?

Да, это так, и здесь нет никаких сомнений. Давайте возьмём большое количество известных поп-песен, записанных в промежутке между 1969 и 2010 годами, нормализуем их так, чтобы пики стали под 0 dBFS, и измерим значение RMS. Теперь давайте рассортируем все значения согласно году релиза каждой песни. Первая диаграмма (вверху) показывает результаты эксперимента, и они реально возбуждают! Красная линия показывает усреднённые значения RMS для каждого года, а прямоугольники показывают распределение: чем темнее, тем больше песен имеет такой же уровень. Здесь, несомненно, наблюдается постоянный рост среднего уровня между 1982 и 2005 годами, и сегодняшние записи примерно на 5 dB громче, чем было в 70-х.

По общему признанию, RMS даёт только информацию об «электрическом» или «физическом» уровне аудиофайла, но никак не говорит о той громкости, что мы реально воспринимаем. Для этого, согласно нормативным рекомендациям EBU 3341, мы оцениваем «интегрированную громкость». Как видно на второй диаграмме, это значение весьма сильно коррелируется с RMS, и два графика очень похожи друг на друга. Таким образом, второй набор результатов подтверждает первый.

Давайте воспользуемся другими критериями и повторим эксперимент. К примеру, для описания динамического поведения музыки часто используется такой критерий, как крест-фактор. Говоря простыми словами, он показывает разницу между пиковым и RMS-уровнями на протяжении песни. Он является хорошим маркером, позволяющим оценить количество компрессии, применённой к музыке: обычно, чем больше компрессии, тем ниже крест-фактор. Некоторые профессионалы считают аккуратное обращение с крест-фактором залогом успешного мастеринга. В общих словах, опять же, чем ниже крест-фактор, тем громче музыка.

Третья диаграмма показывает эволюцию крест-фактора. Основываясь на тех же самых 4500 песен, этот усреднённый график, начиная с 80-х годов, показывает падение на 3 dB. Это укрепляет нас во мнении, что увеличение громкости, явно начавшееся с 90-х, было порождено компрессией. Нетрудно заметить, что эволюцию крест-фактора можно разделить на три этапа. Первый, с 1969 по 1980-й, показывает увеличение крест-фактора, обусловленное, вероятно, совершенствованием студийного оборудования, улучшением отношения сигнал/шум и, как следствие, расширением его динамического диапазона. С 1980 по 1990-й крест-фактор остаётся довольно устойчивым. Затем, с 1990 по 2010-й – в эпоху войны за громкость – крест-фактор драматически уменьшается.

Наконец, ещё один полезный и информативный критерий – это пропорция сэмплов, после нормализации близко подобравшихся к потолку 0 dBFS. Большая плотность очень громких сэмплов предполагает, что в мастер-копии был клиппинг или использовался цифровой brickwall-ограничитель. Четвёртая диаграмма отслеживает плотность пиковых сэмплов в той же самой коллекции из 4500 треков. Первые две диаграммы показывают, что музыка становится громче; третья указывает, что это происходит, вероятно, в результате компрессии динамического диапазона; а эта иллюстрирует, что компрессия, скорее всего, сопровождалась цифровым brickwall-ограничением.

Что такое динамический диапазон музыки?

Вы удивитесь, но на этот вопрос довольно трудно ответить. Интуитивно, мы чувствуем, что динамический диапазон это некий критерий, показывающий, насколько варьируется уровень в музыкальной композиции. Давайте попробуем материализовать эти догадки. Первая диаграмма сравнивает значения RMS в двух песнях: «Fuk» от Plastikman и «Smells Like Teen Spirit» от Nirvana. Очевидно, что уровень в Smells Like Teen Spirit более подвижен, чем в Fuk. И это не удивляет, поскольку Plastikman приверженец минимал-техно, тогда как для Nirvana характерны мягкие куплеты и громкие припевы.

Однако, результат меняется просто радикально, если для анализа использовать окно не 2 секунды, а 100 миллисекунд. При большем окне музыка Plastikman демонстрирует более стабильный RMS-уровень, но, как Вы видите на второй диаграмме, при меньшем времени интеграции в ней появляются более интенсивные вариации. Это обусловлено громкими и сухими барабанами. Поэтому, если мы хотим объективно измерить «подвижность уровня», то должны тщательно подумать над тем, какой масштаб использовать.

Также есть вопрос по поводу того, как фактически вычислить эту подвижность уровня. Иными словами, как получить цифровое значение, которое было бы мерой «динамического диапазона». Очевидно, мы могли бы измерить полную вертикальную амплитуду кривой RMS в заданном временном масштабе, суммируя амплитуду каждого вертикального движения. На первый взгляд, это даёт идеальную картину: снова посмотрите на первую диаграмму, на которой синяя кривая выглядит более подвижной, чем красная, и имеет большую общую вертикальную амплитуду.

Однако, на практике, этот метод ненадёжен. К примеру, изолированный пик посреди плоской RMS-кривой исказит измерение, давая ложное представление подвижности уровня. Существует более надёжный метод, используемый EBU для оценки диапазона громкости. Он заключается в вычислении распределения значений RMS. Такое распределение показано в третьей диаграмме. Затем мы измерили «разброс» распределения, используя трюк, подобный методу вероятностной выборки из арсенала описательной статистики, оставив только 5% высших значений и 10% низших. Результаты анализа в двухсекундном окне показывают более широкий разброс RMS у Smells Like Teen Spirit.

Давайте теперь изменим масштаб и измерим разброс RMS в окне 0,1 секунды. Итоги эксперимента показаны в четвёртой диаграмме и снова результаты прямо противоположны: разброс в Fuk намного больше, чем в Smells Like Teen Spirit. Теперь, проведём этот же эксперимент с другими размерами окна. Результаты представлены в последней диаграмме. Интересно, что вариации уровня в Smells Like Teen Spirit всегда больше, за исключением окон менее 0,18 секунды. Это как раз тот временной промежуток, где барабаны Fuk оказывают решающее влияние.

То, что изображено на пятой диаграмме, является хорошей кандидатурой на роль измерителя «динамического диапазона» музыки. Теперь предположим, что вместо того, чтобы пользоваться значениями RMS, мы будем иметь дело с некой единицей измерения воспринимаемой громкости, типа той, что упомянута в рекомендации ITU BS 1770. Это и есть тот самый «диапазон громкости». Основы того, как EBU определяет «диапазон громкости» находятся в документе EBU Tech 3342 и объясняются нами в главе «Измерение диапазона громкости по методике EBU».

Теперь остаётся только вопрос, нужно ли вообще использовать такой термин, как «динамический диапазон». Нет никакого официального определения для него, и это понятие можно спутать с динамическим диапазоном носителя записи, который показывает разницу между самым маленьким и самым большим уровнями, с которыми он может работать. Поэтому, в этой статье я не буду говорить о «динамическом диапазоне» музыки. Вместо этого, я буду использовать такие термины, как «RMS-вариабельность» или, в более широком смысле, «динамическая вариабельность». А термин «динамический диапазон» мы оставим для определения отношения сигнал/шум носителя записи. Я буду использовать термин «диапазон громкости» в строгом соответствии с документом EBU 3342 и термин «вариабельность громкости» во всех других случаях, вовлекающих понятие громкости вместо RMS.

Источник звуковых колебаний излучает в окружающее пространство энергию. Количество звуковой энергии, проходящей за секунду через площадь в 1 м2, расположенную перпендикулярно направлению распространения звуковых колебаний, называют интенсивностью (силой) звука.

Когда мы ведем обычный разговор, мощность потока энергии приблизительно равен 10 мкВт. Мощность самых громких звуков скрипки может составлять 60 мкВт, а мощность звуков органа - от 140 до 3200 мкВт.

Человек слышит звук в чрезвычайно широком диапазоне звуковых давлений (интенсивностей). Одной из опорных величин этого диапазона является стандартный порог слышимости - эффективное значение звукового давления, создаваемого гармоническим звуковым колебанием частоты 1000 Гц, едва слышимым человеком со средней чувствительностью слуха.

Порогу слышимости соответствует интенсивность звука Iзв0 = 10-12 Вт/м2 или звуковое давление pзв0 = 2Ч10-5 Па.

Верхний предел определяется значениями Iзв. макс. = 1 Вт/м2 или pзв. макс. = 20 Па. При восприятии звука такой интенсивности у человека появляются болевые ощущения.

В области звуковых давлений, существенно превышающих стандартный порог слышимости, величина ощущения пропорциональна не амплитуде звукового давления pзв, а логарифму отношения pзв/pзв0. Поэтому звуковое давление и интенсивность звука часто оценивают в логарифмических единицах децибелах (дБ) по отношению к стандартному порогу слышимости.

Диапазон изменения звуковых давлений от абсолютного порога слышимости до болевого порога составляет для разных частот от 90 дБ до 130 дБ.

Если ухо человека воспринимает одновременно два или несколько звуков различной громкости, то более громкий звук заглушает (поглощает) слабые звуки. Происходит так называемая маскировка звуков, и ухо воспринимает только один, более громкий, звук. Сразу после воздействия на ухо громкого звука снижается восприимчивость слуха к слабым звукам. Эта способность называется адаптацией слуха.

Таким образом, порог слышимости в значительной степени зависит от условий прослушивания: в тишине или же на фоне шума (или другого мешающего звука). В последнем случае порог слышимости повышается. Это свидетельствует о том, что помеха маскирует полезный сигнал.

Слуховой аппарат человека обладает определенной инерционностью: ощущение возникновения звука, а также его прекращения появляется не сразу.

Аудиосигнал является случайным процессом. Его акустические или электрические характеристики непрерывно изменяются во времени. Пытаться отследить случайные изменения реализаций этого хаоса - занятие, имеющее не много смысла. Обуздать его величество случай, придать ему черты детерминированности можно, используя усредненные параметры, такие, как уровень аудиосигнала.

Уровень аудиосигнала характеризует сигнал в определенный момент и представляет собой выраженное в децибелах выпрямленное и усредненное за некоторый предшествующий промежуток времени напряжение аудиосигнала.

Под динамическим диапазоном аудиосигнала понимают отношение максимального звукового давления к минимальному или отношение соответствующих напряжений. В таком определении нет сведений о том, какое давление и напряжение считается максимальным и минимальным. Наверное, поэтому определенный таким образом динамический диапазон сигнала, называется теоретическим. Наряду с этим динамический диапазон аудиосигнала можно определить и экспериментально как разность максимального и минимального уровней для достаточно длительного периода. Это значение существенно зависит от выбранного времени измерения и типа измерителя уровней.

Динамические диапазоны музыкальных и речевых акустических сигналов разных типов, измеренные с помощью приборов, составляют в среднем:

80 дБ для симфонического оркестра

45 дБ для хора

35 дБ для эстрадной музыки и солистов-вокалистов

25 дБ для речи дикторов

При записи уровни необходимо регулировать. Объясняется это тем, что исходные (необработанные) сигналы зачастую имеют большой динамический диапазон (например, до 80 дБ у симфонической музыки), а в домашних условиях аудиопрограммы прослушиваются в диапазоне порядка 40 дБ.

Ручной регулировке уровней присущ недостаток. Время реакции звукорежиссера составляет около 2 с даже если партитура композиции ему заранее известна. Это приводит к погрешности в поддержании максимальных уровней музыкальных программ до 4 дБ в обе стороны.

Усилители, акустические системы да и уши человека нужно защищать от перегрузок, вызванных резкими скачкообразными изменениями амплитуды аудиосигнала - ограничивать сигнал по амплитуде.

Динамический диапазон сигнала нужно согласовывать с динамическими диапазонами устройств записи, усиления, передачи.

Для увеличения дальности действия FM радиостанций динамический диапазон аудиосигнала нужно сжимать. Для снижения уровня шума в паузах динамический диапазон желательно увеличивать.

В конце концов, мода, диктующая свои условия во всех сферах человеческой деятельности, в том числе и в звукозаписи, требует насыщенного, плотного звучания современной музыки, которое достигается резким сужением ее динамического диапазона.

Звуковая волна (огибающая громкости) фрагмента оперы С. Рахманинова "Алеко",

и современной танцевальной музыки.

В классической музыке важны нюансы, танцевальная музыка должна быть "сильнодействующей".

Этим диктуется необходимость в применении устройств автоматической обработки уровней сигналов.