Reverse Mastering: Este posibilă creșterea intervalului dinamic al înregistrărilor comprimate? Sunet dinamic la niveluri distructibile din Rainbow Six: Siege

VOLOGDIN E.I.

GAMA DINAMICĂ

PISTE AUDIO DIGITALE

Note de curs

Saint Petersburg

	Gamă dinamică de sunete și muzică.................................................. ........ ........................
	Gama dinamică a fonogramelor.................................................. ..................... ................................ ...........
	Gama dinamică a căii audio digitale.................................................. ......... ............
	Extinderea intervalului dinamic folosind tehnologia Dithering.....
	Extinderea intervalului dinamic folosind tehnologia Noise Shaping
.......................................................................................................................................................
Bibliografie................................................. . .................................................. ...... .............

1. Gamă dinamică de sunete și muzică

O persoană aude sunet într-o gamă extrem de largă de presiuni sonore. Acest interval se extinde de la pragul absolut de auz până la pragul de durere de 140 dB SPL în raport cu nivelul zero, care este considerat o presiune de 0,00002 Pa (Fig. 1). Zona de risc din această figură indică zona presiunilor sonore care, atunci când

Pragul absolut de auz

Frecvența tonală, kHz

Orez. 1. Zone de audibilitate auditivă

expunerea pe termen lung poate duce la pierderea completă a auzului. Pragul de durere pentru sunetele tonale depinde de frecvență; pentru sunetele cu un spectru arbitrar, un nivel de presiune de 120 dB SPL este luat ca prag de durere. Graficul pragului absolut de auz este descris destul de precis de egalitatea empirică

În tăcere, sensibilitatea auzului unei persoane crește, iar într-o atmosferă de sunete puternice scade; auzul se adaptează la mediul sonor înconjurător, prin urmare intervalul dinamic al auzului nu atât de mare - aproximativ 70..80 dB. De sus este limitat de o presiune de 100 dB SPL, iar de jos de zgomot cu un nivel de -30...35 dB SPL. Acest interval dinamic poate fi deplasat în sus și în jos cu până la 20 dB. Pentru o percepție confortabilă a muzicii, se recomandă ca presiunea sonoră să nu depășească 104 dB SPL acasă și 112 dB SPL în încăperile special echipate.

Gama dinamică a muzicii determinată de raportul în decibeli dintre cel mai puternic sunet (fortissimo) și cel mai silențios sunet (pianissimo). Gamă dinamică de muzică simfonică este de 65...75 dB, iar la concertele de muzică rock crește

până la 105 dB, în timp ce vârfurile presiunii sonore pot atinge 122...130 dB SPL.

Gama dinamică a interpreților vocali nu depășește 35...45 dB (Tabelul 1).

Gama dinamică a muzicii depinde în mod semnificativ de alegerea maximului

presiunea sonoră P max, deoarece este limitată de jos de pragul absolut

audibilitate. Această dependență este cel mai pronunțată la marginile intervalului audio.

În fig. 2

sunt date exemple de modificări ale intervalului dinamic al sunetelor tonale. ÎN

Pragul de durere 120dB

Pmax

80dB

DR 40 dB

50dB

80dB

50dB

Prag absolut

audibilitate

Frecvența tonală, kHz

Orez. 2. Gama dinamică a muzicii și pragurile de auz

in functie de alegerea P max

și frecvențele sunetelor tonale

dinamic

gamă

80 dB redus la margini

interval de sunet de până la 40

Acesta este motivul pentru care

Se obișnuiește să se măsoare intervalul dinamic al sunetelor la o frecvență de 1 kHz, pe care poate

ajunge la 117 dB.

camera maschează sunetul și, prin urmare, îi reduce intervalul dinamic

muzica de jos. Figura 3. afișat ca atunci când presiunea sonoră scade de la 120 la 80 dB

Gama dinamică SPL a muzicii datorită zgomotului din cameră este redusă de la 90 la 50 dB.

120 dB SPL

DR 90 dB

Influență

complet

neglijare

Doar cand

90dB

nivel minim de sunete muzicale.

70dB

În studiourile de înregistrare nivelul de zgomot nu este

90dB

depaseste

apartamente

50dB

vorbi

crește nivelul

zgomot de până la 60 dB SPL.

Acesta este motivul pentru care muzica liniștită se îneacă adesea

Zgomot în apartament

sediul

audiții

Involuntar

apare

crește

volum.

Zgomotul de cuantizare fiind alb

zgomot, vizibil la ureche atunci când este

Zgomot în studio

intensitate de până la 4 dB SPL, chiar și atunci când

zgomotul general al echipamentelor audio din cameră

ajunge

Orez. 3. Gama dinamică a muzicii

trebuie comparat cu faptul că complet

Scara FS a contorului de nivel digital

corespund unui nivel între 105 și 112 dB SPL. Prin urmare pentru

spații casnice

Gama dinamică a muzicii nu trebuie să depășească 101 - 108 dB.

Gama dinamică de microfoane este determinată în același mod ca de obicei în căile electrice. Limita superioară este limitată de valoarea admisibilă a distorsiunii neliniare, iar limita inferioară este limitată de nivelul de zgomot intrinsec. Microfoanele de studio moderne permit o presiune sonoră maximă de 125 ... 145 dB SPL, în timp ce distorsiunile neliniare nu depășesc 0,5% ... 3%. Nivelul de zgomot propriu al microfonului este de 15...20 dBA, intervalul dinamic este de la 90 la 112 dBA, iar raportul semnal-zgomot este de 70 până la 80 dBA. Aceste microfoane acoperă cu generozitate întreaga gamă de auz uman de la 120 dB SPL până la niveluri de zgomot de studio de 20 dB SPL. În studiourile moderne, înregistrarea se face folosind ADC-uri pe 22 sau 24 de biți, uneori folosind cuantizarea în virgulă mobilă, deci nu există probleme cu intervalul dinamic. Un astfel de echipament este extrem de scump.

2. Gama dinamică a fonogramelor

Semnalele muzicale și de vorbire sunt o secvență de impulsuri sonore care cresc rapid și care se descompun mai lent (Fig. 4.). Un astfel de semnal este caracterizat RMS și valori ale nivelului de vârf, diferența dintre aceste niveluri se numește factor de creastă. O undă pătrată (undă pătrată) are un factor de crestă unitar de 0 dB, iar o undă sinusoidală are un factor de crestă unitar de 3 dB. Fonogramele semnalelor muzicale și vocale au un factor de vârf de până la 20 dB sau mai mult. Timp de determinare Factorul de creastă este legat de timpul de integrare la calcularea valorii pătrate medii a semnalului și este de obicei egal cu 50 ms.

Intervalul dinamic și factorul de creastă al unei fonograme muzicale sunt determinate de procesarea statistică a valorilor semnalului instantaneu. Cele mai detaliate caracteristici statistice sunt calculate în editorul de sunet Audition 3 (Fig. 4).

Fig.4. Fragmente de fonograme de fragmente muzicale de diferite durate

Dintre acestea, principalele sunt următoarele: Peak Amplitude (L pic), Maximum RMS Power (L max), Minimum RMS Power (L min) și Average RMS Power (L avr) (niveluri de maxim,

valorile minime și medii ale puterii semnalului rădăcină pătratică medie (efectivă).

Intervalul dinamic al fonogramei conform acestui tabel este determinat ca

DR mL picL min,

factorul de creastă se calculează folosind formula

PF mL picL avr

Intervalul dinamic poate fi determinat și din histograma distribuției nivelurilor de fonogramă prezentată în Fig. 5. Este convenabil să efectuați rapid astfel de operațiuni înainte și după procesarea dinamică a unei fonograme.

Fig.4. Caracteristicile statistice ale fonogramei muzicii lui Beethoven „Elise”

Fig.5. Histograma de distribuție a muzicii lui Beethoven „Elise”

în funcţie de sarcina de cercetare. Dacă, de exemplu, intervalul dinamic al valorilor instantanee ale nivelurilor de fonogramă este important, atunci timpul de integrare ar trebui să fie de 1-5 ms. Dacă intervalul dinamic al muzicii este măsurat ținând cont de percepția auditivă, atunci timpul de integrare este ales să fie de 60 ms, aceasta este constanta de timp de auz.

vă permite să determinați intervalul dinamic și factorul de creastă cu o probabilitate dată la un moment de integrare selectat. Editorul audio Adobe Audition 3 folosește normalizarea histogramei, în care probabilitatea maximă de evenimente corespunde întotdeauna unei valori de 100. O astfel de histogramă descrie distribuția probabilității nivelurilor semnalului de fonogramă în raport cu valoarea maximă. La construirea acestuia, scara de-a lungul axei X este selectată automat, deci este dificil să comparați histogramele diferitelor fonograme.

Uz practic. Cine are nevoie de informații statistice și de o histogramă a unei fonograme și de ce. În primul rând, aceste date oferă o asistență neprețuită în procesarea dinamică a unei fonograme, deoarece permit selectarea în mod rezonabil a caracteristicilor compresorului și expandorului. Rezultatele statistice ale procesării fonogramelor cu muzică de diferite genuri fac posibilă determinarea intervalului dinamic necesar al căii electroacustice și formularea cerințelor pentru puterea de vârf și medie a capetelor difuzoarelor. Ele joacă un rol semnificativ în dezvoltarea algoritmilor de compresie a semnalului audio.

Muzică emoțională cu o gamă dinamică largă și vârf mare
factorul poate fi ascultat numai pe echipamente scumpe de înaltă calitate cu bun
		acustic	unitati.
		căști și în mașini din cauza zgomotului dinamic
	15 raza este redusă și ea			doar dezgustător.
		Prin urmare, astfel de înregistrări nu sunt foarte solicitate și,
		inevitabil, în fiecare an intervalul dinamic și vârful






		Fig.7. Fonograma cântecului „I`ll Be There For You”
		Fig.7. Fonograma cântecului „I`ll Be There For You”
Orez. 6. Factor de creasta CD

fonogramele sunt reduse în mod deliberat de către producători (Fig. 6.). Pe CD-urile moderne

Pe discuri, în majoritatea cazurilor, intervalul dinamic nu depășește 20 dB, iar factorul de creastă este

puțin mai mult de 3 dB, ceea ce este suficient pentru muzica dance. În Fig. 7. dat

imaginea unei fonograme moderne de pe un CD.

3. Gama dinamică a căii audio digitale

Calea digitală convențională

include ADC și DAC.

Primul efectuează

cuantificarea semnalelor analogice și transformarea lor într-un flux digital. Al doilea

inversă transformă fluxul digital într-un semnal analogic.

Cuantizarea

rotunjire

secvențe de mostre

la un întreg binar

sensuri. Cu modularea codului de impuls (PCM), asta

Operațiune

efectuate

liniar

cuantificator, numit în literatura tehnică Mid-

Călca. U

raportul lui de transmisie

are forma

„scări” cu trepte identice

Neapărat,

un număr impar de niveluri de cuantizare. Rotunjire

sunt produse date digitale în acest cuantificator

cel mai apropiat

valoare binară (Fig. 8).

Acest algoritm

numită de obicei rotunjire.

algoritm

zi libera

cuantificator

simetric față de axa timpului și cuantizarea

Orez. 8. Angrenaje

efectuate cu un prag egal cu

0,5 trepte de cuantizare

funcții de cuantizare

Atâta timp cât semnalul de intrare este mai mic decât acest prag, semnalul de ieșire

Mid-Tread și Mid-Riser

semnalul cuantificatorului este zero, ceea ce înseamnă că

cuantizarea se realizează cu un cutoff central.

semnal de intrare puțin peste pragul de cuantizare, semnalul de ieșire are forma

secvenţe de impulsuri cu un duty cycle în funcţie

de la nivel

Odată cu o creștere suplimentară a nivelului GS, se formează un semnal de ieșire în formă de pas.

Rotunjirea datelor digitale în cuantificatorul Mid-Riser este efectuată la cea mai apropiată valoare mai mică (Fig. 8), astfel încât acest algoritm este de obicei numit trunchiere. Cuantificatorul Mid-Riser este diferit prin faptul că nu are un prag de cuantizare, astfel încât transmite semnale audio la niveluri foarte mici, chiar și sub

zgomot. Totuși, în absența ES, orice zgomot nesemnificativ generează la ieșire o secvență de impulsuri aleatorii cu o amplitudine de 1 cuantum, ceea ce înseamnă că un astfel de cuantificator amplifică zgomotul.

Gama dinamică a ADC cu cuantificator Mid-Tread determinat prin logaritmul raportului dintre valorile maxime și minime ale semnalului sinusoidal la intrarea cuantificatorului

DR A 20 logA max,

Amin

Q 2 (q 1), A		Q – pas de cuantizare, q – numărul de biți. De aceea
Q 2 (q 1), A		Q – pas de cuantizare, q – numărul de biți. De aceea


	DRA		Q 2 (q 1)	) 6,02q (1)
	DRA			) 6,02q (1)
			Q/2

La q = 8 acest interval dinamic este de 48 dB, iar la q = 16 crește la 96 dB. Valoarea DR A determină limita inferioară a intervalului dinamic pe baza nivelului semnalelor de intrare ale cuantificatorului Mid-Tread.

interval dinamic DAC măsurată în conformitate cu recomandările standardului EIAJ prin raportul valorii efective maxime a semnalului

forma sinusoidală A max la ieșire la valoarea medie pătrată a zgomotului de cuantizare măsurat în banda de la 0 la frecvența Nyquist F N

Amax

Q 2 (q 1)

Amax

q 1, 76;q

La q = 16

DR R = 98 dB, care

decibel

interval dinamic

cuantificator definit prin formula (1). Intervalul dinamic al DAC-ului măsurat în acest mod este identificat cu valoarea SNR-ului său.

Dacă domeniul de frecvență superioară este limitat de valoarea F max F N , atunci formula de calcul pentru SNR și DR R ia forma

	SNR R DR R 6,02q 1,76 10 log
		2 Fmax

unde f s este frecvența de eșantionare, F max este frecvența maximă a domeniului audio. La

f s = 44,1 kHz și F max = 20 kHz și SNR R =DR R = 98,5 dB. După cum puteți vedea, raportul semnal-zgomot este cu doar 2 decibeli mai mare decât intervalul dinamic. Trebuie remarcat faptul că valoarea SNR depinde de frecvențele f s și F max, în timp ce DR nu depinde de acești parametri.

Cu toate acestea, majoritatea publicațiilor tehnice echivalează intervalul dinamic cu raportul semnal-zgomot. Acest lucru este confirmat atât de AES 17, cât și de

IEC 61606.

Standardul IEC 61606 recomandă măsurarea SNR și DR atunci când la intrarea ADC se aplică un semnal sinusoidal cu o frecvență de 997 Hz și un nivel de minus 60 dB FS cu utilizarea obligatorie a tehnologiei TPDF Dithering. În acest caz, raportul calculat pentru SNR din cauza zgomotului suplimentar introdus este propus sub formă

	SNR T DR T 6.02q 3.01 10 log
		2 Fmax

În aceleași condiții, DR = SNR = 93,7 dB, și nu 96 dB, așa cum se găsește adesea în literatura tehnică. În consecință, intervalul dinamic calculat scade și el. În loc de SNR, este adesea folosit inversul acestuia, care determină nivelul integral al zgomotului de cuantizare

L nTSNR T.

În conformitate cu standardul IEC 61606, măsurarea intervalului dinamic DR R este efectuată în conformitate cu diagrama prezentată în Fig. 9. În această schemă testul

Fig..9. Circuit de măsurare a intervalului dinamic DAC

un semnal digital cu o frecvență de 1 kHz și un nivel de minus 60 dB, generat folosind tehnologia TPDF Dithering, este alimentat la intrarea DAC-ului. Semnalul analogic de la DAC este alimentat la intrarea unui filtru trece-jos cu o frecvență de tăiere de 20 kHz, ceea ce limitează spectrul zgomotului de cuantizare. În continuare, filtrarea se realizează folosind un filtru de ponderare de tip A, care ia în considerare caracteristicile percepției auditive a zgomotului de cuantizare, care mărește domeniul dinamic cu 2-3 dB. Semnalul de testare și zgomotul sunt amplificate cu 60 dB și transmise la un contor de nivel THD+N. În acest contor, semnalul de ton este suprimat de un filtru cu crestătură, iar nivelul de zgomot este măsurat în decibeli folosind un voltmetru eficient. Această valoare măsurată a nivelului de zgomot este identificată, cu semnul opus, cu domeniul dinamic al DAC.

La cuantizarea semnalelor la un nivel minim apar distorsiuni enorme, ajungând la 100% (Fig. 10). În acest sens, în practică trebuie urmat interval dinamic real ADC. La determinarea acestui interval, este necesar să se țină seama de: factorul de creastă al semnalelor muzicale, ajungând la 12...20 dB, necesitatea ridicării nivelului limitei inferioare a intervalului dinamic peste nivelul de zgomot de cuantizare cu cel puțin 20 dB și au o marjă suplimentară în partea superioară a intervalului dinamic de aproximativ 10...12 dB pentru a preveni supraîncărcarea accidentală.

Ca rezultat, intervalul dinamic real			înregistrare ADC PCM pe 16 biți
			nu depaseste 48...54 dB. Acest
			nu depaseste 48...54 dB. Acest
	nici măcar aproape de a fi bun
	studio			înregistrări sonore.
	reglare automată a nivelului, care
	apare la înregistrarea CD-urilor,
		intervalul poate fi extins la 74
16 biți, 1000 Hz, 93 dB				vizibil	deteriorare
16 biți, 1000 Hz, 93 dB	calitatea sunetului semnalelor de nivel scăzut.
	calitatea sunetului semnalelor de nivel scăzut.
Fig. 10. Secvența probelor este distorsionată	Înălțime pentru gamă dinamică deasupra
forma de undă sinusoidală	protejează împotriva posibilității de suprasarcină,
					depaseste

valorea estimata. Când înregistrați muzică de dans, 6 dB de spațiu pentru cap este suficient.

Când înregistrați muzică simfonică, uneori trebuie să aveți o marjă de până la 20...30 dB. Rezerva de gamă dinamică din partea inferioară previne posibilitatea ca trecerile liniștite să scadă sub nivelul de zgomot și, în plus, sub pragul audibilității.

Pe căi digitale limita superioară a intervalului dinamic limitat la nivelul semnalului de 0 dB FS . Fără a folosi tehnologia Dithering limita inferioară a intervalului dinamic limitat la nivel

LA 1/DRA.

La q = 8 biți este egal cu minus 48 dB, iar la q = 16 biți este minus 96 dB. Zgomotul inevitabil al tractului crește acest nivel.

Nivelul de zgomot integrat minus 93,7 dB este mult sau puțin. Este important cât de mult depășește acest nivel pragul de auz. Utilizarea tehnologiei Noise Dithering

Fig. 11. Praguri de audibilitate a zgomotului de cuantizare în funcție de numărul de biți

cuantizarea devine zgomot alb, al cărui prag de audibilitate este de 4 dB SPL. Aceasta înseamnă că aproape de 3 kHz, zgomotul de cuantizare la q = 16 biți va depăși pragul de audibilitate cu 22,3 dB (Fig. 11). După cum puteți vedea din această figură, pentru ca zgomotul de cuantizare să fie inaudibil, este necesară cuantizarea pe 20 de biți.

4. Extinderea intervalului dinamic folosind tehnologia Dithering

Pentru a extinde intervalul dinamic Calea PCM cu tip cuantificator MeadTread fără a crește numărul de biți și frecvența de eșantionare, multe

semnale analogice, un mic zgomot analogic este adăugat la ES. Mai des această tehnologie este folosită când recuantizarea sateliților digitali când este produs

se realizează cu 24 de biți, iar apoi se realizează recuantizarea, de obicei până la 16 biți, așa cum este obișnuit în standardul CD. În același timp, calitatea zgomotului unui astfel de CD corespunde înregistrării pe 20 de biți.

În procesul de recuantizare, cel mai des este utilizată operația de trunchiere, în care biții de ordin inferior ai cuvintelor de cod sunt pur și simplu aruncați. În acest caz, semnalul de ieșire

Oamenii pasionați de audio acasă prezintă un paradox interesant. Ei sunt gata să dea cu lopata sala de ascultare, să construiască difuzoare cu drivere exotice, dar se retrag timid în fața muzicii conservate, ca un lup în fața unui steag roșu. Dar, de fapt, de ce nu poți să te ridici pentru steag și să încerci să gătești ceva mai comestibil din conserve?

Din când în când, pe forum apar întrebări plângătoare: „Recomandă albume bine înregistrate”. Acest lucru este de înțeles. Publicații speciale audiofile, deși încântă urechea din primul minut, nimeni nu le ascultă până la final, repertoriul e prea plictisitor. În ceea ce privește restul bibliotecii muzicale, problema pare evidentă. Puteți economisi sau nu puteți economisi și turnați o tonă de bani în componente. Cu toate acestea, puțini oameni le place să asculte muzica lor preferată la volume ridicate, iar capacitățile amplificatorului nu au nimic de-a face cu asta.

Astăzi, chiar și în albumele Hi-Res, vârfurile coloanei sonore sunt tăiate și volumul este decupat. Se crede că majoritatea ascultă muzică pe tot felul de vechituri și, prin urmare, este necesar să „calcăm pe gaz”, pentru a face un fel de compensare puternică.

Desigur, acest lucru nu se face intenționat pentru a supăra audiofilii. Puțini oameni își amintesc deloc de ele. Poate s-au gândit să le dea fișierele master din care este copiată tirajul principal - CD-uri, MP3-uri etc. Desigur, masterul a fost mult timp aplatizat de un compresor; nimeni nu va pregăti în mod deliberat versiuni speciale pentru melodiile HD. Cu excepția cazului în care se efectuează o anumită procedură pentru suporturile de vinil, care din acest motiv sună mai uman. Și pentru ruta digitală, totul se termină la fel - cu un compresor mare de grăsime.

Deci, în prezent, 100% din fonogramele publicate, minus muzica clasică, sunt supuse compresiei în timpul masterizării. Unii efectuează această procedură mai mult sau mai puțin priceput, în timp ce alții o fac complet prostește. Drept urmare, avem pelerini pe forumuri cu o linie de plugin-uri DR în sân, comparații dureroase de ediții, un zbor către vinil, unde trebuie și noi să minăm primele prese.

Cei mai degerați la vederea tuturor acestor scandaluri s-au transformat literalmente în sataniști audio. Nu glumesc, ei citesc pe dos sfânta scripturi a inginerului de sunet! Programele moderne de editare audio au câteva instrumente pentru restabilirea unui val sonor tăiat.

Inițial, această funcționalitate a fost destinată studiourilor. La mixare, există situații în care clipping-ul intră în înregistrare și, din mai multe motive, nu mai este posibilă refacerea sesiunii, iar aici arsenalul unui editor audio vine în ajutor - un declipper, un decompresor etc.

Și acum ascultătorii obișnuiți, cărora le sângerează urechile după următorul produs nou, apelează din ce în ce mai mult la un astfel de software din ce în ce mai îndrăzneț. Unii preferă iZotope, alții Adobe Audition, alții împart operațiunile între mai multe programe. Scopul restabilirii dinamicii anterioare este de a corecta programatic vârfurile de semnal tăiate, care, în repaus la 0 dB, seamănă cu o viteză.

Da, nu se vorbește despre o revigorare 100% a codului sursă, deoarece procesele de interpolare au loc folosind algoritmi mai degrabă speculativi. Dar totuși, unele dintre rezultatele procesării mi s-au părut interesante și demne de studiat.

De exemplu, albumul Lanei Del Rey „Lust For Life”, înjură constant, ugh, înjură! Cântecul original „When the World Was at War We Kept Dancing” era așa.

Și după o serie de decupere și decompresoare a devenit așa. Coeficientul DR s-a modificat de la 5 la 9. Puteți descărca și asculta eșantionul înainte și după procesare.

Nu pot spune că metoda este universală și potrivită pentru toate albumele ruinate, dar în acest caz am ales să păstrez această versiune în colecție, procesată de un activist root tracker, în locul ediției oficiale pe 24 de biți.

Chiar dacă extragerea artificială a vârfurilor din materialul sonor nu returnează adevărata dinamică a unei performanțe muzicale, DAC-ul dvs. vă va mulțumi totuși. La urma urmei, i-a fost atât de dificil să lucreze fără erori la niveluri extreme, unde există o probabilitate mare de apariție a așa-numitelor vârfuri între eșantionare (ISP). Și acum doar fulgerările rare ale semnalului vor sări la 0 dB. În plus, o coloană sonoră silentioasă atunci când este comprimată în FLAC sau alt codec fără pierderi va fi acum mai mică. Mai mult „aer” în semnal economisește spațiu pe hard disk.

Încearcă să reînvie albumele tale cele mai urâte care au fost ucise în „războiul zgomotului”. Pentru a rezerva dinamica, mai întâi trebuie să reduceți nivelul piesei cu -6 dB și apoi să rulați dispozitivul de tăiere. Cei care nu au încredere în computere pot conecta pur și simplu un expander de studio între CD player și amplificator. Acest dispozitiv face în esență același lucru - restabilește și întinde vârfurile unui semnal audio comprimat dinamic cât poate de bine. Dispozitivele similare din anii 80-90 nu sunt foarte scumpe și va fi foarte interesant să le încerci ca experiment.

Controlerul de gamă dinamică DBX 3BX procesează semnalul separat în trei benzi - LF, MF și HF

Pe vremuri, egalizatoarele erau o componentă de la sine înțeleasă a unui sistem audio și nimeni nu se temea de ele. Astăzi nu este nevoie să nivelăm ruloul de înaltă frecvență al unei benzi magnetice, dar trebuie făcut ceva în privința dinamicii urâte, fraților.

Ce este intervalul dinamic?

Intervalul dinamic poate fi definit ca distanța dintre cel mai silențios și cel mai puternic nivel de semnal posibil. De exemplu, dacă instrucțiunile pentru procesor indică faptul că nivelul maxim al semnalului de intrare înainte de distorsiune este de +24 dB, iar nivelul de zgomot de ieșire este -92 dB, atunci intervalul dinamic total al procesorului este de 24 + 92 = 116 dB.

Intervalul dinamic al unei orchestre este în medie între -50 dB și +10 dB. Care adaugă până la 60 dB. Deși s-ar putea să credeți că 60 dB de interval dinamic este scăzut, după ce ați făcut niște calcule simple, se dovedește că +10 dB este de 1000 de ori mai puternic decât -50 dB!

Gama dinamică în muzica rock este mult mai mică, de obicei -10 dB până la +10 dB sau 20 dB în total. Prin urmare, amestecarea diferitelor semnale din muzica rock într-un singur mix este o sarcină destul de obositoare.

De ce avem nevoie de compresie?

Să presupunem că mixați un disc rock care are o gamă dinamică medie de 20 dB. Și doriți să adăugați voci necomprimate în mix. Intervalul dinamic mediu al vocii este de aproximativ 40 dB. Ce înseamnă asta pentru mix? Părțile vocale care sunt prea silentioase pur și simplu nu vor fi auzite, iar părțile vocale prea tare vor ieși în evidență din imaginea de ansamblu. În această situație, este nevoie de un compresor pentru a reduce (comprima) intervalul dinamic al vocii cu 10 dB.

În acest caz, vocea va fi de aproximativ +5 dB. Interval - de la 0 dB la +10 dB. Frazele liniștite vor fi acum mai ridicate decât cel mai scăzut nivel al semnalului din mix, iar frazele puternice nu vor ieși în evidență. Se pare că vocea își ia locul în mix.

Același principiu funcționează pentru orice instrument din mix. Fiecare instrument își are locul în amestec, iar un compresor bun îl ajută pe inginer să le amestece corect.

Este necesar un compresor pentru orice?

De obicei, ca răspuns la această întrebare, auziți: „Desigur că nu! Piesele supracomprimate sună groaznic.” Această afirmație este adevărată doar într-un caz - dacă puteți auzi clar cum funcționează compresorul la înregistrare. Un compresor scump, de înaltă calitate, atunci când este configurat corespunzător, sună imperceptibil! Sunetul supracomprimat este o consecință a erorilor în procesarea unor instrumente specifice , cu excepția cazului în care desigur acest lucru a fost făcut în mod deliberat pentru a obține un efect special .

De ce crezi că toate consolele de mixaj scumpe au propriul lor compresor pe fiecare canal? Răspunsul este simplu - majoritatea instrumentelor au nevoie de compresie, chiar dacă este subtilă. Acest lucru îi ajută să fie auziți în mix.

De ce avem nevoie de noise gate?

Să ne uităm la un exemplu cu voce. Să presupunem că îi setați intervalul la 20 dB. Problemele încep când compresorul amplifica cele mai silentioase semnale dintr-o pistă vocală. Pe fundal apar tot felul de zgomote nedorite, bucăți din coloana sonoră care au intrat în microfon de la căști etc. Puteți încerca pur și simplu să reduceți volumul în timpul pauzelor, dar acest lucru se termină de obicei cu un eșec complet. O modalitate mult mai bună este să utilizați o poartă de zgomot. Putem seta pragul noise gate la, de exemplu, -10 dB, ceea ce corespunde limitei inferioare a gamei dinamice a vocii în cazul nostru. În acest fel, poarta va șterge automat toate semnalele nedorite dintre fraze la zero.

Dacă ați încercat vreodată să mixați o înregistrare live, știți cât de multe probleme sunt cu setul de tobe, și anume cu hardware-ul care intră în microfoanele montate pe tomuri. De îndată ce adăugați înalte pe EQ pentru a face tomurile mai strălucitoare, chimvalele încep să urce. Și acest lucru este audibil în special prin difuzoarele de înaltă frecvență din monitoare. Dacă folosim porți la microfoanele care înregistrează tom-uri, astfel încât hardware-ul să nu mai sune prin ele în timpul pauzelor, vom curăța foarte mult mixul general și îl vom face mult mai inteligibil.

Tipuri de procesare dinamică

Procesarea dinamică este procesul de modificare a intervalului dinamic al unui semnal pentru a îmbunătăți capacitățile echipamentului prin care semnalul este înregistrat sau redat. Cu alte cuvinte, avem posibilitatea de a înregistra sau reda semnalul înregistrat fără distorsiuni și/sau zgomot, simplificând astfel sarcina de mixare.

Compresor și limitator

Punchy, clar audibil, cu prezență bună - toate acestea sunt descrieri ale semnalelor audio obținute prin procesarea lor cu compresoare și limitatoare.

Compresia și limitarea sunt forme de control al intervalului dinamic (volumul) unui semnal. Semnalele audio au o gamă destul de largă de niveluri de volum. Un semnal de vârf poate provoca supraîncărcare în circuitul de înregistrare, care la rândul său va provoca distorsiuni ale semnalului.

Un compresor/limitator este un tip de amplificator în care nivelul volumului depinde de nivelul semnalului audio care trece prin el. Prin selectarea unei anumite valori pentru compresor/limitator, semnalul va fi atenuat automat peste nivelul specificat sau nivelul pragului.

În esență, compresia este procesul de atenuare a semnalului de intrare cu o proporție specificată. Folosit pentru a restrânge gama dinamică a unei voci sau a unui instrument muzical, permițând înregistrarea fără distorsiuni. Folosit și la crearea unui mixaj, reducând diferența de frecvențe a fiecărei piese.

Să presupunem că vocalistul se mișcă constant în fața microfonului și semnalul de ieșire fluctuează în sus și în jos, ceea ce sună ciudat. În acest caz, un compresor va rezolva problema reducând volumul frazelor individuale, astfel încât rezultatul să fie o voce lină.

Gradul de atenuare a semnalului depinde de raportul dintre compresie și nivelul pragului. Un raport de 2:1 sau mai puțin este considerat o compresie slabă, în care semnalul de ieșire peste nivelul pragului este redus la jumătate. Raporturile de peste 10:1 pot fi numite limitare puternică.

Cu cât nivelul pragului este mai scăzut, cu atât semnalul este comprimat mai mult (la un anumit nivel al semnalului de intrare). Este important să știi când să te oprești, deoarece prea multă compresie distruge dinamica înregistrării (și unii ingineri de sunet o distrug în mod special ca efect)!

Limitarea este un tip de procesare a semnalului care suprimă supratensiunile de volum (sărituri de amplitudine).

Compresorul/limitatorul este utilizat pentru multe sarcini de procesare audio, cum ar fi:

Sunetul loviturii unui set de tobe se poate pierde printre chitarele electrice. Și oricât de tare ar fi piesa, toba sună murdar. Compresia va îndrepta sunetul tobei împotriva chitarelor.

Gama de voci de pe înregistrare este destul de largă. Vârfurile de intensitate pot ieși cu adevărat în evidență din sunetul general. Pot exista multe astfel de vârfuri și toate sunt diferite, așa că este aproape imposibil să le egalezi prin mixer. Compresorul/limitatorul controlează automat volumul fără a distorsiona subtilitățile vocii.

Chitara solo este înecată de ritm. Nu ridicați faderul până la capăt, compresia va pune chitara principală la locul său în mix.

Chitara bas este greu de înregistrat. Un sunet neted cu un atac bun este obținut printr-o compresie adecvată. Și nu este nevoie să tăiați capătul inferior al mixului - compresorul/limitatorul va permite basului să apară la orice frecvență

Expander

Există două tipuri principale de expansiune: dinamică și descendentă. Expansiunea extinde intervalul dinamic al unui semnal atunci când acesta este peste o valoare de prag. Expansiunea dinamică este, în esență, compresie inversă. Expansiunea dinamică este utilizată în TV și radio pentru a anula compresia imediat înainte ca semnalul audio să fie transmis. Compresia urmată de expansiune se numește comprimare.În prezent, expansiunea descendentă este folosită cel mai des. Spre deosebire de compresie, care scade semnalul peste un prag, expansiunea scade semnalul sub pragul de expansiune. Gradul de reducere este determinat de raportul de expansiune. De exemplu, un raport de 2:1 reduce semnalul la jumătate (însemnând că dacă semnalul este cu 5 dB sub prag, expanderul îl va reduce la 10 dB). Folosit adesea pentru a reduce zgomotul, extinderea este o poartă de zgomot foarte puternică și simplă. Principala diferență dintre un expander și o poartă de zgomot este că expansiunea depinde de cât de departe a ajuns semnalul „sub prag”, în timp ce cu o poartă de zgomot acest lucru nu contează.

Antifonare

Reducerea zgomotului este procesul de eliminare a zgomotului nedorit dintr-o înregistrare prin limitarea semnalului sub un prag specificat. După cum a fost scris mai sus, funcționarea porții de zgomot nu depinde de nivelul semnalului sub prag. Ieșirea dispozitivului este deschisă atâta timp cât semnalul este peste prag.

Durata deschiderii de ieșire este determinată de viteza de atac. Durata de funcționare a dispozitivului când semnalul este sub prag se numește timp de menținere. Viteza cu care se închide ieșirea este determinată de timpul de întoarcere. Nivelul de suprimare a semnalului nedorit în poziția închis este determinat de interval.

Scurt glosar de termeni

Este dovedit științific că, dacă vrei să înveți rapid un subiect, trebuie mai întâi să înțelegi conceptele de bază. Același principiu se aplică înregistrării sunetului și lucrărilor ulterioare cu sunet. Majoritatea instrucțiunilor și manualelor presupun cunoștințe de bază, fără de care este dificil să le citești. Sper că următoarea secțiune vă va ajuta să vă puneți în ordine și să înțelegeți în sfârșit elementele de bază.

Compresoare

Atac.

Atacul determină viteza cu care compresorul acționează asupra semnalului de intrare. Atacul lung (controlul în sensul acelor de ceasornic pe tot parcursul) permite mai întâi semnalului (alias tranzitoriul inițial) să treacă neprocesat prin compresor, în timp ce atacul scurt (în sens invers acelor de ceasornic pe tot parcursul) procesează imediat semnalul în funcție de raportul de compresie și pragul setat. nivel.

Auto.

Compresorul funcționează în modul automat de atac și retur. În acest caz, regulatoarele nu afectează procesul, dar sunt utilizate valorile parametrilor programați.

Compresor Sidechain.

Intrarea canalului lateral întrerupe semnalul pe care compresorul îl folosește pentru a determina nivelul dorit de compresie. Când canalul lateral este dezactivat, semnalul de intrare merge direct la circuitul principal al compresorului. Când este pornit, nu este trimis niciun semnal către circuitul principal. Acum puteți procesa semnalul de control cu un egalizator, de exemplu, folosind de-essing (corecția frecvenței vocii). După procesare, semnalul de control este trimis înapoi la compresor prin ieșirea canalului. O utilizare tipică pentru un canal lateral este utilizarea unui compresor pentru a opri muzica de fundal în timpul spectacolului unui animator sau pentru a reduce volumul chitarei ritmice pe fundalul vocii. Acum vocea este ușor de distins. În acest caz, piesa vocală merge pe canalul lateral, în timp ce muzica de fundal merge către circuitul compresorului principal. Compresorul scade acum nivelul muzicii de fundal (un proces numit ducking) atunci când vocalistul începe să cânte sau să vorbească.

Compresie dură și moale (genunchi dur/moale)

În cazul compresiei dure, atenuarea semnalului are loc cât mai repede posibil atunci când valoarea pragului este depășită. Cu soft, semnalul este atenuat mai ușor după ce a depășit un prag prestabilit, rezultând un sunet mai natural pentru muzică.

Limitatoare.

Un limitator este un compresor care împiedică creșterea semnalului peste un nivel de prag. De exemplu, dacă pragul este setat la 0 dB, parametrul „Ratio” este rotit până la capăt în sensul acelor de ceasornic, compresorul va începe să funcționeze în modul limitator la 0 dB, iar semnalul de ieșire nu va depăși niciodată această valoare.

Câștig compensator (Makeup Gain).

În cazul compresiei, comprimarea unui semnal afectează de obicei nivelul general al volumului. Controlul câștigului vă permite să restabiliți nivelul pierdut în timpul compresiei.

Raport.

Raportul este relația dintre semnalele de ieșire și de intrare, acest parametru stabilește rata de compresie. De exemplu, prin setarea raportului la 2:1, orice semnal peste prag va fi comprimat la un raport de 2:1. Pentru fiecare decibel la intrarea compresorului, există 0,5 dB la ieșire, creând astfel o compresie care comprimă semnalul la jumătate. Pe măsură ce raportul crește, compresorul intră treptat în modul limitator.

Timpul de eliberare.

Timpul de eliberare este timpul care trece între momentul în care nivelul semnalului de intrare scade sub prag și momentul în care nivelul de compresie revine la zero (compresorul nu mai atenuează semnalul). O scurtă revenire creează un sunet neuniform, „tocat”, în special la o chitară bas. O revenire lungă „strânge” prea mult sunetul, aplatindu-l. Există o utilizare pentru orice valoare a timpului de întoarcere - alegeți după ureche.

Prag.

Nivelul de compresie prag (pragul de compresie) determină valoarea peste care semnalul începe să se atenueze. De obicei, rotirea controlului pragului spre stânga crește semnalul care este comprimat (la un raport mai mare de 1:1).

Expansoare

Expansiunea descendentă.

Expansiunea în jos este folosită cel mai adesea în înregistrarea profesională. Semnalul este atenuat sub valoarea pragului. Aceasta este o metodă standard de reducere a zgomotului.

Raport.

Raportul de expansiune determină nivelul la care semnalul este atenuat atunci când scade sub prag. De exemplu, cu un raport de expansiune de 2:1, fiecare decibel sub prag este atenuat la jumătate. La un raport de 4:1 și mai mare, expanderul funcționează aproape ca o poartă de zgomot, doar fără posibilitatea de a regla timpul de atac, întârzierea și revenirea.

Porți de zgomot

Atac.

Parametrul „timp de atac” stabilește valoarea la care se deschide poarta. Un atac rapid este potrivit pentru instrumentele de percuție, în timp ce vocea și basul necesită o deschidere lină. Aplicarea unui atac prea rapid asupra acestora va duce la o „mătase” vizibilă la amestecare. Un sunet de clic la deschidere este inerent oricărei porți, dar atunci când este configurat corect, nu este audibil.

Opreste timpul.

Timpul de reținere este o perioadă fixă de timp în care poarta este deschisă atunci când nivelul semnalului este sub prag. Valoarea acestui parametru joacă un rol atunci când porți, de exemplu, o capcană - după lovirea lui, trece un anumit timp, după care poarta se închide brusc.

Gamă.

Gama porții este cantitatea de atenuare a semnalului atunci când poarta este închisă. Astfel, când acest parametru este setat la 0 dB, nu există nicio atenuare a semnalului. O valoare de -60 dB înseamnă că atunci când poarta este închisă, semnalul va fi atenuat (gated) cu 60 dB etc.

Timpul de eliberare.

Timpul de resetare a porții determină viteza cu care poarta trece de la deschisă la complet închisă. Timpul de eliberare este de obicei ajustat pentru a păstra degradarea naturală a instrumentului sau a sunetului vocal. O viteză mare de întoarcere elimină zgomotul, dar poate provoca „bâlbâială” la instrumentele cu tobe, care este eliminată printr-o viteză scăzută de întoarcere. Reglați această setare cu atenție pentru cel mai natural efect.

Nivel de prag.

Nivelul pragului porții stabilește valoarea la care se deschide poarta. Principiul este simplu - orice semnal peste prag trece intact, iar semnalul de mai jos este atenuat cu o sumă în funcție de setările intervalului. Dacă rotiți butonul complet spre stânga, poarta va fi dezactivată (adică întotdeauna deschisă) și orice semnal va trece fără atenuare.

Mai jos sunt presetările de compresie utilizate în PreSonus BlueMax. Aceste presetări sunt setări standard, un fel de punct de plecare pentru lucrul cu sunetul.

Voce

Voci calde.Acestea sunt setări pentru compresie ușoară cu raport scăzut și gamă extinsă, în principal pentru melodiile versuri interpretate live. Vocea este „la locul potrivit”.

Țipând.Opțiuni pentru voce tare. Compresie destul de dură pentru vocaliștii care nu acordă atenție distanței până la microfon. Vocea iese puternic în evidență din mix, creând un efect de prezență.

Suprafețe stânga/dreapta (stereo). Parametrii „raport” și „prag” sunt scăzuti aici, ceea ce oferă o gamă largă în care se încadrează chiar și chimvale. Joase profunde, sunetul general este plin de viață, cu reverberație scăzută. Sunet mai puternic, mai puțin efect de cameră.

Chitara acustica.Presetarea accentuează atacul unei chitare acustice și oferă un ton uniform care permite chitarei să rămână audibilă.

Instrumente cu tastatură

Pian.O presetare specială pentru nivelarea întregii game a pianului - de la sunetul inferior până la octava a cincea. Părțile ambelor mâini sunt clar audibile.

Orchestră.Setările sunt potrivite atât pentru coarde, cât și pentru alte „seturi” de sintetizatoare orchestrale. Gama dinamică generală este redusă pentru o adăugare ușoară la amestec.

Circuit.Setările extind gama mixului principal.

Prag	Raport	Atac	Eliberare
-13,4 dB	1.2:1	0,002 ms	182 ms

Emmanuel Deruty

„De ce muzica suna mai rău?” „Fanii se plâng că Death Magnetic pe Guitar Hero sună mai bine decât pe CD”. „Chiar și fanii heavy metalului cred că muzica de astăzi este prea tare!” „Dynamic Range Day anunță o nouă mișcare împotriva zgomotului”. „The Death of Hi-Fi”... Există o mișcare în creștere în presă și online împotriva „războaielor sonore”, o practică în care oamenii încearcă să obțină cel mai tare volum posibil pe piesele lor pentru a-i face pe ascultători să le simtă mai fierbinți. decât versiunile concurente. Potrivit acestor articole, practicile neînțelepte de stăpânire și, mai precis, abuzul de limitatoare brickwall pun muzica în pericol. Fabricația modernă nu are detalii și sacrifică calitatea pentru standard. Bob Dylan a spus într-un interviu din 2006 că „Ascultați aceste albume moderne și pur și simplu sună brutal. Au același sunet peste tot. Nu există claritate sau detaliu, nici în voce și nici în orice altceva. Totul este static.”

Dar nu este remarca lui Dylan o reflectare a conflictului vechi dintre tați și fii? Nu ar fi prima dată când vechea gardă disprețuiește ceea ce face noua generație. Deși, este și adevărat că mulți ingineri audio se alătură societății care preferă muzica „mai dinamică”. Dar spun ei în mod obiectiv că acest gen de muzică este mai bun, sau pur și simplu preferă un anumit tip de sunet? Cercetarea mea va încerca să răspundă la aceste întrebări. Vom afla dacă muzica modernă a devenit cu adevărat mai tare și dacă a devenit mai puțin dinamică. Vom lua în considerare, de asemenea, ipoteza conform căreia sonoritatea poate fi o trăsătură stilistică a unor genuri muzicale specifice, mai degrabă decât o „maniere proastă” motivată de interese comerciale disprețuitoare. În cele din urmă, aruncăm o privire mai atentă la infamul album Death Magnetic al Metallica și aflăm de ce mulți oameni cred că sună rău.

Muzica este cu adevărat mai tare acum?

Da, acest lucru este adevărat și nu există nicio îndoială. Să luăm un număr mare de melodii pop celebre înregistrate între 1969 și 2010, să le normalizăm astfel încât vârfurile să fie la 0 dBFS și să măsurăm valoarea RMS. Acum să sortăm toate valorile în funcție de anul lansării fiecărei piese. Prima diagramă (mai sus) arată rezultatele experimentului și sunt cu adevărat interesante! Linia roșie arată valorile RMS medii pentru fiecare an, iar casetele arată distribuția: cu cât este mai întunecat, cu atât mai multe melodii au același nivel. Cu siguranță a existat o creștere constantă a nivelului mediu între 1982 și 2005, iar înregistrările de astăzi sunt cu aproximativ 5 dB mai puternice decât erau în anii '70.

Desigur, RMS oferă doar informații despre nivelul „electric” sau „fizic” al unui fișier audio, dar nu ne spune nimic despre volumul pe care îl percepem de fapt. Pentru a face acest lucru, în conformitate cu orientările de reglementare EBU 3341, evaluăm „intensitatea integrată”. După cum puteți vedea în al doilea grafic, această valoare este destul de puternic corelată cu RMS, iar cele două grafice sunt foarte asemănătoare unul cu celălalt. Astfel, al doilea set de rezultate îl confirmă pe primul.

Să folosim alte criterii și să repetăm experimentul. De exemplu, pentru a descrie comportamentul dinamic al muzicii, este adesea folosit un criteriu precum factorul de creasta. În termeni simpli, arată diferența dintre nivelurile de vârf și RMS pe parcursul unei melodii. Este un marker bun pentru evaluarea cantității de compresie aplicată muzicii: în general, cu cât mai multă compresie, cu atât factorul de creastă este mai mic. Unii profesioniști consideră că manipularea atentă a factorului de creastă este cheia stăpânirii cu succes. În termeni generali, din nou, cu cât factorul de creastă este mai mic, cu atât muzica este mai tare.

A treia diagramă arată evoluția factorului de creastă. Bazat pe aceleași 4.500 de melodii, acest grafic mediu din anii 80 arată o scădere de 3 dB. Acest lucru ne întărește convingerea că creșterea volumului care a început clar în anii 90 a fost generată de compresie. Este ușor de observat că evoluția factorului de creastă poate fi împărțită în trei etape. Primul, din 1969 până în 1980, arată o creștere a factorului de creastă, probabil ca urmare a îmbunătățirii echipamentelor de studio, o îmbunătățire a raportului semnal-zgomot și, în consecință, o extindere a intervalului său dinamic. Din 1980 până în 1990, factorul de creastă a rămas destul de stabil. Apoi, din 1990 până în 2010 – epoca războiului de zgomot – factorul de vârf a scăzut dramatic.

În sfârșit, un alt criteriu util și informativ este proporția de eșantioane care, după normalizare, se apropie de plafonul de 0 dBFS. Densitatea mare a mostrelor foarte puternice sugerează că masterul a fost tăiat sau a folosit un limitator digital de perete de cărămidă. Al patrulea grafic urmărește densitatea eșantioanelor de vârf din aceeași colecție de 4.500 de piese. Primele două diagrame arată că muzica devine mai tare; al treilea indică faptul că acest lucru se datorează probabil compresiei intervalului dinamic; iar acesta ilustrează faptul că compresia a fost cel mai probabil însoțită de o limitare digitală a zidului de cărămidă.

Care este gama dinamică a muzicii?

Vei fi surprins, dar la această întrebare este destul de greu de răspuns. Intuitiv, credem că intervalul dinamic este o măsură a cât de mult variază nivelul într-o compoziție muzicală. Să încercăm să concretizăm aceste presupuneri. Primul grafic compară valorile RMS a două melodii: „Fuk” de Plastikman și „Smells Like Teen Spirit” de Nirvana. Evident, nivelul în Smells Like Teen Spirit este mai fluid decât în Fuk. Și acest lucru nu este surprinzător, deoarece Plastikman este un adept al techno minimal, în timp ce Nirvana se caracterizează prin versuri blânde și refrenuri puternice.

Cu toate acestea, rezultatul se schimbă pur și simplu radical dacă pentru analiză se folosește o fereastră de 100 de milisecunde, mai degrabă decât 2 secunde. Cu o fereastră mai mare, muzica lui Plastikman prezintă un nivel RMS mai stabil, dar după cum puteți vedea în a doua diagramă, cu un timp de integrare mai scurt, în ea apar variații mai intense. Acest lucru se datorează tobelor puternice și uscate. Prin urmare, dacă dorim să măsurăm în mod obiectiv „fluiditatea nivelului”, trebuie să ne gândim cu atenție la ce scară să folosim.

Există, de asemenea, o întrebare despre cum să se calculeze efectiv acest nivel de mobilitate. Cu alte cuvinte, cum să obțineți o valoare digitală care ar fi o măsură a „interval dinamic”. Evident, am putea măsura amplitudinea verticală totală a curbei RMS la o scară de timp dată prin însumarea amplitudinii fiecărei mișcări verticale. La prima vedere, aceasta oferă o imagine ideală: priviți din nou prima diagramă, în care curba albastră pare mai mobilă decât cea roșie și are o amplitudine verticală globală mai mare.

Cu toate acestea, în practică, această metodă nu este de încredere. De exemplu, un vârf izolat în mijlocul unei curbe RMS plate va distorsiona măsurarea, dând o indicație falsă a mobilității nivelului. Există o metodă mai fiabilă folosită de EBU pentru a estima intervalul de zgomot. Constă în calcularea distribuției valorilor RMS. Această distribuție este prezentată în a treia diagramă. Apoi am măsurat „împrăștierea” distribuției folosind un truc similar cu metoda de eșantionare probabilă din statistica descriptivă, lăsând doar 5% de sus și 10% de jos. Rezultatele analizei într-o fereastră de două secunde arată o răspândire mai largă a RMS pentru Smells Like Teen Spirit.

Să schimbăm acum scara și să măsurăm răspândirea RMS într-o fereastră de 0,1 secunde. Rezultatele experimentului sunt prezentate în cel de-al patrulea grafic și din nou rezultatele sunt exact invers: răspândirea în Fuk este mult mai mare decât în Smells Like Teen Spirit. Acum, să efectuăm același experiment cu alte dimensiuni de ferestre. Rezultatele sunt prezentate în ultimul grafic. Interesant este că variația de nivel în Smells Like Teen Spirit este întotdeauna mai mare, cu excepția ferestrelor de mai puțin de 0,18 secunde. Aceasta este exact perioada de timp în care tobele Fuk au o influență decisivă.

Ceea ce este prezentat în diagrama a cincea este un bun candidat pentru măsurarea „intervalului dinamic” al muzicii. Acum să presupunem că, în loc să folosim valori RMS, vom avea de-a face cu un fel de unitate de măsură a sonorității percepute, cum ar fi cea menționată în recomandarea ITU BS 1770. Acesta este „intervalul de volum”. Elementele de bază ale modului în care EBU definește „gama de intensitate” se găsesc în EBU Tech 3342 și sunt explicate de noi în capitolul „Măsurarea intervalului de intensitate prin metodologia EBU”.

Acum, singura întrebare care rămâne este dacă un astfel de termen precum „interval dinamic” ar trebui folosit deloc. Nu există o definiție oficială pentru acesta, iar conceptul poate fi confundat cu intervalul dinamic al unui mediu de înregistrare, care măsoară diferența dintre cel mai mic și cel mai mare nivel pe care îl poate gestiona. Prin urmare, în acest articol nu voi vorbi despre „gama dinamică” a muzicii. În schimb, voi folosi termeni precum „variabilitate RMS” sau, mai larg, „variabilitate dinamică”. Vom rezerva termenul „interval dinamic” pentru a defini raportul semnal-zgomot al mediului de înregistrare. Voi folosi termenul „gamă de sonoritate” strict în conformitate cu EBU 3342 și termenul „variabilitate a sonorității” în toate celelalte cazuri care implică conceptul de intensitate în loc de RMS.

Sursa vibrațiilor sonore radiază energie în spațiul înconjurător. Cantitatea de energie sonoră care trece pe secundă printr-o suprafață de 1 m2 situată perpendicular pe direcția de propagare a vibrațiilor sonore se numește intensitatea (tăria) sunetului.

Când purtăm o conversație normală, puterea fluxului de energie este de aproximativ 10 µW. Cele mai puternice sunete de vioară pot avea o putere de 60 μW, în timp ce puterea sunetelor de orgă poate varia de la 140 la 3200 μW.

O persoană aude sunet într-o gamă extrem de largă de presiuni (intensități) sonore. Una dintre valorile de referință pentru acest interval este pragul de auz standard - valoarea efectivă a presiunii sonore creată de o vibrație sonoră armonică cu o frecvență de 1000 Hz, abia audibilă de o persoană cu sensibilitate auditivă medie.

Pragul de auz corespunde unei intensități a sunetului Is0 = 10-12 W/m2 sau unei presiuni sonore ps0 = 2Х10-5 Pa.

Limita superioară este determinată de valorile lui Is. Max. = 1 W/m2 sau psv. Max. = 20 Pa. Când o persoană percepe un sunet de o asemenea intensitate, apare durerea.

În regiunea presiunilor sonore care depășesc semnificativ pragul standard de auz, magnitudinea senzației este proporțională nu cu amplitudinea presiunii sonore psv, ci cu logaritmul raportului psv/psv0. Prin urmare, presiunea sonoră și intensitatea sunetului sunt adesea măsurate în unități logaritmice de decibeli (dB) în raport cu pragul standard de auz.

Gama de modificări ale presiunii sonore de la pragul absolut de audibilitate la pragul de durere este pentru diferite frecvențe de la 90 dB la 130 dB.

Dacă urechea umană percepe simultan două sau mai multe sunete de volume diferite, atunci sunetul mai puternic îneacă (absoarbe) sunetele mai slabe. Are loc așa-numita mascare a sunetelor, iar urechea percepe un singur sunet, mai puternic. Imediat după expunerea la un sunet puternic, sensibilitatea urechii la sunetele slabe scade. Această abilitate se numește adaptare la auz.

Astfel, pragul de auz depinde în mare măsură de condițiile de ascultare: în tăcere sau pe fond de zgomot (sau alt sunet deranjant). În acest din urmă caz, pragul de auz crește. Aceasta indică faptul că interferența maschează semnalul util.

Sistemul auditiv uman are o anumită inerție: senzația de apariție a sunetului, precum și încetarea acestuia, nu apare imediat.

Semnalul audio este un proces aleatoriu. Caracteristicile sale acustice sau electrice se modifică continuu în timp. Încercarea de a urmări modificări aleatorii în implementările acestui haos este o activitate care nu are sens. Puteți reduce șansa Majestății Sale și îi puteți oferi caracteristici deterministe utilizând parametri medii, cum ar fi nivelul semnalului audio.

Nivelul semnalului audio caracterizează semnalul la un anumit moment și reprezintă tensiunea semnalului audio, exprimată în decibeli, rectificată și mediată într-o anumită perioadă de timp anterioară.

Intervalul dinamic al unui semnal audio este înțeles ca raportul dintre presiunea sonoră maximă și cea minimă sau raportul tensiunilor corespunzătoare. În această definiție nu există informații despre ce presiune și tensiune sunt considerate maxime și minime. Acesta este probabil motivul pentru care intervalul dinamic al semnalului determinat astfel se numește teoretic. Împreună cu aceasta, intervalul dinamic al unui semnal audio poate fi determinat experimental ca diferență între nivelurile maxime și minime pentru o perioadă suficient de lungă. Această valoare depinde în mod semnificativ de timpul de măsurare selectat și de tipul contorului de nivel.

Intervalele dinamice ale semnalelor acustice muzicale și de vorbire de diferite tipuri, măsurate cu ajutorul instrumentelor, sunt în medie:

80 dB pentru orchestra simfonică

45 dB pentru cor

35 dB pentru muzică pop și soliști

25 dB pentru vorbirea difuzorului

La înregistrare, nivelurile trebuie ajustate. Acest lucru se explică prin faptul că semnalele originale (brute) au adesea o gamă dinamică mare (de exemplu, până la 80 dB pentru muzica simfonică), iar acasă programele audio sunt ascultate într-un interval de aproximativ 40 dB.

Există un dezavantaj inerent pentru ajustarea manuală a nivelurilor. Timpul de reacție al sunetistului este de aproximativ 2 secunde, chiar dacă știe dinainte scorul compoziției. Acest lucru duce la o eroare în menținerea nivelurilor maxime ale programelor muzicale de până la 4 dB în ambele direcții.

Amplificatoarele, sistemele de difuzoare și chiar urechile umane trebuie protejate de supraîncărcările cauzate de schimbările bruște bruște ale amplitudinii semnalului audio - semnalul trebuie să fie limitat în amplitudine.

Intervalul dinamic al semnalului trebuie să fie coordonat cu intervalele dinamice ale dispozitivelor de înregistrare, amplificare și transmisie.

Pentru a crește raza de acțiune a posturilor de radio FM, intervalul dinamic al semnalului audio trebuie să fie comprimat. Pentru a reduce nivelul de zgomot în timpul pauzelor, este recomandabil să măriți intervalul dinamic.

În cele din urmă, moda, care își dictează termenii în toate sferele activității umane, inclusiv înregistrarea sunetului, necesită un sunet bogat și dens al muzicii moderne, care se realizează prin restrângerea bruscă a intervalului său dinamic.

Unda sonoră (plic de volum) a unui fragment din opera lui S. Rahmaninov „Aleko”,

și muzică de dans contemporan.

În muzica clasică nuanțele sunt importante, muzica de dans trebuie să fie „puternică”.

Acest lucru dictează necesitatea utilizării dispozitivelor pentru procesarea automată a nivelurilor de semnal.