Cele mai comune concepții greșite despre audio digital. Mp3 Să o rezolvăm astfel încât modul de codare stereo oferă o calitate mai bună decât Joint Stereo

Dezmind miturile populare despre audio digital.

2017-10-01T15:27

2017-10-01T15:27

Software pentru audiofili

Notă: Pentru o mai bună înțelegere a textului de mai jos, vă recomand cu căldură să vă familiarizați cu elementele de bază ale audio digital.

De asemenea, multe dintre punctele prezentate mai jos sunt acoperite în publicația mea „Încă o dată despre tristul adevăr: de unde vine de fapt sunetul bun?” .

Cu cât rata de biți este mai mare, cu atât calitatea piesei este mai bună.

Acesta nu este întotdeauna cazul. În primul rând, permiteți-mi să vă reamintesc ce este bitray T(bitrate, nu bitraid). Aceasta este de fapt rata de date în kilobiți pe secundă în timpul redării. Adică, dacă luăm dimensiunea unei piese în kilobiți și o împărțim la durata ei în secunde, obținem rata de biți a acesteia - așa-numita. Rata de biți bazată pe fișiere (FBR), de obicei nu este prea diferită de rata de biți a fluxului audio (motivul diferențelor este prezența metadatelor în pistă - etichete, imagini încorporate etc.).

Acum să luăm un exemplu: rata de biți a sunetului PCM necomprimat înregistrat pe un CD audio obișnuit este calculată după cum urmează: 2 (canale) × 16 (biți pe eșantion) × 44100 (mostre pe secundă) = 1411200 (bps) = 1411,2 kbps . Acum să luăm și să comprimăm piesa cu orice codec fără pierderi („fără pierderi” - „fără pierderi”, adică unul care nu duce la pierderea niciunei informații), de exemplu, codecul FLAC. Drept urmare, vom obține o rată de biți mai mică decât cea inițială, dar calitatea va rămâne neschimbată - iată prima dvs. respingere.

Mai este un lucru care merită adăugat aici. Rata de biți de ieșire cu compresie fără pierderi poate fi foarte diferită (dar, de regulă, este mai mică decât cea a audio necomprimat) - aceasta depinde de complexitatea semnalului comprimat sau, mai precis, de redundanța datelor. Astfel, semnalele mai simple vor fi comprimate mai bine (adică avem o dimensiune mai mică a fișierului pentru aceeași durată => rata de biți mai mică), iar cele mai complexe se vor comprima mai rău. Acesta este motivul pentru care muzica clasică fără pierderi are o rată de biți mai mică decât, să zicem, rock-ul. Dar trebuie subliniat că bitrate-ul de aici nu este în niciun caz un indicator al calității materialului audio.

Acum să vorbim despre compresia cu pierderi. În primul rând, trebuie să înțelegeți că există multe codificatoare și formate diferite și, chiar și în același format, calitatea de codificare a diferitelor codificatoare poate diferi (de exemplu, QuickTime AAC codifică mult mai bine decât FAAC învechit), ca să nu mai vorbim superioritatea formatelor moderne (OGG Vorbis, AAC, Opus) față de MP3. Mai simplu spus, din două piese identice codificate de codificatori diferiți cu același bitrate, una va suna mai bine și alta va suna mai rău.

În plus, există așa ceva ca plic. Adică puteți lua o piesă în format MP3 cu un bitrate de 96 kbps și o puteți converti în MP3 320 kbps. Nu numai că calitatea nu se va îmbunătăți (la urma urmei, datele pierdute în timpul codificării anterioare de 96 kbit/s nu pot fi returnate), ci se va înrăutăți chiar. Merită să subliniem aici că în fiecare etapă a codării cu pierderi (cu orice bitrate și orice codificator), o anumită cantitate de distorsiune este introdusă în audio.

Și încă mai mult. Mai este o nuanță. Dacă, să zicem, rata de biți a unui flux audio este de 320 kbps, aceasta nu înseamnă că toți cei 320 kbps au fost cheltuiți pentru codificare chiar în acea secundă. Acest lucru este tipic pentru codificarea cu o rată de biți constantă și pentru acele cazuri în care o persoană, sperând să obțină o calitate maximă, forțează rata de biți constantă să fie prea mare (de exemplu, setarea CBR de 512 kbps pentru Nero AAC). După cum se știe, numărul de biți alocați unui anumit cadru este reglementat de un model psihoacustic. Dar în cazul în care suma alocată este mult mai mică decât rata de biți setată, nici măcar rezervorul de biți nu salvează (citiți despre termenii din articolul „Ce sunt CBR, ABR, VBR?”) - ca urmare, devenim inutili „zero biți” care pur și simplu „termină” » dimensiunea cadrului la dimensiunea dorită (adică, măriți dimensiunea fluxului la cea specificată). Apropo, acest lucru este ușor de verificat - comprimați fișierul rezultat cu un arhivator (de preferință 7z) și uitați-vă la raportul de compresie - cu cât este mai mare, cu atât mai mulți biți zero (deoarece duc la redundanță), cu atât mai mult spațiu irosit.

Codecurile cu pierderi (MP3 și altele) sunt capabile să facă față muzicii electronice moderne, dar nu sunt capabile de codificare de înaltă calitate a muzicii clasice (academice), live, instrumentale

„Ironia sorții” aici este că, de fapt, totul este exact invers. După cum se știe, muzica academică în marea majoritate a cazurilor urmează principii melodice și armonice, precum și compoziția instrumentală. Din punct de vedere matematic, aceasta rezultă într-o compoziție armonică relativ simplă a muzicii. Astfel, predominanța consonanțelor produce un număr mai mic de armonici secundare: de exemplu, pentru o cincime (un interval în care frecvențele fundamentale a două sunete diferă de o dată și jumătate), fiecare a doua armonică va fi comună celor două sunete. , pentru o patra, unde frecvențele diferă cu o treime - la fiecare treime și etc. În plus, prezența unor rapoarte de frecvență fixe, datorită utilizării temperamentului egal, simplifică și compoziția spectrală a muzicii clasice. Compoziția instrumentală live a clasicilor determină absența zgomotului caracteristic muzicii electronice, distorsiunea, salturile ascuțite de amplitudine, precum și absența unui exces de componente de înaltă frecvență.

Factorii enumerați mai sus duc la faptul că muzica clasică este mult mai ușor de comprimat, în primul rând, pur matematic. Dacă vă amintiți, compresia matematică funcționează eliminând redundanța (descriind informații similare folosind mai puțini biți) și, de asemenea, făcând predicții (alias. predictori preziceți comportamentul semnalului și apoi este codificată doar abaterea semnalului real față de cel prezis - cu cât se potrivesc mai precis, cu atât sunt necesari mai puțini biți pentru codare). În acest caz, compoziția și armonia spectrală relativ simplă conduc la o redundanță ridicată, a cărei eliminare asigură un grad semnificativ de compresie, iar un număr mic de rafale și componente de zgomot (care sunt semnale aleatorii și imprevizibile) determină o bună predictibilitate matematică a marea majoritate a informațiilor. Și nici măcar nu vorbesc despre volumul mediu relativ scăzut al pieselor clasice și intervalele frecvente de tăcere, pentru care practic nu este nevoie de informații pentru a codifica. Ca rezultat, putem comprima fără pierderi, de exemplu, unele muzică instrumentală solo la rate de biți sub 320 kbps (encoderele TAK și OFR sunt destul de capabile de acest lucru).

Deci, în primul rând, faptul este că compresia matematică care stă la baza codificării fără pierderi este, de asemenea, una dintre etapele codificării cu pierderi (a se citi Înțelegerea codificării MP3). Și în al doilea rând, deoarece lossy utilizează transformata Fourier (descompunerea semnalului în armonici), simplitatea compoziției spectrale chiar face munca codificatorului de două ori mai ușoară. Ca rezultat, comparând mostrele de muzică clasică originale și codificate într-un test orb, suntem surprinși să constatăm că nu putem găsi nicio diferență, chiar și la un bitrate relativ scăzut. Și lucrul amuzant este că atunci când începem să reducem complet rata de codare, primul lucru care dezvăluie diferențele este zgomotul de fundal din înregistrare.

În ceea ce privește muzica electronică, codificatorii au o perioadă foarte dificilă cu ea: componentele de zgomot au o redundanță minimă, iar împreună cu salturile ascuțite (un fel de impulsuri din dinți de ferăstrău) sunt semnale extrem de imprevizibile (pentru codificatorii care sunt „crozați” la sunete naturale care se comportă). cu totul altfel), transformarea Fourier directă și inversă cu respingerea armonicilor individuale de către modelul psihoacustic produce inevitabil efecte pre- și post-eco, a căror audibilitate nu este întotdeauna ușor de evaluat de către codificator... Adăugați la aceasta și nivel ridicat de componente HF - și obțineți un număr mare de killer -eșantioane, cărora nici cei mai avansati encodere nu le pot face față la rate medii-scăzute, destul de ciudat, mai ales în muzică electronică.

De asemenea, amuzante sunt părerile „ascultătorilor cu experiență” și muzicienilor care, cu o lipsă totală de înțelegere a principiilor codării cu pierderi, încep să susțină că aud cum instrumentele din muzică după codare încep să se dezacordeze, frecvențele plutesc. , etc. Acest lucru ar putea fi încă valabil pentru casetofoanele antediluviane cu detonație, dar în audio digital totul este exact: componenta de frecvență fie rămâne, fie este aruncată, pur și simplu nu este nevoie să se schimbe tonalitatea. Mai mult decât atât: prezența urechii unei persoane pentru muzică nu înseamnă deloc că are un auz bun de frecvență (de exemplu, capacitatea de a percepe frecvențe >16 kHz, care dispare odată cu vârsta) și nu-i face deloc mai ușor căutați artefacte de codare cu pierderi, deoarece distorsiunea Acestea au un caracter foarte specific și necesită experiența de comparare oarbă a sunetului cu pierderi - trebuie să știți ce și unde să căutați.

DVD-Audio sună mai bine decât CD-ul audio (24 de biți față de 16, 96 kHz față de 44,1 etc.)

Din păcate, oamenii se uită de obicei doar la cifre și foarte rar se gândesc la impactul unui anumit parametru asupra calității obiective.

Să luăm în considerare mai întâi adâncimea de biți. Acest parametru nu este responsabil pentru nimic mai mult decât intervalul dinamic, adică diferența dintre cele mai silentioase și cele mai puternice sunete (în dB). În audio digital, nivelul maxim este de 0 dBFS (FS - scară completă), iar minimul este limitat de nivelul de zgomot, adică, de fapt, intervalul dinamic în valoare absolută este egal cu nivelul de zgomot. Pentru audio pe 16 biți, intervalul dinamic este calculat ca 20 × log 10 2 16, care este egal cu 96,33 vB. În același timp, intervalul dinamic al unei orchestre simfonice este de până la 75 dB (în mare parte aproximativ 40-50 dB).

Acum să ne imaginăm condiții reale. Nivelul de zgomot din cameră este de aproximativ 40 dB (nu uitați că dB este o valoare relativă. În acest caz, pragul de audibilitate este luat ca 0 dB), volumul maxim al muzicii ajunge la 110 dB (pentru a evita disconfortul) - noi obține o diferență de 70 dB. Astfel, se dovedește că un interval dinamic de peste 70 dB în acest caz este pur și simplu inutil. Adică, la o gamă mai mare, fie sunetele puternice vor atinge pragul durerii, fie sunetele liniștite vor fi absorbite de zgomotul din jur. Este foarte dificil să se atingă un nivel de zgomot ambiental mai mic de 15 dB (deoarece volumul respirației umane și al altor zgomote cauzate de fiziologia umană sunt la acest nivel), ca urmare, se dovedește un interval de 95 dB pentru ascultarea muzicii. să fie complet suficient.

Acum despre frecvența de eșantionare (frecvența de eșantionare, rata de eșantionare). Acest parametru controlează frecvența de eșantionare în timp și afectează direct frecvența maximă a semnalului care poate fi descrisă de o anumită reprezentare audio. Conform teoremei lui Kotelnikov, este egal cu jumătate din frecvența de eșantionare. Adică, pentru frecvența obișnuită de eșantionare de 44100 Hz, frecvența maximă a componentelor semnalului este de 22050 Hz. Frecvența maximă. care este perceput de urechea umană este puțin peste 20.000 Hz (și apoi la naștere; pe măsură ce îmbătrânim, pragul scade la 16.000 Hz).

Acest subiect este tratat cel mai bine în articolul Descărcări în format 24/192 - de ce nu au sens.

Diferiți jucători software sună diferit (de exemplu, foobar2000 este mai bun decât Winamp etc.)

Pentru a înțelege de ce nu este cazul, trebuie să înțelegeți ce este un player software. În esență, acesta este un decodor, handlere (opțional), un plugin de ieșire (la una dintre interfețele: ASIO, DirectSound, WASAPI etc.) și, desigur, GUI (interfață grafică de utilizator). Deoarece decodorul în 99,9% din cazuri funcționează conform unui algoritm standard, iar pluginul de ieșire este doar o parte a programului care transmite fluxul către placa de sunet printr-una dintre interfețe, singurul motiv al diferențelor pot fi manipulatorii. Dar adevărul este că procesoarele sunt de obicei oprite în mod implicit (sau ar trebui să fie dezactivate, deoarece principalul lucru pentru un jucător bun este să poată transmite sunetul în forma sa „pură”). Ca urmare, singurul subiect de comparație aici poate fi posibilităților procesare și ieșire, care, apropo, de multe ori nu sunt deloc necesare. Dar chiar dacă există o astfel de nevoie, atunci aceasta este o comparație a procesoarelor, și nu a jucătorilor.

Diferite versiuni de drivere sună diferit

Această afirmație se bazează pe ignorarea banală a principiilor de funcționare a unei plăci de sunet. Un driver este un software necesar pentru interacțiunea eficientă a unui dispozitiv cu sistemul de operare, oferind, de obicei, o interfață grafică de utilizator pentru abilitatea de a gestiona dispozitivul, parametrii acestuia etc. Un driver de placă de sunet asigură că placa de sunet este recunoscută ca Windows dispozitiv de sunet, informează sistemul de operare cu privire la formatele care acceptă cardul, oferă transmiterea unui flux PCM necomprimat (în cele mai multe cazuri) către card și, de asemenea, oferă acces la setări. În plus, dacă există procesare software (folosind instrumente CPU), driverul poate conține diferite DSP-uri (procesoare). Prin urmare, în primul rând, cu efectele și procesarea dezactivate, dacă driverul nu oferă transmisie PCM precisă pe card, aceasta este considerată o eroare gravă, o eroare critică. Și asta se întâmplă rareori. Pe de altă parte, diferențele dintre drivere pot fi în actualizarea algoritmilor de procesare (resampler, efecte), deși acest lucru nu se întâmplă des. În plus, pentru a obține cea mai înaltă calitate, efectele și orice procesare a driverului ar trebui în continuare excluse.

Astfel, actualizările driverelor sunt axate în principal pe îmbunătățirea stabilității și eliminarea erorilor de procesare. Nici unul, nici celălalt în cazul nostru nu afectează calitatea redării, prin urmare în 999 de cazuri din 1000 driverul nu are niciun efect asupra sunetului.

CD-urile audio cu licență sună mai bine decât copiile lor

Dacă nu au apărut erori (fatale) de citire/scriere în timpul copierii și unitatea optică a dispozitivului pe care va fi redat discul de copiere nu are probleme la citirea acestuia, atunci această afirmație este eronată și ușor de respins.

Modul de codare stereo oferă o calitate mai bună decât Joint Stereo

Această concepție greșită se referă în principal la LAME MP3, deoarece toate codificatoarele moderne (AAC, Vorbis, Musepack) folosesc numai Modul Stereo comun (și asta spune deja ceva)

Pentru început, merită menționat că modul Joint Stereo este utilizat cu succes cu compresie fără pierderi. Esența sa constă în faptul că, înainte de codificare, semnalul este descompus în suma canalelor dreapta și stânga (Mid) și diferența lor (Side), iar apoi are loc codificarea separată a acestor semnale. În limită (pentru aceleași informații în canalele dreapta și stânga), se obțin economii duble de date. Și deoarece în majoritatea muzicii informațiile din canalele din dreapta și din stânga sunt destul de asemănătoare, această metodă se dovedește a fi foarte eficientă și vă permite să creșteți semnificativ raportul de compresie.

În lossy principiul este același. Dar aici, în modul de bitrate constant, calitatea fragmentelor cu informații similare pe două canale va crește (în limită, dublu), iar pentru modul VBR în astfel de locuri, rata de biți va scădea pur și simplu (nu uitați că sarcina principală al modului VBR este menținerea stabilă a calității de codificare specificată, folosind cel mai mic bitrate posibil). Deoarece în timpul codificării cu pierderi, prioritatea (la distribuirea biților) este acordată sumei canalelor, pentru a evita deteriorarea panoramei stereo, comutarea dinamică între stereo mixt (Mid/Side) și stereo obișnuit (Stânga/Dreapta) bazat pe cadru. se utilizează moduri. Apropo, motivul acestei concepții greșite a fost imperfecțiunea algoritmului de comutare în versiunile mai vechi ale LAME, precum și prezența modului de îmbinare forțată, în care nu există comutare automată. În cele mai recente versiuni ale LAME, modul Joint este activat în mod implicit și nu este recomandat să îl schimbați.

Cu cât spectrul este mai larg, cu atât calitatea înregistrării este mai bună (despre spectrograme, auCDtect și interval de frecvență)

În zilele noastre, pe forumuri, din păcate, este foarte comun să se măsoare calitatea unei piese „cu o riglă folosind o spectrogramă”. Evident, datorită simplității acestei metode. Dar, după cum arată practica, în realitate totul este mult mai complicat.

Și iată chestia. Spectrograma demonstrează vizual distribuția puterii semnalului pe frecvențe, dar nu poate oferi o imagine completă a sunetului înregistrării, prezența distorsiunilor și artefactelor de compresie în ea. Adică, în esență, tot ceea ce poate fi determinat din spectrogramă este domeniul de frecvență (și parțial densitatea spectrului în regiunea HF). Adică, în cel mai bun caz, prin analiza spectrogramei, se poate identifica o conversie ascendentă. Compararea spectrogramelor de piste obținute prin codificare cu diferite codificatoare cu originalul este o absurditate totală. Da, puteți identifica diferențele în spectru, dar a determina dacă (și în ce măsură) vor fi percepute de urechea umană este aproape imposibil. Nu trebuie să uităm că sarcina codării cu pierderi este de a asigura un rezultat care nu se poate distinge urechea umană din original (nu cu ochiul).

Același lucru este valabil și pentru evaluarea calității codificării prin analiza pieselor de ieșire cu programul auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect - acestea sunt doar shell-uri pentru programul de consolă unic în felul auCDtect). Algoritmul auCDtect analizează de fapt gama de frecvență și vă permite doar să determinați (cu un anumit grad de probabilitate) dacă compresia MPEG a fost aplicată în oricare dintre etapele de codificare. Algoritmul este adaptat pentru MP3, deci este ușor să îl „înșeli” cu ajutorul codecurilor Vorbis, AAC și Musepack, deci chiar dacă programul scrie „100% CDDA”, asta nu înseamnă că audio codificat este 100% identic cu cel original.

Și revenind direct la spectre. Există, de asemenea, o dorință populară printre unii „entuziaști” de a dezactiva cu orice preț filtrul lowpass din encoderul LAME. Aici există o lipsă clară de înțelegere a principiilor de codificare și psihoacustică. În primul rând, codificatorul taie frecvențele înalte doar pentru un singur scop - pentru a salva date și a le folosi pentru a codifica cea mai audibilă gamă de frecvențe. Gama extinsă de frecvență poate avea un impact fatal asupra calității generale a sunetului și poate duce la artefacte de codare audibile. Mai mult decât atât, dezactivarea tăierii la 20 kHz este în general complet nejustificată, deoarece o persoană pur și simplu nu poate auzi frecvențe mai mari.

Există o anumită presetare a egalizatorului „magic” care poate îmbunătăți semnificativ sunetul

Acest lucru nu este în întregime adevărat, în primul rând, deoarece fiecare configurație individuală (căști, acustică, placă de sunet) are propriii parametri (în special, propriul răspuns amplitudine-frecvență). Și, prin urmare, fiecare configurație trebuie să aibă propria abordare unică. Mai simplu spus, o astfel de presetare a egalizatorului există, dar diferă pentru diferite configurații. Esența sa constă în ajustarea răspunsului în frecvență al căii, și anume în „nivelarea” scăderilor și creșterilor nedorite.

De asemenea, printre oamenii care sunt departe de a lucra direct cu sunetul, setarea unui egalizator grafic cu un „tic” este foarte populară, ceea ce reprezintă de fapt o creștere a nivelului componentelor de joasă și înaltă frecvență, dar în același timp conduce la dezactivarea vocii și a instrumentelor, al căror spectru sonor se află în regiunea de frecvență medie.

Înainte de a converti muzica într-un alt format, ar trebui să o decomprimați în WAV

Permiteți-mi să notez imediat că WAV înseamnă date PCM (modularea codului de impulsuri) în containerul WAVE (fișier cu extensia *.wav). Aceste date nu sunt altceva decât o secvență de biți (zerouri și unu) în grupuri de 16, 24 sau 32 (în funcție de adâncimea de biți), fiecare dintre care reprezintă codul binar al amplitudinii eșantionului corespunzător (de exemplu, pentru 16 biți în notație zecimală acestea sunt valori de la -32768 la +32768).

Deci, adevărul este că orice procesor de sunet - fie el un filtru sau un encoder - funcționează de obicei numai cu aceste valori, adică numai cu date necomprimate. Aceasta înseamnă că pentru a converti audio de la, de exemplu, FLAC în APE, pur și simplu necesar Mai întâi decodați FLAC în PCM, apoi codificați PCM în APE. Este ca și cum ați reambala fișierele din ZIP în RAR, mai întâi trebuie să despachetați fișierul ZIP.

Cu toate acestea, dacă utilizați un convertor sau doar un codificator de consolă avansat, conversia intermediară în PCM are loc din mers, uneori fără a scrie măcar într-un fișier WAV temporar. Acesta este ceea ce induce oamenii în eroare: se pare că formatele sunt convertite direct dintr-unul în altul, dar de fapt un astfel de program trebuie să aibă un decodor de format de intrare care să realizeze o conversie intermediară în PCM.

Astfel, convertirea manuală în WAV nu vă va oferi absolut nimic altceva decât pierdere de timp.

Care este una dintre cele mai comune și adânc înrădăcinate concepții greșite în lumea iubitorilor de muzică?

Salvați și citiți mai târziu -

Notă traducere: Aceasta este traducerea celei de-a doua (dintre patru) părți a unui articol amplu al lui Christopher „Monty” Montgomery (creatorul Ogg Free Software și Vorbis) despre ceea ce el crede că este una dintre cele mai comune și adânc înrădăcinate concepții greșite din lumea iubitori de muzică.

Frecvența 192 kHz este considerată dăunătoare

Fișierele de muzică digitală la 192 kHz nu oferă niciun beneficiu, dar au totuși un anumit impact. În practică, se dovedește că calitatea lor de redare este puțin mai proastă, iar undele ultrasonice apar în timpul redării.

Atât convertoarele audio, cât și amplificatoarele de putere sunt susceptibile la distorsiuni, iar distorsiunea tinde să crească rapid la frecvențe înalte și joase. Dacă același difuzor reproduce ultrasunetele împreună cu frecvențele din domeniul audibil, atunci orice răspuns neliniar va muta o parte din domeniul ultrasonic în spectrul audibil sub formă de distorsiuni neliniare dezordonate, necontrolate, care acoperă întregul interval audio audibil. Neliniaritatea într-un amplificator de putere va avea același efect. Aceste efecte sunt greu de observat, dar testele au confirmat că ambele tipuri de distorsiuni pot fi auzite.

Graficul de mai sus arată distorsiunea rezultată din intermodularea audio de 30 kHz și 33 kHz într-un amplificator teoretic cu o distorsiune armonică totală constantă (THD) de aproximativ 0,09%. Distorsiunea este vizibilă pe întregul spectru, chiar și la frecvențe mai mici.

Undele ultrasonice inaudibile contribuie la distorsiunea intermodulației în domeniul audibil (zonă albastru deschis). Sistemele care nu sunt concepute pentru a reproduce ultrasunetele au de obicei niveluri de distorsiune mai ridicate, în jur de 20 kHz, contribuind în continuare la intermodulație. Extinderea intervalului de frecvență pentru a include ultrasunetele necesită compromisuri care vor reduce zgomotul și activitatea de distorsiune în spectrul sonor, dar, în orice caz, reproducerea inutilă a componentei ultrasonice va degrada calitatea reproducerii.

Există mai multe moduri de a evita distorsiunile suplimentare:

  1. Un difuzor conceput pentru a reproduce doar ultrasunetele, un amplificator și un divizor de spectru de semnal pentru a separa și a reproduce independent ultrasunetele pe care nu le puteți auzi, astfel încât să nu afecteze alte sunete.
  2. Amplificatoare și traductoare concepute pentru a reproduce o gamă mai largă de frecvențe, astfel încât ultrasunetele să nu provoace distorsiuni armonice audibile. Datorită costului suplimentar și complexității implementării, intervalul de frecvență suplimentar va reduce calitatea reproducerii în partea audibilă a spectrului.
  3. Difuzoare și amplificatoare bine proiectate, care nu reproduc deloc ultrasunetele.
  4. Pentru început, puteți evita codificarea unei game atât de largă de frecvențe. Nu puteți (și nu ar trebui) să auziți armonici ultrasonice în banda de frecvență audibilă decât dacă există o componentă ultrasonică în ea.

Toate aceste metode au ca scop rezolvarea unei probleme, dar numai metoda 4 are sens.

Dacă sunteți interesat de ceea ce poate face propriul dvs. sistem, următoarele mostre conțin: sunet de 30 kHz și 33 kHz în format WAV 24/96, o versiune mai lungă în format FLAC, câteva melodii și o tăietură de melodii obișnuite la 24 de ore. kHz, astfel încât acestea să se încadreze în întregime în domeniul ultrasonic de la 24 kHz la 46 kHz.

Teste pentru măsurarea distorsiunii neliniare:

  • 30 kHz audio + 33 kHz audio (24 biți / 96 kHz)
  • Tonuri de apel 26 kHz – 48 kHz (24 biți / 96 kHz)
  • Tonuri de apel 26 kHz – 96 kHz (24 biți / 192 kHz)
  • O tăietură de melodii redusă la 24 kHz (24 biți / 96 kHz WAV) (versiunea originală tăiată) (16 biți / 44,1 kHz WAV)

Să presupunem că sistemul dumneavoastră este capabil să redea toate formatele la rate de eșantionare de 96 kHz. Când redați fișierele de mai sus, nu ar trebui să auziți nimic, niciun zgomot, niciun șuierat, niciun clic sau orice alte sunete. Dacă auziți ceva, atunci sistemul dumneavoastră are un răspuns neliniar și provoacă o distorsiune sonoră neliniară a ultrasunetelor. Aveți grijă când creșteți volumul; dacă atingeți decuparea digitală sau analogică, chiar și una moale, poate provoca zgomot puternic de intermodulație.

În general, nu este un fapt că distorsiunile neliniare ale ultrasunetelor vor fi audibile pe un anumit sistem. Distorsiunea introdusă poate fi fie minoră, fie destul de vizibilă. În orice caz, componenta ultrasonică nu este niciodată un lucru bun, iar în multe sisteme audio va duce la o reducere severă a calității reproducerii sunetului. În sistemele care nu sunt afectate de acesta, capacitatea de a procesa ultrasunetele poate fi păstrată, sau resursa poate fi folosită în schimb pentru a îmbunătăți calitatea sunetului din domeniul audibil.

Înțelegerea greșită a procesului de eșantionare

Teoria eșantionării este adesea de neînțeles fără contextul procesării semnalului. Și nu este de mirare că majoritatea oamenilor, chiar și doctorii străluciți în științe din alte domenii, de obicei nu o înțeleg. De asemenea, nu este de mirare că mulți oameni nici măcar nu își dau seama că au înțeles greșit.

Semnalele eșantionate sunt adesea descrise ca o scară zimțată, ca cea de mai sus (în roșu), care arată ca o aproximare aproximativă a semnalului original. Cu toate acestea, această reprezentare este precisă din punct de vedere matematic și, atunci când este convertită într-un semnal analogic, graficul său devine neted (linia albastră în figură).

Cea mai comună concepție greșită este că eșantionarea este un proces dur și duce la pierderea de informații. Un semnal discret este adesea descris ca o copie zimțată, unghiulară, ca un pas a undei originale perfect netede. Dacă credeți că da, atunci puteți presupune că cu cât este mai mare rata de eșantionare (și cu cât mai mulți biți per probă), cu atât pașii vor fi mai mici și cu atât aproximarea va fi mai precisă. Un semnal digital se va asemăna din ce în ce mai mult cu un semnal analog până când își va lua forma, pe măsură ce rata de eșantionare tinde spre infinit.

Prin analogie, mulți oameni care nu sunt implicați în procesarea semnalului digital se vor uita la imaginea de mai jos și vor spune: „Uf!” Poate părea că un semnal eșantionat nu reprezintă bine frecvențele înalte ale unei unde analogice sau, cu alte cuvinte, pe măsură ce frecvența audio crește, calitatea eșantionării scade și răspunsul în frecvență se deteriorează sau devine sensibil la faza semnalului de intrare.

Pur și simplu arată așa. Aceste convingeri sunt greșite!

Comentariu din 04/04/2013: Ca răspuns la toate e-mailurile cu privire la semnalele digitale și pașii pe care le-am primit, voi arăta comportamentul real al unui semnal digital pe echipamente reale în videoclipul nostru Digital Show & Tell, astfel încât să nu trebuie să mă cred pe cuvânt.

Toate semnalele sub frecvența Nyquist (jumătate din rata de eșantionare) vor fi captate perfect și complet în timpul eșantionării și nu este necesară o rată de eșantionare infinit de mare pentru aceasta. Eșantionarea nu afectează răspunsul în frecvență sau faza. Semnalul analogic poate fi restabilit fără pierderi - la fel de lin și sincron ca originalul.

Nu te poți certa cu matematica, dar care este dificultatea? Cea mai cunoscută este cerința de limită a benzii. Semnalele cu frecvențe peste frecvența Nyquist trebuie filtrate înainte de eșantionare pentru a evita distorsiunile datorate aliasing-ului. Acest filtru este infamul filtru anti-aliasing. Suprimarea zgomotului de eșantionare, în practică, nu poate fi perfectă, dar tehnologiile moderne fac posibilă apropierea de rezultatul ideal. Și ajungem la supraeșantionare.

Supraeșantionarea

Ratele de eșantionare de peste 48 kHz nu sunt asociate cu reproducerea audio de înaltă fidelitate, dar sunt necesare pentru unele tehnologii moderne. Supraeșantionarea (supraesantionarea) este cea mai semnificativă dintre ele.

Ideea din spatele reeșantionării este simplă și elegantă. Poate vă amintiți din videoclipul meu „Digital Multimedia. A Guide to Beginner Geeks” că ratele mari de eșantionare oferă un decalaj mult mai mare între frecvența cea mai înaltă la care ne interesează (20 kHz) și frecvența Nyquist (jumătate din rata de eșantionare). Acest lucru vă permite să utilizați filtre anti-aliasing mai simple și mai fiabile și să creșteți fidelitatea. Acest spațiu suplimentar între 20 kHz și frecvența Nyquist este în esență doar un tampon pentru filtrul analogic.

Figura de mai sus prezintă diagrame din videoclipul „Digital Multimedia. A Guide for Beginner Geeks”, ilustrând lățimea de bandă de tranziție pentru un DAC sau ADC la 48 kHz (stânga) și 96 kHz (dreapta).

Aceasta este doar jumătate din luptă, deoarece filtrele digitale au mai puține limitări practice decât filtrele analogice și putem finaliza anti-aliasing-ul cu o mai mare acuratețe și eficiență. Semnalul uscat de înaltă frecvență trece printr-un filtru digital de anti-aliasing, care nu are nicio problemă în ajustarea benzii de tranziție a filtrului în spații înguste. Odată ce netezirea este completă, secțiunile suplimentare discrete din spațiul de amortizare sunt pur și simplu pliate înapoi. Redarea semnalului reeșantionat continuă în ordine inversă.

Aceasta înseamnă că semnalele cu o rată de eșantionare scăzută (44,1 kHz sau 48 kHz) pot avea aceeași fidelitate, netezime și aliasing scăzut ca și semnalele cu o frecvență de eșantionare de 192 kHz sau mai mare, dar niciunul dintre ele nu va apărea. dezavantaje (unde ultrasonice provocând distorsiuni de intermodulație, mărirea dimensiunii fișierului). Aproape toate DAC-urile și ADC-urile moderne eșantionează în exces la viteze foarte mari și puțini oameni știu despre asta, deoarece se întâmplă automat în interiorul dispozitivului.

DAC-urile și ADC-urile nu au fost întotdeauna capabile să reeșantioneze. În urmă cu treizeci de ani, unele console de înregistrare foloseau rate de eșantionare ridicate pentru înregistrarea audio folosind numai filtre analogice. Acest semnal de înaltă frecvență a fost apoi folosit pentru a crea discuri master. Netezirea digitală și decimarea (reeșantionarea la o frecvență mai mică pentru CD și DAT) au avut loc în etapa finală a creării înregistrărilor. Acesta poate să fi fost unul dintre primele motive pentru care ratele de eșantionare de 96 kHz și 192 kHz au devenit asociate cu producția de înregistrări profesionale.

16 biți vs 24 de biți

Bine, acum știm că salvarea muzicii la 192 kHz nu are sens. Subiect închis. Dar ce zici de audio pe 16 și 24 de biți? Ce e mai bine?

Audio PCM pe 16 biți nu acoperă în totalitate intervalul audio dinamic teoretic pe care oamenii îl pot auzi în condiții ideale. Există, de asemenea, (și vor exista întotdeauna) motive pentru a utiliza mai mult de 16 biți pentru înregistrarea audio.

Niciunul dintre aceste motive nu are vreo legătură cu redarea audio - în această situație, sunetul pe 24 de biți este la fel de inutil ca eșantionarea la 192 kHz. Vestea bună este că utilizarea cuantizării pe 24 de biți nu dăunează calității sunetului, pur și simplu nu o înrăutățește și nici nu ocupă spațiu suplimentar.

Note pentru partea 2

6. Multe dintre sistemele care nu pot reda mostre de 96 kHz nu vor refuza să le redea, ci le vor reduce eșantionarea în tăcere la 48 kHz. În acest caz, sunetul nu va fi reprodus deloc și nu va fi nimic pe înregistrare, indiferent de gradul de neliniaritate al sistemului.

7. Supraeșantionarea nu este singura modalitate de a face față ratelor de eșantionare ridicate în procesarea semnalului. Există mai multe modalități teoretice de a obține sunet cu bandă limitată la o rată de eșantionare mare și de a evita decimarea, chiar dacă ulterior este subeșantionat pentru înregistrarea pe discuri. Nu este clar dacă astfel de metode sunt utilizate în practică, deoarece dezvoltarea majorității instalațiilor profesionale este ținută secretă.

8. Indiferent dacă din punct de vedere istoric sau nu, mulți profesioniști din ziua de azi folosesc rezoluții înalte, deoarece cred în mod eronat că sunetul cu conținut păstrat peste 20 kHz sună mai bine. La fel ca și consumatorii.

Acest articol a fost citit de 33.932 de ori.

Formatul de fișier MP3 este un așa-numit „format deschis” acceptat de majoritatea producătorilor.

Formatul MP3 este unul dintre cele mai comune formate de codare audio digitală. O caracteristică a codării audio MP3 este codarea cu pierderi. Cu toate acestea, codificarea se bazează pe un model special care ține cont de caracteristicile percepției auditive. Prin urmare, prezența pierderilor nu duce la degradarea sunetului catastrofal.

Fișierele MP3 au devenit standardul de facto și sunt acceptate de cele mai populare sisteme de operare, multe playere CD și DVD și alte dispozitive.

Interesant este că standardul descrie formatul de stocare în sine, și nu metoda de codificare audio. Datorită acestui fapt, există un număr mare de instrumente disponibile pentru redarea audio în format MP3.

Codecuri speciale sunt folosite pentru a codifica audio în format MP3.
Un codec audio poate fi unul din două tipuri - codec hardware și codec software.

Codificarea hardware se realizează folosind cipuri speciale.
Codarea software-ului se realizează folosind programe speciale de calculator.

Calitatea sunetului în format MP3 (toate celelalte lucruri fiind egale) depinde de gradul de compresie (citește cantitatea de pierderi) și de programul de codare. De aceea, playerele de marcă care folosesc codecuri și sisteme de procesare a semnalului audio de la mărci cunoscute depășesc semnificativ calitatea redării dispozitivelor convenționale asamblate din componente standard.

Calitatea redării în sine depinde de cantitatea de flux de date de la media. Uneori, dimensiunea fluxului de date se numește lățimea fluxului. Există un termen special - bitrate. Debitul de date este determinat în kilobiți pe secundă și este notat cu kbs, kbps, kb/s. O înregistrare poate fi codificată în mai multe moduri - cu o rată de biți constantă și cu o rată de biți variabilă. Rata de biți variabilă ajută la păstrarea detaliilor prin creșterea cantității de date.

Pentru redare muzicală de înaltă calitate Nu toate debitele de date sunt adecvate, vezi Tabelul 1

Rate de biți MP3 și aplicații

tabelul 1

Datele prezentate în tabelul 1 pot servi doar ca ghid. Cert este că la momentul apariției formatului MP3, calitatea echipamentelor audio la cerere în masă nu era foarte mare. Multe publicații autorizate au susținut serios că un flux de date de 128 kb/s este suficient pentru o reproducere a sunetului de înaltă calitate.

În prezent, o rată de biți de cel puțin 192 kb/s este considerată de înaltă calitate. În plus, adoptarea pe scară largă a sistemelor hi-fi, high-end și home theater a condus la o schimbare masivă către reproducerea audio de înaltă calitate.

Prin urmare, defectele de reproducere a sunetului, neobservate pe echipamentele bugetare din trecut, devin vizibile pentru un „ascultător nepregătit” folosind echipamente moderne de înaltă calitate. Apropo, nivelul acestui „ascultător nepregătit” a crescut semnificativ.

În general, ideea de compresie (și în special de compresie cu pierderi) devine treptat învechită. Apărând în epocă medii de stocare scumpeȘi canale de transmisie a datelor cu capacitate redusă, ideea comprimării datelor a făcut o treabă excelentă în sarcina sa principală. Cu toate acestea, iubitorii de audio trec treptat la rate de biți mai mari (compresie cu pierderi mai mici) sau chiar la formate de compresie „fără pierderi” sau chiar necomprimate.

Practicitatea formatelor comprimate, și în special a formatului MP3, a dus la lansarea unor playere MP3 compacte, construite pe cipuri de memorie sau pe hard disk-uri în miniatură.

Atunci când alegeți unul sau altul model al unui astfel de jucător, apare o întrebare legată de capacitatea sa de memorie. Desigur, utilizatorul dorește să estimeze în avans cantitatea de material muzical pe care o poate stoca pe playerul său MP3 la un moment dat.

Datele aproximative despre dimensiunea fișierelor și durata sunetului sunt colectate în Tabelul 2. Când utilizați Tabelul 2, trebuie luat în considerare faptul că acestea sunt date aproximative care vă permit să estimați capacitatea de memorie necesară a playerelor sau a suporturilor amovibile.

Durata fișierelor MP3 și nivelul de compresie

masa 2

Rata de biți,
kb/s

înregistrare de 1 minut,
K.B.

Standard
compoziție de 3 minute,
M.B.

Standard
compoziție de 4 minute,
M.B.

Standard
compoziție de 5 minute,
M.B.

Notă la tabelul 2
Un grad ridicat de compresie corespunde la 56 kb/s, un grad scăzut de compresie și o calitate ridicată a sunetului corespunde la 320 kb/s

Tabelul 3 oferă date orientative despre durata totală a înregistrărilor muzicale - timpul de joc al unui jucător cu o anumită cantitate de memorie.

Timpul total de redare al unui player MP3, în funcție de dimensiunea memoriei

Tabelul 3

Durata jocului

Capacitate de memorie,
G.B.

Rata de biți, kb/s

minute
Ore

minute
Ore

minute
Ore

minute
Ore

minute
Ore

minute
Ore

Din câte se poate aprecia din Tabelul 3, 8 GB sunt suficienți pentru a stoca înregistrări în format MP3 de cea mai bună calitate într-o cantitate potrivită pentru ascultare timp de 8 ore în fiecare zi timp de o săptămână (7 zile). Fara repetari! Cu adevărat nimeni nu are o asemenea nevoie.

Chiar dacă acesta este cazul, puteți actualiza înregistrările de pe player nu mai mult de o dată pe săptămână.

site-ul 2013. Toate drepturile rezervate.

Ne vedem pe Web!

Cum să activați Wi-Fi pe un laptop Asus
Vista - cum să eliberați spațiu pe disc
Conectarea unui modem 3G MTS
Volumul și calitatea fișierelor MP3
Metodologia și practica alegerii unui MP3 player, partea 1
Metodologia și practica alegerii unui MP3 player, partea a 2-a
Vista - cum se deschide promptul de comandă într-un folder
Cum să imprimați numele fișierelor dintr-un folder
Cum să salvați numele fișierelor ca text
Cum să copiați numele fișierelor în MS Excel
Lanterna LED USB
Dispozitivul și designul căștilor
Cum să alegi căștile?
Cum rămân căștile în poziție?
Alimentarea gadgeturilor - baterii
Dimensiunile cartelei SIM
Alimentarea gadgeturilor - mufe și prize
Alimentare pentru gadget-uri - adaptoare

Rata de biți este indicată ca una dintre principalele caracteristici ale înregistrărilor video și audio. Majoritatea utilizatorilor sunt obișnuiți să creadă că aceasta determină calitatea fișierului descărcat. Dar ce sunt ratele de biți și cum caracterizează de fapt fișierele muzicale și videoclipurile? Să ne uităm la asta mai detaliat.

Ce sunt ratele de biți?

Bitrate este o valoare care afișează numărul de unități de informații (megabiți sau kilobiți) conținute într-o secundă de redare a fișierului. În consecință, se măsoară în megabiți pe secundă (Mbps) sau kilobiți pe secundă (Kbps). În caz contrar, rata de biți poate fi descrisă ca lățime de bandă. Această caracteristică este importantă pentru cei care doresc să convertească fișiere deoarece, având aceeași durată, o rată de biți mai mare va avea ca rezultat un fișier mai mare. Pe lângă dimensiune, se modifică și calitatea sunetului. Reducerea dimensiunii pe măsură ce rata de biți scade se numește compresie.

Un fișier muzical obișnuit este un fișier audio comprimat în așa măsură încât până la 12 ore de muzică pot încăpea pe un disc standard. În același timp, calitatea rămâne destul de ridicată datorită compresiei psihoacustice: sunetele cu acele frecvențe și niveluri de volum care nu sunt captate de urechea umană sunt eliminate din întreaga gamă. Sunetele selectate sunt formate în blocuri separate numite cadre. Cadrele au aceeași durată a sunetului și sunt comprimate conform unui algoritm dat. Când se redă muzică, semnalul este recreat din blocurile decodate într-o anumită secvență.

Ce compresie este folosită în mod obișnuit?

Rata de biți audio este cel mai adesea de 256 Kbps. La această valoare, înregistrarea audio este comprimată de aproximativ 6 ori, permițându-vă să înregistrați de 6 ori mai multă muzică pe un disc decât înainte de comprimare. Dacă rata de biți este redusă la 128 Kbps, atunci un disc va potrivi de 12 ori mai multă muzică, dar calitatea sunetului va fi vizibil mai scăzută. Muzica înregistrată la o calitate de 128 Kbps este oferită cel mai adesea pentru ascultare pe Internet, deoarece în căutarea creșterii vitezei de încărcare a paginii, proprietarii de resurse fac orice sacrificii. Mulți utilizatori notează că calitatea sa este departe de a fi ideală.

Acum că este clar ce sunt ratele de biți, este timpul să le stabilim nivelul optim. Atât amatorii, cât și profesioniștii dezbat la nesfârșit modul în care bitrate afectează calitatea sunetului, dacă este deloc. Albumele muzicale indică de obicei rata de biți. Același disc, înregistrat la 128 Kbit/s și 256 Kbit/s, va fi de două ori mai scump.

Rată de biți optimă în diferite condiții de ascultare

Pentru mulți oameni, compresia de 12x nu dăunează, în timp ce alții susțin că nu pot asculta muzică cu un bitrate mai mic de 320 Kbps. Paradoxal, ambele au dreptate. Faptul este că în cele din urmă calitatea redării depinde nu de, ci de condițiile de redare și chiar de tipul muzicii.

De exemplu, o melodie este redată pe un magnetofon instalat într-o mașină domestică. În acest caz, calitatea la 192 Kbps va fi destul de suficientă. Un bitrate mai mare va îmbunătăți calitatea sunetului, dar diferența nu va fi vizibilă din cauza nivelului ridicat de zgomot în timpul călătoriei. Dacă muzica este redată pe un computer de acasă sau pe un player portabil, atunci este necesar cel puțin 256 Kbps. Dacă semnalul nu este supus modificărilor, este transmis către dispozitive externe și scos la difuzoare scumpe importate, atunci ar trebui, dacă este posibil, să recurgeți la compresie minimă. Este posibil la un bitrate de 320 Kbps.

Rată de biți optimă pentru diferite stiluri de muzică

Muzica cu rata de biți mare nu este întotdeauna necesară. Muzica populară sună de obicei destul de bine la o rată de biți de 192-256 Kbps. Este posibil să setați o calitate mai mare, dar nu are rost să faceți acest lucru: melodiile pop nu durează mult, așa că economisirea spațiului pe disc ar trebui să fie o prioritate. În plus, calitatea înregistrărilor sursă este, de asemenea, mediocră, astfel încât creșterea ratei de biți poate să nu afecteze calitatea fișierului redat. Pentru ascultarea în transport și la petreceri informale, calitatea medie este suficientă.

Dacă vorbim de muzică clasică, lucrări ale trupelor rock legendare sau melodii originale rare, atunci calitatea ar trebui să fie mai presus de toate. Când cumpărați o astfel de muzică, trebuie să vă uitați la rata de biți indicată pe ambalajul discului. Dacă melodia este descărcată de pe Internet, atunci astfel de informații ar trebui să fie prezente pe pagina de descărcare. În plus, rata de biți este afișată în player în timpul redării.

Ratele de biți ale fișierelor video

Am discutat mai sus ce sunt ratele de biți ale înregistrărilor audio. Dar ce este rata de biți video? Având în vedere că videoclipul este redat ca o secvență de sunete și imagini, definiția ratei de biți va fi similară. Prezența video face fișierul mai greu, dar în cele din urmă imaginile pentru procesor sunt aceleași zerouri și aceleași ca sunetele. Principiul criptării informațiilor este același pentru toate tipurile de fișiere.

Bitrate este de obicei folosit pentru a măsura viteza efectivă de transmisie a unui flux de date pe un canal, adică dimensiunea minimă a unui canal care poate trece acest flux fără întârzieri.

Rata de biți este exprimată în biți pe secundă (bit/s, bps), precum și cantități derivate cu prefixele kilo- (kbit/s, kbps), mega- (Mbit/s, Mbps) etc.

Rata datelor folosind bloc de biți pe secundă (simbol: „bit/s”), adesea folosit în combinație cu prefixele Sistemului Internațional de Măsurare (SI) precum „kilo” (1 kbit/s = 1024 biți/s), „mega” (1 Mbit/s = 1024 kbit/s), „giga” (1 Gbit/s = 1024 Mbit/s) sau „tera” (1 Tbit/s = 1024 Gbit/s). Abrevierea non-standard „bps” este adesea folosită pentru a înlocui simbolul standard „bit/s”, astfel că, de exemplu, „1 Mbit” este folosit pentru a reprezenta un milion de biți pe secundă. Un octet pe secundă (1 B/s) corespunde la 8 biți/s.

YouTube enciclopedic

  • 1 / 5

    În formatele de streaming video și audio (cum ar fi MPEG și MP3) care utilizează compresie cu pierderi, parametrul debitrate exprimă gradul de compresie al fluxului și, prin urmare, determină dimensiunea canalului pentru care fluxul de date este comprimat. Cel mai adesea, rata de biți audio și video este măsurată în kilobiți pe secundă (kilobiți pe secundă, kbps), mai rar - în megabiți pe secundă (doar pentru video).

    Există trei moduri de compresie pentru streaming de date:

    • CBR(ing. Bitrate constant) - cu un bitrate constant;
    • VBR(ing. Variable bitrate) - cu bitrate variabil;
    • ABR(ing. Rata medie de biți) - cu o rată de biți medie.

    Rata de transfer de informații

    Rata de biți netă a stratului fizic, rata de biți a informațiilor, frecvența de încărcare utilă, frecvența de încărcare utilă, rata netă de biți, rata de transmisie codificată, rata efectivă de biți sau rata de alimentare a firului (limbaj informal) a unui canal de comunicație digitală este capacitatea fără a lua în considerare protocol de suprapunere a stratului, pentru un exemplu de multiplex, biți de încadrare de modelare a diviziunii în timp (TDM), coduri rezervate de corectare a erorilor înainte (FEC), egalizator de simboluri de antrenament și alte coduri de canal. Codurile anti-interferențe sunt comune, în special în sistemele de comunicații fără fir, standardele modemurilor în bandă largă sau rețelele locale moderne de mare viteză pe bază de cupru. Rata de biți pur a stratului fizic este rata de date măsurată la un punct de referință la interfața dintre stratul de legătură și stratul fizic și, prin urmare, poate include linia de date, precum și încărcarea stratului.

    În modemuri și sisteme fără fir, adaptarea legăturii (adaptarea automată a ratei de date și erorilor de modulare și/sau schema de codare, calitatea semnalului) este adesea folosită. În acest context, termenul de bitrate de vârf înseamnă rata de biți pură a celui mai rapid și mai puțin fiabil mod de transmisie, folosit de exemplu [când distanța este foarte scurtcircuitată] între emițător și transmițător. Unele sisteme de operare și echipamente de rețea pot detecta „viteza legăturii” (limbaj informal) a unei anumite tehnologii de acces la rețea sau a unui dispozitiv de comunicație, ceea ce sugerează rata actuală de transfer de date netă. Trebuie remarcat faptul că termenul de viteză a liniei este definit în unele manuale ca rata de biți brută, iar în altele ca rată de biți netă.

    Relația dintre rata de biți agregată și rata netă a datelor depinde de rata codului FEC conform celor de mai jos.

    Rată de biți constantă

    Rată de biți constantă- o variantă de codificare a datelor în flux, în care utilizatorul setează inițial rata de biți necesară, care nu se modifică pe parcursul întregului fișier.

    Principalul său avantaj este capacitatea de a prezice destul de precis dimensiunea fișierului final.

    Cu toate acestea, opțiunea de bitrate constant nu este foarte potrivită pentru lucrări muzicale al căror sunet se modifică dinamic în timp, deoarece nu oferă un raport optim dimensiune/calitate.

    Rată de biți variabilă

    CU rata de biți variabilă Codecul selectează valoarea debitului pe baza parametrilor (nivelul calității dorite), iar rata de biți se poate modifica în timpul fragmentului codificat. La comprimarea audio, rata de biți necesară este determinată pe baza unui model psihoacustic. Această metodă oferă cel mai bun raport calitate/dimensiune fișier de ieșire, dar dimensiunea sa exactă este foarte dificil de prezis. În funcție de natura sunetului (sau a imaginii, în cazul codificării video), dimensiunea fișierului rezultat poate diferi de mai multe ori.

    Rata medie de biți

    Rata medie de biți este un hibrid de rate de biți constante și variabile: valoarea în kbit/s este setată de utilizator, iar programul o variază în anumite limite. Cu toate acestea, spre deosebire de VBR, codecul folosește cu prudență valorile maxime și minime posibile, fără a risca să depășească valoarea medie specificată de utilizator. Această metodă vă permite să setați viteza de procesare cel mai flexibil (pentru audio, acesta poate fi orice număr între 8 și 320 kbps, față de multipli de 16 în metoda CBR) și să preziceți dimensiunea fișierului de ieșire cu o precizie mult mai mare (comparativ cu VBR). ).

    MP3

    Format MP3 de compresie audio cu pierderi. Calitatea sunetului se îmbunătățește pe măsură ce crește rata de biți:

    • 32 kbps - în general acceptabil numai pentru vorbire
    • 96 kbps - folosit de obicei pentru vorbire de calitate scăzută sau streaming audio
    • 128 sau 160 kbps - codificare muzicală la nivel de intrare
    • 192 kbps - calitate acceptabilă de codificare a muzicii
    • 256 kbps - codificare muzicală de înaltă calitate
    • 320 kbps - cea mai înaltă calitate de codificare acceptată de standardul MP3