Meniu

Ce este bitrate? Sau o poveste despre calitatea fluxului video. Configurarea OBS pentru fluxul YouTube. Instrucțiuni pas cu pas despre cum să porniți primul flux

Foarte des mi se pune aceeași întrebare - ce rată de biți este mai bine să setați când scoateți un film?. Și întrucât acesta este unul dintre cei mai importanți parametri care afectează calitatea imaginii finale, am decis să-l iau în considerare mai detaliat în acest articol, precum și să dau recomandările mele pentru alegerea valorii optime.

Ce este bitrate?

Rata de biți Aceasta este cantitatea de informații transmise sau stocate într-o anumită perioadă de timp. De obicei într-o secundă. În video se obișnuiește să se desemneze raportul de compresie și se măsoară megabiți (Mbps) sau kilobiți (kbps) pe secundă. Și cu cât valoarea sa este mai mare, cu atât calitatea imaginii este mai bună. Mai simplu spus, când setam în codec rata de biți se pare că îi spunem că avem, de exemplu, doar 16 megabiți (adică 2 megaocteți) pentru o secundă de videoclip și deja încearcă, folosind algoritmii săi de compresie, să salveze imaginea cu cea mai mică pierdere. În consecință, cu cât această valoare este mai mare, cu atât codecul trebuie să comprima mai puțin imaginea, dar dimensiunea fișierului rezultat crește.

De obicei, programele de editare și conversie video au capacitatea de a selecta unul dintre cele trei moduri de compresie:

1. Cu un bitrate constant. (Rata de biți constantă, CBR)În acest mod, rata de biți setată nu se modifică pe tot parcursul codificării și, prin urmare, dimensiunea fișierului final poate fi calculată cu precizie.

2. Cu rată de biți variabilă. (Rata de biți variabilă, VBR) Atunci când alegem acest mod, setăm deja rata de biți maximă posibilă, iar codecul însuși îl selectează pe cel necesar pentru fiecare scenă specifică din videoclip. Din acest motiv, dimensiunea finală a fișierului poate fi mai mică decât dacă selectați modul de bitrate constant. Dar este mai greu de calculat. (Puteți să vă concentrați pe rata maximă de biți atunci când calculați)

3. Cu rata medie de biți (ABR)În acest mod, am setat deja rata de biți permisă minimă și maximă. Ca și în cazul unei variabile, codecul însuși o selectează, dar numai în aceste limite. Calitatea codificării este mai bună. Deoarece codecul nu poate depăși limita minimă a ratei de biți.

Personal, aleg mereu modul de rată de biți constantă deoarece îmi oferă posibilitatea de a calcula cu exactitate dimensiunea finală a fișierului și calitatea previzibilă a imaginii. (Ei bine, nu am încredere în codec)

Ei bine, acum să exersăm. Mai exact, la cifre.

Acum există destul de multe formate și codecuri pentru compresia video. Dar cea mai înaltă calitate, după părerea mea, este încă H.264.În plus, este recomandat de serviciile video Youtube și Vimeo. De aceea mă voi concentra pe cel mai comun format de înregistrare video Full HD (1920×1080) și codec H.264.

Ce rată de biți ar trebui să setez atunci?

Pentru YouTube și Vimeo Vă sfătuiesc să expuneți bitrate de la 10 la 16 Mbps(megabiți pe secundă. În consecință, va fi de la 10000 la 16000 kbps). Acest lucru este suficient pentru a obține o imagine bună și o dimensiune mică a fișierului.

Dacă trebuie să obțineți cea mai bună calitate și dimensiunea medie a fișierului, atunci recomand setarea ratei de biți în interval de 18 - 25 mbps.

Ei bine, pentru economisire calitate maximă a imaginii – 50 mbps.

Dar mai este o nuanță aici. Trebuie să vă uitați la ce rată de biți aveți în videoclipurile originale. Dacă ei, de exemplu, înregistrat la 10 mbps, Asta Nu are rost să setezi 25 Mbps la randare. Deoarece dimensiunea fișierului va crește, dar calitatea va rămâne aceeași. În acest caz poți lasa 10 mbps. Adică, pentru cea mai înaltă calitate posibilă, te poți concentra pe bitrate-ul fișierelor video originale, fără a depăși valorile acestora.

Pentru a-l găsi trebuie să utilizați browserul Windows Faceți clic dreapta pe fișierul dorit, accesați proprietăți și selectați fila de detalii.

Acolo, în elementul „Rata de transfer de date”, va fi indicat rata de biți pe care o puteți utiliza. Aici puteți vedea rezoluția și rata de cadre.

Voi nota de asemenea că rata de biți maximă la crearea Blu-Ray discul este 35 mbps.

Dacă creați discuri în format DVD, apoi setați rata de biți între 5 – 9 Mbps.Și tot recomand să folosești 9 Mbps pentru calitate maximă.(pentru permisie 720×576 asta este destul)

Apropo, cu cât rezoluția video este mai mică, cu atât rata de biți necesară este mai mică.

Și, în sfârșit, câteva formule pentru calcularea dimensiunii unui fișier video și a ratei de biți necesare:

Să spunem că am stabilit 50 Mbps și redați 1 oră de videoclip, Atunci (50 (rata de biți în megabiți) * 3600 (număr de secunde într-o oră)) / 8 (convertit în megaocteți) = 22500 megaocteți. Adică 1 ora video la bitrate 50 Mbps va lua 21,97 gigaocteți (22500/1024=21,97 convertiți în gigaocteți)

Ei bine, dacă trebuie să calculăm rata de biți necesară, pentru a încadra 1 oră de videoclip pe 8 gigaocteți, atunci ai nevoie (7800 (aproximativ 8 gigaocteți în megaocteți) / 3600 (secunde într-o oră) * 8 (convertiți megaocteți în megabiți) = 17,3 mbps.

Presupun că voi încheia aici. Daca articolul ti-a fost de folos, atunci da like, aboneaza-te la stiri si lasa comentarii.

Mult succes cu redarea ta.

Raspunsuri:

TU-154:
Acest lucru se poate face folosind orice editor audio (de exemplu, SoundForge), dar nu are rost, deoarece calitatea nu va crește, ci mai degrabă va scădea, în ciuda dimensiunii mai mari a fișierului de ieșire. Faptul este că fișierul MP3 este deja comprimat cu pierderi atunci când este recodificat, vor fi introduse noi pierderi, care vor afecta negativ calitatea. Trebuie să luați un fișier necomprimat sau comprimat fără pierderi (fără pierderi) și să îl recodificați în MP3 cu rata de biți necesară.

Alexey:
Îl puteți crește, dar nu va face nimic decât să mărească dimensiunea fișierului și chiar să înrăutățiți calitatea. Prin urmare, nu există programe speciale pentru aceasta.

Zvyagintsev Pavel:
Da, chiar și CoolEdit, dar ce rost are? Nu puteți face bine din rău... De exemplu, luați o imagine de 32*32 și în Photoshop măriți-o la 128*128, ca rezultat - pătrate. Este aproape la fel cu muzica - doar volumul va crește, dar calitatea va rămâne la același nivel (scăzut)...

Eugen Lukin:
Creșterea ratei de biți nu poate îmbunătăți în mod fundamental calitatea sunetului. Prin urmare, o astfel de operațiune este inutilă. Și acest lucru este posibil în orice editor de sunet profesional, Adobe Audition, de exemplu.

Sanya:
Încercați Sound Forge. În general, este destul de bun pentru editarea fișierelor muzicale. Adevărat, cântărește destul de mult, mai mult de 20 de metri.

Gennady:
Este logic să codificați din WAV în MP3 cu o rată de biți mai mare, atunci calitatea sunetului va fi de fapt mai mare, dar creșterea ratei de biți a unui fișier MP3 gata făcut este inutilă, deoarece calitatea nu se va îmbunătăți și dimensiunea fișierului va crește. Puteți codifica folosind codecul Lame și interfața grafică pentru acesta RazorLame, http://www.mp3dev.org/

Configurarea corectă a OBS nu este o sarcină atât de dificilă pe cât ar părea. Dar dacă aveți dificultăți, atunci citiți ghidul nostru detaliat.

Open Broadcaster Software (OBS) este cel mai popular program pentru realizarea unui stream pe Twitch. Este gratuit, are o funcționalitate bună și vă permite să realizați fluxuri de înaltă calitate - ce altceva aveți nevoie pentru a fi fericit?

Să începem configurarea OBS pentru streaming pe Twitch

Cel mai bine este să descărcați programul de pe site-ul oficial https://obsproject.com/ și să nu căutați undeva pe torrente și site-uri de găzduire de fișiere. În acest fel, este mai fiabil și garantat că veți instala un program curat fără viruși inutile și alte murdărie.

După instalare, începem procesul inițial de configurare. Pentru a face acest lucru, selectați „Setări -> Setări” în meniul de sus.

Setări generale

Aici selectăm limba interfeței și adăugăm un profil pentru difuzare. Profil – va stoca toate setările. În esență, creăm un profil. În consecință, pot exista mai multe profiluri cu setări diferite. Acest lucru este convenabil, astfel încât în viitor să nu trebuiască să modificați toate setările, ci pur și simplu să comutați profilul la cel dorit.

Mai multe profiluri pot fi utile dacă intenționați să transmiteți periodic pe diferite platforme, și nu doar pe Twitch.

Codificare

Unul dintre cele mai importante puncte din setări. Calitatea imaginii și a sunetului din flux va depinde de aceste valori în viitor.

Twitch a cerut de mult ca streamerii să seteze o rată de biți constantă, așa că ambele casete de selectare CBR trebuie să fie active.

În funcție de rezoluția fluxului pe care intenționați să o setați, trebuie să introduceți valoarea ratei de biți. Twitch recomandă setarea următoarelor valori:

1080p: 3000-3500
720p: 1800-2500
480p: 900-1200
360p: 600-800
240p: până la 500

Dimensiunea bufferului ar trebui să aibă aceeași semnificație cu rata de biți. Rețineți că, cu cât rata de biți este mai mare, cu atât calitatea imaginii va fi mai bună în flux, dar, în același timp, va exista o sarcină mai mare pe computerul dvs., pe rețea și pe computerele spectatorilor. Nu toți spectatorii au suficient internet pentru a viziona corect un flux de 1080p cu rata de biți maximă. Prin urmare, acest indicator trebuie testat.

Codificarea audio este mai bine să utilizați AAC și rata de biți în intervalul 64-128. Twitch recomandă acest lucru și din nou avem încredere în el.

Difuzare

Totul este destul de simplu aici. Selectăm modul „Live”, serviciul – „Twitch / Justin.tv”, este mai bine să alegeți cel mai apropiat server, dar aici trebuie să testați și să urmăriți. Cel mai apropiat server din punct de vedere geografic nu va afișa întotdeauna cele mai bune rezultate.

Reconectarea automată trebuie lăsată activată. Este recomandat să setați întârzierea de reconectare automată în 5-10, dar toată lumea o setează la 10 și este normal.

Întârzierea este un lucru grozav dacă joci un joc și nu vrei ca adversarii tăi să ardă ceva important. De exemplu, când jucați Dota, de obicei setați o întârziere pentru durata saloanelor, astfel încât adversarii care vor ataca în liniște fluxul să nu vadă unde sunt saloanele. Dar uită-te și decideți singur dacă faceți asta sau nu. Având în vedere că întârzierea este setată în secunde, deci dacă trebuie să setați o întârziere de 5 minute, trebuie să introduceți 300 în acest câmp.

Atenție și la toate rândurile pe care OBS le scrie cu roșu. Există câteva sfaturi și comentarii sensibile acolo.

Puteți seta setările rămase la propria discreție - acestea nu afectează calitatea fluxului. De exemplu, puteți salva suplimentar fluxul pe computer, acest lucru va asigura că fluxul este salvat, deoarece orice se poate întâmpla pe Twitch și înregistrarea poate fi ștearsă. Prin urmare, dacă, pe lângă streamuri, postezi și înregistrări pe YouTube, este mai bine să bifezi această casetă și să salvezi totul pe computer. Există întotdeauna timp pentru a elimina ceea ce este inutil.

Video

Aici trebuie să alegeți rezoluția și rata de cadre pentru difuzarea dvs., care va ajunge la audiență. Trebuie să vă bazați pe calitatea hardware-ului și a conexiunii la internet. Valorile optime sunt 720p și 1080p la 60fps. Dacă chiar și 720p întârzie cu 60 de cadre pe secundă, apoi setați-l la 30 de cadre, imaginea va fi foarte bună, dar tot nu este ideală.

Este mai bine să nu activați niciodată scalarea, deoarece aceasta reduce foarte mult calitatea.

Audio

O secțiune importantă pentru începători, pentru că foarte des pe stream-urile lor toată lumea se plânge nu atât de calitatea video, cât de calitatea sunetului. Deci să încercăm să ne dăm seama ce să facem. Aşa.

Selectați un dispozitiv pentru redarea sunetului (difuzoare, difuzoare sau propriile căști) și un microfon.

În continuare, dacă doriți ca sunetul să fie înregistrat de la microfon nu în mod constant, ci doar în momentele în care apăsați o tastă, bifați caseta necesară și în câmpul din dreapta acestuia selectați tasta care va face acest lucru. Puteți selecta 2 taste diferite, dar acest lucru nu are sens.

Întârzierea N&G vă permite să înregistrați sunetul într-un buffer, mai degrabă decât să îl difuzați imediat online. Acest lucru este necesar dacă internetul dvs. nu este foarte bun, iar telespectatorii se plâng că terminațiile frazelor sunt pur și simplu tăiate. Aici cel mai bine este să creșteți treptat cu 100 ms dacă problema este serioasă și testați.

Tastele pentru a porni/opri microfonul și sunetul sunt de înțeles.

Consolidarea aplicațiilor implicite 1. Trebuie să creșteți sau să micșorați această valoare dacă doriți ca fluxul să aibă și sunet nu numai din joc și microfon, ci și din alte aplicații. De exemplu, de pe Skype sau cu niște muzică redată în fundal. La amplificare trebuie să fii atent, să crești cu 1 și să urmărești. Mărirea mare poate face mult mai tare, dar poate și distorsiona foarte mult sunetele, reducând calitatea.

Câștigul microfonului este același cu cel precedent, doar pentru microfonul dvs.

Offset vă permite să eliminați sincronizarea audio și video. Trebuie să-l testăm. Unii oameni joacă fără el, în timp ce alții, dimpotrivă, primesc un flux prost fără această setare. Testați, verificați, ajustați.

Vă rugăm să rețineți că parametrii modificați vor fi utilizați numai pentru următoarea lansare. În consecință, dacă există probleme cu sunetul, atunci simpla schimbare a ceva în setări nu va funcționa. Va trebui să reporniți fluxul pentru ca acestea să aibă efect. Prin urmare, este mai bine să exersați mai întâi și să configurați totul bine, apoi mergeți cu fluxul către mase.

Setări avansate

Un punct important, dar aici este ideal să lași aproape totul implicit. Am setat optimizarea multi-threaded în mod activ, timpul de tamponare este de 400 ms (aceasta este o cerință Twitch). Prioritate proces – Medie.

Presetarea implicită a procesorului x264 este cel mai bine lăsată ca foarte rapidă. Dar, dacă ai un procesor de vârf foarte puternic, atunci poți reduce această valoare. Calitatea fluxului va crește, dar și sarcina procesorului va crește semnificativ.

Interval de cadre cheie – 2 (cerință Twitch). caseta de selectare CFR. Restul poate fi lăsat neatins.

Unii oameni bifează caseta pentru a ajusta sunetul la sincronizarea videoclipului, dar acest lucru este mai degrabă opțional și nu este necesar. Va fi necesar doar dacă sunetul este foarte în spatele sau înaintea imaginii.

Poarta de zgomot

Aici puteți seta limitele în care microfonul va funcționa și va percepe sunetul. Acest lucru vă permite să filtrați sunetele inutile și zgomotele care pot pătrunde în flux (zgomot de la vecini, sunete de pe stradă etc.). Trebuie să-l testați și să-l ajustați pentru a vă potrivi, deoarece acestea se difuzează cu emoții diferite și, în consecință, indicatori de sunet diferiți.

Configurarea OBS pentru streaming pe Twitch

Aceasta completează configurarea de bază OBS. În continuare, pentru ca streamerul să iasă bine, mai trebuie să faci o scenă și , dar asta este o altă poveste și va fi discutată într-un alt articol. Dacă aveți întrebări, întrebați în comentarii.

Dezmințirea miturilor populare despre audio digital.

2017-10-01T15:27

2017-10-01T15:27

Software pentru audiofili

Nota: Pentru o mai bună înțelegere a textului de mai jos, vă recomand cu căldură să vă familiarizați cu elementele de bază ale audio digital.

De asemenea, multe dintre punctele prezentate mai jos sunt acoperite în publicația mea „Încă o dată despre tristul adevăr: de unde vine de fapt sunetul bun?” .

Cu cât rata de biți este mai mare, cu atât calitatea piesei este mai bună.

Acesta nu este întotdeauna cazul. În primul rând, permiteți-mi să vă reamintesc ce este bitray T(bitrate, nu bitraid). Aceasta este de fapt rata de date în kilobiți pe secundă în timpul redării. Adică, dacă luăm dimensiunea unei piese în kilobiți și o împărțim la durata ei în secunde, obținem rata de biți a acesteia - așa-numita. Rata de biți bazată pe fișiere (FBR), de obicei nu este prea diferită de rata de biți a fluxului audio (motivul diferențelor este prezența metadatelor în pistă - etichete, imagini încorporate etc.).

Acum să luăm un exemplu: rata de biți a sunetului PCM necomprimat înregistrat pe un CD audio obișnuit este calculată după cum urmează: 2 (canale) × 16 (biți pe eșantion) × 44100 (mostre pe secundă) = 1411200 (bps) = 1411,2 kbps . Acum să luăm și să comprimăm piesa cu orice codec fără pierderi („fără pierderi” - „fără pierderi”, adică unul care nu duce la pierderea niciunei informații), de exemplu, codecul FLAC. Drept urmare, vom obține o rată de biți mai mică decât cea inițială, dar calitatea va rămâne neschimbată - iată prima dvs. respingere.

Mai este un lucru care merită adăugat aici. Rata de biți de ieșire cu compresie fără pierderi poate fi foarte diferită (dar, de regulă, este mai mică decât cea a audio necomprimat) - aceasta depinde de complexitatea semnalului comprimat sau, mai precis, de redundanța datelor. Astfel, semnalele mai simple vor fi comprimate mai bine (adică avem o dimensiune mai mică a fișierului pentru aceeași durată => rata de biți mai mică), iar cele mai complexe se vor comprima mai rău. Acesta este motivul pentru care muzica clasică fără pierderi are o rată de biți mai mică decât, să zicem, rock-ul. Dar trebuie subliniat că bitrate-ul de aici nu este în niciun caz un indicator al calității materialului audio.

Acum să vorbim despre compresia cu pierderi. În primul rând, trebuie să înțelegeți că există multe codificatoare și formate diferite și, chiar și în același format, calitatea de codificare a diferitelor codificatoare poate diferi (de exemplu, QuickTime AAC codifică mult mai bine decât FAAC învechit), ca să nu mai vorbim superioritatea formatelor moderne (OGG Vorbis, AAC, Opus) față de MP3. Mai simplu spus, dintre două piese identice codificate de codificatori diferiți cu același bitrate, una va suna mai bine și alta va suna mai rău.

În plus, există așa ceva ca plic. Adică poți lua o piesă în format MP3 cu un bitrate de 96 kbps și o poți converti în MP3 320 kbps. Nu numai că calitatea nu se va îmbunătăți (la urma urmei, datele pierdute în timpul codificării anterioare de 96 kbit/s nu pot fi returnate), ci se va înrăutăți chiar. Merită să subliniem aici că în fiecare etapă a codării cu pierderi (cu orice bitrate și orice codificator), o anumită cantitate de distorsiune este introdusă în audio.

Și chiar mai mult. Mai este o nuanță. Dacă, să zicem, rata de biți a unui flux audio este de 320 kbps, aceasta nu înseamnă că toți cei 320 kbps au fost cheltuiți pentru codificarea în acea secundă. Acest lucru este tipic pentru codificarea cu o rată de biți constantă și pentru acele cazuri în care o persoană, sperând să obțină o calitate maximă, forțează rata de biți constantă să fie prea mare (de exemplu, setarea CBR de 512 kbps pentru Nero AAC). După cum se știe, numărul de biți alocați unui anumit cadru este reglementat de un model psihoacustic. Dar în cazul în care suma alocată este mult mai mică decât rata de biți setată, nici măcar rezervorul de biți nu salvează (citiți despre termenii din articolul „Ce sunt CBR, ABR, VBR?”) - ca urmare, devenim inutili „zero biți” care pur și simplu „termină” » dimensiunea cadrului la dimensiunea dorită (adică, măriți dimensiunea fluxului la cea specificată). Apropo, acest lucru este ușor de verificat - comprimați fișierul rezultat cu un arhivator (de preferință 7z) și uitați-vă la raportul de compresie - cu cât este mai mare, cu atât mai mulți biți zero (deoarece duc la redundanță), cu atât mai mult spațiu irosit.

Codecurile cu pierderi (MP3 și altele) sunt capabile să facă față muzicii electronice moderne, dar nu sunt capabile de codificare de înaltă calitate a muzicii clasice (academice), live, instrumentale

„Ironia sorții” aici este că, de fapt, totul este exact invers. După cum se știe, muzica academică în marea majoritate a cazurilor urmează principii melodice și armonice, precum și compoziția instrumentală. Din punct de vedere matematic, aceasta rezultă într-o compoziție armonică relativ simplă a muzicii. Astfel, predominanța consonanțelor produce un număr mai mic de armonici laterale: de exemplu, pentru o cincime (un interval în care frecvențele fundamentale a două sunete diferă de o dată și jumătate), fiecare a doua armonică va fi comună celor două sunete. , pentru o patra, unde frecvențele diferă cu o treime - la fiecare treime și etc. În plus, prezența unor rapoarte de frecvență fixe, datorită utilizării temperamentului egal, simplifică și compoziția spectrală a muzicii clasice. Compoziția instrumentală live a clasicilor determină absența zgomotului caracteristic muzicii electronice, distorsiunea, salturile ascuțite de amplitudine, precum și absența unui exces de componente de înaltă frecvență.

Factorii enumerați mai sus duc la faptul că muzica clasică este mult mai ușor de comprimat, în primul rând, pur matematic. Dacă vă amintiți, compresia matematică funcționează prin eliminarea redundanței (descrierea unor informații similare folosind mai puțini biți) și, de asemenea, prin realizarea de predicții (alias. predictori preziceți comportamentul semnalului și apoi este codificată doar abaterea semnalului real față de cel prezis - cu cât se potrivesc mai precis, cu atât sunt necesari mai puțini biți pentru codare). În acest caz, compoziția spectrală relativ simplă și armonicitatea determină o redundanță ridicată, a cărei eliminare asigură un grad semnificativ de compresie, iar un număr mic de rafale și componente de zgomot (care sunt semnale aleatorii și imprevizibile) determină o bună predictibilitate matematică a vastei. majoritatea informatiilor. Și nici măcar nu vorbesc despre volumul mediu relativ scăzut al pieselor clasice și intervalele frecvente de tăcere, pentru care practic nu este nevoie de informații pentru a codifica. Ca rezultat, putem comprima fără pierderi, de exemplu, unele muzică instrumentală solo la rate de biți sub 320 kbps (encoderele TAK și OFR sunt destul de capabile de acest lucru).

Deci, în primul rând, faptul este că compresia matematică care stă la baza codificării fără pierderi este, de asemenea, una dintre etapele codificării cu pierderi (a se citi Înțelegerea codificării MP3). Și în al doilea rând, deoarece lossy utilizează transformata Fourier (descompunerea semnalului în armonici), simplitatea compoziției spectrale chiar face munca codificatorului de două ori mai ușoară. Ca rezultat, comparând mostrele de muzică clasică originale și codificate într-un test orb, suntem surprinși să constatăm că nu putem găsi nicio diferență, chiar și la un bitrate relativ scăzut. Și lucrul amuzant este că atunci când începem să reducem complet rata de codare, primul lucru care dezvăluie diferențele este zgomotul de fundal din înregistrare.

În ceea ce privește muzica electronică, codificatorii au o perioadă foarte dificilă cu ea: componentele de zgomot au o redundanță minimă, iar împreună cu sărituri ascuțite (un fel de impulsuri din dinți de ferăstrău) sunt semnale extrem de imprevizibile (pentru programatorii care sunt „cropit” la sunete naturale care se comportă). cu totul altfel), transformarea Fourier directă și inversă cu respingerea armonicilor individuale de către modelul psihoacustic produce inevitabil efecte pre- și post-eco, a căror audibilitate nu este întotdeauna ușor de evaluat de către codificator... Adăugați la aceasta și nivel ridicat de componente HF - și obțineți un număr mare de killer -eșantioane, cărora nici cei mai avansati encodere nu le pot face față la rate medii-scăzute, destul de ciudat, mai ales în muzică electronică.

Distractive sunt și părerile „ascultătorilor cu experiență” și ale muzicienilor care, cu o lipsă totală de înțelegere a principiilor codării cu pierderi, încep să susțină că aud cum instrumentele din muzică după codare încep să se dezacordeze, frecvențele plutesc. , etc. Acest lucru ar putea fi încă valabil pentru casetofonele antediluviane cu detonație, dar în audio digital totul este exact: componenta de frecvență fie rămâne, fie este aruncată, pur și simplu nu este nevoie să se schimbe tonalitatea. Mai mult decât atât: prezența urechii unei persoane pentru muzică nu înseamnă deloc că are un auz bun de frecvență (de exemplu, capacitatea de a percepe frecvențe >16 kHz, care dispare odată cu vârsta) și nu-i face deloc mai ușor căutați artefacte de codare cu pierderi, deoarece distorsiunea Acestea au un caracter foarte specific și necesită experiența de comparare oarbă a sunetului cu pierderi - trebuie să știți ce și unde să căutați.

DVD-Audio sună mai bine decât CD-ul audio (24 de biți față de 16, 96 kHz față de 44,1 etc.)

Din păcate, oamenii se uită de obicei doar la cifre și foarte rar se gândesc la impactul unui anumit parametru asupra calității obiective.

Să luăm în considerare mai întâi adâncimea de biți. Acest parametru nu este responsabil pentru nimic mai mult decât intervalul dinamic, adică diferența dintre cele mai silentioase și cele mai puternice sunete (în dB). În audio digital, nivelul maxim este de 0 dBFS (FS - scară completă), iar minimul este limitat de nivelul de zgomot, adică, de fapt, intervalul dinamic în valoare absolută este egal cu nivelul de zgomot. Pentru audio pe 16 biți, intervalul dinamic este calculat ca 20 × log 10 2 16, care este egal cu 96,33 vB. În același timp, intervalul dinamic al unei orchestre simfonice este de până la 75 dB (în mare parte aproximativ 40-50 dB).

Acum să ne imaginăm condiții reale. Nivelul de zgomot din cameră este de aproximativ 40 dB (nu uitați că dB este o valoare relativă. În acest caz, pragul de audibilitate este luat ca 0 dB), volumul maxim al muzicii ajunge la 110 dB (pentru a evita disconfortul) - noi obține o diferență de 70 dB. Astfel, se dovedește că un interval dinamic de peste 70 dB în acest caz este pur și simplu inutil. Adică, la o gamă mai mare, fie sunetele puternice vor atinge pragul durerii, fie sunetele liniștite vor fi absorbite de zgomotul din jur. Este foarte dificil să se atingă un nivel de zgomot ambiental mai mic de 15 dB (deoarece volumul respirației umane și al altor zgomote cauzate de fiziologia umană sunt la acest nivel), ca urmare, se dovedește un interval de 95 dB pentru ascultarea muzicii. să fie complet suficientă.

Acum despre frecvența de eșantionare (frecvența de eșantionare, rata de eșantionare). Acest parametru controlează frecvența de eșantionare în timp și afectează direct frecvența maximă a semnalului care poate fi descrisă de o anumită reprezentare audio. Conform teoremei lui Kotelnikov, este egal cu jumătate din frecvența de eșantionare. Adică, pentru frecvența obișnuită de eșantionare de 44100 Hz, frecvența maximă a componentelor semnalului este de 22050 Hz. Frecvența maximă. care este perceput de urechea umană este puțin peste 20.000 Hz (și apoi la naștere; pe măsură ce îmbătrânim, pragul scade la 16.000 Hz).

Acest subiect este tratat cel mai bine în articolul Descărcări în format 24/192 - de ce nu au sens.

Diferiți jucători software sună diferit (de exemplu, foobar2000 este mai bun decât Winamp etc.)

Pentru a înțelege de ce nu este cazul, trebuie să înțelegeți ce este un player software. În esență, acesta este un decodor, handlere (opțional), un plugin de ieșire (la una dintre interfețele: ASIO, DirectSound, WASAPI etc.) și bineînțeles GUI (interfață grafică de utilizator). Deoarece decodorul în 99,9% din cazuri funcționează conform unui algoritm standard, iar plug-in-ul de ieșire este doar o parte a programului care transmite fluxul către placa de sunet prin una dintre interfețe, singurul motiv pentru diferențe poate fi manipulatorii. Dar adevărul este că procesoarele sunt de obicei oprite în mod implicit (sau ar trebui să fie dezactivate, deoarece principalul lucru pentru un jucător bun este să poată transmite sunetul în forma sa „pură”). Ca urmare, singurul subiect de comparație aici poate fi posibilităților procesare și ieșire, care, apropo, de multe ori nu sunt deloc necesare. Dar chiar dacă există o astfel de nevoie, atunci aceasta este o comparație a procesoarelor, și nu a jucătorilor.

Diferite versiuni de drivere sună diferit

Această afirmație se bazează pe ignorarea banală a principiilor de funcționare a unei plăci de sunet. Un driver este un software necesar pentru interacțiunea eficientă a unui dispozitiv cu sistemul de operare, oferind, de obicei, o interfață grafică de utilizator pentru abilitatea de a gestiona dispozitivul, parametrii acestuia etc. Un driver de placă de sunet asigură că placa de sunet este recunoscută ca Windows dispozitiv de sunet, informează sistemul de operare cu privire la formatele care acceptă cardul, oferă transmiterea unui flux PCM necomprimat (în majoritatea cazurilor) către card și, de asemenea, oferă acces la setări. În plus, dacă există procesare software (folosind CPU), driverul poate conține diferite DSP-uri (procesoare). Prin urmare, în primul rând, cu efectele și procesarea dezactivate, dacă driverul nu oferă transmisie PCM precisă pe card, aceasta este considerată o eroare gravă, o eroare critică. Și asta se întâmplă extrem de rare. Pe de altă parte, diferențele dintre drivere pot fi în actualizarea algoritmilor de procesare (resampler, efecte), deși acest lucru nu se întâmplă des. În plus, pentru a obține cea mai înaltă calitate, efectele și orice procesare a driverului ar trebui în continuare excluse.

Astfel, actualizările driverelor sunt axate în principal pe îmbunătățirea stabilității și eliminarea erorilor de procesare. Nici unul, nici celălalt în cazul nostru nu afectează calitatea redării, prin urmare în 999 de cazuri din 1000 driverul nu are niciun efect asupra sunetului.

CD-urile audio cu licență sună mai bine decât copiile lor

Dacă nu au apărut erori (fatale) de citire/scriere în timpul copierii și unitatea optică a dispozitivului pe care va fi redat discul de copiere nu are probleme la citirea acestuia, atunci această afirmație este eronată și ușor de respins.

Modul de codare stereo oferă o calitate mai bună decât Joint Stereo

Această concepție greșită se referă în principal la LAME MP3, deoarece toate codificatoarele moderne (AAC, Vorbis, Musepack) folosesc numai Modul Stereo comun (și asta spune deja ceva)

Pentru început, merită menționat că modul Joint Stereo este utilizat cu succes cu compresie fără pierderi. Esența sa constă în faptul că, înainte de codificare, semnalul este descompus în suma canalelor dreapta și stânga (Mid) și diferența lor (Side), iar apoi are loc codificarea separată a acestor semnale. În limită (pentru aceleași informații în canalele dreapta și stânga), se obțin economii duble de date. Și deoarece în majoritatea muzicii informațiile din canalele din dreapta și din stânga sunt destul de asemănătoare, această metodă se dovedește a fi foarte eficientă și vă permite să creșteți semnificativ raportul de compresie.

În lossy principiul este același. Dar aici, în modul de bitrate constant, calitatea fragmentelor cu informații similare pe două canale va crește (în limită, dublu), iar pentru modul VBR în astfel de locuri, rata de biți va scădea pur și simplu (nu uitați că sarcina principală al modului VBR este menținerea stabilă a calității de codificare specificată, folosind cel mai mic bitrate posibil). Deoarece în timpul codificării cu pierderi, prioritatea (la distribuirea biților) este acordată sumei canalelor, pentru a evita deteriorarea panoramei stereo, comutarea dinamică între stereo mixt (Mid/Side) și stereo obișnuit (Stânga/Dreapta) bazat pe cadru. se utilizează moduri. Apropo, motivul acestei concepții greșite a fost imperfecțiunea algoritmului de comutare în versiunile mai vechi ale LAME, precum și prezența modului de îmbinare forțată, în care nu există comutare automată. În cele mai recente versiuni ale LAME, modul Joint este activat în mod implicit și nu este recomandat să îl schimbați.

Cu cât spectrul este mai larg, cu atât calitatea înregistrării este mai bună (despre spectrograme, auCDtect și interval de frecvență)

În zilele noastre, pe forumuri, din păcate, este foarte comun să se măsoare calitatea unei piese „cu o riglă folosind o spectrogramă”. Evident, datorită simplității acestei metode. Dar, după cum arată practica, în realitate totul este mult mai complicat.

Și iată chestia. Spectrograma demonstrează vizual distribuția puterii semnalului pe frecvențe, dar nu poate oferi o imagine completă a sunetului înregistrării, prezența distorsiunilor și artefactelor de compresie în ea. Adică, în esență, tot ceea ce poate fi determinat din spectrogramă este domeniul de frecvență (și parțial densitatea spectrului în regiunea HF). Adică, în cel mai bun caz, prin analiza spectrogramei este posibil să se identifice o conversie ascendentă. Compararea spectrogramelor de piste obținute prin codificare cu diverse codificatoare cu originalul este o absurditate totală. Da, puteți identifica diferențele în spectru, dar a determina dacă (și în ce măsură) vor fi percepute de urechea umană este aproape imposibil. Nu trebuie să uităm că sarcina codării cu pierderi este de a asigura un rezultat care nu se poate distinge urechea umană din original (nu cu ochii).

Același lucru este valabil și pentru evaluarea calității codificării prin analiza pieselor de ieșire cu programul auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect - acestea sunt doar shell-uri pentru programul de consolă unic auCDtect). Algoritmul auCDtect analizează de fapt și intervalul de frecvență și vă permite doar să determinați (cu un anumit grad de probabilitate) dacă compresia MPEG a fost aplicată în oricare dintre etapele de codificare. Algoritmul este adaptat pentru MP3, deci este ușor să îl „înșeli” cu ajutorul codecurilor Vorbis, AAC și Musepack, deci chiar dacă programul scrie „100% CDDA”, asta nu înseamnă că audio codificat este 100% identic cu cel original.

Și revenind direct la spectre. Există, de asemenea, o dorință populară printre unii „entuziaști” de a dezactiva cu orice preț filtrul lowpass din encoderul LAME. Aici există o lipsă clară de înțelegere a principiilor de codificare și psihoacustică. În primul rând, codificatorul taie frecvențele înalte doar pentru un singur scop - pentru a salva date și a le folosi pentru a codifica cea mai audibilă gamă de frecvențe. Gama extinsă de frecvență poate avea un impact fatal asupra calității generale a sunetului și poate duce la artefacte de codare audibile. Mai mult decât atât, dezactivarea tăierii la 20 kHz este în general complet nejustificată, deoarece o persoană pur și simplu nu poate auzi frecvențe mai mari.

Există o anumită presetare a egalizatorului „magic” care poate îmbunătăți semnificativ sunetul

Acest lucru nu este în întregime adevărat, în primul rând, deoarece fiecare configurație individuală (căști, acustică, placă de sunet) are propriii parametri (în special, propriul răspuns amplitudine-frecvență). Și, prin urmare, fiecare configurație trebuie să aibă propria abordare unică. Mai simplu spus, o astfel de presetare a egalizatorului există, dar diferă pentru diferite configurații. Esența sa constă în ajustarea răspunsului în frecvență al căii, și anume în „nivelarea” scăderilor și creșterilor nedorite.

De asemenea, printre oamenii departe de a lucra direct cu sunetul, setarea unui egalizator grafic cu un „tic” este foarte populară, ceea ce reprezintă de fapt o creștere a nivelului componentelor de joasă frecvență și de înaltă frecvență, dar în același timp duce la înăbușire. de voci și instrumente, al căror spectru sonor se află în regiunea de frecvență medie.

Înainte de a converti muzica într-un alt format, ar trebui să o decomprimați în WAV

Permiteți-mi să notez imediat că WAV înseamnă date PCM (modularea codului de impulsuri) în containerul WAVE (fișier cu extensia *.wav). Aceste date nu sunt altceva decât o secvență de biți (zerouri și unu) în grupuri de 16, 24 sau 32 (în funcție de adâncimea de biți), fiecare dintre acestea reprezentând codul binar pentru amplitudinea eșantionului corespunzător (de exemplu, pentru 16 biți în notație zecimală acestea sunt valori de la -32768 la +32768).

Deci, adevărul este că orice procesor de sunet - fie că este un filtru sau un encoder - funcționează de obicei numai cu aceste valori, adică numai cu date necomprimate. Aceasta înseamnă că pentru a converti audio de la, de exemplu, FLAC în APE, pur și simplu necesar Mai întâi decodați FLAC în PCM, apoi codificați PCM în APE. Este ca și cum ați reambala fișierele din ZIP în RAR, mai întâi trebuie să despachetați fișierul ZIP.

Cu toate acestea, dacă utilizați un convertor sau doar un codificator de consolă avansat, conversia intermediară în PCM are loc din mers, uneori fără a scrie măcar într-un fișier WAV temporar. Acesta este ceea ce induce oamenii în eroare: se pare că formatele sunt convertite direct dintr-unul în altul, dar de fapt un astfel de program trebuie să aibă un decodor de format de intrare care să realizeze conversia intermediară în PCM.

Astfel, convertirea manuală în WAV nu vă va oferi absolut nimic altceva decât pierdere de timp.

Bună ziua, dragi cititori ai site-ului. Este timpul pentru al doilea episod din Mom's Streamer, iar astăzi ne vom uita la configurarea inițială a OBS. Ultima dată am colectat și testat echipamentul optim pentru streaming în Full HD 60 FPS.

Voi încerca să vorbesc despre punctele importante cât mai rapid și informativ posibil, pentru a selecta setările optime pentru diferite computere pentru fiecare encoder: NVENC, x264, Quick Sync și AVC Encoder pentru plăcile video AMD.

Unii s-ar putea întreba de ce OBS și nu Xsplit. În primul rând, OBS este gratuit. Și în al doilea rând, este mai puțin solicitant cu resursele computerului. Și cu aceleași presetări, OBS va încărca mai puțin computerul. Să începem deja!

Vă rugăm să rețineți că aceste valori se bazează pe criteriile de calitate YouTube. Aceste. Aceste valori nu corespund în mare măsură temei de joc, ci formatului videoclipurilor filmate cu camera.

„Super calitate” este limita funcțională maximă; Când difuzați jocuri, nu are rost să le afișați, deoarece... vizual, calitatea va fi aproape aceeași ca în „Calitate înaltă”.

Prin urmare, pentru jocuri, „calitate scăzută” este adesea acceptabilă. De exemplu, pe Twitch se consideră normal să se ia o rată de biți de 1800 pentru un flux de 720p - aceasta este valoarea implicită în OBS pentru această platformă.

UPDATE: Twitch a crescut rata maximă de biți de la 3500 la 6000. Deci, dacă aveți un computer puternic, puteți seta în siguranță, de exemplu, 720 la 60fps cu un bitrate de 5k

De asemenea, este important să înțelegeți că alegerea ratei de biți depinde de jocul specific. Dacă joci un joc de pixeli precum Realm of the Mad God, un bitrate mare nu va face diferența, pentru că... Jocul în sine nu strălucește cu grafică. De asemenea, calitatea ridicată a imaginii nu este importantă în jocurile statice precum Hearthstone, unde majoritatea spectatorilor știu deja ce card face ce.

Alegerea mea personală pentru majoritatea jocurilor este rata de biți YouTube:
720p (rezoluție 1280x720), 30 fps - 2500
1080p (rezoluție 1920x1080), 30 fps - 4300

Ajustarea intervalului dintre cadrele cheie poate îmbunătăți calitatea imaginii și poate utiliza mai eficient rata de biți selectată. Cadrul cheie este codificat în întregime, următorul conține doar diferențe față de cadrul cheie, al treilea conține diferențe față de al doilea și așa mai departe până la următorul cadru cheie.

Pentru jocurile care nu sunt prea dinamice, intervalul poate fi mărit, deoarece imaginea de acolo nu se schimbă dramatic sau rapid. Pentru cele dinamice, nu recomand să setați mai mult de un cadru cheie la 3 secunde - imaginea va fi foarte neclară.

Utilizare procesor presetat este responsabil pentru încărcarea procesorului și calitatea imaginii. Dacă procesorul este puternic, atunci puteți crește parametrul, obținând o imagine mai bună.

Dimpotrivă, dacă aparatul nu poate face față streamingului și jocurilor în același timp, atunci merită să reduceți utilizarea procesorului pentru a face videoclipul mai fluid. Valoarea recomandată pentru procesoarele slabe și medii este „Foarte rapidă”.

Profilul articolului depinde direct de hardware-ul dvs. Pentru componentele mai vechi este indicat să setați principal, pentru componentele mai noi - ridicat. În acest caz, pierderea calității va fi minimă.

Element separat „Setări” sub profile - acesta este un fel de optimizare pentru difuzarea dvs. Recomand să setați setarea de latență zero, care este special destinată streamingului video.

Acum să ne uităm la setările de difuzare prin codecul NVENC H.264 pentru plăcile video NVIDIA. Nu există diferențe speciale aici. Aceeași linie cu bitrate, presetări și profiluri.

Presetările de aici sunt deja etichetate în termeni umani, iar din nume puteți înțelege cum să îmbunătățiți calitatea imaginii și cum să reduceți încărcarea pe placa video. Cu toate acestea, parametrul de nivel (de ce?) este o subtuning mai precisă, care este încă prea devreme pentru ca noi, nobii, să intrăm. Prin urmare, îl lăsăm în modul „auto”.

Când utilizați codarea în două treceri, calitatea imaginii se va îmbunătăți, dar sarcina pe GPU va crește. Dar acesta este un preț adecvat, așa că îl bifăm.

Dacă sunteți major și aveți mai multe plăci video în SLI, atunci în următorul element GPU setați valoarea la „unu” pentru două plăci video, valoarea două pentru trei și așa mai departe. Dacă aveți o singură placă video, lăsați valoarea „zero”.

Folosirea cadrelor B înseamnă că un anumit cadru se referă la două cadre adiacente - precedentul și următorul. Acest lucru accelerează redarea și reduce sarcina hardware-ului. Lăsați valoarea la 2.

Streaming prin plăcile video AMD. Există și presetări aici, în care trebuie doar să schimbați rata de biți la cea dorită pentru rezoluția dvs.

Dacă treceți la modul de vizualizare „Expert”, puteți configura codificatorul pentru a se potrivi nevoilor dvs. cât mai detaliat posibil. Cu toate acestea, nu mă voi concentra asupra acestui lucru, deoarece, în primul rând, va întinde videoclipul timp de o oră, iar în al doilea rând, puțini oameni folosesc plăcile video AMD pentru streaming.

Sincronizare rapidă

De asemenea, este posibilă codificarea transmisiilor prin Quick Sync și nucleul video încorporat în procesoarele Intel. Cu toate acestea, calitatea va fi sub medie, deși sarcina principală pe procesor va fi redusă.

Pentru a activa tehnologia, trebuie să intrați în BIOS și să schimbați elementul cu mai multe monitoare din secțiunea de bază video încorporată la Activare. Numele poate diferi pe diferite plăci de bază. Apoi, configurația este aceeași ca pentru streaming printr-un procesor.

Următorul articol este „Audio”. Aici puteți conecta mai multe dispozitive audio pentru redarea transmisiei, selectați calitatea, determinați numărul de canale și setați întârzierea pentru pornirea și oprirea microfonului.

Rata de biți audio pentru flux ar trebui, de asemenea, să difere în funcție de rezoluția dvs., altfel sunetul poate întârzia. Recomand următoarele valori audio bitrate:

240p (426 x 240) - 32 kbps (mono)
270p (480x270) - 40 kbps (mono)
360p (640x360) - 48 kbps
480p (854x480) - 64 kbps
540p (960x540) - 96 kbps
720p (1280x720) - 128 kbps
1080p (1920x1080) - 128 kbps

Când transmiteți în flux la rezoluții scăzute (până la 720), puteți încerca o rată de biți audio mai mare, experiment.

În secțiunea „Video”, este setată rezoluția nativă a ecranului, rezoluția de ieșire pentru difuzare și este determinată valoarea maximă FPS.

Filtru de scalare– o caracteristică foarte utilă. Voi explica cum diferă metodele și care este cel mai bine să o alegeți pentru computerul dvs.

Prima metodă este biliniară. Este potrivit pentru computere slabe și calitate medie de difuzare. Imaginea va fi puțin neclară, mai ales în scenele dinamice. Dar resursele consumate vor fi semnificativ mai mici.

A doua metodă este bicubic. Este folosit cel mai des de către streameri. Combinație optimă de încărcare și calitate a imaginii.

A treia metodă și cea mai consumatoare de resurse este Lanczos. Calitatea difuzării va fi maximă, la fel ca și încărcarea de pe PC. Nu recomand să-l folosești cu procesoare mai slabe decât Ryzen 5 1400, Intel Core i5 6400 și plăci video mai tinere decât GTX 1060 cu 6 GB.

In sectiunea „Taste rapide” Puteți seta combinații sau legături individuale pentru a activa rapid anumite funcții sau pentru a schimba scenele de difuzare.

ÎN „Setări avansate” Vă sfătuiesc să setați prioritatea procesului la mare, astfel încât actualizările de fundal sau alt software să nu ocupe resursele necesare. Este mai bine să nu atingeți formatul de culoare, spațiul și gama.

Configurarea primului flux

Acum să creăm prima noastră scenă cu jocul și camera web. Pentru a începe, faceți clic pe semnul plus din stânga jos și creați prima scenă.

În dreapta sunt sursele, pe care le vom umple treptat.

Să începem prin a adăuga jocul pe care îl vom difuza. Faceți clic pe butonul „plus” din surse și selectați „Game Capture”.