Cum se creează subtitrări automate pentru ca un program să genereze automat subtitrări folosind vorbire în text? Încărcați un fișier de subtitrări personalizat

Am un videoclip pentru care vreau să creez subtitrări. Există un program care poate face vorbire rudimentară către text

  1. setați pornirea/oprirea corectă pentru fiecare subtitrare individuală
  2. creați subtitrări rudimentare de text (folosind o anumită vorbire în text)

Știu despre subtitrarea gnomilor. Cu toate acestea, crearea acestor subtitrări necesită mult efort. Trebuie să vă alegeți propriul început și oprire pentru fiecare propoziție.

Youtube are funcțiile enumerate mai sus (creează subtitrări de text rudimentare cu momente corecte folosind textul vorbit). Cu toate acestea, aș prefera să nu încarc videoclipul pe Youtube pentru a-mi obține subtitrări. Este posibil să faci subtitrări eficient în Ubuntu?

Actualizați: Intenționez să folosesc numai subtitles.srt și nu trebuie să le codificați în videoclip. Cea mai mare cerință a mea este ca programul să găsească automat start/stop pentru fiecare propoziție, așa că scriu textul în ea.

Actualizare #2: Există software Speech-to-Text pentru Linux cu pachetul CMU Sphinx. Este posibil să utilizați CMU Sphinx cu un program de subtitrări conform http://sourceforge.net/projects/cmusphinx/forums/forum/5471/topic/3949891 De asemenea, un instrument de subtitrare știe despre această caracteristică CMU Sphinx, http:// google.com/group/universal-subtitles-testing/browse_thread/thread/613361ffb921b43b (instrument web), cu toate acestea, nu există niciun link în cel mai recent cod sursă unde au adăugat CMU Sphinx. Căutarea continuă pentru a găsi un program care folosește CMU Sphinx pentru transpunerea rudimentară a vorbirii în text (care, de asemenea, a corectat timpul), la fel ca Youtube.

Am folosit Aegisub pentru Windows acum câțiva ani și am fost foarte mulțumit de el. Se pare că este disponibil pentru Linux. Este destul de conștient de sine.

Aegisub creează doar un fișier de subtitrare, cum ar fi un fișier .srt. Pentru a combina videoclipuri și subtitrări pentru a crea subtitrări hard-codate, mai trebuie să utilizați un al doilea program.
Pe Windows am folosit VirtualDub, dar nu este disponibil pentru Linux. Puteți găsi un program potrivit pentru Wikipedia.

Există și alți editori de subtitrări

Actualizați:
Nu-mi amintesc ca Aegisub să aibă funcționalitate pentru a seta automat începutul și sfârșitul unei propoziții rostite într-un fișier de subtitrare. Și nu văd nicio mențiune despre o astfel de caracteristică nicăieri pe site. Cu toate acestea, folosind (comenzi rapide de la tastatură) este destul de ușor să setați manual aceste timpi.

Există vreun program care are o astfel de caracteristică (în orice sistem de operare)?

Nu am găsit o modalitate de a face ca programul de subtitrare să adauge automat subtitrări rudimentare analizând vocile din videoclip.

Deci alternativa pe care o folosesc este

  1. Încărcați un videoclip pe Youtube (privat, de exemplu) și utilizați instrumentul încorporat pentru a genera automat subtitrări rudimentare.
  1. Adăugați videoclipuri la http://www.universalsubtitles.org/ și creați manual intervale de timp pentru fiecare propoziție dacă modul automat de pe Youtube nu funcționează sau propunerile sunt în curs de maturizare.
  2. Utilizați subtitrări GNOME (în Centrul de software) pentru a șterge subtitrările și a corecta orice timp.

Personal îmi plac subtitrările Gnome disponibile în depozite.

Sudo apt-get install gnome-subtitles

Bine, am găsit un instrument care arată frumos și arată ca un atelier de subtitrare - editor de subtitrare (apt-get install subtitleeditor).

Încercând să-l comparăm cu subtitrările Gnome, editorul de subtitrări pare mai avansat.

Pentru KDE, un editor bun de subtitrări este Subtitrări. Instalați-l folosind comanda

Sudo apt-get install subtitlecomposer

sau folosind link-ul de subtitrare

Configurarea conversiei

Camtasia Studio are capacitatea de a crea automat subtitrări prin conversia vorbirii în text.

Capacitățile acestei conversii depind de sistemul de operare utilizat pe computer. Pentru a verifica capabilitățile de conversie în fereastra Camtasia Studio din meniu Instrumente alege echipa Vorbire, iar apoi în submeniu - comanda Proprietățile vorbirii(Fig. 8.16).

În prezent, Microsoft Windows nu are module pentru recunoașterea vorbirii în limba rusă.

Pentru a începe procesul de conversie, accesați fila Subtitrări(Fig. 8.1) apăsați butonul Vorbire în text. Când îl lansați pentru prima dată, apare o fereastră (Fig. 8.17), folosind link-urile puteți accesa setările modulului de recunoaștere a vorbirii.

Vă rugăm să rețineți că acest modul aparține sistemului de operare și nu Camtasia Studio. Setarea este posibilă numai dacă limba de recunoaștere se potrivește cu limba interfeței sistemului de operare. Cu toate acestea, conversia vorbirii în text de subtitrare este posibilă în orice caz, cu condiția ca sistemul de operare să conțină modulul necesar.

Dacă intenționați să recunoașteți și să vă convertiți propriul discurs în subtitrări, puteți face clic pe link Începeți antrenamentul vocal(Fig. 8.17) pentru a antrena modulul de recunoaștere.

  • În următoarea fereastră care apare, faceți clic pe butonul Următorul.
  • În fereastra următoare (Fig. 8.18), citiți expresiile care apar acolo. Vor fi o mulțime de fraze. Procesul de antrenament poate dura 30 de minute sau mai mult.

Când ați terminat, va apărea o fereastră (Fig. 8.19). Puteți continua antrenamentul apăsând butonul Mai mult Training. Pentru a termina antrenamentul trebuie să apăsați butonul Următorul.

Această funcție nu este încă disponibilă în noul Creative Studio. Pentru a accesa interfața clasică, faceți clic Varianta clasicaîn meniul din stânga.

Dacă doriți ca conținutul dvs. să fie înțeles de toți spectatorii, adăugați-i subtitrări. Puteți activa generarea automată de subtitrări pe YouTube. Se bazează pe tehnologia de recunoaștere a vorbirii folosind algoritmi de învățare automată.

Crearea automată de subtitrări video

Crearea automată a subtitrarilor este disponibilă pentru următoarele limbi: engleză, spaniolă, italiană, coreeană, germană, olandeză, portugheză, rusă, franceză și japoneză.

Subtitrările vor fi adăugate la videoclip dacă funcția este disponibilă pentru limba dvs. Vă rugăm să rețineți că timpul de procesare depinde de complexitatea pistei audio. Prin urmare, este posibil ca subtitrările să nu apară imediat.

Specialiștii noștri îmbunătățesc în mod constant tehnologia, dar uneori vorbirea este recunoscută incorect. De obicei, erorile în subtitrările automate se datorează pronunției incorecte, accentului sau dialectului vorbitorului sau zgomotului străin. În acest sens, vă sfătuim să vizualizați subtitrările care au fost create automat și, dacă este necesar, să le editați.

Iată cum să verificați subtitrările:

  1. Conectați-vă la contul dvs. și faceți clic pe pictograma canalului din colțul din dreapta sus al paginii. Mergi la Studio de creație, deschideți secțiunea Manager videoși selectați Video.
  2. Găsiți videoclipul dorit și faceți clic pe meniul drop-down din dreapta butonului Schimbare.
  3. Selectați Subtitrări.
  4. Găsiți subtitrări care au fost generate automat. Este foarte ușor să le distingeți - în lista „Publicate”, care se află în dreapta videoclipului, lângă limba unor astfel de subtitrări va fi indicată (automat).
  5. Citiți subtitrările și modificați-le sau eliminați-le dacă este necesar.

Probleme

Probleme cu crearea automată a subtitrarilor pot apărea din unul dintre următoarele motive:

  • Subtitrările nu sunt încă disponibile, deoarece piesa audio complexă este încă în procesare.
  • Generarea automată a subtitrarilor nu este disponibilă pentru limba selectată.
  • Videoclipul este prea lung.
  • Videoclipul are o calitate audio scăzută sau conține vorbire pe care YouTube nu o poate recunoaște.
  • Videoclipul începe cu o secvență lungă fără sunet.
  • Mai multe persoane vorbesc deodată.

Crearea automată de subtitrări pentru emisiuni

Puteți activa subtitrarea automată numai pentru emisiunile în limba engleză cu latență normală.

Subtitrările automate nu sunt salvate după încheierea difuzării. Când vizionați emisiunea în înregistrări, acestea sunt create din nou.

Citiți mai multe despre subtitrări pentru transmisiunile live.

Să ne imaginăm o situație în care există un videoclip în germană (japoneză, coreeană, engleză) și trebuie să afli rapid despre ce vorbesc. Dar capacitatea ta de a înțelege limba vorbită în această limbă este foarte slab dezvoltată sau absentă. Ce să fac?

Să vorbim despre câteva trucuri care pot fi utile într-o astfel de situație.

1. Descărcați subtitrări

A avea o versiune text a videoclipului ajută foarte mult în această situație. Poate fi copiat în Google Translate sau citit cu un dicționar.

Copiați linkul către videoclip și inserați-l în formularul de la. Funcționează cu Youtube, DramaFever, ViKi, DailyMotion, OnDemandKorea, Drama, Vlive, VIU. Subtitrările sunt descărcate ca fișier .srt. Îl puteți deschide cu orice editor de text.

Serviciul oferă traduceri automate în alte limbi. Ele pot fi descărcate și în fișierul .srt. Dar dacă știți măcar puțin despre limba vorbită în videoclip, atunci este mai bine să descărcați subtitrări în limba originală și să le traduceți cu atenție.

2. Caut videoclipuri cu subtitrare

Dacă Downsub dă un mesaj despre absența subtitrarilor, atunci poți încerca să cauți o copie a acestuia pe YouTube, dar cu subtitrări. Acest lucru se poate face folosind căutarea avansată.

3. Creați automat subtitrări

Dacă nu există o versiune cu subtitrări pentru videoclipul care vă interesează pe YouTube, atunci puteți încărca fișierul original pe canalul dvs. (nu uitați să specificați setarea „Acces prin link” sau „Acces limitat”) și utilizați funcția de creare automată a subtitrarilor.

Dacă nu aveți fișierul sursă cu videoclipul, dar aveți doar un link către acesta, atunci încercați să îl descărcați folosind site-ul ru.savefrom.net.

Cum se creează automat subtitrări? Foarte simplu. YouTube încearcă spontan să traducă toate videoclipurile în rusă, engleză, franceză, germană, spaniolă, italiană, olandeză, portugheză, coreeană și japoneză.

Un link către subtitrări generate automat apare la ceva timp după ce videoclipul este încărcat. Pentru un videoclip de trei minute, au trebuit să aștepte mai mult de cinci minute. Subtitrările pentru videoclipurile postate pe canalul tău pot fi descărcate direct de pe YouTube.

Uneori textul se dovedește a fi destul de asemănător cu videoclipul. Dar dacă discursul din el sună de neînțeles, atunci rezultatul te poate face să râzi și să te surprindă. Ajutor YouTube avertizează că este posibil ca subtitrările să nu fie generate automat pentru videoclipuri de calitate foarte slabă.

Această metodă nu este rea hack de viață pentru studenți. Vi s-a cerut să vizionați un videoclip de trei ore cu o prelegere? Un fișier generat automat cu subtitrări și Command+F vă va ajuta să găsiți rapid ce secțiuni ale videoclipului acoperă subiectele de care aveți nevoie.

4. Conversia audio în video

Dacă nu aveți un videoclip, ci doar o înregistrare audio, atunci îl puteți converti în .mp4. De exemplu, și încărcați fișierul rezultat pe YouTube.

5. Convertiți vorbirea în text

Dacă nu trebuie să traduceți întregul videoclip, ci să înțelegeți doar fragmente scurte individuale, atunci este mai convenabil să utilizați pluginul SpeechLogger pentru browserul Google Chrome.

Desigur, îl puteți folosi pentru a converti întregul videoclip în text. Pluginul facilitează lucrul cu fragmente de text (notați câte o frază și corectați imediat erorile).

Ca și în cazul subtitrărilor automate, calitatea rezultatului este o loterie. Vorbirea pe îndelete a unei persoane cu o dicție bună pe un subiect simplu de zi cu zi poate fi recunoscută perfect. Și pluginul poate ignora un monolog rapid cu zgomot de fundal.

6. Schimbați setările de redare

Metoda este foarte banala, dar foarte eficienta. Dacă reduceți viteza de redare la jumătate, sunetul este perceput complet diferit. Acest lucru se aplică nu numai oamenilor, ci și pluginurilor/aplicațiilor de recunoaștere a vorbirii. Cu cât ritmul este mai lent, cu atât fac mai puține greșeli.

7. Trezirea creierului

Această metodă este potrivită pentru cei care înțeleg foarte bine textul tipărit într-o limbă străină, dar sunt puțin lent în înțelegerea limbajului vorbit. Acest lucru se întâmplă atunci când trebuie să citiți articole și cărți în fiecare zi, dar vizionați videoclipuri/ascultați audio mult mai rar sau aproape niciodată.

Înainte de a viziona un videoclip pe o anumită temă, trebuie să luați mai multe articole pe același subiect (ca să existe mai mulți termeni) și să le ascultați folosind pluginul Vorbeste. În același timp, nu uitați să citiți cu atenție textul și să îl corelați cu sunetul. În setările extensiei, puteți schimba vocea feminină cu una masculină, care sună mai plăcut și mai clar.

Pentru unii, 20 de minute sunt suficiente pentru ca abilitățile de înțelegere a vorbirii orale să se trezească (cu condiția să le fi exersat la un moment dat), în timp ce pentru alții este semnificativ mai lung. Efectul este același ca atunci când vizitați o altă țară. La început, există un ușor șoc, dar în câteva zile toate cuvintele și frazele care au fost învățate odată sunt amintite, iar vorbirea oamenilor din jur se transformă treptat din zgomot de fond în ceva semnificativ și de înțeles.

În concluzie, merită să reamintim că traducerea este un serviciu foarte ieftin. În cazul limbii engleze, nu va costa mai mult de 100 de ruble pentru fiecare minut de decodare audio/video + 200-400 de ruble pe pagină de text tradus. Pentru alte limbi, va fi puțin mai scump.