Moje třetí vlna AI- umělé inteligence - ASR
Thread poster: Milan Condak
Milan Condak
Milan Condak  Identity Verified
Local time: 16:06
English to Czech
Oct 29, 2022

Moje třetí vlna AI- umělé inteligence

Programy AI v mém PC s MS Windows:

a) Nejprve jsem si nainstaloval Model pro rozpoznávání písma, které je obsažené v obrázcích, tj. OCR. Program se jmenuje TesserAct. (10. července 2021) Nyní jej většinou samostatně nepoužívám. Je součástí programů s vlastním grafickým uživatelským prostředím. Většinou používám v balíku PDF24.

b) potom jsem si nainstaloval strojový překladač OP
... See more
Moje třetí vlna AI- umělé inteligence

Programy AI v mém PC s MS Windows:

a) Nejprve jsem si nainstaloval Model pro rozpoznávání písma, které je obsažené v obrázcích, tj. OCR. Program se jmenuje TesserAct. (10. července 2021) Nyní jej většinou samostatně nepoužívám. Je součástí programů s vlastním grafickým uživatelským prostředím. Většinou používám v balíku PDF24.

b) potom jsem si nainstaloval strojový překladač OPUS-CAT pro překládání z češtiny a do češtiny v OmegaT (24. července 2021);

c) Na YouTube jsou velmi často anglické titulky. České titulky jsou pouze na některých kanálech, které spravují lidé, kteří umí titulky vytvořit.

Státní svátek 28. října 2022 jsem oslavil tím, že jsem si nainstaloval do SubtitleEdit 3.6.8 model Vosk/Kaldi pro přepis české řeči do titulků SRT. Vyzkoušel jsem na pěti stažených videích. Ještě mi zbývá otestovat Whisper, který má také položku v menu SubtitleEditu. Teoretici funkci nazývají ASR (Automatic Speech Recognition).

Milan

[Edited at 2022-10-29 10:41 GMT]
Collapse


 
Milan Condak
Milan Condak  Identity Verified
Local time: 16:06
English to Czech
TOPIC STARTER
Editace titulků se zvukem Oct 30, 2022

Milan Condak wrote:

...nainstaloval do SubtitleEdit 3.6.8 model Vosk/Kaldi pro přepis české řeči do titulků SRT.


Na videa s titulky jsem se díval v prohlížeči VLC. Všechno fungovalo. Automatický přepis není dokonalý (dokonalé jsou pouze přeslechy) a když ASR ví, že nerozumí, vloží tam slůvko [unk]. Často ASR neví, že nerozumí a v textu jsou zcela nesprávná slova (jako v MT).
ASR pravděpodobně vypnulo v SubtitleEditu 3.6.8 zvuk. Pro editaci titulků se zvukem používám starší verzi SE 3.6.4.

Na přepis české řeči ve svém PC jsem čekal více než deset let. Jsem šťasten, že jsem se dočkal.

Milan


 
Milan Condak
Milan Condak  Identity Verified
Local time: 16:06
English to Czech
TOPIC STARTER
První moje video je cizí nahrávka s automatickými českými titulky Dec 7, 2022

Dnes jsem zveřejnil první video na YouTube

https://youtu.be/VDGPhdphgTA

Do videa z přednášky z roku 2019 jsem vypálil české titulky vytvořené automaticky programem Whisper s vícejazyčným modelem "large.bin". Modely Audio do textu by měly fungovat v programu Subtitle Edit.
Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.
... See more
Dnes jsem zveřejnil první video na YouTube

https://youtu.be/VDGPhdphgTA

Do videa z přednášky z roku 2019 jsem vypálil české titulky vytvořené automaticky programem Whisper s vícejazyčným modelem "large.bin". Modely Audio do textu by měly fungovat v programu Subtitle Edit.
Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.
Titulky z programu Vosk jsou u této nahrávky nepoužitelné.

Milan
Collapse


 
Milan Condak
Milan Condak  Identity Verified
Local time: 16:06
English to Czech
TOPIC STARTER
Mám nové PC pro ASR a ASRPE Dec 19, 2022

Milan Condak wrote:

Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.



Program Whisper v mém pracovním PC nefungoval, protože měl nainstalovaný processor I7 navržený v roce 2012. Program Whisper používá příkazy, které zpracovávají procesory navržené po roce 2013.
V novém PC (dnes sestaveném) mi nefungoval model large.bin, který stáhl SubtitleEdit (SE). Nahradil jsem jej dříve staženým modelem.

large.bin 3 094 623 691 07.12.2022 19:27 dříve stažený = funguje
large.bin 2 147 470 636 19.12.2022 22:22 dnes stažený z programu SubtitleEdit = nefunguje

První zkušenosti:

HUDBA - nahrál jsem na mobil dětský sbor zpívající koledy; před rozpoznáváním řeči je vhodné použít program, který ze zvuku extrahuje pouze řeč (potlačí hudbu).
HLASITOST - na základě křivky zvuku v SE je vhodné zvuk před rozpoznáváním zesílit nebo zeslabit.

Post Editace: ani přepis s modelem "large" není perfektní. Vygenerovaný SRT přejmenuji na W.SRT (přepisem programem Whisper) nebo na V.SRT (přepisem programem Vosk). Opravy ukládám do souboru CS.SRT (dělám pouze přepisy české řeči).

ASRPE = Automatic Speech Recognition Post Editing. Opravený text může být přeložen do jiných jazyků.

Milan


 
Milan Condak
Milan Condak  Identity Verified
Local time: 16:06
English to Czech
TOPIC STARTER
Buzz pro přepis bez SubtitleEdit Jan 7, 2023

Milan Condak wrote:

Post Editace: ani přepis s modelem "large" není perfektní. Vygenerovaný SRT přejmenuji na W.SRT (přepisem programem Whisper) ... programem Vosk).

Přepisy s malým modelem Vosk jsou méně přesné a již je nedělám.
Jako uživatel Windows sleduji aplikace, které fungují s Whisperem ve Windows.

a) Nejprve jsem spouštěl přepis řeči do titulků z Subtitle Editu. Proces se zastavil po dosažení 100% z 32 GB RAM.
b) Potom jsem spouštěl Whisper z příkazového řádku a v okně jsem viděl přepisovaný text. Pokud bylo v RAM nějaké místo a přepis nebyl zcela hotový, mohl jsem obsah okna zkopírovat do textového souboru a nepřepsanou část videa přepsat dodatečně.
c) Od 4. ledna používám program Buzz. Ve verzi 0.7.0 e mi podařilo stáhnout modely, se kterými Buzz pracuje.

Autor programu Buzz, David Mbugua, stejný den zveřejnil video, které jsem objevil včera.

https://www.youtube.com/watch?v=2NDwOoV62-k

What's new in Buzz v0.7.0

Video je dostatečně názorné, takže nemusím SW popisovat. Buzz má minimalistické rozhraní. Je možno přepisovat řeč, kterou snímá mikrofon nebo přepsat soubory (zvukové nebo video).
Kromě balíku SW, který má velikost 1GB je nutno stáhnout modely, které jsou přibližně stejně velké jako dříve uvedené modely. Vzhledem k horečnému vývoji a upgradům používám verzi, která se neinstaluje, ale pouze rozbalí na vybrané místo. Buzz lépe využívá RAM mého PC.
Přepsaný text je možno uložit jako TXT, SRT nebo VTT.

Milan



[Edited at 2023-01-07 23:05 GMT]


 
Milan Condak
Milan Condak  Identity Verified
Local time: 16:06
English to Czech
TOPIC STARTER
Buzz je lépe napsaný SW Jan 8, 2023

Milan Condak wrote:

Whisper mi zatím v mém pracovním PC nefunguje. Nepodařilo se nám zjistit proč.



Whisper v SubtitleEdit ani samostatné verze Whisperu pro Windows

a) nefungovaly v PC bez procesoru, který nepodporoval AVX1 a AVX2;
b) v průběhu zpracování se neuvolňovala paměť v RAM.

Buzz je jiný software, který pracuje s původními mnohojazyčnými modely pro Whisper.
Buzz funguje i v mém původním PC a v 16 GB RAM je dostatek volného místa.
Správce souborů ale vykazuje vysokou spotřebu elektrické energie, která je v novém PC v normálních mezích.
Buzz nezpracovává signál z mikrofonů připojených konektorem přes zvukovou kartu; zpracovává vstupní signál z mikrofonu webové kamery, která má USB. Určitě zpracovává signál i z jiných USB mikrofonů.

Milan


 


There is no moderator assigned specifically to this forum.
To report site rules violations or get help, please contact site staff »


Moje třetí vlna AI- umělé inteligence - ASR






Protemos translation business management system
Create your account in minutes, and start working! 3-month trial for agencies, and free for freelancers!

The system lets you keep client/vendor database, with contacts and rates, manage projects and assign jobs to vendors, issue invoices, track payments, store and manage project files, generate business reports on turnover profit per client/manager etc.

More info »
Trados Business Manager Lite
Create customer quotes and invoices from within Trados Studio

Trados Business Manager Lite helps to simplify and speed up some of the daily tasks, such as invoicing and reporting, associated with running your freelance translation business.

More info »