Vi har integreret OpenAI's Whisper-model til automatisk tale-til-tekst-konvertering, som præcist kan genkende accenter og baggrundsstøj. Systemet segmenterer automatisk tidslinjen og sikrer, at underteksterne forbliver synkroniserede med billedet.

Parallel generering af flersprogede undertekster

Under transskriberingen benyttes LLM til kontekstoptimeret oversættelse, og de genererede SRT- eller VTT-filer kan importeres direkte i YouTube, Premiere eller lignende videoredigeringssoftware.

Endelig løsningssammenfatning

Ved at samle multimedie- og dokumentoversættelse udvikler DL.Translator sig til et fuldt medielokaliseringscenter.