Live TV subtitling through respeaking with remote cutting-edge technology

Autor:	Vlasta Radová, Zdeněk Loose, Josef Psutka, Aleš Pražák
Rok vydání:	2019
Předmět:	Czech stínové přemlouvání Multimedia Computer Networks and Communications Computer science automatic speech recognition Training system Speech technology 020207 software engineering 02 engineering and technology živé titulkování computer.software_genre language.human_language Hardware and Architecture live subtitling 0202 electrical engineering electronic engineering information engineering Media Technology language Subtitle automatické rozpoznávání řeči Enhanced Data Rates for GSM Evolution computer Software respeaking
Zdroj:	Multimedia Tools and Applications. 79:1203-1220
ISSN:	1573-7721 1380-7501
DOI:	10.1007/s11042-019-08235-3
Popis:	Tento článek představuje originální systém pro titulkování živého televizního vysílání využívající stínové přemlouvání a automatické rozpoznávání řeči. Na rozdíl od několika komerčně dostupných řešení pro živé titulkování, technologie uvedená v tomto článku zahrnuje systém rozpoznávání řeči, který je navržen speciálně pro živé titulkování a který využívá plný potenciál nejmodernější technologie počítačového zpracování řeči. Popsána jsou vylepšení implementovaná v naší architektuře vzdáleného živého titulkování, která jsou podložena parametry reálného systému získanými během několika let nasazení ve veřejnoprávním vysílání v České republice. Tento článek dále představuje čtyřfázový trénovací systém pro stínové řečníky a některé nové techniky vztahující se k celému životnímu cyklu živých titulků, jako je například metoda automatického časování živých titulků nebo technika eliminace zpoždění živých titulků. Tento článek může sloužit jako inspirace pro řešení živého titulkování, zejména v méně používaných jazycích. This article presents an original system for live TV subtitling using respeaking and automatic speech recognition. Unlike several commercially available live subtitling solutions, the technology presented in this article comprises a speech recognition system specifically designed for live subtitling, realizing the full potential of state-of-the-art speech technology. The enhancements implemented in our remote live subtitling system architecture are described and accompanied by real-world parameters obtained during several years of deployment at the public service broadcaster in the Czech Republic. This article also presents our four-phase respeaker training system and some new techniques related to the whole life cycle of live subtitles, such as a method for automatic live subtitle retiming or a technique for live subtitle delay elimination. This article can serve as an inspiration for how to deal with live subtitling, especially in minor languages.
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=doi_dedup___::596b3eb1167e54be3492594a3ed8bfbc https://doi.org/10.1007/s11042-019-08235-3 Zobrazit plný text záznamu Full text from SpringerLink