Zobrazeno 1 - 10
of 157
pro vyhledávání: '"phonetic posteriorgram"'
Cross-lingual voice conversion (VC) is an important and challenging problem due to significant mismatches of the phonetic set and the speech prosody of different languages. In this paper, we build upon the neural text-to-speech (TTS) model, i.e., Fas
Externí odkaz:
http://arxiv.org/abs/2102.01991
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
In Computer Methods and Programs in Biomedicine March 2022 215
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
2022 Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC).
Publikováno v:
Journal of East China University of Science & Technology; 2023, Vol. 49 Issue 6, p900-906, 7p
Autor:
Ricardo Gutierrez-Osuna, Guanlong Zhao
Publikováno v:
IEEE/ACM Transactions on Audio, Speech, and Language Processing. 27:1649-1660
Accent conversion AC aims to transform non-native utterances to sound as if the speaker had a native accent. This can be achieved by mapping source speech spectra from a native speaker into the acoustic space of the target non-native speaker. In prio
Publikováno v:
Computer methods and programs in biomedicine. 215
Most dysarthric patients encounter communication problems due to unintelligible speech. Currently, there are many voice-driven systems aimed at improving their speech intelligibility; however, the intelligibility performance of these systems are affe
Conference
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
ICASSP
Cross-lingual voice conversion (VC) is an important and challenging problem due to significant mismatches of the phonetic set and the speech prosody of different languages. In this paper, we build upon the neural text-to-speech (TTS) model, i.e., Fas