Zobrazeno 1 - 10
of 16
pro vyhledávání: '"Jakub Vít"'
Autor:
Jakub Vít, Dalibor Repček, Christelle Kadlec, Filip Kadlec, Nidhi Adhlakha, Paola Di Pietro, Federica Piccirilli, Sergey Kovalev, Jan-Christoph Deinert, Igor Ilyakov, Nilesh Awari, Min Chen, Josef Buršík, Chang Bae Park, Kee Hoon Kim, Michael Gensch, Andrea Perucchi, Stanislav Kamba
Publikováno v:
Journal of the Physical Society of Japan 91(2022), 104703
Complex frustrated magnetic structures in multiferroic hexaferrites are well tunable by temperature, magnetic field and doping. We investigated the influence of strong THz pulses generated by superradiant THz sources on magnetic structure and related
Publikováno v:
Text, Speech, and Dialogue ISBN: 9783030835262
TDS
TDS
Článek popisuje experimenty s vícejazyčnými systémy syntézy řeči trénovanými společně z anglických, německých, ruských a českých dat. Experimentální systém založený na LSTM neuronových sítích a trénovatelný neuronový vok
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::e2293a0afbcf8510c2912ee3f70f4fdc
http://hdl.handle.net/11025/47246
http://hdl.handle.net/11025/47246
Autor:
Zdeněk Hanzlíček, Jakub Vít
Publikováno v:
Text, Speech, and Dialogue ISBN: 9783030583224
TDS
TDS
This paper describes experiments on speech segmentation by using bidirectional LSTM neural networks. The networks were trained on various languages (English, German, Russian and Czech), segmentation experiments were performed on 4 Czech professional
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::bb869222f69903d36eadd42ef9c71073
https://doi.org/10.1007/978-3-030-58323-1_49
https://doi.org/10.1007/978-3-030-58323-1_49
Publikováno v:
Speech and Computer ISBN: 9783030602758
SPECOM
SPECOM
Modern web browsers are becoming operating systems of their own kind, allowing unified access to the underlying hardware. The sound device can thus be used by web-based communication systems, such a Google meet, Zoom and others. This attracts the ide
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::f342da3e622af34760a1074a7dd7a88d
https://doi.org/10.1007/978-3-030-60276-5_57
https://doi.org/10.1007/978-3-030-60276-5_57
Publikováno v:
Text, Speech, and Dialogue ISBN: 9783030279462
TSD
TSD
Tento článek popisuje experimenty se segmentací řeči pro účely TTS syntézy . Použili jsme obousměrnou LSTM neuronovou síť pro klasifikaci telefonů v rámečku a další obousměrnou LSTM síť pro predikci délky jednotlivých telefonů.
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::b0dc4334131f0167378b28c1e4907350
https://doi.org/10.1007/978-3-030-27947-9_31
https://doi.org/10.1007/978-3-030-27947-9_31
Autor:
Markéta Jůzová, Jakub Vít
Publikováno v:
Text, Speech, and Dialogue ISBN: 9783030279462
TSD
TSD
Důležitou součástí téměř všech současných systémů TTS je konverze grafémů na fonémy (G2P), tj. transkripce jakékoli vstupní sekvence grafémů do správné sekvence fonémů v daném jazyce. Příprava transkripčních pravidel a sl
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::702f610b27940105973f8cbb465e9647
http://hdl.handle.net/11025/36610
http://hdl.handle.net/11025/36610
Publikováno v:
Text, Speech, and Dialogue ISBN: 9783030279462
TSD
TSD
In recent years, new neural architectures for generating high-quality synthetic speech on a per-sample basis were introduced. We describe our application of statistical parametric speech synthesis based on LSTM neural networks combined with a generat
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::4d7080cde28334bec8a59145df6723cc
https://doi.org/10.1007/978-3-030-27947-9_26
https://doi.org/10.1007/978-3-030-27947-9_26
Publikováno v:
INTERSPEECH
Představujeme jednotný model pro převod grafémů na fonémy založený na hlubokých neuronových sítích. Na rozdíl od obvyklých přístupů, které používají pro trénovaní slovník, používáme celé fráze, což nám umožňuje zachyt
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::5bb602253e50d7107e137abf65672be0
http://hdl.handle.net/11025/47118
http://hdl.handle.net/11025/47118
Publikováno v:
ICASSP
In this paper, we analyze how much, how consistent and how accurate data WaveNet-based speech synthesis method needs to be able to generate speech of good quality. We do this by adding artificial noise to the description of our training data and obse
Publikováno v:
Text, Speech, and Dialogue ISBN: 9783030007935
TSD
TSD
WaveNet is a recently-developed deep neural network for generating high-quality synthetic speech. It produces directly raw audio samples. This paper describes the first application of WaveNet-based speech synthesis for the Czech language. We used the
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_________::cf2b09d77b0d3fd2dd9048bd08605b0a
https://doi.org/10.1007/978-3-030-00794-2_48
https://doi.org/10.1007/978-3-030-00794-2_48