Zobrazeno 1 - 10
of 49
pro vyhledávání: '"Jin, Minho"'
Autor:
Cho, Yong Hyun1 (AUTHOR), Jin, Minho1 (AUTHOR), Jin, Huding2,3 (AUTHOR), Han, Junghyup3 (AUTHOR), Yu, Seungyeon3 (AUTHOR), Li, Lianghui3 (AUTHOR), Kim, Youn Sang1,2,3,4 (AUTHOR) younskim@snu.ac.kr
Publikováno v:
Advanced Science. 10/16/2024, Vol. 11 Issue 38, p1-9. 9p.
Publikováno v:
Proc. Interspeech, Sept. 2022, pp. 4800-4804
We address performance fairness for speaker verification using the adversarial reweighting (ARW) method. ARW is reformulated for speaker verification with metric learning, and shown to improve results across different subgroups of gender and national
Externí odkaz:
http://arxiv.org/abs/2207.07776
Autor:
C, Kishan K, Tan, Zhenning, Chen, Long, Jin, Minho, Han, Eunjung, Stolcke, Andreas, Lee, Chul
Publikováno v:
Proc. IEEE ICASSP, May 2022, pp. 7062-7066
Household speaker identification with few enrollment utterances is an important yet challenging problem, especially when household members share similar voice characteristics and room acoustics. A common embedding space learned from a large number of
Externí odkaz:
http://arxiv.org/abs/2202.12349
Publikováno v:
Proc. IEEE ICASSP, May 2022, pp. 7652-7656
This paper proposes a novel formulation of prototypical loss with mixup for speaker verification. Mixup is a simple yet efficient data augmentation technique that fabricates a weighted combination of random data point and label pairs for deep neural
Externí odkaz:
http://arxiv.org/abs/2202.10672
We present a two-stage framework for deep one-class classification. We first learn self-supervised representations from one-class data, and then build one-class classifiers on learned representations. The framework not only allows to learn better rep
Externí odkaz:
http://arxiv.org/abs/2011.02578
A Streaming On-Device End-to-End Model Surpassing Server-Side Conventional Model Quality and Latency
Autor:
Sainath, Tara N., He, Yanzhang, Li, Bo, Narayanan, Arun, Pang, Ruoming, Bruguier, Antoine, Chang, Shuo-yiin, Li, Wei, Alvarez, Raziel, Chen, Zhifeng, Chiu, Chung-Cheng, Garcia, David, Gruenstein, Alex, Hu, Ke, Jin, Minho, Kannan, Anjuli, Liang, Qiao, McGraw, Ian, Peyser, Cal, Prabhavalkar, Rohit, Pundak, Golan, Rybach, David, Shangguan, Yuan, Sheth, Yash, Strohman, Trevor, Visontai, Mirko, Wu, Yonghui, Zhang, Yu, Zhao, Ding
Thus far, end-to-end (E2E) models have not been shown to outperform state-of-the-art conventional models with respect to both quality, i.e., word error rate (WER), and latency, i.e., the time the hypothesis is finalized after the user stops speaking.
Externí odkaz:
http://arxiv.org/abs/2003.12710
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.