Výsledky vyhledávání - "Wan-Cyuan Fan"

IoU-Aware Multi-Expert Cascade Network Via Dynamic Ensemble for Long-Tailed Object Detection

Autor: Wan-Cyuan Fan, Cheng-Yao Hong, Yen-Chi Hsu, Tyng-Luh Liu

Publikováno v: ICASSP 2023 - 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP).

Externí odkaz: https://explore.openaire.eu/search/publication?articleId=doi_________::e2ccce42cffc6a50a1aade9a4bdd4ee6
https://doi.org/10.1109/icassp49357.2023.10095439

Zobrazit plný text záznamu

Cross-Modal Mutual Learning for Audio-Visual Speech Recognition and Manipulation

Autor: Chih-Chun Yang, Wan-Cyuan Fan, Cheng-Fu Yang, Yu-Chiang Frank Wang

Publikováno v: Proceedings of the AAAI Conference on Artificial Intelligence. 36:3036-3044

As a key characteristic in audio-visual speech recognition (AVSR), relating linguistic information observed across visual and audio data has been a challenge, benefiting not only audio/visual speech recognition (ASR/VSR) but also for manipulating dat

Externí odkaz: https://explore.openaire.eu/search/publication?articleId=doi_________::fc716e09a57483d5cc93ed2f657228b2
https://doi.org/10.1609/aaai.v36i3.20210

Zobrazit plný text záznamu

LayoutTransformer: Scene Layout Generation with Conceptual and Spatial Diversity

Autor: Fu-En Yang, Yu-Chiang Frank Wang, Cheng-Fu Yang, Wan-Cyuan Fan

Publikováno v: CVPR

When translating text inputs into layouts or images, existing works typically require explicit descriptions of each object in a scene, including their spatial information or the associated relationships. To better exploit the text input, so that impl

Externí odkaz: https://explore.openaire.eu/search/publication?articleId=doi_________::9d11da95c488c39f077f5228fa42ded9
https://doi.org/10.1109/cvpr46437.2021.00373

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání