Zobrazeno 1 - 9
of 9
pro vyhledávání: '"Zhou, Yuanen"'
Cross-lingual image captioning is a challenging task that requires addressing both cross-lingual and cross-modal obstacles in multimedia analysis. The crucial issue in this task is to model the global and the local matching between the image and diff
Externí odkaz:
http://arxiv.org/abs/2307.09915
Most current image captioning models typically generate captions from left to right. This unidirectional property makes them can only leverage past context but not future context. Though recent refinement-based models can exploit both past and future
Externí odkaz:
http://arxiv.org/abs/2201.01984
Current state-of-the-art image captioning models adopt autoregressive decoders, \ie they generate each word by conditioning on previously generated words, which leads to heavy latency during inference. To tackle this issue, non-autoregressive image c
Externí odkaz:
http://arxiv.org/abs/2106.09436
Visual attention not only improves the performance of image captioners, but also serves as a visual interpretation to qualitatively measure the caption rationality and model transparency. Specifically, we expect that a captioner can fix its attentive
Externí odkaz:
http://arxiv.org/abs/2004.00390
Publikováno v:
ACM Transactions on Intelligent Systems & Technology; Dec2024, Vol. 15 Issue 6, p1-16, 16p
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
Multimedia Tools & Applications; May2021, Vol. 80 Issue 11, p16141-16152, 12p