Zobrazeno 1 - 2
of 2
pro vyhledávání: '"Haque, Naznin"'
Visual question answering (VQA) refers to the problem where, given an image and a natural language question about the image, a correct natural language answer has to be generated. A VQA model has to demonstrate both the visual understanding of the im
Externí odkaz:
http://arxiv.org/abs/2411.11150
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.