Výsledky vyhledávání - "Ha, Cuong Nhat"

Report

Fusion of Domain-Adapted Vision and Language Models for Medical Visual Question Answering

Autor: Ha, Cuong Nhat, Asaadi, Shima, Karn, Sanjeev Kumar, Farri, Oladimeji, Heimann, Tobias, Runkler, Thomas

Vision-language models, while effective in general domains and showing strong performance in diverse multi-modal applications like visual question-answering (VQA), struggle to maintain the same level of effectiveness in more specialized domains, e.g.

Externí odkaz: http://arxiv.org/abs/2404.16192

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání