Zobrazeno 1 - 3
of 3
pro vyhledávání: '"Li, Baoteng"'
The Controllable Image Captioning Agent (CapAgent) is an innovative system designed to bridge the gap between user simplicity and professional-level outputs in image captioning tasks. CapAgent automatically transforms user-provided simple instruction
Externí odkaz:
http://arxiv.org/abs/2412.11025
Autor:
Wang, Xinran, Zhang, Haiwen, Li, Baoteng, Liang, Kongming, Sun, Hao, He, Zhongjiang, Ma, Zhanyu, Guo, Jun
Object description plays an important role for visually impaired individuals to understand and compare the differences between objects. Recent multimodal large language models (MLLMs) exhibit powerful perceptual abilities and demonstrate impressive p
Externí odkaz:
http://arxiv.org/abs/2411.19106
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.