Výsledky vyhledávání - "Ullegaddi, Prashant"

Report

Audio-visual training for improved grounding in video-text LLMs

Autor: Sagare, Shivprasad, S, Hemachandran, Sarabhai, Kinshuk, Ullegaddi, Prashant, SA, Rajeshkumar

Recent advances in multimodal LLMs, have led to several video-text models being proposed for critical video-related tasks. However, most of the previous works support visual input only, essentially muting the audio signal in the video. Few models tha

Externí odkaz: http://arxiv.org/abs/2407.15046

Zobrazit plný text záznamu

Conference

Learning to rank categories for web queries.

Autor: Ullegaddi, Prashant V., Varma, Vasudeva

Publikováno v: Proceedings of the 20th ACM International Conference: Information & Knowledge Management; Oct2011, p2065-2068, 4p

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání