Výsledky vyhledávání - "Nagasawa, Haruki"

Report

A Challenging Multimodal Video Summary: Simultaneously Extracting and Generating Keyframe-Caption Pairs from Video

Autor: Kudo, Keito, Nagasawa, Haruki, Suzuki, Jun, Shimizu, Nobuyuki

This paper proposes a practical multimodal video summarization task setting and a dataset to train and evaluate the task. The target task involves summarizing a given video into a predefined number of keyframe-caption pairs and displaying them in a l

Externí odkaz: http://arxiv.org/abs/2312.01575

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání