Výsledky vyhledávání

Report

AVESFormer: Efficient Transformer Design for Real-Time Audio-Visual Segmentation

Autor: Wang, Zili, Yang, Qi, Shi, Linsu, Yu, Jiazhong, Liang, Qinghua, Li, Fei, Xiang, Shiming

Recently, transformer-based models have demonstrated remarkable performance on audio-visual segmentation (AVS) tasks. However, their expensive computational cost makes real-time inference impractical. By characterizing attention maps of the network,

Externí odkaz: http://arxiv.org/abs/2408.01708

Zobrazit plný text záznamu

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Akademický článek

Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.

Vyhledávací nástroje:

Upřesnit hledání