Výsledky vyhledávání - "Katta, Aarush"

Report

LAION-5B: An open large-scale dataset for training next generation image-text models

Autor: Schuhmann, Christoph, Beaumont, Romain, Vencu, Richard, Gordon, Cade, Wightman, Ross, Cherti, Mehdi, Coombes, Theo, Katta, Aarush, Mullis, Clayton, Wortsman, Mitchell, Schramowski, Patrick, Kundurthy, Srivatsa, Crowson, Katherine, Schmidt, Ludwig, Kaczmarczyk, Robert, Jitsev, Jenia

Groundbreaking language-vision architectures like CLIP and DALL-E proved the utility of training on large amounts of noisy image-text data, without relying on expensive accurate labels used in standard vision unimodal supervised learning. The resulti

Externí odkaz: http://arxiv.org/abs/2210.08402

Zobrazit plný text záznamu

Report

LAION-400M: Open Dataset of CLIP-Filtered 400 Million Image-Text Pairs

Autor: Schuhmann, Christoph, Vencu, Richard, Beaumont, Romain, Kaczmarczyk, Robert, Mullis, Clayton, Katta, Aarush, Coombes, Theo, Jitsev, Jenia, Komatsuzaki, Aran

Multi-modal language-vision models trained on hundreds of millions of image-text pairs (e.g. CLIP, DALL-E) gained a recent surge, showing remarkable capability to perform zero- or few-shot learning and transfer even in absence of per-sample labels on

Externí odkaz: http://arxiv.org/abs/2111.02114

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání