Výsledky vyhledávání - "Kauffman, Derik"

Report

REBUS: A Robust Evaluation Benchmark of Understanding Symbols

Autor: Gritsevskiy, Andrew, Panickssery, Arjun, Kirtland, Aaron, Kauffman, Derik, Gundlach, Hans, Gritsevskaya, Irina, Cavanagh, Joe, Chiang, Jonathan, La Roux, Lydia, Hung, Michelle

We propose a new benchmark evaluating the performance of multimodal large language models on rebus puzzles. The dataset covers 333 original examples of image-based wordplay, cluing 13 categories such as movies, composers, major cities, and food. To a

Externí odkaz: http://arxiv.org/abs/2401.05604

Zobrazit plný text záznamu

Report

Inverse Scaling: When Bigger Isn't Better

Publikováno v: Transactions on Machine Learning Research (TMLR), 10/2023, https://openreview.net/forum?id=DwgRm72GQF

Work on scaling laws has found that large language models (LMs) show predictable improvements to overall loss with increased scale (model size, training data, and compute). Here, we present evidence for the claim that LMs may show inverse scaling, or

Externí odkaz: http://arxiv.org/abs/2306.09479

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání