Výsledky vyhledávání - "Ocejo, Borja"

Report

A Precise Characterization of SGD Stability Using Loss Surface Geometry

Autor: Dexter, Gregory, Ocejo, Borja, Keerthi, Sathiya, Gupta, Aman, Acharya, Ayan, Khanna, Rajiv

Stochastic Gradient Descent (SGD) stands as a cornerstone optimization algorithm with proven real-world empirical successes but relatively limited theoretical understanding. Recent research has illuminated a key factor contributing to its practical e

Externí odkaz: http://arxiv.org/abs/2401.12332

Zobrazit plný text záznamu

Report

mSAM: Micro-Batch-Averaged Sharpness-Aware Minimization

Autor: Behdin, Kayhan, Song, Qingquan, Gupta, Aman, Keerthi, Sathiya, Acharya, Ayan, Ocejo, Borja, Dexter, Gregory, Khanna, Rajiv, Durfee, David, Mazumder, Rahul

Modern deep learning models are over-parameterized, where different optima can result in widely varying generalization performance. The Sharpness-Aware Minimization (SAM) technique modifies the fundamental loss function that steers gradient descent m

Externí odkaz: http://arxiv.org/abs/2302.09693

Zobrazit plný text záznamu

Vyhledávací nástroje:

Upřesnit hledání