Zobrazeno 1 - 9
of 9
pro vyhledávání: '"Shustin, Boris"'
Training and fine-tuning large language models (LLMs) come with challenges related to memory and computational requirements due to the increasing size of the model weights and the optimizer states. Various techniques have been developed to tackle the
Externí odkaz:
http://arxiv.org/abs/2410.17881
Riemannian optimization is a principled framework for solving optimization problems where the desired optimum is constrained to a smooth manifold $\mathcal{M}$. Algorithms designed in this framework usually require some geometrical description of the
Externí odkaz:
http://arxiv.org/abs/2209.03269
Autor:
Shustin, Boris, Avron, Haim
Recent literature has advocated the use of randomized methods for accelerating the solution of various matrix problems arising throughout data science and computational science. One popular strategy for leveraging randomization is to use it as a way
Externí odkaz:
http://arxiv.org/abs/2106.12060
The Trust Region Subproblem is a fundamental optimization problem that takes a pivotal role in Trust Region Methods. However, the problem, and variants of it, also arise in quite a few other applications. In this article, we present a family of itera
Externí odkaz:
http://arxiv.org/abs/2010.07547
Autor:
Shustin, Boris, Avron, Haim
Optimization problems on the generalized Stiefel manifold (and products of it) are prevalent across science and engineering. For example, in computational science they arise in symmetric (generalized) eigenvalue problems, in nonlinear eigenvalue prob
Externí odkaz:
http://arxiv.org/abs/1902.01635
Autor:
Shustin, Boris, Avron, Haim
Publikováno v:
In Journal of Computational and Applied Mathematics 15 May 2023 423
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Kuznetsova Zinaida, Kuznetsov Aleksandr, Nagovitsyn Roman, Shustin Boris, Drandrov Gerold, Pyanzin Andrey, Gibadullin Ildus, Vrublevskiy Eugene, Gorelov Aleksandr
Publikováno v:
BIO Web of Conferences, Vol 26, p 00001 (2020)
Externí odkaz:
https://doaj.org/article/6be6dd00b71843e58494ac9fc1377c13
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.