Zobrazeno 1 - 10
of 36
pro vyhledávání: '"Bellman optimality"'
Autor:
Mathukumalli Vidyasagar
Publikováno v:
SICE Journal of Control, Measurement, and System Integration, Vol 16, Iss 1, Pp 172-191 (2023)
In this paper, we present a brief survey of reinforcement learning, with particular emphasis on stochastic approximation (SA) as a unifying theme. The scope of the paper includes Markov reward processes, Markov decision processes, SA algorithms, and
Externí odkaz:
https://doaj.org/article/8e4ee9a0515949188c327645dab0c284
Publikováno v:
IEEE Access, Vol 10, Pp 134848-134869 (2022)
In order to meet the strong diversification of services that demand network flexibility that will be able to serve the dire need for transmission resources, network slicing was embraced as a plausible solution. Reinforcement learning (RL) has been ap
Externí odkaz:
https://doaj.org/article/705f2897970642dfbb5943f7fdbea919
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
Eastern-European Journal of Enterprise Technologies; Vol. 1 No. 4 (121) (2023): Mathematics and Cybernetics-applied aspects; 34-40
Eastern-European Journal of Enterprise Technologies; Том 1 № 4 (121) (2023): Математика та кібернетика-прикладні аспекти; 34-40
Eastern-European Journal of Enterprise Technologies; Том 1 № 4 (121) (2023): Математика та кібернетика-прикладні аспекти; 34-40
The object of this study is an approach to solving the problems of designing service-oriented networks that warn about emergencies using dynamic programming. The main issue is the complexity of algorithmization of processes that describe the achievem
The object of this study is an approach to solving the problems of designing service-oriented networks that warn about emergencies using dynamic programming. The main issue is the complexity of algorithmization of processes that describe the achievem
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_dedup___::cdd1bbd5822f861b237bf8d84d4dc121
https://zenodo.org/record/7733739
https://zenodo.org/record/7733739
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Chassaing, Philippe
Publikováno v:
The Annals of Applied Probability, 1993 Nov 01. 3(4), 1219-1240.
Externí odkaz:
https://www.jstor.org/stable/2245206