Zobrazeno 1 - 10
of 41
pro vyhledávání: '"Zhang, Lepeng"'
Temporal difference (TD) learning is a fundamental technique in reinforcement learning that updates value estimates for states or state-action pairs using a TD target. This target represents an improved estimate of the true value by incorporating bot
Externí odkaz:
http://arxiv.org/abs/2405.16522
Publikováno v:
In Engineering Structures 15 December 2022 273
Mechanical behavior of a novel steel–concrete joint in concrete-composited hybrid continuous bridges
Publikováno v:
In Structures February 2022 36:291-302
Publikováno v:
In Composite Structures 15 November 2021 276
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
Structural Engineering International; April 2024, Vol. 34 Issue: 2 p283-292, 10p
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.