Zobrazeno 1 - 7
of 7
pro vyhledávání: '"Gros, Timo"'
We propose an extension of the reinforcement learning architecture that enables moral decision-making of reinforcement learning agents based on normative reasons. Central to this approach is a reason-based shield generator yielding a moral shield tha
Externí odkaz:
http://arxiv.org/abs/2409.15014
Learning-based approaches for solving large sequential decision making problems have become popular in recent years. The resulting agents perform differently and their characteristics depend on those of the underlying learning approach. Here, we cons
Externí odkaz:
http://arxiv.org/abs/2008.00766
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Steinmetz, Marcel, Fišer, Daniel, Enişer, Hasan Ferit, Ferber, Patrick, Gros, Timo, Heim, Philippe, Höller, Daniel, Schuler, Xandra, Wüstholz, Valentin, Christakis, Maria, Hoffmann, Jörg
Publikováno v:
Proceedings of the Thirty-Second International Conference on Automated Planning and Scheduling
Testing is a promising way to gain trust in neural action policies π. Previous work on policy testing in sequential decision making targeted environment behavior leading to failure conditions. But if the failure is unavoidable given that behavior, t
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
International Journal on Software Tools for Technology Transfer; Jun2023, Vol. 25 Issue 3, p407-426, 20p