Zobrazeno 1 - 10
of 17
pro vyhledávání: '"V.V. Phansalkar"'
Autor:
V.V. Phansalkar, M.A.L. Thathachar
Publikováno v:
IEEE Transactions on Neural Networks. 6:398-406
A feedforward network composed of units of teams of parameterized learning automata is considered as a model of a reinforcement learning system. The internal state vector of each learning automaton is updated using an algorithm consisting of a gradie
Autor:
V.V. Phansalkar, M. A. L. Thathachar
Publikováno v:
IEEE Transactions on Systems, Man, and Cybernetics. 25:1459-1469
Learning algorithms for feedforward connectionist systems in a reinforcement learning environment are developed and analyzed in this paper. The connectionist system is made of units of groups of learning automata. The learning algorithm used is the L
Publikováno v:
Proceedings Mathematical Sciences. 104:279-294
This paper considers a multi-person discrete game with random payoffs. The distribution of the random payoff is unknown to the players and further none of the players know the strategies or the actual moves of other players. A class of absolutely exp
Autor:
V.V. Phansalkar, M.A.L. Thathachar
Publikováno v:
[Proceedings 1992] IJCNN International Joint Conference on Neural Networks.
A feedforward network composed of units of teams of parameterized learning automata is considered as a model of a reinforcement learning system. The parameters of each learning automaton are updated using an algorithm consisting of a gradient followi
Autor:
V.V. Phansalkar, P. S. Sastry
Publikováno v:
IEEE transactions on neural networks. 5(3)
In this letter, the back-propagation algorithm with the momentum term is analyzed. It is shown that all local minima of the sum of least squares error are stable. Other equilibrium points are unstable. >
Autor:
V.V. Phansalkar, M.A.L. Thathachar
Publikováno v:
[Proceedings] 1991 IEEE International Joint Conference on Neural Networks.
A model made of units of teams of learning automata is developed for the three layer pattern classifier. The algorithm is approximated by an ordinary differential equation (ODE), using weak convergence methods. The pattern recognition problem is pose
Publikováno v:
IndraStra Global.
Weak convergence methods are used to analyse generalized learning automata algorithms. The REINFORCE algorithm has been analysed. It is shown by an example that this algorithm can exhibit unbounded behaviour. A modification based on constrained optim
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.