Deep reinforcement learning algorithms in multi agent changing environments using potential fields
Autor: | Lo Anguera, Joan |
---|---|
Přispěvatelé: | Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Lázaro Villa, José Antonio |
Jazyk: | angličtina |
Rok vydání: | 2022 |
Předmět: |
Intelligent agents (Computer software)
Artificial intelligence MATLAB PPO Aprendizaje Profundo Intel·ligència artificial SAC Deep learning Aprendizaje Profundo por Refuerzo Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] Reinforcement Learning DDPG ntel·ligència artificial Agents intel·ligents (Programari) Aprenentatge automàtic Informàtica::Intel·ligència artificial [Àrees temàtiques de la UPC] TD3 |
Popis: | Se propone el desarrollo de sistemas y algoritmos de aprendizaje reforzado profundo para entornos de vehículos autónomos. Para ello se propone inicialmente realizar una búsqueda bibliográfica sobre el uso de esta técnica de aprendizaje reforzado profundo para aplicaciones futuras de vehículos autónomos. Otro elemento básico de este proyecto será el desarrollo de herramientas de aprendizaje reforzado profundo, para mejorar en lo posible, la capacidad de aprendizaje del vehículo, la capacidad de adaptación a un entorno cambiante, y su capacidad final de decidir y realizar u The project explores the possibilities offered by reinforcement learning in the field of robotics with the vision of guiding robots in changing environments with collision avoidance through potential fields. For this, the DDPG, TD3, SAC and PPO reinforcement learning algorithms are implemented through the Matlab Toolbox "Reinforcement Learning" with the aim of carrying out a comparative study on which of them is the most optimal for different configurations of environments and parameters, with the help of training graphs and statistical tables. Also, potential fields have been developed in this project, demonstrating to be a suitable tool for guiding robots in changing environments, and even to implement multi agent scenarios, avoiding collisions among them and enhancing collaboration. El projecte explora les possibilitats que ofereix l'aprenentatge per reforç en l'àmbit de la robòtica amb la visió de guiar robots a través d'entorns canviants amb evitació de col·lisions mitjançant camps de potencials. Per això s'implementen els algorismes d'aprenentatge per reforç DDPG, TD3, SAC i PPO per mitjà de la Toolbox de Matlab Reinforcement Learning amb l'objectiu de fer un estudi comparatiu sobre quin d'ells és el més òptim per a diferents configuracions d'entorns i paràmetres; tot això amb l'ajuda de gràfiques d'entrenament i taules estadístiques. Així mateix, s'han desenvolupat camps potencials en aquest projecte, demostrant ser una eina adequada per a guiar robots en entorns canviants, i fins i tot per implementar escenaris multiagent, evitant col·lisions entre ells i potenciant la col·laboració. El proyecto explora las posibilidades que ofrece el aprendizaje por refuerzo en el ámbito de la robótica con la visión de guiar a robots a través de entornos cambiantes con evitación de colisiones mediante campos potenciales. Para ello se implementan los algoritmos de aprendizaje por refuerzo DDPG, TD3, SAC y PPO por intermedio de la Toolbox de Matlab "Reinforcement Learning" con el objetivo de realizar un estudio comparativo sobre cuál de ellos es el más óptimo para diferentes configuraciones de entornos y parámetros; todo ello con la ayuda de gráficas de entrenamiento y tablas estadísticas. Además, en este proyecto se han desarrollado campos potenciales, demostrando ser una herramienta adecuada para guiar robots en entornos cambiantes, e incluso implementar escenarios multiagente, evitando colisiones entre ellos y potenciando la colaboración. |
Databáze: | OpenAIRE |
Externí odkaz: |