Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo
Autor: | Gómez Garzón, Nicolás David, Peña Castro, Néstor Harbey |
---|---|
Přispěvatelé: | Calderón Chávez, Juan Manuel, Universidad Santo Tomás |
Jazyk: | Spanish; Castilian |
Rok vydání: | 2022 |
Předmět: |
deep reinforcement learning
Repulsión Ingeniería Electrónica Leader-follower deep learning Pybullet aprendizaje por refuerzo profundo simulation repulsion enjambre trayectoria Deep Q networks drones Movimientos Coordinados swarm trajectory Métodos de simulación Algoritmos-Aprendizaje Simulación Software |
Popis: | EL presente trabajo de grado plantea un algoritmo de aprendizaje profundo basado en Q learning que permite a un grupo de agentes representar un movimiento de enjambre, específicamente leader follower implementando una repulsión entre agentes y evasión de obstáculos fijos. El modelo de aprendizaje incluye dos métodos para disminuir el riesgo de divergencia del algoritmo, el primero de ellos es la inclusión de una memoria de experiencias para el sistema y por otro lado el uso de una segunda . La convergencia del Algoritmo lograda en menos de 6000 episodios se verificó con ayuda de la librería MATPLOT para posteriormente ser implementando en el ambiente de simulación del software CoppeliaSim. La evaluación del sistema de implementación del modelo se realizó por medio de 6 experimentos, cada uno de ellos representando distintas situaciones de evasión de obstáculos y seguimiento de líder demostrando que el modelo entrenado cumple correctamente con lo esperado. This degree project proposes a deep learning algorithm based on Q learning that allows a group of agents to represent a swarm movement, specifically leader follower, implementing a repulsion between agents and evasion of fixed obstacles. The learning model includes two methods to reduce the risk of algorithm divergence, the first of which is the inclusion of a memory of experiences for the system and on the other hand the use of a second . The convergence of the Algorithm achieved in less than 6000 episodes was verified with the help of the MATPLOT library to later be implemented in the simulation environment of the Coppelia Sim software. The evaluation of the model implementation system was carried out through 6 experiments, each one of them representing different situations of obstacle avoidance and leader follow-up, demonstrating that the trained model correctly complies with what is expected. Ingeniero Electronico Pregrado |
Databáze: | OpenAIRE |
Externí odkaz: |