Generación de Movimientos Coordinados de Enjambre en Múltiples Drones a través de Algoritmos de Aprendizaje Profundo

Autor:	Gómez Garzón, Nicolás David, Peña Castro, Néstor Harbey
Přispěvatelé:	Calderón Chávez, Juan Manuel, Universidad Santo Tomás
Jazyk:	Spanish; Castilian
Rok vydání:	2022
Předmět:	deep reinforcement learning Repulsión Ingeniería Electrónica Leader-follower deep learning Pybullet aprendizaje por refuerzo profundo simulation repulsion enjambre trayectoria Deep Q networks drones Movimientos Coordinados swarm trajectory Métodos de simulación Algoritmos-Aprendizaje Simulación Software
Popis:	EL presente trabajo de grado plantea un algoritmo de aprendizaje profundo basado en Q learning que permite a un grupo de agentes representar un movimiento de enjambre, específicamente leader follower implementando una repulsión entre agentes y evasión de obstáculos fijos. El modelo de aprendizaje incluye dos métodos para disminuir el riesgo de divergencia del algoritmo, el primero de ellos es la inclusión de una memoria de experiencias para el sistema y por otro lado el uso de una segunda . La convergencia del Algoritmo lograda en menos de 6000 episodios se verificó con ayuda de la librería MATPLOT para posteriormente ser implementando en el ambiente de simulación del software CoppeliaSim. La evaluación del sistema de implementación del modelo se realizó por medio de 6 experimentos, cada uno de ellos representando distintas situaciones de evasión de obstáculos y seguimiento de líder demostrando que el modelo entrenado cumple correctamente con lo esperado. This degree project proposes a deep learning algorithm based on Q learning that allows a group of agents to represent a swarm movement, specifically leader follower, implementing a repulsion between agents and evasion of fixed obstacles. The learning model includes two methods to reduce the risk of algorithm divergence, the first of which is the inclusion of a memory of experiences for the system and on the other hand the use of a second . The convergence of the Algorithm achieved in less than 6000 episodes was verified with the help of the MATPLOT library to later be implemented in the simulation environment of the Coppelia Sim software. The evaluation of the model implementation system was carried out through 6 experiments, each one of them representing different situations of obstacle avoidance and leader follow-up, demonstrating that the trained model correctly complies with what is expected. Ingeniero Electronico Pregrado
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=od______3896::76a7b83fa13f10f2b35b96324d731456 https://hdl.handle.net/11634/46788 Zobrazit plný text záznamu