Sintonia QR do Regulador Linear Quadrático LQR Discreto e Programação Dinâmica Aproximada baseada em Ação-Estado para Aplicações Online do Projeto de Sistemas de Controle Ótimo

Autor: M. Cerqueira, L. Lopes, J. V. Fonseca
Jazyk: English<br />Portuguese
Rok vydání: 2024
Předmět:
Zdroj: Trends in Computational and Applied Mathematics, Vol 25, Iss 1 (2024)
Druh dokumentu: article
ISSN: 2676-0029
DOI: 10.5540/tcam.2024.025.e01686
Popis: Devido ao crescente desenvolvimento tecnol´ogico e `as consequentes aplicaç˜oes industriais, novos m´etodos para o projeto de controle e Aprendizado por Reforço tem sido desenvolvidas, n˜ao apenas para resolver novos problemas de controle, mas tamb´em para melhorar o desempenho de controladores j´a implementados em sistemas do mundo real. As abordagens de Aprendizagem por Reforc¸o e Regulador Quadr´atico Linear Discreto s˜ao conectadas por m´etodos de Programaç˜ao Dinˆamica Adaptativa. Esses paradigmas s˜ao orientados para o projeto de controladores ´otimos em sistemas multivari´aveis. Para o caso do Regulador Quadr´atico Linear Discreto, AD-HDP, Aprendizado por Reforc¸o, Pol´ıtica de Iterac¸ ˜ao e Valor de Iterac¸ ˜ao, um m´etodo e um algoritmo s˜ao desenvolvidos e implementados para projeto de controle online. Com base na seleção das matrizes de ponderac¸ ˜ao Q e R, tamb´em ´e apresentado um m´etodo para ajustar controladores reguladores lineares quadr´aticos discretos. Este m´etodo fornece diretrizes para a construção de heur´ısticas para a seleç˜ao de matrizes de ponderaç˜ao, aspectos de convergˆencia relacionados `as variaç˜oes das matrizes de ponderaç˜ao s˜ao investigados. Para um sistema dinˆamico multivari´avel de terceira ordem, o algoritmo proposto e a heur´ıstica de ajuste s˜ao avaliados pela capacidade de estabelecer a pol´ıtica de controle ´otima
Databáze: Directory of Open Access Journals