Autor: |
M. Cerqueira, L. Lopes, J. V. Fonseca |
Jazyk: |
English<br />Portuguese |
Rok vydání: |
2024 |
Předmět: |
|
Zdroj: |
Trends in Computational and Applied Mathematics, Vol 25, Iss 1 (2024) |
Druh dokumentu: |
article |
ISSN: |
2676-0029 |
DOI: |
10.5540/tcam.2024.025.e01686 |
Popis: |
Devido ao crescente desenvolvimento tecnol´ogico e `as consequentes aplicaç˜oes industriais, novos m´etodos para o projeto de controle e Aprendizado por Reforço tem sido desenvolvidas, n˜ao apenas para resolver novos problemas de controle, mas tamb´em para melhorar o desempenho de controladores j´a implementados em sistemas do mundo real. As abordagens de Aprendizagem por Reforc¸o e Regulador Quadr´atico Linear Discreto s˜ao conectadas por m´etodos de Programaç˜ao Dinˆamica Adaptativa. Esses paradigmas s˜ao orientados para o projeto de controladores ´otimos em sistemas multivari´aveis. Para o caso do Regulador Quadr´atico Linear Discreto, AD-HDP, Aprendizado por Reforc¸o, Pol´ıtica de Iterac¸ ˜ao e Valor de Iterac¸ ˜ao, um m´etodo e um algoritmo s˜ao desenvolvidos e implementados para projeto de controle online. Com base na seleção das matrizes de ponderac¸ ˜ao Q e R, tamb´em ´e apresentado um m´etodo para ajustar controladores reguladores lineares quadr´aticos discretos. Este m´etodo fornece diretrizes para a construção de heur´ısticas para a seleç˜ao de matrizes de ponderaç˜ao, aspectos de convergˆencia relacionados `as variaç˜oes das matrizes de ponderaç˜ao s˜ao investigados. Para um sistema dinˆamico multivari´avel de terceira ordem, o algoritmo proposto e a heur´ıstica de ajuste s˜ao avaliados pela capacidade de estabelecer a pol´ıtica de controle ´otima |
Databáze: |
Directory of Open Access Journals |
Externí odkaz: |
|