Autor: |
André Luiz Carvalho Ottoni, Erivelton Geraldo Nepomuceno, Marcos Santos de Oliveira, Lara Toledo Cordeiro, Rubisson Duarte Lamperti |
Jazyk: |
English<br />Portuguese |
Rok vydání: |
2016 |
Předmět: |
|
Zdroj: |
Revista Brasileira de Computação Aplicada, Vol 8, Iss 2, Pp 44-59 (2016) |
Druh dokumentu: |
article |
ISSN: |
2176-6649 |
DOI: |
10.5335/rbca.v8i2.5249 |
Popis: |
Nos algoritmos de aprendizado por reforço, a taxa de aprendizado (alpha) e o fator de desconto (gamma) podem ser definidos entre qualquer valor no intervalo entre 0 e 1. Assim, adotando os conceitos de regressão logística, é proposta uma metodologia estatística para a análise da influência da variação de \alpha e \gamma nos algoritmos Q-learning e SARSA. Como estudo de caso, o aprendizado por reforço foi aplicado em experimentos de navegação autônoma. A análise de resultados mostrou que simples variações em \alpha e \gamma podem interferir diretamente no desempenho do aprendizado por reforço. |
Databáze: |
Directory of Open Access Journals |
Externí odkaz: |
|