Resource allocation in multicarrier wireless networks with millimeter waves using reinforcement learning based on the Markovian model
Autor: | Carneiro, Daniel Porto Queiroz |
---|---|
Přispěvatelé: | Vieira, Flávio Henrique Teles, Cardoso, Alisson Assis, Soares, Anderson da Silva, Lemos, Rodrigo Pinto |
Jazyk: | portugalština |
Rok vydání: | 2022 |
Předmět: | |
Zdroj: | Biblioteca Digital de Teses e Dissertações da UFG Universidade Federal de Goiás (UFG) instacron:UFG |
Popis: | Nesta dissertação, apresenta-se algoritmos de alocação de recursos baseado em aprendizado por reforço para um sistema de comunicação multiportadora considerando múltiplos usuários e efeitos de multipercurso e perda média do percurso em uma transmissão assumindo ondas milimétricas. Para tal, propõe-se que o sistema de comunicação possa ser descrito por um modelo Markoviano representado pelos estados da fila nos buffers e estados dos canais. Para os algoritmo de alocação de recursos deste trabalho, são introduzidas funções de recompensa a serem utilizadas no algoritmo de aprendizado por reforço Q- learning. Os resultados obtidos nas simulações mostram que a aplicação dos algoritmos propostos de escalonamento de recursos provê, de forma geral, melhoria nos parâmetros de desempenho do sistema de comunicação considerado, como por exemplo, aumento de vazão e diminuição de perda de pacotes. Comparações com outros algoritmos apresentados na literatura são realizadas, mostrando também que o uso da função de recompensa proposta e modelo Markoviano considerado torna o escalonamento de usuários e o compartilhamento de recursos mais eficientes. Ainda, é apresentada uma solução para alocação de recursos e potência utilizando uma Deep Q-Network. A modelagem de estados propostos para rede DQN soluciona algumas limitações encontradas com a representação matricial dos estados e amplia os limites para o tamanho do buffer. In this dissertation, we present reinforcement learning-based resource allocation algorithms for a multicarrier communication system considering multiple users and the effects of multipath and average path loss in a transmission assuming millimeter waves. To this end, it is proposed that the communication system can be described by a Markovian model represented by queue states in buffers and channel states. For the resource allocation algorithms of this work, we introduce reward functions to be used in the reinforcement learning algorithm Q-learning. The results obtained in the simulations show that the application of the proposed algorithms for resource scheduling provides, in general, an improvement in the performance parameters of the considered communication system, such as, for example, increased throughput and decreased packet loss. Comparisons with other algorithms presented in the literature are carried out, also showing that the use of the proposed reward function and considered Markovian model makes the scheduling of users and the sharing of resources more efficient. Furthermore, a solution for resource and power allocation using a Deep Q-Network is presented. The modeling of states proposed for the DQN network covers some limitations encountered with the matrix representation of states and extends the limits for the size of the buffer. Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES |
Databáze: | OpenAIRE |
Externí odkaz: |