Structure learning and parameter estimation of probabilistic context neighborhoods

Autor: Débora de Freitas Magalhães
Přispěvatelé: Denise Duarte Scarpa Magalhães Alves, Aline Martines Piroutek, Marcos Oliveira Prates, Rodrigo Lambert, Caio Teodoro de Magalhães Alves
Jazyk: angličtina
Rok vydání: 2021
Předmět:
Zdroj: Repositório Institucional da UFMG
Universidade Federal de Minas Gerais (UFMG)
instacron:UFMG
Popis: CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior Probabilistic context trees offer a more efficient representation of the dependency of a Markov Chain, both in terms of the computational effort needed as well as its easy inter­pretability. This model has been extensively utilized and its properties have been studied by various authors. The present thesis aims to study an extension of the probabilistic context tree model to lattices in Z^2, called probabilistic context neighborhood (PCN) model, introduced by Piroutek (2013). The PCN model proposes a tree representation for the spatial dependency of a two­-dimensional Markov random field. It allows the sites of a region to depend on a variable neighborhood size, called context. This Markov random field variation is known in the literature as variable­-neighborhood random field and it drastically reduces the number of free parameters to be estimated. In the PCN model, the neighborhood geometry is set to frames which allows us to calculate the cardinality of contexts of a given tree. Therefore, unlike the work of Csiszár and Talata (2006a), an algorithm is proposed to select the optimal model based on the pseudo-­Bayesian information criterion (PIC). Our work seeks to validate the PCN algorithm through a simulation study. In addition, we exemplify the use of such methodology through a real­-world data application. The results presented here confirm the adequacy of the algorithm, and suggest that the quota for the maximum depth of the tree could be further improved. Furthermore, an empirical study of the estimated transition probabilities indicate adequate estimates. As árvores probabilísticas de contexto oferecem uma representação mais eficiente para a dependência de uma Cadeia de Markov, tanto do ponto de vista computacional como em sua fácil interpretação. Essas vantagens permitiram que esses modelos fossem amplamente utilizados e suas propriedades, estudadas. A presente dissertação busca estudar a extensão desse modelo para reticulados em Z 2 introduzida por Piroutek (2013) e denominada modelo de contexto de vizinhança probabilística, ou em inglês, probabilistic context neighborhood (PCN). O modelo PCN propõe uma representação em forma de árvore para a dependência espacial de um campo aleatório de Markov bidimimensional, permitindo que cada site dependa de uma vizinhança de tamanho variável, denominada contexto. Essa variação de campos aleatórios de Markov permite uma redução significativa dos parâmetros livres a serem estimados. No PCN, a estrutura de vizinhança é fixada em frames, diferentemente do trabalho feito em Csiszár e Talata (2006a), o que permite o cálculo da cardinalidade dos diferentes contextos de uma árvore e a proposta de um algoritmo que seleciona o melhor modelo baseado no critério PIC (pseudo­Bayesian information criterion). Nosso trabalho procura também validar o algoritmo PCN através de um estudo de simulações, além de exemplificar a aplicação do modelo para dados reais. Os resultados confirmam a adequação do algoritmo e sugerem que a cota do tamanho máximo da árvore permitida pode ser melhorada. Além disso, os resultados empíricos fornecem estimativas para as probabilidades de transição do processo
Databáze: OpenAIRE