Uma medida de contribuição local para sequências de processos fora de regime permanente
Autor: | Silvio Alves de Souza |
---|---|
Jazyk: | portugalština |
Rok vydání: | 2015 |
Zdroj: | Biblioteca Digital de Teses e Dissertações da UFMGUniversidade Federal de Minas GeraisUFMG. |
Druh dokumentu: | Doctoral Thesis |
Popis: | In this work we let us consider a set with a finite number of sequences, discrete and continuous. The main goal in this work is to measure instantaneously the contribution of each sequence of this set to the marginal probability distribution of another, instantaneously, in the discrete case. In the continuous case, to measure the contribution of each transition density function of these sequences to the marginal transition function of another one instantaneously. In the discrete case let us consider categorical sequences generated by sources with the same alphabet. The contribution found is measured by the weight parameter of a special linear combination involving information of all sequences. The coefficients of this combination are denominated local contribution coefficients and represent how much each marginal probability distribution contributes to calculate of another. Therefore it is possible to know in real time how probable an outcome is based on the outcomes of all other sequences. The methodology proposed here extends the models given in Ching2002 and Ching2008 for Markov chains to Probabilistic Context Tree models. An algorithm to estimate the local contribution of each sequence to marginal distributions as time evolves is presented. Simulation results show that the estimated marginal distribution using the model is close to the true one. The proposed methodology is applied to a Historical Portuguese electronic corpus of texts written in Portuguese by authors born between 1380 and 1845 codified according to rhythmic features. In continuous case a methodology to measure the contribution of one sequence (time series) to another sequence using the marginal probability of the process is proposed. A set of sequences with continuous space state and discrete time with Markovian dependence structure on the past is considered. Such a measure is not a measure of (dis)similarity between time series, but a measure of contribution of one sequence towards another sequence. To this end, the cross marginal transition density function across continuous Markov chains is defined and a model that expresses the marginal transition density function of a determined chain as a linear combination of all the other marginal transition density functions is proposed. This contribution is measured by the weight parameter of a special linear combination involving information of all the other density functions. In this way the marginal transition density takes into account information of all other sequences. The coefficients of this combination are also denominated local contribution coefficients and represent how much each transition density function contributes to the calculation of the determined transition density function. As a result an algorithm to estimate the local contribution of each sequence of density functions is presented. In order to estimate the marginal density functions a kernel-based estimator is used. Simulations, considering 2 chains, are presented so as to check the sensitivity of the proposed model and an example using real data is given. Neste trabalho consideramos um conjunto com um número finito de sequências, tanto discreta quanto contínua. Nosso objetivo é medir instantaneamente a contribuição da distribuição de probabilidade marginal de cada sequência deste conjunto para o cálculo da distribuição de probabilidade marginal de outra sequência, instantaneamente, no caso discreto. No caso contínuo, o objetivo é medir a contribuição de cada função de densidade de transição de sequência deste conjunto para a função de transição marginal de outra, instantaneamente. No caso discreto consideramos sequências categóricas discretas geradas por fontes com o mesmo alfabeto. A contribuição encontrada é medida pelo peso de um parâmetro combinação linear especial envolvendo informações de todas as sequências. Os coeficientes desta combinação são denominados coeficientes de contribuição local e representam o quanto cada distribuição de probabilidade marginal contribui para o cálculo de determinada distribuição de probabilidade marginal. Por isso, é possível saber em tempo real como provável um resultado baseia-se nos resultados de todas as outras sequências. A metodologia aqui proposta estende os modelos constantes em Ching2002 e Ching2008 de cadeias de Markov para modelos de árvores probabilísticas de contextos. Um algoritmo para estimar a contribuição local de cada sequência de distribuições marginais evolui evoluíndo com tempo é apresentado. Os resultados das simulações mostram que a distribuição marginal estimada utilizando o modelo está perto da verdadeira. A metodologia proposta é aplicada a um corpus eletrônico Português histórico de textos escritos em Português por autores nascidos entre 1380 e 1845 codificada de acordo com características rítmicas. No caso contínuo, aplicamos a metodologia a um conjunto de seqüências com espaço de estado contínuo e em tempo discreto com estrutura de dependência Markoviana sobre o passado. Tal medida não é uma medida de (dis) similaridade entre séries temporais, mas uma medida da contribuição de uma seqüência para outra seqüência. Para isto, a função de densidade de transição marginal cruzada ao longo das sequências contínuas de Markov é definida e um modelo que exprime a função de densidade de transição marginal de uma determinada cadeia como uma combinação linear de todas as outras funções de densidade de transição marginal é proposto. Esta contribuição é medida pelo peso de um parâmetro combinação linear especial envolvendo informações de todas as outras funções de densidade. Desta forma, a densidade de transição marginal leva em conta as informações de todas as outras sequências. Os coeficientes desta combinação também são denominados coeficientes de contribuição local e representam o quanto cada função de densidade de transição contribui para o cálculo de determinada função de densidade de transição. Como resultado, um algoritmo para estimar a contribuição local de cada sequência de funções de densidade é apresentada. Para estimar as funções de densidade marginais um estimador baseado no kernel é usado. As simulações, considerando 2 cadeias, são apresentadas de modo a verificar a sensibilidade do modelo proposto e um exemplo usando dados reais também é apresentado. |
Databáze: | Networked Digital Library of Theses & Dissertations |
Externí odkaz: |