Stochastics blockmodels, classifications and applications
Autor: | El Haj, Abir |
---|---|
Přispěvatelé: | Laboratoire de Mathématiques et Applications (LMA-Poitiers), Université de Poitiers-Centre National de la Recherche Scientifique (CNRS), Université de Poitiers, Université Libanaise, Yousri Slaoui, Zaher Khraibani, Pierre-Yves Louis |
Jazyk: | angličtina |
Rok vydání: | 2019 |
Předmět: |
Text mining
Inférence variationnelle EEG data Variational bayesian inference Modèle à blocs stochastiques binomial Weighted networks Réseaux pondérés [MATH.MATH-CV]Mathematics [math]/Complex Variables [math.CV] Données EEG Classification [INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation Clustering Binomial stochastic blockmodel Stochastic blockmodel with attributed weighted nodes Fouille de texte Modèle à blocs stochastiques avec des noeuds pondérés attribués Inférence bayésienne variationnelle Variational inference |
Zdroj: | Modeling and Simulation. Université de Poitiers; Université Libanaise, 2019. English. ⟨NNT : 2019POIT2300⟩ |
Popis: | This PhD thesis focuses on the analysis of weighted networks, where each edge is associated to a weight representing its strength. We introduce an extension of the binary stochastic block model (SBM), called binomial stochastic block model (bSBM). This question is motivated by the study of co-citation networks in a context of text mining where data is represented by a graph. Nodes are words and each edge joining two words is weighted by the number of documents included in the corpus simultaneously citing this pair of words. We develop an inference method based on a variational maximization algorithm (VEM) to estimate the parameters of the modelas well as to classify the words of the network. Then, we adopt a method based on maximizing an integrated classification likelihood (ICL) criterion to select the optimal model and the number of clusters. Otherwise, we develop a variational approach to analyze the given network. Then we compare the two approaches. Applications based on real data are adopted to show the effectiveness of the two methods as well as to compare them. Finally, we develop a SBM model with several attributes to deal with node-weighted networks. We motivate this approach by an application that aims at the development of a tool to help the specification of different cognitive treatments performed by the brain during the preparation of the writing.; Cette thèse de doctorat porte sur l’analyse de réseaux pondérés, graphes finis où chaque arête est associée à un poids représentant l’intensité de sa force. Nous introduisons une extension du modèle à blocs stochastiques (SBM) binaire, appelée modèle à blocs stochastiques binomial (bSBM). Cette question est motivée par l’étude des réseaux de co-citations dans un contexte de fouille de textes où les données sont représentées par un graphe. Les noeuds sont des mots et chaque arête joignant deux mots est pondérée par le nombre de documents inclus dans le corpus citant simultanément cette paire de mots. Nous développons une méthode d’inférence basée sur l’algorithme espérance maximisation variationnel (EMV) pour estimer les paramètres du modèle proposé ainsi que pour classifier les mots du réseau. Puis nous adoptons une méthode qui repose sur la maximisation d’un critère ICL (en anglais integrated classification likelihood) pour sélectionner le modèle optimal et le nombre de clusters. D’autre part, nous développons une approche variationnelle pour traiter le réseau et nous comparons les deux approches. Des applications à des données réelles sont adoptées pour montrer l’efficacité des deux méthodes ainsi que pour les comparer. Enfin, nous développons un SBM avec plusieurs attributs pour traiter les réseaux ayant des poids associés aux noeuds. Nous motivons cette méthode par une application qui vise au développement d’un outil d’aide à la spécification de différents traitements cognitifs réalisés par le cerveau lors de la préparation à l’écriture. |
Databáze: | OpenAIRE |
Externí odkaz: |