Les communautés dans les multigraphes de co-appartenance : Application aux listes Twitter

Autor: Benabdelkrim, Mohamed
Přispěvatelé: STAR, ABES
Jazyk: francouzština
Rok vydání: 2021
Předmět:
Popis: Graphs are mathematical tools for modelling relationships between entities. They are used in multiple scientific fields: in computer science for knowledge representation, in sociology for studying relationships between people, in chemistry for representing molecules and in many other fields. One specific type of relationships, that is of interest in this work, is the one that represents common membership of a set of entities to a set of groups. This relationship defines a multilayer network called the co-membership network where entities are represented by nodes and groups correspond to layers. Such relationship also has the property of transitivity which makes the layers of the co-membership network fully-connected. Moreover, in many cases, textual descriptions are associated to the groups and are represented in the co-membership network by layer attributes. The objective of this thesis if to develop community detection tools for co-membership networks using both the structural and semantic information they contain. The studied common membership relationship has various applications including the analysis of common attendancy of researchers to conferences and the representation of co-authorship of scientific publications. In social networks, this type of relationship is even more frequent and can be found in Twitter with common membership to lists. In this work, we give a formal definition of co-membership networks and underline the properties that distinguish them from the other multilayer networks. We present two algorithms for delimitting subgraphs that correspond to domains of interest of users. We also explain how to adapt data mining methods for the extraction of itemset and numeric patterns to the task of community detection in co-membership networks. Results are compared to those of state the art methods using two example networks from the social network Twitter and the collaborative encyclopedia Wikipedia.
Les graphes sont considérés comme l’outil mathématique de prédilection pour la modélisation d'une relation entre des paires d’entités. Ils peuvent être utilisés pour modéliser une relation de connaissance entre des personnes, ou encore une relation de similarité entre des mots. Parmi ces relations, celle de l’appartenance commune d’un ensemble d’entités à un ensemble de groupes permet de définir un multigraphe de co-appartenance. Dans ce multigraphe, les entités correspondent aux nœuds, les relations aux liens et les groupes aux couches. Par ailleurs, la relation d’appartenance commune étant transitive, les nœuds d’une même couche forment une clique. Et dans plusieurs cas, des descriptions textuelles sont associées aux groupes et sont représentées par des attributs associés aux couches dans le multigraphe de co-appartenance. L’objectif de cette thèse est de développer des outils de détection de communautés de noeuds homogènes dans les multigraphes de co-appartenance en utilisant les informations structurelle et sémantique qui y sont contenues. La relation d’appartenance commune à des groupes, que nous étudions, se retrouve dans plusieurs situations réelles comme, par exemple, la participation d’un ensemble de chercheurs à des conférences ou la rédaction commune par des auteurs d’un ensemble d’articles. Dans les réseaux sociaux, cette relation est encore plus courante et nous la retrouvons, entre autres, dans le réseau social Twitter avec l’appartenance commune des utilisateurs aux listes. Dans ce travail, nous définissons formellement les multigraphes de co-appartenance et soulignons les propriétés qui les distinguent des multigraphes classiques. Nous présentons deux algorithmes pour y délimiter des sous-graphes qui correspondent à des domaines d’intérêt pour l’analyste utilisateur de l’outil de détection de communautés. Nous expliquons, aussi, comment adapter certaines méthodes de fouille de données pour l’extraction de motifs symboliques et numériques à la détection de communautés dans les multigraphes de co-appartenance. Les résultats obtenus sont comparés à ceux des méthodes de l’état de l’art en utilisant des exemples de multigraphes de co-appartenance issus du réseau social Twitter et de la plateforme collaborative Wikipedia.
Databáze: OpenAIRE