Contributions à la représentation et à l'apprentissage de patrons d’hyperonymie basées sur les dépendances syntaxiques et la fouille de motifs séquentiels

Autor: Issa Alaa Aldine, Hamad
Přispěvatelé: Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT), Université de Bretagne Sud, Nicolas Béchet, Mounira Harzallah, Giuseppe Berio, Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique)
Jazyk: angličtina
Rok vydání: 2020
Předmět:
Zdroj: Artificial Intelligence [cs.AI]. Université de Bretagne Sud, 2020. English. ⟨NNT : 2020LORIS575⟩
Popis: Hypernym relation is a semantic relationship between a specific term and a generic term of it. Approaches to extract such relations from texts have gained a large interest due to the huge availability of textual resources and their key role in ontology building. These approaches are commonly divided into two types: pattern-based and distributional. Patterns seem quite more interesting than distributional for building ontology due to their ability in extracting explicit relations from texts and their good precision. Thus, we focus on patterns and we describe an approach for systematically improving pattern performances. The approach is based on the coupled usage of sequential pattern mining and a specific pattern representation using grammatical dependencies to learn hypernym and anti-hypernym patterns. The results confirm that our approach can learn patterns that outperform unsupervised approaches and a supervised pattern-based approach. However, while the best performances are achieved by some supervised distributional approaches using word embedding, patterns can extract distinct hypernym relationships. This confirms that both types of approaches are complementary. Additionally, further experiments also confirm that the proposed approach tends to learn generically valid patterns across various corpora.; L’hyperonymie est une relation sémantique entre un terme général et un terme spécifique. Les approches pour extraire de telles relations à partir des textes ont connu un regain d'intérêt en raison de la disponibilité d'une gamme de ressources textuelles ainsi que de leur rôle clé dans la construction de l'ontologie. Généralement, il existe deux types de ces approches : celles basées sur des patrons et celles distributionnelles. L'approche basée sur des patrons s'avère être plus intéressante que l’approche distributionnelle pour la construction de l’ontologie, ce qui est dû au fait que la première permet d'extraire de relations explicites à partir des textes avec une grande précision. Dans cette thèse, nous nous intéressons sur les patrons et nous introduisons une approche pour améliorer systématiquement les performances des patrons. Notre approche est basée sur le couplage d'une fouille des patrons séquentiels avec une représentation de patrons spécifique en utilisant les dépendances grammaticales pour l'apprentissage des patrons d'hyperonymie et d'anti-hyperonymie. Les résultats confirment que notre approche peut apprendre les patrons qui surpassent les approches non supervisées et une approche supervisée basée sur des patrons. Cependant, bien que les meilleures performances soient obtenues par certaines approches distributionnelles supervisées utilisant l'incorporation de mots, les patrons peuvent extraire de relations d'hyperonymie distinctes. Cela confirme que les deux types d'approches sont complémentaires. De plus, d'autres expériences confirment également que l'approche proposée tend à apprendre des patrons génériquement valides à travers divers corpora.
Databáze: OpenAIRE