Combining word and entity embeddings for entity linking
Autor: | Romaric Besançon, Eva D'hondt, Sophie Rosset, Xavier Tannier, Anne-Laure Ligozat, Brigitte Grau, Romain Beaumont, Jose G. Moreno |
---|---|
Přispěvatelé: | Recherche d’Information et Synthèse d’Information (IRIT-IRIS), Institut de recherche en informatique de Toulouse (IRIT), Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées, Département Intelligence Ambiante et Systèmes Interactifs (DIASI), Laboratoire d'Intégration des Systèmes et des Technologies (LIST), Direction de Recherche Technologique (CEA) (DRT (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Direction de Recherche Technologique (CEA) (DRT (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay, Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur (LIMSI), Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), French National Agency for Research under the grant PULSAR-FUI-18 (PUrchasing Low Signals and Adaptive Recommendation - Fonds unique interministériel), Springer, Université Toulouse Capitole (UT Capitole), Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse - Jean Jaurès (UT2J), Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université de Toulouse (UT)-Toulouse Mind & Brain Institut (TMBI), Université Toulouse - Jean Jaurès (UT2J), Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université Toulouse Capitole (UT Capitole), Université de Toulouse (UT), Laboratoire d'Intégration des Systèmes et des Technologies (LIST (CEA)), ANR under the grant PULSAR-FUI-18 (PUrchasing Low Signals and Adaptive Recommendation - Fonds unique interministériel), Eva Blomqvist, Diana Maynard, Aldo Gangemi, Rinke Hoekstra, Pascal Hitzler, Olaf Hartig |
Jazyk: | angličtina |
Rok vydání: | 2017 |
Předmět: |
Computer science
business.industry Context (language use) 02 engineering and technology Entity Linking computer.software_genre [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL] Set (abstract data type) Entity linking Information extraction Identification (information) Knowledge base 020204 information systems Linked Data 0202 electrical engineering electronic engineering information engineering Selection (linguistics) 020201 artificial intelligence & image processing Weak entity Artificial intelligence business computer Natural language processing Natural Language Processing and Information Retrieval |
Zdroj: | ESWC 2017 proceedings 'The Semantic Web', Part I 14th Extended Semantic Web Conference-ESCW 2017 14th Extended Semantic Web Conference-ESCW 2017, Springer, Jan 2017, Portoroz, Slovenia. ⟨10.1007/978-3-319-58068-5_21⟩ The Semantic Web: 14th International Conference, ESWC 2017, Portorož, Slovenia, May 28 – June 1, 2017, Proceedings, Part I 14th Extended Semantic Web Conference-ESCW 2017, May 2017, Portorož, Slovenia. pp.337-352, ⟨10.1007/978-3-319-58068-5_21⟩ The Semantic Web ISBN: 9783319580678 ESWC (1) |
DOI: | 10.1007/978-3-319-58068-5_21⟩ |
Popis: | ISBN 978-3-319-58067-8; International audience; The correct identification of the link between an entity mention in a text and a known entity in a large knowledge base is important in information retrieval or information extraction. The general approach for this task is to generate, for a given mention, a set of candidate entities from the base and, in a second step, determine which is the best one. This paper proposes a novel method for the second step which is based on the joint learning of embeddings for the words in the text and the entities in the knowledge base. By learning these embeddings in the same space we arrive at a more conceptually grounded model that can be used for candidate selection based on the surrounding context. The relative improvement of this approach is experimentally validated on a recent benchmark corpus from the TAC-EDL 2015 evaluation campaign. |
Databáze: | OpenAIRE |
Externí odkaz: |