Extracting Absolute Spatial Entities from SMS : Comparing a Supervised and an Unsupervised Approach
Autor: | Lopez, Cédric, Zenasni, Sarah, Kergosien, Eric, Partalas, Ioannis, Roche, Mathieu, Teisseire, Maguelonne, Panckhurst, Rachel |
---|---|
Přispěvatelé: | Objet Direct [Grenoble], Territoires, Environnement, Télédétection et Information Spatiale (UMR TETIS), Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-AgroParisTech-Institut national de recherche en sciences et technologies pour l'environnement et l'agriculture (IRSTEA)-Centre National de la Recherche Scientifique (CNRS), Groupe d'Études et de Recherche Interdisciplinaire en Information et COmmunication - ULR 4073 (GERIICO ), Université de Lille, Aristotle University of Thessaloniki, Praxiling (Praxiling), Université Paul-Valéry - Montpellier 3 (UPVM)-Centre National de la Recherche Scientifique (CNRS), Groupe d'Études et de Recherche Interdisciplinaire en Information et COmmunication (GERiiCO) - EA 4073 (GERIICO ), Praxiling UMR 5267 (Praxiling), Université Paul-Valéry - Montpellier 3 (UM3)-Centre National de la Recherche Scientifique (CNRS), Institut national de recherche en sciences et technologies pour l'environnement et l'agriculture (IRSTEA)-AgroParisTech-Centre National de la Recherche Scientifique (CNRS)-Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad) |
Jazyk: | angličtina |
Rok vydání: | 2018 |
Předmět: |
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing
C10 - Enseignement C30 - Documentation et information U10 - Informatique mathématiques et statistiques ComputingMilieux_MISCELLANEOUS ACM: H.: Information Systems/H.3: INFORMATION STORAGE AND RETRIEVAL/H.3.1: Content Analysis and Indexing/H.3.1.3: Linguistic processing |
Zdroj: | CMC and Language, special issue in the Cahiers du Cental (UCL) CMC and Language, special issue in the Cahiers du Cental (UCL), 9, Presses universitaires de Louvain, pp.15-22, 2018, 978-2-87558-697-1. ⟨10.18167/DVN1/0ZGJRC⟩ Language and the new (instant) media CMC and Language, special issue in the Cahiers du Cental (UCL), In press, ⟨10.18167/DVN1/0ZGJRC⟩ |
DOI: | 10.18167/DVN1/0ZGJRC⟩ |
Popis: | More than one hundred thousand SMS messages are sent worldwide every second, and each SMS message is likely to contain lexical creativity. Recently, SMS content has been recognised to be of notable interest in many domains, such as e-commerce or psychiatry and more generally Health Informatics. But the automatic analysis of such data is difficult, particularly when dealing with information extraction. In this study, we will focus on “spatial entity recognition”, which consists of recognising countries, cities, places, bars, restaurants, cinemas, beaches, and so forth. For instance, Montpel, mtpl, mtp, and motpeliè all stand for the city of Montpellier. We will compare two different ways of tackling new forms of spatial entity recognition in SMS. |
Databáze: | OpenAIRE |
Externí odkaz: |