Extracting Absolute Spatial Entities from SMS : Comparing a Supervised and an Unsupervised Approach

Autor: Lopez, Cédric, Zenasni, Sarah, Kergosien, Eric, Partalas, Ioannis, Roche, Mathieu, Teisseire, Maguelonne, Panckhurst, Rachel
Přispěvatelé: Objet Direct [Grenoble], Territoires, Environnement, Télédétection et Information Spatiale (UMR TETIS), Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-AgroParisTech-Institut national de recherche en sciences et technologies pour l'environnement et l'agriculture (IRSTEA)-Centre National de la Recherche Scientifique (CNRS), Groupe d'Études et de Recherche Interdisciplinaire en Information et COmmunication - ULR 4073 (GERIICO ), Université de Lille, Aristotle University of Thessaloniki, Praxiling (Praxiling), Université Paul-Valéry - Montpellier 3 (UPVM)-Centre National de la Recherche Scientifique (CNRS), Groupe d'Études et de Recherche Interdisciplinaire en Information et COmmunication (GERiiCO) - EA 4073 (GERIICO ), Praxiling UMR 5267 (Praxiling), Université Paul-Valéry - Montpellier 3 (UM3)-Centre National de la Recherche Scientifique (CNRS), Institut national de recherche en sciences et technologies pour l'environnement et l'agriculture (IRSTEA)-AgroParisTech-Centre National de la Recherche Scientifique (CNRS)-Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)
Jazyk: angličtina
Rok vydání: 2018
Předmět:
Zdroj: CMC and Language, special issue in the Cahiers du Cental (UCL)
CMC and Language, special issue in the Cahiers du Cental (UCL), 9, Presses universitaires de Louvain, pp.15-22, 2018, 978-2-87558-697-1. ⟨10.18167/DVN1/0ZGJRC⟩
Language and the new (instant) media
CMC and Language, special issue in the Cahiers du Cental (UCL), In press, ⟨10.18167/DVN1/0ZGJRC⟩
DOI: 10.18167/DVN1/0ZGJRC⟩
Popis: More than one hundred thousand SMS messages are sent worldwide every second, and each SMS message is likely to contain lexical creativity. Recently, SMS content has been recognised to be of notable interest in many domains, such as e-commerce or psychiatry and more generally Health Informatics. But the automatic analysis of such data is difficult, particularly when dealing with information extraction. In this study, we will focus on “spatial entity recognition”, which consists of recognising countries, cities, places, bars, restaurants, cinemas, beaches, and so forth. For instance, Montpel, mtpl, mtp, and motpeliè all stand for the city of Montpellier. We will compare two different ways of tackling new forms of spatial entity recognition in SMS.
Databáze: OpenAIRE