Methodology for identifying study sites in scientific corpus

Autor: Kergosien, Eric, Bessagnet, Marie-No��lle, Teisseire, Maguelonne, Sch��pfel, Joachim, Farvardin, Mohammad Amin, Chaudiron, St��phane, Jacquemin, Bernard, Parc-Lacayrelle, Annig Le, Roche, Mathieu, Sallaberry, Christian, Tonneau, Jean-Philippe, Bessagnet, Marie-Noelle, Farvardin, Amin, Lacayrelle, Annig
Přispěvatelé: Groupe d'Études et de Recherche Interdisciplinaire en Information et COmmunication - ULR 4073 (GERIICO ), Université de Lille, Laboratoire Informatique de l'Université de Pau et des Pays de l'Adour (LIUPPA), Université de Pau et des Pays de l'Adour (UPPA), Territoires, Environnement, Télédétection et Information Spatiale (UMR TETIS), Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-AgroParisTech-Institut national de recherche en sciences et technologies pour l'environnement et l'agriculture (IRSTEA)-Centre National de la Recherche Scientifique (CNRS), Laboratoire d'analyse et modélisation de systèmes pour l'aide à la décision (LAMSADE), Centre National de la Recherche Scientifique (CNRS)-Université Paris Dauphine-PSL, Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL), Université Paris Dauphine-PSL, Université Paris sciences et lettres (PSL)-Université Paris sciences et lettres (PSL)-Centre National de la Recherche Scientifique (CNRS), Groupe d'Études et de Recherche Interdisciplinaire en Information et COmmunication (GERiiCO) - EA 4073 (GERIICO ), Institut national de recherche en sciences et technologies pour l'environnement et l'agriculture (IRSTEA)-Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-AgroParisTech-Centre National de la Recherche Scientifique (CNRS), Université Paris Dauphine-PSL-Centre National de la Recherche Scientifique (CNRS)
Jazyk: angličtina
Rok vydání: 2018
Předmět:
Zdroj: Document Numérique
Document Numérique, Lavoisier, 2017, 20 (2-3), pp.11-30. ⟨10.3166/dn.2017.00011⟩
Revue des Sciences et Technologies de l'Information-Série Document Numérique
Revue des Sciences et Technologies de l'Information-Série Document Numérique, Lavoisier, 2017, 20 (2-3), pp.11-30. ⟨10.3166/dn.2017.00011⟩
ISSN: 1279-5127
1963-1014
DOI: 10.3166/dn.2017.00011⟩
Popis: International audience; The TERRE-ISTEX project aims at identifying the evolution of research working relation to study areas, disciplinary crossings and concrete research methods based on the heterogeneous digital content available in scientific corpora. The project is divided into three main actions: (1) to identify the periods and places which have been the subject of empirical studies, and which reflect the publications resulting from the corpus analyzed, (2) to identify the thematics addressed in these works and (3) to develop a web-based geographical information retrieval tool (GIR). The first two actions involve approaches combining Natural languages processing patterns with text mining methods. By crossing the three dimensions (spatial, thematic and temporal) in a GIR engine, it will be possible to understand what research has been carried out on which territories and at what time. In the project, the experiments are carried out on a heterogeneous corpus including electronic thesis and scientific articles from the ISTEX digital libraries and the CIRAD research center.; Le projet interdisciplinaire TERRE-ISTEX a pour objectif d'identifier l'évolution des fronts de recherche en relation avec les territoires d'études, les croisements disciplinaires ainsi que les modalités concrètes de recherche à partir des contenus numériques hétérogènes disponibles dans les corpus scientifiques. Le projet se décompose en trois actions principales~: (1) identifier les périodes et les lieux qui ont fait l'objet d'études empiriques et dont rendent compte les publications issues des corpus analysés, (2) identifier les thématiques traitées dans le cadre de ces études et enfin (3) développer un démonstrateur Web de recherche d'information géographique (RIG). Les deux premières actions font intervenir des approches combinant des patrons du traitement automatique du langage naturel à des méthodes de fouille de textes. En croisant les trois dimensions (spatial, thématique et temporel) dans un moteur de RIG, il sera ainsi possible de comprendre quelles recherches ont été menées sur quels territoires et à quel moment. Dans le cadre du projet, les expérimentations sont menées sur un corpus hétérogène constitué de thèses électroniques et d'articles scientifiques provenant des bibliothèques numériques d'ISTEX et du centre de recherche CIRAD.
Databáze: OpenAIRE