O Processamento de Linguagem Natural nos Estudos Métricos da Informação: uma análise dos artigos indexados pela Web of Science (2000- 2019)

Autor: Puerta-Diaz, Mirelys [UNESP], Mira, Bianca Savegnago de [UNESP], Martinez-Avila, Daniel, Ovalle-Perandones, Maria-Antonia, Cabrini Gracio, Maria Claudia [UNESP]
Přispěvatelé: Universidade Estadual Paulista (Unesp), Univ Carlos III Madrid, Univ Complutense Madrid
Jazyk: portugalština
Rok vydání: 2021
Předmět:
Zdroj: Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; Vol. 26 (2021): Encontros Bibli "25 years giving voice to Science"; 01-24
Encontros Bibli: revista electrónica de bibliotecología y ciencias de la información.; Vol. 26 (2021): Encontros Bibli "25 años dando voz a la ciencia"; 01-24
Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação; v. 26 (2021): A Encontros Bibli "25 anos dando voz à Ciência"; 01-24
Encontros Bibli
Universidade Federal de Santa Catarina (UFSC)
instacron:UFSC
Web of Science
Repositório Institucional da UNESP
Universidade Estadual Paulista (UNESP)
instacron:UNESP
ISSN: 1518-2924
Popis: Objective: To identify the international scientific structure of the research on the use of natural language processing in the information metric studies area. Methods: It follows qualitative and quantitative approaches of the information metric studies and the knowledge organization domain. The data was retrieved on 02/02/2020 from the Web of Science Core Collection using the expression "natural language processing", limited to the document types articles and reviews, the category Information Science Library Science, and the timespan of the last 20 complete years (from 2000 to 2019). A Social Networks Analysis was conducted for the visualization of the scientific collaboration, co-citation, and keywords co-occurrence networks. Results: Out of the 552 documents retrieved, 31 papers were identified in the information metric studies area. Bibliometric indicators of production, relationship, and impact were considered in the study and showed an increase of publications in the last three years, being 2018 the most productive year. Conclusions: The international scientific literature on the application of NLP in information metric studies is emerging. Scientometrics was identified as the source that achieved a greatest impact. Finally, the k-core of the co-citation analysis shows the existence of an important theoretical core, often cited in the international academic community. The set of NLP techniques (e.., bag of words, tokenization, word stemming, part-of-speech tagging, and SVM) allows the researcher to go beyond the traditional citation analysis and focus on content and context of the citations. Objetivo: Identificar a estrutura científica internacional das pesquisas que vinculam o uso do Processamento de linguagem natural no campo dos estudos métricos da informação. Método: A pesquisa é baseada em uma perspectiva qualiquantitativa própria dos estudos métricos da informação no domínio da organização do conhecimento. A coleta de dados foi realizada em 02/02/2020 no recurso Web of Science Core Collection com a expressão "natural language processing", na categoria artigos e revisão, refinada pelas Categorias da Web of Science Information Science Library Science e limitada à janela temporal dos últimos 20 anos completos (período de 2000 a 2019). A Análise de Redes Sociais é utilizada como método de pesquisa para examinar e visualizar a rede de colaboração científica, de cocitação e de coocorrência de palavras-chave. Resultados: Dos 552 documentos recuperados, após a análise dos resumos, observou-se que 31 estavam inseridos no campo dos estudos métricos. A literatura científica mostra um crescente aumento das publicações nos últimos três anos, com 2018 sendo o ano mais produtivo. Conclusões: Considerando que o conjunto de técnicas de PLN (ex. bag of words, tokenization, word stemming, part-of-speech tagging e SVM) vem permitindo ao pesquisador ir além da análise de citação tradicional, para uma análise mais voltada ao conteúdo e contexto da citação, a literatura científica internacional sobre a aplicação do PLN nos estudos métricos da informação tem se mostrado emergente. A revista Scientometrics configura o meio de disseminação dos trabalhos que alcançaram maior impacto. Finalizando, a análise de cocitação k-core mostra a existência de um importante núcleo teórico, frequentemente citado na comunidade acadêmica internacional.
Databáze: OpenAIRE