Autor: Cristina Restrepo-Arango, Andrés L. Cárdenas-Rozo
Jazyk: English<br />Spanish; Castilian<br />French<br />Portuguese
Rok vydání: 2022
Předmět:
Zdroj: Encontros Bibli, Vol 27, Iss 1 (2022)
Druh dokumentu: article
ISSN: 1518-2924
DOI: 10.5007/1518-2924.2022.e83470
Popis: Este trabalho aplica a análise textual a cinco artigos paleontológicos sobre fósseis colombianos, a fim de identificar a proximidade lexical em um corpus de textos. Este trabalho permitiu determinar: as categorias gramaticais, a proximidade entre categorias de palavras e variáveis ​​com a análise de especificidades (AE), o agrupamento das palavras com a análise da classificação hierárquica descendente (CJD) e a apresentação gráfica das palavras. Verificamos que o corpus documental é composto por 31.319 ocorrências de palavras, 1.450 formas ativas ou palavras específicas e 303 formas complementares ou palavras comuns. A categoria gramatical de substantivo predomina (24%) e palavras não reconhecidas no dicionário (17%). As palavras comuns com maior número de frequências são artigos, conjugações, proposições e pronomes. Constatou-se que existe uma proximidade lexical entre o artigo 1 e as formas ativas de “Colômbia” e o artigo 2 e as formas ativas de “fóssil”. As palavras foram agrupadas em cinco classes e a nuvem de palavras foi criada com 1271 palavras
Databáze: Directory of Open Access Journals