Hacia una normalización de la frecuencia de los corpus CREA y CORDE

Autor:	Gerardo Eugenio Sierra Martínez, Claudio Molina Salinas
Rok vydání:	2015
Předmět:	Linguistics and Language estadística de corpus Literature and Literary Theory corpus CORDE y CREA Lingüística de corpus normalización de frecuencias de corpus Language and Linguistics Lengua y Literatura lingüística cuantitativa
Zdroj:	Revista signos v.48 n.89 2015 SciELO Chile CONICYT Chile instacron:CONICYT Universidad Nacional Autónoma de México UNAM Redalyc-UNAM Revista Signos (Chile) Num.89 Vol.48
ISSN:	0718-0934
Popis:	espanolEl Corpus Diacronico del Espanol (CORDE) y el Corpus de Referencia del Espanol Actual (CREA) integran uno de los bancos de datos documentales mas grande del espanol y son usados por especialistas en el estudio de la lengua espanola. Este recurso presenta algunas limitaciones en terminos de tamano, unidad de muestra y representatividad, que condicionan sus resultados y, por tanto, las descripciones de cualquier fenomeno linguistico estudiado. En el presente trabajo identificamos estas limitaciones y proponemos un metodo de normalizacion de frecuencias de documento, por medio del calculo de medias moviles. Esto permite una interpretacion mas realista de la lengua espanola, a traves de los datos del corpus, y un aprovechamiento mas efectivo del propio recurso EnglishCORDE (Corpus Diacronico del Espanol) and CREA (Corpus de Referencia del Espanol Actual) are two of the largest and most frequently used databases in the study of the Spanish language. However, they have some limitations in terms of size, sample unit and representativeness that may influence the results of studies and descriptions of linguistic phenomena. In this paper we identify these limitations and propose a method for the normalization of document frequencies by computing moving averages. We show how this method allows for a more realistic interpretation of corpus data and, thus, a more effective use of these resources
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=doi_dedup___::0a7df816b90f98533ae7c5ab0bc6ee12 https://doi.org/10.4067/s0718-09342015000300002 Zobrazit plný text záznamu