Genre and register in comparable corpora: An English/Spanish contrastive analysis

Autor:	Belén López Arroyo, Roda P. Roberts
Rok vydání:	2017
Předmět:	Register (sociolinguistics) Linguistics and Language traduction Social Sciences and Humanities translation studies Computer science comparable corpora 5505.10 Filología Representativeness heuristic Language and Linguistics Pragmática pragmatica genre Selection (linguistics) 0601 history and archaeology lenguajes de especialdiad Sampling frame 060201 languages & linguistics 5705.01 Lingüística Comparada 060101 anthropology Lenguas de especialidad pragmatique 06 humanities and the arts Lingüística de contraste corpus comparables Linguistics 5701.12 Traducción 0602 languages and literature langues de spécialité Language for specific purposes Sciences Humaines et Sociales pragmatics language for specific purposes género Contrastive analysis traducción
Zdroj:	UVaDOC. Repositorio Documental de la Universidad de Valladolid instname
Popis:	Producción Científica A multilingual comparable corpus is a corpus containing texts that are collected using the same sampling frame and similar balance and representativeness. According to McEnery and Xiao (2007: 20), presentingproportion, genre, domain, and time constitutes the main criteria when compiling a comparable corpus and these criteria must match in the different languages for the corpus to be considered comparable. The problem is that these criteria do not always guarantee that the different language subcorpora in a comparable corpus match. This study, which analyzes two comparable corpora compiled by the authors, shows that, even when the text selection criteria are refined, genre theory cannot always guarantee enough linguistic similarities between language for specific purposes (LSP) texts in different languages. Genre seems to suffice to establish a good comparable corpus for scientific abstracts. However, the comparable corpus of wine tasting notes is not truly comparable, since the English and Spanish texts differ in register. Un corpus comparable est un corpus multilingue qui contient des textes recueillis en utilisant les mêmes critères tout en reflétant un équilibre et une représentativité similaires. Selon McEnery and Xiao (2007 : 20), la proportion, le genre, le domaine et l’époque constituent les principaux critères de compilation d’un corpus comparable, et ces critères doivent correspondre dans les différentes langues pour que le corpus soit comparable. Malheureusement, ces critères n’assurent pas toujours le caractère comparable des corpus de langues différentes. Notre étude, qui analyse deux corpus comparables compilés par les auteurs, démontre que, même si on raffine les critères de sélection de textes, la théorie des genres ne garantit pas toujours assez de ressemblances linguistiques entre les textes de langues de spécialité dans les langues différentes. Le genre semble suffire pour établir un bon corpus comparable des résumés d’articles scientifiques. Cependant, le corpus comparable de fiches de dégustation de vin n’est pas vraiment comparable, surtout à cause des variations de registre. Los corpus comparables son corpus multilingües que se construyen usando los mismos criterios de compilación y representatividad. Como afirman McEnery y Xiao (2007: 20), los criterios principales a la hora de compilar un corpus comparable, deben ser proporcionalidad, género, campo de especialidad y año de publicación de las muestras; además, estos autores destacan que se tienen que aplicar estos criterios en las diferentes lenguas o en los diferentes subcorpus que integran el corpus comparable. Sin embargo, el uso de estos criterios no garantiza que los subcorpus de diferentes lenguas sean parejos en términos de comparación. El presente estudio, que analiza dos corpus comparables de dos lenguajes de especialidad diferentes, la enología y la medicina y compilados ad hoc, demuestra que, incluso aunque se definan minuciosamente los criterios de compilación, el uso del mismo género no es un criterio de comparación suficientemente válido en diferentes lenguas. El análisis de nuestro corpus demuestra que el concepto de género parece ser válido para establecer una comparación en el caso de los abstracts científicos, pero no ocurre lo mismo en el caso de las fichas de cata ya que los textos incluyen registros diferentes en inglés y en español. Ministerio de Educación y Ciencia (project FFI2013-42994-R) Junta de Castilla y León (project LE227413) Ministerio de Economía y Competitividad (project FFI2016-75672-R)
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=doi_dedup___::4d88b389d1ab36add86d03e5246a507a https://doi.org/10.7202/1040469ar Zobrazit plný text záznamu