Genre and register in comparable corpora: An English/Spanish contrastive analysis

Autor: Belén López Arroyo, Roda P. Roberts
Rok vydání: 2017
Předmět:
Zdroj: UVaDOC. Repositorio Documental de la Universidad de Valladolid
instname
Popis: Producción Científica
A multilingual comparable corpus is a corpus containing texts that are collected using the same sampling frame and similar balance and representativeness. According to McEnery and Xiao (2007: 20), presentingproportion, genre, domain, and time constitutes the main criteria when compiling a comparable corpus and these criteria must match in the different languages for the corpus to be considered comparable. The problem is that these criteria do not always guarantee that the different language subcorpora in a comparable corpus match. This study, which analyzes two comparable corpora compiled by the authors, shows that, even when the text selection criteria are refined, genre theory cannot always guarantee enough linguistic similarities between language for specific purposes (LSP) texts in different languages. Genre seems to suffice to establish a good comparable corpus for scientific abstracts. However, the comparable corpus of wine tasting notes is not truly comparable, since the English and Spanish texts differ in register.
Un corpus comparable est un corpus multilingue qui contient des textes recueillis en utilisant les mêmes critères tout en reflétant un équilibre et une représentativité similaires. Selon McEnery and Xiao (2007 : 20), la proportion, le genre, le domaine et l’époque constituent les principaux critères de compilation d’un corpus comparable, et ces critères doivent correspondre dans les différentes langues pour que le corpus soit comparable. Malheureusement, ces critères n’assurent pas toujours le caractère comparable des corpus de langues différentes. Notre étude, qui analyse deux corpus comparables compilés par les auteurs, démontre que, même si on raffine les critères de sélection de textes, la théorie des genres ne garantit pas toujours assez de ressemblances linguistiques entre les textes de langues de spécialité dans les langues différentes. Le genre semble suffire pour établir un bon corpus comparable des résumés d’articles scientifiques. Cependant, le corpus comparable de fiches de dégustation de vin n’est pas vraiment comparable, surtout à cause des variations de registre.
Los corpus comparables son corpus multilingües que se construyen usando los mismos criterios de compilación y representatividad. Como afirman McEnery y Xiao (2007: 20), los criterios principales a la hora de compilar un corpus comparable, deben ser proporcionalidad, género, campo de especialidad y año de publicación de las muestras; además, estos autores destacan que se tienen que aplicar estos criterios en las diferentes lenguas o en los diferentes subcorpus que integran el corpus comparable. Sin embargo, el uso de estos criterios no garantiza que los subcorpus de diferentes lenguas sean parejos en términos de comparación. El presente estudio, que analiza dos corpus comparables de dos lenguajes de especialidad diferentes, la enología y la medicina y compilados ad hoc, demuestra que, incluso aunque se definan minuciosamente los criterios de compilación, el uso del mismo género no es un criterio de comparación suficientemente válido en diferentes lenguas. El análisis de nuestro corpus demuestra que el concepto de género parece ser válido para establecer una comparación en el caso de los abstracts científicos, pero no ocurre lo mismo en el caso de las fichas de cata ya que los textos incluyen registros diferentes en inglés y en español.
Ministerio de Educación y Ciencia (project FFI2013-42994-R)
Junta de Castilla y León (project LE227413)
Ministerio de Economía y Competitividad (project FFI2016-75672-R)
Databáze: OpenAIRE