ClInt: A bilingual Spanish-Catalan spoken corpus of clinical interviews

Autor: Vila Rigat, Marta, González Fuente, Santiago, Martí Antonin, M. Antònia, Llisterri, Joaquim, Machuca Ayuso, María Jesús
Přispěvatelé: Universitat de Barcelona
Předmět:
Zdroj: Recercat. Dipósit de la Recerca de Catalunya
instname
RUA. Repositorio Institucional de la Universidad de Alicante
Universidad de Alicante (UA)
Dipòsit Digital de la UB
Universidad de Barcelona
Popis: En este artículo se presenta ClInt (Clinical Interview), un corpus oral bilingüe español-catalán que contiene un total de 15 horas de entrevistas clínicas. Está formado por archivos sonoros alineados con transcripciones a varios niveles que comprenden información ortográfica, fonética y morfológica, además de codificación lingüística y extralingüística. Se trata de un recurso hasta el momento inexistente para estas lenguas que ofrece múltiples posibilidades de explotación desde una amplia variedad de disciplinas, tanto las vinculadas a la Lingüística como las que se relacionan con el Procesamiento del Lenguaje Natural. In this paper we present ClInt (Clinical Interview), a bilingual Spanish-Catalan spoken corpus that contains 15 hours of clinical interviews. It consists of audio files aligned with multiple-level transcriptions comprising orthographic, phonetic and morphological information, as well as linguistic and extralinguistic encoding. This is a previously non-existent resource for these languages and it offers a wide-ranging exploitation potential in a broad variety of disciplines such as Linguistics, Natural Language Processing and related fields. This work is supported by the FPU Grant AP2008-02185 from the Spanish Ministry of Education, and the Text-Knowledge 2.0 (TIN2009-13391-C04-04) and ClInt (FFI2009-06252-E/FILO) projects.
Databáze: OpenAIRE