ClInt: A bilingual Spanish-Catalan spoken corpus of clinical interviews
Autor: | Vila Rigat, Marta, González Fuente, Santiago, Martí Antonin, M. Antònia, Llisterri, Joaquim, Machuca Ayuso, María Jesús |
---|---|
Přispěvatelé: | Universitat de Barcelona |
Předmět: |
Catalan language
Typology (Linguistics) Corpora (Linguistics) Corpus bilingüe Spanish language Computational linguistics Spoken corpus Castellà (Llengua) Corpus oral Corpus (Lingüística) Entrevista clínica Bilingual corpus Tipologia (Lingüística) Català Natural language processing (Computer science) Lenguajes y Sistemas Informáticos Lingüística computacional Clinical interview Tractament del llenguatge natural (Informàtica) |
Zdroj: | Recercat. Dipósit de la Recerca de Catalunya instname RUA. Repositorio Institucional de la Universidad de Alicante Universidad de Alicante (UA) Dipòsit Digital de la UB Universidad de Barcelona |
Popis: | En este artículo se presenta ClInt (Clinical Interview), un corpus oral bilingüe español-catalán que contiene un total de 15 horas de entrevistas clínicas. Está formado por archivos sonoros alineados con transcripciones a varios niveles que comprenden información ortográfica, fonética y morfológica, además de codificación lingüística y extralingüística. Se trata de un recurso hasta el momento inexistente para estas lenguas que ofrece múltiples posibilidades de explotación desde una amplia variedad de disciplinas, tanto las vinculadas a la Lingüística como las que se relacionan con el Procesamiento del Lenguaje Natural. In this paper we present ClInt (Clinical Interview), a bilingual Spanish-Catalan spoken corpus that contains 15 hours of clinical interviews. It consists of audio files aligned with multiple-level transcriptions comprising orthographic, phonetic and morphological information, as well as linguistic and extralinguistic encoding. This is a previously non-existent resource for these languages and it offers a wide-ranging exploitation potential in a broad variety of disciplines such as Linguistics, Natural Language Processing and related fields. This work is supported by the FPU Grant AP2008-02185 from the Spanish Ministry of Education, and the Text-Knowledge 2.0 (TIN2009-13391-C04-04) and ClInt (FFI2009-06252-E/FILO) projects. |
Databáze: | OpenAIRE |
Externí odkaz: |