Desing and consctruction of a mini-corpus from bilingual speech: structure and data collection
Autor: | Vuk, Andrea |
---|---|
Přispěvatelé: | Poropat Jeletić, Nada |
Jazyk: | italština |
Rok vydání: | 2019 |
Předmět: |
linguistica dei corpora del parlato
HUMANISTIC SCIENCES. Philology. Romance Studies speech corpus linguistics code switching bilingualism kodno preključivanje TalkBank CLAN HUMANISTIČKE ZNANOSTI. Filologija. Romanistika CHAT commutazione di codice bilinguismo Istra dvojezičnost Istria korpusna lingvistika govora |
Popis: | La presente tesi è incentrata sulla descrizione del processo metodologico di progettazione e costruzione di un piccolo corpus del parlato bilingue, onde poter condurre l’analisi funzionale della commutazione di codice (code-switching), pratica tipica dei discorsi bilingui informali. Le registrazioni raccolte sul campo sono state trascritte, codificate e segmentate utilizzando gli strumenti messi a disposizione dalla banca dati chiamata Talkbank. È stato condotto il processo di segmentazione in unità comunicative in base a criteri sintattici, usando il formato di trascrizione Codes for human analysis and trascription, comunemente chiamato CHAT. Inoltre, le trascrizioni sono state connesse ai corrispondenti file audio per garantire l’autenticità del materiale raccolto e rendere possibile l’applicazione di ulteriori analisi linguistiche grazie al software Computerised language analysis (CLAN). Il materiale raccolto verrà ulteriormente controllato ed elaborato ed entrerà a far parte del corpus che si sta costruendo nell'ambito del progetto scientifico internazionale intitolato Multilevel approach to discourse in language development (finanziato dalla Hrvatska zaklada za znanost). Il progetto, la cui durata prevista è quella di cinque anni (2018-2022), è svolto in collaborazione dalle seguenti istituzioni: Università degli Studi di Zagabria, Università degli Studi "Sorbonne" di Parigi, Università degli Studi di Vienna, Università degli Studi di Osijek, Università degli Studi ''Juraj Dobrila'' di Pola, Istituto per la Linguistica e la Lingua Croata. La responsabile del progetto è la professoressa Gordana Hržica dell'Università degli Studi di Zagabria. The present thesis focuses on the description of the methodological process of designing and construction of a small corpus of bilingual speech, in order to conduct a functional analysis of code switching, a typical practice of informal bilingual speeches. Field recordings were transcribed, coded and segmented using the tools provided by the database called Talkbank. The process of segmentation into communicative units was executed based on syntactic criteria, using the transcription format Codes for human analysis and transcription, commonly called CHAT. Furthermore, the transcripts have been connected to the corresponding audio files to guarantee the authenticity of the material collected and make possible the application of further linguistic analysis thanks to the Computerized language analysis (CLAN) software. The material collected will be further controlled and elaborated and will become part of the corpus that is being built within the international scientific project entitled Multilevel approach to discourse in language development (funded by the Hrvatska zaklada za znanost), whose expected duration is five years (2018-2022). The project is performed by a collaboration among the following institutions: University of Zagreb, "Sorbonne" University of Paris, University of Vienna, University of Osijek, "Juraj Dobrila" University of Pula, Institute for Linguistics and Croatian Language. The project leader is Professor Gordana Hržica from the University of Zagreb. Ovaj se rad fokusira na opisu metodološkoga procesa dizajniranja i konstrukcije maloga korpusa dvojezičnoga govora, kako bi se provela funkcionalna analiza kodnoga preključivanja (engl. code-switching), uobičajene prakse neformalnoga dvojezičnog diskursa. Zvučni zapisi prikupljeni tijekom terenskoga istraživanja transkribirani su, kodirani i segmentirani pomoću alata koje nudi baza podataka zvana Talkbank. Proces segmentacije u komunikacijske jedinice proveden je na temelju sintaktičkih kriterija, koristeći transkripcijski format Codes for human analysis and transcription, odnosno skraćenoga naziva CHAT. Nadalje, transkripti su povezani s odgovarajućim audio datotekama kako bi se zajamčila autentičnost prikupljenoga materijala i omogućila daljnja jezična analiza zahvaljujući softveru Computerised language analysis (CLAN). Materijal pohranjen u CLAN datotekama za svrhe ovoga rada bit će dodatno pregledan i obrađen te će postati dio korpusa koji se gradi u sklopu međunarodnoga znanstvenog projekta pod nazivom Multilevel approach to discourse in language development (financira ga Hrvatska zaklada za znanost), a čije je očekivano trajanje pet godina (2018.-2022.). Projekt se provodi kao suradnja sljedećih institucija: Sveučilište u Zagrebu (nositelj projekta), Sveučilište "Sorbonne" u Parizu, Sveučilište u Beču, Sveučilište u Osijeku, Sveučilište "Juraj Dobrila" u Puli, Institut za lingvistiku i hrvatski jezik. Voditeljica projekta je profesorica Gordana Hržica sa Sveučilišta u Zagrebu. |
Databáze: | OpenAIRE |
Externí odkaz: |