Building a Spoken Natural Conversation Corpus of the Okinawan Language for Documentation, Revitalization, Investigation, and Acquisition of Endangered Languages -Challenges and Prospects―

Jazyk: japonština
Rok vydání: 2022
Předmět:
Zdroj: 沖縄キリスト教学院大学論集 = Okinawa Christian Univesity Review. 19:1-10
ISSN: 1349-8479
Popis: 琉球諸語・沖縄語は、2009年、ユネスコにより消滅危機言語に指定され、保存・復興への取り組みが始まってきたが、自然会話の記録は見落とされてきた。自然会話データには、elicitation methodでは現れない言いさし、言い換え、よどみ、沈黙、間なども記される。それらを反映した自然会話コーパスを構築することができれば、従来の研究方式とは異なる文法記述の可能性や言語習得のための有効活用が期待できる。 本稿では、沖縄語の自然会話・簡易コーパス構築を目指し、その計画概要と進捗、そして直面している課題と展望をまとめた。主な課題としては、危機言語特有の課題ともいえる、堪能話者の協力確保、そして音声データを文字起こしする協力者確保の困難さを挙げた。主な展望としては、終助詞や接続詞・感嘆詞的用法、敬語、テンス・アスペクト、evidentialityなど様々な研究分野において自然会話であるからこそ抽出できる事例の一部を挙げ、今後の言語研究発展に貢献できる可能性を示した。Since the UNESCO Atlas of the World’s Languages in Danger included six Ryukyuan languages in 2009, various attempts at the revitalization of Okinawan language have been taken. However, the necessary effort in recording and documenting natural conversation has been largely overlooked by scholars. The data that comprise natural conversations appear as filler, hedging, and silence during the conversation which are difficult to extract from the elicitation method. Building a corpus that indicates such data should contribute to the more practical descriptions of grammar and language acquisition that usual methods have, so far, been unable to provide.The purposes of this paper are to offer a brief overview of the ongoing corpus building project of Okinawan language including a discussion of the unexpected challenges we are facing as well as the potentials the data, hitherto, appear to suggest. A major challenge has been the lack of human resources in terms of both fluent speakers and transcribers. Regarding the project’s potential to motivate future research was the discovery of various expressions (detectable only through observation of natural conversation) such as the use of final particles, conjunctions, exclamatory and honorific expressions, as well as possible key findings in the areas of tense, aspect evidentiality, etc.
Databáze: OpenAIRE