Compilation of the Monitor Version of\nthe Corpus of Everyday Japanese Conversation

Autor: Koiso, Hanae
Jazyk: japonština
Rok vydání: 2019
Předmět:
Zdroj: 計量国語学. 32(2):133-142
ISSN: 0453-4611
Popis: application/pdf
国立国語研究所
National Institute for Japanese Language and Linguistics
We have been constructing the Corpus of Everyday Japanese Conversation, CEJC, under the NINJAL collaborative research project since 2016. The main features of the CEJC are i) that we target conversations embedded in naturally occurring ctivities in daily life; ii) that we collect various kinds of everyday conversations in a balanced manner so as to capture the diversity of everyday conversations and to observe natural conversational behavior; and iii) that we collect and publish not only audio but also video data in order to precisely understand the mechanism of our real-life social behavior. Prior to the publication of the whole corpus scheduled for 2022, we published the monitor version of the CEJC in December 2018. In this article, we first outline the design of the monitor version of the CEJC. Then, we conduct a preliminary analysis, showing possible implications of the corpus.
国立国語研究所共同研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」では,『日本語日常会話コーパス』(CEJC)の構築を進めている.CEJC は,自宅での家族との会話や飲食店での友人との会話,職場での同僚との会合,散策時の会話など,日常生活における多様な場面の会話を,映像まで含めて収録・公開するものであり,世界的に見ても極めて新しい試みである.最終的には200時間規模のコーパスとして2021年度末に公開する予定であるが,コーパスの利用可能性や問題などを把握し今後の構築に活かすために,50 時間のデータについて2018 年12 月にモニター公開を開始した.本稿ではCEJC モニター公開版の設計・構成やそれを用いた研究の可能性について概説する.
Databáze: OpenAIRE