Survey of Conversational Behavior : Towards the Design of a Balanced Corpus of Conversational Japanese
Autor: | KOISO, Hanae, TSUCHIYA, Tomoyuki, WATANABE, Ryoko, YOKOMORI, Daisuke, AIZAWA, Masao, DEN, Yasuharu |
---|---|
Jazyk: | japonština |
Rok vydání: | 2016 |
Předmět: | |
Zdroj: | 国立国語研究所論集. (10):85-106 |
ISSN: | 2186-134X |
Popis: | 国立国語研究所 理論・構造研究系 九州大学 国立国語研究所 コーパス開発センター 非常勤研究員 国立国語研究所 時空間変異研究系 千葉大学 Department of Linguistic Theory and Structure, NINJAL Kyushu University Adjunct Researcher, Center for Corpus Development, NINJAL Department of Language Change and Variation, NINJAL Chiba University 本稿では,国立国語研究所共同研究プロジェクト「均衡性を考慮した大規模日本語会話コーパス構築に向けた基盤整備」(リーダー:小磯,2014年7月~2015年8月)の活動について報告する。本プロジェクトの目標は,21世紀初頭の日本語母語話者の多様な会話行動を納めた大規模な日本語日常会話コーパスの構築を目指し,その基盤整備として,(1)均衡性を考慮した会話コーパスの設計,(2)種々の日常場面での会話を収録するための方法論,(3)日常会話を適切・効率的に転記するための方法論の策定を進めることである。本稿ではこのうち(1)に焦点を当て,均衡性を考慮したコーパス設計案を策定するために実施した,一日の会話行動の種類と従事時間に関する調査について報告する。調査では,首都圏在住の成人約250人を対象に,起床から就寝までの間に行ったそれぞれの会話について,いつ,どこで,誰と,何をしながら,どのような種類の会話を,どのくらいの長さ行ったか,などを問う調査項目に回答してもらった。その結果,日常会話には以下の傾向が見られることが分かった。(1)雑談や用談・相談が多く,会議・会合や授業・レッスン・講演は少ない。(2)少人数・短時間の会話が多い。(3)自宅や職場・学校など,私的あるいは公的に主たる空間での会話が多い。(4)いくつかの調査項目の間には対応関係が見られる。これらの分析結果にもとづき,均衡性を考慮した日常会話コーパスの設計方針について議論する。 In this paper, we report on the activity of a preparatory project to build a large-scale corpus of conversational Japanese (NINJAL collaborative research project, 2014/7/1-2015/8/31). The overall aims of this project are: i) to establish a corpus design for collecting various kinds of everyday conversations in a balanced manner, ii) to develop a methodology of recording naturally occurring conversations, and iii) to create a transcription system suitable for effectively transcribing natural conversations. This report focuses on the first issue of establishing a corpus design. We first describe our survey of everyday conversational behavior, conducted with about 250 Japanese adults last year, in order to reveal how diverse our everyday conversational behavior is, and to build an empirical foundation for corpus design. The questionnaire included when, where, how long, with whom, and in what kind of activity informants were engaged in conversations. We found that ordinary conversations show the following tendencies: i) they mainly consist of chats, business talks, and consultations; ii) in general, the number of participants is small and the duration is short; iii) many conversations are conducted in private places such as homes, as well as in public places such as offices and schools; and iv) some questionnaire items are related to each other. Based on these results, we discuss how to design a balanced corpus of conversational Japanese. application/pdf |
Databáze: | OpenAIRE |
Externí odkaz: |