A Guideline on the Release of the Corpus of Everyday Japanese Conversation: From the Viewpoint of Legal and Ethical Issues

Autor: KOISO, Hanae, DEN, Yasuharu
Jazyk: japonština
Rok vydání: 2018
Zdroj: 国立国語研究所論集. (15):75-89
ISSN: 2186-134X
Popis: 国立国語研究所 研究系 音声言語研究領域
Spoken Language Division, Research Department, NINJAL
Chiba University
現在,国立国語研究所の機関拠点型基幹研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」で構築している『日本語日常会話コーパス』(CEJC)には,例えば自宅での家族との会話や飲食店での友人との会話,職場での同僚との打ち合せ,学校での同級生との雑談,散策時や車中の会話など,実に多様な場面の会話が含まれる。本コーパスは,音声データや転記テキストだけでなく,映像データについても公開する方針だが,こうした日常生活の中で記録された会話を,映像データも含めて公開したコーパスはこれまでにほとんど存在せず,データ公開のための方針を確立する必要がある。例えば,日常場面の会話を録画すると,映像データには公開の承諾を得ていない第三者の顔やテレビなどの著作物の写り込みが多く見られる。そこで,これまでに収録した多様な会話データをもとに具体的な問題を洗い出し,その対応について,肖像権や個人情報保護,著作権などの観点から,知財関連を専門とする弁護士と相談を重ねてきた。本稿では,これら一連の検討・議論を踏まえて定めたCEJC のデータ公開方針について報告する。
Under the NINJAL collaborative research project, we started the compilation of a large-scale corpus of everyday Japanese conversation, the Corpus of Everyday Japanese Conversation (CEJC). The CEJC targets various kinds of naturally occurring conversations in daily situations, such as conversations during eating with the family at home, meetings with colleagues at work, and conversations while driving. A notable characteristic of the CEJC is that both audio and video data are collected and published. However, as virtually no corpora have contained video recordings of everyday conversations, guidelines have to be established on the release of such data in light of the potential ethical and legal issues of showing the faces of non-consenting third parties or copyrighted content such as TV programs. Based on a variety of data collected thus far, we discussed with a lawyer specializing in copyright and portrait right issues how to deal with such ethical problems. In this paper, we report a guideline for the release of the CEJC that we have established based on this discussion.
Databáze: OpenAIRE