Enlargement of NDC metadata on the Book samples in the Balanced Corpus of Contemporary Written Japanese

Autor: Sachi, Kato, Nanami, Moriyama, Masayuki, Asahara
Jazyk: japonština
Rok vydání: 2019
Předmět:
Zdroj: 言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop. 4:155-160
Popis: National Institute for Japanese Language and Linguistics
Tsuda University / National Institute for Japanese Language and Linguistics
会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター
『現代日本語書き言葉均衡コーパス』の書籍サンプル(PB(出版)10,117サンプル・LB(図書館)10,551サンプル・OB(ベストセラー)1,390サンプル)に付与された日本十進分類法(NDC)分類記号の補助分類を拡張した。また、開発当時NDC分類記号が付与されていなかったサンプル(「分類なし」)などの見直しもあわせて行った。作業は、国立国会図書館のNDC情報を参照し、人手によって分類の確認と追加を進めた。本作業結果により、たとえば形式区分を利用し、ジャンルの分散する「随筆(-049)」「理論(-01)」「研究法(-07)」などのカテゴリでBCCWJサンプルを分類することが可能となった。このほか、時代情報や小項目が追加されたサンプルもあり、今まで以上に詳細な分類が可能となった。本発表では、情報付与作業の方法と基礎情報を報告し、分類例を示す。本作業結果データは「中納言」の検索結果として利用可能となる。
Databáze: OpenAIRE