Enlargement of NDC metadata on the Book samples in the Balanced Corpus of Contemporary Written Japanese
Autor: | Sachi, Kato, Nanami, Moriyama, Masayuki, Asahara |
---|---|
Jazyk: | japonština |
Rok vydání: | 2019 |
Předmět: | |
Zdroj: | 言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop. 4:155-160 |
Popis: | National Institute for Japanese Language and Linguistics Tsuda University / National Institute for Japanese Language and Linguistics 会議名: 言語資源活用ワークショップ2019, 開催地: 国立国語研究所, 会期: 2019年9月2日−4日, 主催: 国立国語研究所 コーパス開発センター 『現代日本語書き言葉均衡コーパス』の書籍サンプル(PB(出版)10,117サンプル・LB(図書館)10,551サンプル・OB(ベストセラー)1,390サンプル)に付与された日本十進分類法(NDC)分類記号の補助分類を拡張した。また、開発当時NDC分類記号が付与されていなかったサンプル(「分類なし」)などの見直しもあわせて行った。作業は、国立国会図書館のNDC情報を参照し、人手によって分類の確認と追加を進めた。本作業結果により、たとえば形式区分を利用し、ジャンルの分散する「随筆(-049)」「理論(-01)」「研究法(-07)」などのカテゴリでBCCWJサンプルを分類することが可能となった。このほか、時代情報や小項目が追加されたサンプルもあり、今まで以上に詳細な分類が可能となった。本発表では、情報付与作業の方法と基礎情報を報告し、分類例を示す。本作業結果データは「中納言」の検索結果として利用可能となる。 |
Databáze: | OpenAIRE |
Externí odkaz: |