A Quantitative Study on Separation of High Frequency Words Obtained as Vocabulary Survey Results

Autor: Ishii, Masahiko
Jazyk: japonština
Rok vydání: 2020
Předmět:
Zdroj: 現代日本語研究. 12:54-73
Popis: 大規模な語彙調査を行うと,得られた語彙は少数の高頻度語と大多数の低頻度語とに分離することが知られている。高頻度語は基本語彙の候補となることから更なる分離が追求され,主に語の「使用範囲」を利用した基本語彙の抽出が試みられてきた。ただし,使用範囲は,その統計量としての性質上,より精度の高い分離の指標としては十分でない。本稿では,語の使用量の層間変動を新たな指標とし,その大きさを「対数化特化係数散布度」によって測定する方法を提案して,高頻度語がどのように分離されるかを検討する。結果として,現代新聞の(内容による層別を施した)語彙調査を行って得た高頻度上位約100語について,対数化特化係数散布度の小さい方から概ね骨組み語→叙述語→テーマ語の順に分布(分離)する傾向を見出し,その有効性を確認した。
Databáze: OpenAIRE