End-of-Word Survey of Compound Words Representing Disease Names
Autor: | Kaoru, Sagara, Satoko, Takasaki, Kana, Tojo, Tzu-Hsuan, Ma, Makoto, Yamazaki |
---|---|
Jazyk: | japonština |
Rok vydání: | 2020 |
Předmět: | |
Zdroj: | 言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop. 5:151-156 |
Popis: | Seinan Jo Gakuin University Osaka University National Institute for Japanese Language and Linguistics 会議名: 言語資源活用ワークショップ2020, 開催地: オンライン, 会期: 2020年9月8日−9日, 主催: 国立国語研究所 コーパス開発センター 本研究では合成語の語末により病名の判別が可能か否かを確認するために合成語の語末調査を行った。具体的には、病名を表す合成語5,465 語について語末のunigram、bigram、trigram を調べた。加えて、筆者等が着手している電子カルテに記載された合成語を対象とした語構成要素解析で定めた語単位で、合成語を分割した場合に語末となる語構成要素の頻度を調べた。その結果、(1)右側主要部の規則による意味を用いた判別が可能なこと、(2)病名の末尾には「ヘモクロマトーシス」のようなカタカナ語があり、文字単位での判別より語単位の判別の方が適していることが分かった。また、意味ラベル「接尾語」が付与された語構成要素と、「病名」が付与された語構成要素の内「接尾語」を含まない要素を用いることで「病名」の機械的な判別が可能であることが示唆された。 |
Databáze: | OpenAIRE |
Externí odkaz: |