An Attempt to Construct a Database of Word Co-occurrence Information using Opensource Software

Autor: Yasushi, Nakao, NARA SANGYO UNIVERSITY
Jazyk: japonština
Rok vydání: 2002
Zdroj: 奈良産業大学産業と経済 = Nara Sangyo University, the journal of industrial economics. 17(5):55-66
ISSN: 0915-9789
Popis: 文書を主たる対象とする検索システムには、検索者からいくつかの検索語を受け取り、システム側であらかじめ作成しておいたインデックスを利用して、その語を含む「情報」を検索結果として返すものが多い。このようなシステムでは、網羅性は高いが、検索者が求めていない不必要な情報までも大量に拾い出す傾向にあることが指摘されている。その欠点を補うためには、検索者に適切な検索語(索引語)を選択させたり、大量に返される情報から絞り込みを行えるような検索支援方法をシステム側で用意しておかねばならない。そのような検索支援方法の一つとして、検索者が入力した検索語と共によく使われている語の一覧を表示して、絞り込みを支援する方法が考えられている。本論文は、著名なオープンソースソフトウェア"Namazu"を用いて、そのような検索支援システムに必要な単語間の共出現頻度を計算し、データベース化する試みについて述べたものである。
Databáze: OpenAIRE