Japanese-English Cross Language Information Retrieval based on Comparable Corpora and Bilingual Dictionary
Autor: | Kai Ishikawa, Akitoshi Okumura, Kenji Satoh |
---|---|
Rok vydání: | 1998 |
Předmět: | |
Zdroj: | Journal of Natural Language Processing. 5:77-93 |
ISSN: | 2185-8314 1340-7619 |
Popis: | クロス言語検索手法GDMAXは, 日本語入力から英語ドキュメントの検索を可能にする. GDMAXは, 対訳辞書によって入力キュエリから翻訳キュエリ候補を生成し, キュエリからそれぞれの言語のコーパスにおけるキュエリタームの共起頻度を成分とすそ共起頻度ベクトルを生成する. 入力共起頻度ベクトルと翻訳共起頻度ベクトルとの距離によって, 翻訳キュエリ候補をランキングし, 上位の英語キュエリ集合を検索キュエリとする. この手法によって, 一つの対訳だけでなく適切な複数の訳語集合を英言語キュエリとして得ることができる. ウォールストリートジャーナルやAP通信など2ギガの英語ドキュメントについて適合率と再現率で評価したところ, 理想訳と比べて約62%の精度を得て, 対訳辞書のすべての訳語候補を用いる場合と比べて12%, 機械翻訳による訳語選択と比べて6%高い精度を得ることができた. |
Databáze: | OpenAIRE |
Externí odkaz: |