情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
漢字の出現頻度特性を用いた日本語文献の機械処理
細野 公男原田 隆史梅田 茂樹諸橋 正幸後藤 智範守屋 智
著者情報
ジャーナル フリー

1986 年 29 巻 5 号 p. 410-420

詳細
抄録

文献情報を有効に活用するには, 個々の文献に対してキーワード, 分類コード等の情報を的確かつ迅速に付与する必要がある。この要件を達成する一つの手段として, キーワードの自動抽出, 文献の自動分類が考えられる。これらに関する研究の多くは, 文献中に出現する単語を手がかりにするものである。しかし, 筆者らは, 日本語文献の場合そのキーワードの多くが漢字もしくはカタカナ表現されることに注目し, 単語ではなく文献中に出現する漢字を手がかりに, これらの情報を自動付与するいくつかの方法を考案し, 実験を行ってきた。本稿はこれらの方法の特徴, 実験成果を紹介し, あわせてその残された問題点を明らかにする。

著者関連情報
© Japan Science and Technology Agency 1986
前の記事 次の記事
feedback
Top