日本ファジィ学会誌
Online ISSN : 2432-9932
Print ISSN : 0915-647X
ISSN-L : 0915-647X
テキスト情報を対象としたキーワード抽出と関連情報収集システム
片岡 充照今中 武水谷 研治若見 昇
著者情報
ジャーナル フリー

1997 年 9 巻 5 号 p. 710-717

詳細
抄録
近年、放送や通信の発展によって、一般ユーザに提供される情報の量が急増している。特にマルチメディア情報を扱えるようになってきた現代においても、インターネット、文字多重放送などではテキスト情報が内容の主要部分を占めている。テキスト情報の量が多くなれば、ユーザは大量の文章を読まなければならず、情報利用が非常に困難になる。このような状況においては、大量のテキスト情報から要点を抽出し、興味のある情報だけを選択的に取り出す情報要約・検索手法が求められる。この要求に対して、従来より、自然言語処理の分野において、いくつかの手法が提案されている。これらの手法では、文章の意味的側面まで捉えることができ、より高度な要約・検索が実現できる。しかしながら、形態素解析や文脈理解を行うために、類似語辞書、文法知識、意味辞書など、大規模な辞書的情報を必要とするため、固有名詞など新たな表現の出現に対して柔軟に対応できない。一方、これらの辞書的情報を用いずに、単語の出現頻度などから要約・検索を実現する手法がある。この手法は適用範囲が広く、固有名詞など新たな単語の出現に柔軟に対応できる反面、例えば、頻出単語が要約結果として単に提供されるなど、結果がユーザにとって分かりにくい。また、検索が単純なキーワード文字列の照合で行うため、要約・検索能力が低いといった問題がある。若者らは実用面から考えた適用範囲の広さに重点を置くために後者の立場をとり、大量の日本語テキスト情報からホットな話題を抽出して要約するシステムKEIFIS(Keyword Extract and Information FIltering System)を開発した。KEIFISでは、より高い要約・検索能力を実現する以下の特徴を持っている。(1)ホットな話題を特徴付ける関連単語を抽出し、関連単語を組み合せることにより要約結果を表現。(2)ユーザの興味ある情報を話題単位で検索し、新たな関連情報の到着を監視。また、KEIFISの実問題への適用例として、実際に放送されている文字多重放送のニュース番組に適用し、適切にホットな話題を抽出できることを確かめた。
著者関連情報
© 1997 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top