日本ソフトウェア科学会大会講演論文集
Online ISSN : 1349-3515
ISSN-L : 0913-5391
日本ソフトウェア科学会第22回大会
セッションID: 4C-2
会議情報

WordNetからの共通概念抽出によるテキスト分類
*猪野 陽子松井 藤五郎大和田 勇人
著者情報
キーワード: 共通概念, 中頻度語
会議録・要旨集 フリー

詳細
抄録

テキスト分類において,WordNetというシソーラス辞書を用いた手法を提案し,その有効性を検証する.提案手法では,単語の言い換え表現に着目し,各テキストの特徴表現の際に使用する特徴語の抽出時に,高頻度語の言い換え表現としてテキスト中に存在する中頻度語を利用する.具体的には,テキスト中の高頻度語と,WordNet中に高頻度語と中頻度語をかけたときの共通概念を特徴語として使用することにより,分類精度の向上を実現する.

著者関連情報
© 2005 日本ソフトウェア科学会
前の記事 次の記事
feedback
Top