ファジィ主成分分析に基づくロバストk-Meansによるテキスト文書の分類

本多 克宏; 松井 智宏; 野津 亮; 市橋 秀友

doi:10.14864/fss.25.0.147.0

抄録

テキスト文書の分類は電子メール自動選別や特許検索などの基盤技術として重要である．本研究では，ファジィ主成分分析に基づくロバストなk-Means法により，ノイズとみなされる文書の影響を除去しながら，関連性の強い文書からなる文書クラスターを抽出する．頻出単語のtf-idf値に基づくテキスト文書の数値化の後，ファジィ主成分分析の応用により文書間の結合行列を作成し，各文書の重要度（ノイズではない度合い）を考慮しながら行列の並べ替えを行うことで，クラスター構造を視覚的にとらえる．

著者関連情報

お気に入り & アラート

お気に入りに追加
追加情報アラート
被引用アラート
認証解除アラート

閲覧履歴

Controlling factors of the geographic difference in Siebold's beech (Fagus crenata Blume) forest vegetation between the Pacific Ocean side and the Sea of Japan side region
Study of Edge Plasma Characteristics at H-mode Transition in Heliotron J
3. Application for TV Program & Making Process
Studies on the Spectrochemical Analysis of Metal Samples by means of the Laser Microprobe (Part 1)

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）