日本経営工学会論文誌
Online ISSN : 2187-9079
Print ISSN : 1342-2618
ISSN-L : 1342-2618
カテゴリ間の単語頻度の差分を用いたテキストの自動分類
鈴木 誠
著者情報
ジャーナル フリー

2008 年 59 巻 4 号 p. 355-363

詳細
抄録

本研究では,前稿において"蓄積手法"という新たな分類手法を提案した.蓄積手法は,特徴語を限りなく利用することができるという特性を持っている.そこで本稿では,この性質を利用して,文字単位のN-gramや単語単位のN-gramを特徴語として用いることを提案する.そして,従来手法であるナイーブベイズ法と本提案手法を用いて,電子的な新聞記事"CD-毎日新聞2002"を分類させる実験を行った.その結果,本提案手法を用いた場合,88.7%という非常に高い分類性能を実現することができ,ナイーブベイズ法に比べて大幅に分類精度が向上することが確認できた.

著者関連情報
© 2008 公益社団法人 日本経営工学会
前の記事 次の記事
feedback
Top