自然言語処理
論文
文書分類のための Negation Naive Bayes
古宮 嘉那子伊藤 裕佑佐藤 直人小谷 善行
著者情報
ジャーナル フリー

20 巻 (2013) 2 号 p. 161-182

詳細
PDFをダウンロード (536K) 発行機関連絡先
抄録

本論文は,文書分類のための新手法として,Negation Naive Bayes (NNB) を提案する.NNB は,クラスの補集合を用いるという点では Complement Naive Bayes (CNB) と等しいが,Naive Bayes (NB) と同じ事後確率最大化の式から導出されるため, 事前確率を数学的に正しく考慮している点で異なっている.NNB の有効性を示すため,オークションの商品分類の実験とニュースグループの文書分類の実験を行った.ニュースグループの文書分類では,一文書あたりの単語数(トークン数)を減らした実験と,クラスごとの文書数を不均一にした実験を行い,NNB の性質を考察した.NB,CNB,サポートベクターマシン (SVM) と比較したところ,特に一文書当たりの単語数が減り,クラスごとの文書数が偏る場合において,NNB が他の Bayesian アプローチより勝る手法であること,また,時には SVM を有意に上回り,比較手法中で最も良い分類正解率を示す手法であることが分かった.

著者関連情報
© 2013 言語処理学会
前の記事 次の記事

閲覧履歴
feedback
Top