抄録
従来のテキストマイニングで多く使われているベクトル空間法という手法では単語の出現頻度のみを考えていた.単語の出現位置を考慮し,その位置が近いほど類似度が高いという仮定にもとづいたファジィ近傍という手法が考案された.これにより文章構造や文脈をふまえた,より優れたテキスト解析ができると考えられる.さらに,ファジィ近傍にカーネル関数を用いることでユークリッド距離にもとづくデータ解析が可能となるため,様々なクラスタリング手法を適用することができる.本研究ではtwitterをはじめとしたテキストデータについて従来手法と比較した結果を考察し,ファジィ近傍の有用性を示す.