抄録
近年,ユーザーレビューとして顧客の声がWebを通じて,テキスト形式で容易に収集可能になってきている.これに伴い,レビュー文のデータから知識を抽出し,自社製品やサービスの向上・改善に反映させるテキストマイニングに対するニーズが高まっている.この知識抽出においては,レビューの分布を低次元空間にマッピングして可視化することが有効である.テキストデータを単語頻度ベクトルなどとして,低次元空間への写像を求める際には,主成分分析やコレスポンデンス分析などが用いられるが,テキストデータが大規模疎で多クラスなうえに,非線形性や多重共線性を持つ状況下では多量の情報を切り捨てて表現することになってしまう.そこで,本研究では多くのテキストデータの可視化において高い成果を収めている自己組織化マップを用いてユーザレビュー文のテキストデータの分布を可視化する方法を提案する.本論文では,自己組織化マップをユーザレビューに応用する際に,大規模疎行列を小規模密行列に変換する方法として,確率的潜在意味解析を用いることを提案した.さらに,評価値の分布を各ノードに対応付ける計算方法を提案した.これにより,製品やレビュー文間の評価値の関係性を視覚的に把握することができることを,ECサイトにおけるレビュー文を用いて確認した.