抄録
文書集合を効率良く整理・検索する手法の一つとして検索結果をクラスタリングする手法がある.しかし,ユーザの望む分類でなければ見当違いのカテゴリを探してしまうため,効率的に目的の文書を探す事ができない.さらに,ユーザの望む分類を行う際,分類を行うユーザの目的・観点により分類結果が異なってしまう.特にマルチラベル文書と呼ばれるデータは複数のクラスに属し,クラス間の類似度が高い場合が多いため多少の観点の違いにより分類結果が変わり易い.そこで,文書分類例から観点を抽出し,その観点情報を行列分解による文書分類に反映させることでユーザの望む分類を目指す.本論文では抽出手法と分類手法を複数提案し比較検証する.