抄録
成功・失敗といった属性を持つ複数の文書集合があった場合、その要因を見つける差異分析はテキストマイニングの魅力的なアプリケーションである。従来は特定の文書集合に特徴的な表現を抽出し提示することによって知見を得る試みが行われており、コンタクトセンターにおけるコールログのような人手による概略から成る短いテキストデータでは有効であった。しかしながら、報告書のような一文書が長いデータの場合、抽出された特徴的な表現を知見に結びつけるには実際の原文を読まないと知見に結びつけるのが難しい。本研究では文脈を指し示す表現とその範囲を利用した分析手法を提案し、決算報告書を使った企業評価分析でその有効性を示す。