2024 年 28 巻 1 号 p. 192-199
情報系センターにおける業務の一つである問合わせ対応の効率化を目的に,問合わせデータを機械的にカテゴライズする方法を検討した.問合わせはメールで行われることが多いが,メールの本文には問合わせと無関係なノイズが多く含まれ,それらのノイズを前処理で削除するための工程が,自動的なカテゴライズを困難なものにしている.そこで本研究では,メールの件名が本文の要約であり,また短文であることからノイズが少ないという点に着目し,件名の活用方法について検討を行う.短文に含まれる単語情報を効果的に活用するため,文書の文脈を考慮することが可能な深層言語モデルBERTを用いて特徴抽出を行った.実際の問い合わせデータを対象に,抽出した特徴をクラスタリングし,人間のカテゴライズと比較した.その結果,件名を用いた分類は本文を用いた分類よりも意味としてまとまったクラスタを生成することが明らかになった.これにより,件名を活用することで,メール分析における前処理の課題を解決できる可能性が示唆された.