一般的な質問応答システムでは,ユーザから与えられた質問を解析し,情報源となる文書集合から,質問に対する適切な回答を検索するモデル(回答文書検索モデル)を構築することで回答候補を抽出し,回答の自動化を実現している.
コミュニティQAサイト(cQAサイト)における質問・回答文書に対して,回答文書検索モデルを構築する場合,基本的な手法として質問文書の類似度による手法が考えられる.しかし,cQAサイトで見られるような,質問ごとに存在する回答文書の多様性を的確に掴みながら,適切な内容の回答文書を提示することは困難であると考えられる.そこで本研究では,トピックモデルの代表的な手法であるLatent Dirichlet Allocation(LDA)を用いることで,従来手法では対応できなかった回答文書の多様性を考慮可能な回答文書検索モデルの構築手法を提案する.最後に,提案モデルの有効性を検証するため,実際にcQAサイトに投稿された質問・回答文書を用いた検証実験を行い,検索結果の性能を評価するとともに,得られた結果に基づいて考察を行う.
抄録全体を表示