自動生成した学習データを用いた文書分類器に基づく FAQ 検索システム

牧野 拓哉; 野呂 智哉; 岩倉 友哉

doi:10.5715/jnlp.24.117

抄録

本論文では，ユーザからの自然文による問い合わせを対応する Frequently Asked Question (FAQ) に分類する文書分類器を用いた FAQ 検索手法を提案する．本文書分類器は，問い合わせ中の単語を手掛かりに，対応する FAQ を判別する．しかし，FAQ の多くは冗長性がないため，FAQ を学習データとして文書分類器を作成する方法では，ユーザからの多様な問い合わせに対応するのが難しい．そこで，この問題に対処するために，蓄積されたユーザからの問い合わせ履歴から学習データを自動生成し，文書分類器を作成する．さらに，FAQ および文書分類用に自動生成した学習データを用いて，通常使われる表層的な手がかりに加えて，本文書分類器の出力を考慮するランキングモデルを学習する．ある企業のコールセンターの 4,738 件の FAQ および問い合わせ履歴 54 万件を用いて本手法を評価した．その結果，提案手法が，pseudo-relevance feedback および，統計的機械翻訳のアライメント手法を用いて得られる語彙知識によるクエリ拡張手法と比較し，高いランキング性能を示した．

著者関連情報

Licensed under CC BY 4.0
https://creativecommons.org/licenses/by/4.0/

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）