主催: 人工知能学会
会議名: 第102回言語・音声理解と対話処理研究会
回次: 102
開催地: 国立国語研究所 講堂
開催日: 2024/11/28 - 2024/11/29
p. 104-108
対話を行いながらユーザにアイテム推薦を行う推薦対話システムにおいて,対話とアイテムからどのように推薦に有用な情報を抽出し,結びつけるかは重要な課題である.先行研究ではLLMを用いて対話履歴から対話要約文を,アイテムの説明文からアイテム推薦文を生成することでそれぞれ情報を抽出し,スコア予測器に要約文と推薦文を入力してスコアを推定する手法を提案した.しかし先行研究では,対話要約文とアイテム推薦文が個別に生成されていたため,対話から得られるユーザの嗜好・経験とアイテムの関係を適切に結びつけることが難しく,適切な推薦を行うことが困難な場合があった.そこで本研究では,LLMをDPOによりファインチューニングすることで,対話履歴とアイテム説明文を相互に考慮した要約文と推薦文を生成する手法を提案する.