主催: 人工知能学会
会議名: 第99回言語・音声理解と対話処理研究会
回次: 99
開催地: 国立国語研究所 講堂 / オンライン
開催日: 2023/12/13 - 2023/12/14
p. 102-107
本稿では,対話システムライブコンペティション6に提出したシステムについて述べる.本システムは,応答生成機構とアバター制御機構を組み合わせたタスク指向型マルチモーダル対話システムである.応答生成機構では,対話履歴と話し合うべき議題を考慮しつつ,GPT-4を用いて発話内容と感情・動作ラベルを生成する.具体的には,スロットフィリングにより対話状態を監視し,状況に応じてプロンプトを変更し続けることで,自然な対話展開を実現している.アバター制御機構では,応答生成機構で生成された発話内容や感情・動作ラベルに応じた音声・表情・姿勢を,ラッセルの感情円環モデルなどを参考に著者らが事前に設計したルールに基づいて制御することで,人間らしい自然な振る舞いを実現する.これら2つの機構を組み合わせることで,対話の状況に応じた議論の展開と発話内容や感情に基づいた自然な話し方を実現した.本システムは予選一位で通過した.