人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
99回 (2023/12)
会議情報

Hagi bot: LLMを用いた対話状態追跡と人間らしい振る舞いで自然な議論を行うマルチモーダル対話システム
中野 雄斗野末 慎之介穀田 一真有山 知希佐藤 魁曾根 周作亀井 遼平謝 素春成田 風香守屋 彰二赤間 怜奈松林 優一郎坂口 慶祐
著者情報
会議録・要旨集 認証あり

p. 102-107

詳細
抄録

本稿では,対話システムライブコンペティション6に提出したシステムについて述べる.本システムは,応答生成機構とアバター制御機構を組み合わせたタスク指向型マルチモーダル対話システムである.応答生成機構では,対話履歴と話し合うべき議題を考慮しつつ,GPT-4を用いて発話内容と感情・動作ラベルを生成する.具体的には,スロットフィリングにより対話状態を監視し,状況に応じてプロンプトを変更し続けることで,自然な対話展開を実現している.アバター制御機構では,応答生成機構で生成された発話内容や感情・動作ラベルに応じた音声・表情・姿勢を,ラッセルの感情円環モデルなどを参考に著者らが事前に設計したルールに基づいて制御することで,人間らしい自然な振る舞いを実現する.これら2つの機構を組み合わせることで,対話の状況に応じた議論の展開と発話内容や感情に基づいた自然な話し方を実現した.本システムは予選一位で通過した.

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top