主催: 人工知能学会
会議名: 第96回研究会言語・音声理解と対話処理研究会
回次: 96
開催地: 国立国語研究所
開催日: 2022/12/13 - 2022/12/14
p. 22-
本稿では、対話システムライブコンペティション5のオープントラックに提出したマルチモーダル対話システムについて述べる。本システムはTransformerをベースとした言語モデルの「HyperCLOVA」を用い、ユーザの発話に応じて選択するFew-Shotプロンプトを利用して応答候補の生成を行う。プロンプトは5種類あり、音声認識誤り時の応答生成、一般的な応答生成、知識応答生成、ペルソナ一貫性を考慮した応答生成、短文抑制のための応答生成を目的としたものを組み合わせて利用する。後に、不適切な発話を除去するフィルタリングを通し、最終的な出力を得る。予選の結果では1位を獲得したが、マルチモーダル化したことにより、幾つかの課題が顕在化した。