主催: 人工知能学会
会議名: 第94回 言語・音声理解と対話処理研究会
回次: 94
開催地: オンライン
開催日: 2022/03/05 - 2022/03/06
p. 01-
本研究では,ビデオ会話での次話者予測に取り組む.従来,対面対話の次話者予測のために,頭部動作や視線等の非言語特徴が使用される.しかし,ビデオ会話では,これらの動作変化が小さいため,高精度な次話者予測は困難である.また,非言語特徴量は個人性があるため,参与者組に対し頑健な次話者予測には,参与者の組み合わせに富んだ学習データが求められる.しかし,従来研究の学習データは収録データのみから構成されるため,含まれる参与者組の数に限度がある.以上から,提案手法では,1) ビデオ会話でも有用な特徴量の導入と,2) 学習データ中の参加者組の疑似拡張を行う.ビデオ会話データを用いた次話者予測実験により,提案手法の有用性を検証する.