人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
94回 (2022/3)
会議情報

多人数ビデオ会話における非言語情報に基づく次話者予測
水野 沙希北条 伸克小橋川 哲増村 亮
著者情報
会議録・要旨集 フリー

p. 01-

詳細
抄録

本研究では,ビデオ会話での次話者予測に取り組む.従来,対面対話の次話者予測のために,頭部動作や視線等の非言語特徴が使用される.しかし,ビデオ会話では,これらの動作変化が小さいため,高精度な次話者予測は困難である.また,非言語特徴量は個人性があるため,参与者組に対し頑健な次話者予測には,参与者の組み合わせに富んだ学習データが求められる.しかし,従来研究の学習データは収録データのみから構成されるため,含まれる参与者組の数に限度がある.以上から,提案手法では,1) ビデオ会話でも有用な特徴量の導入と,2) 学習データ中の参加者組の疑似拡張を行う.ビデオ会話データを用いた次話者予測実験により,提案手法の有用性を検証する.

著者関連情報
© 2022 人工知能学会
次の記事
feedback
Top