多人数ビデオ会話における非言語情報に基づく次話者予測

水野 沙希; 北条 伸克; 小橋川 哲; 増村 亮

doi:10.11517/jsaislud.94.0_01

抄録

本研究では，ビデオ会話での次話者予測に取り組む．従来，対面対話の次話者予測のために，頭部動作や視線等の非言語特徴が使用される．しかし，ビデオ会話では，これらの動作変化が小さいため，高精度な次話者予測は困難である．また，非言語特徴量は個人性があるため，参与者組に対し頑健な次話者予測には，参与者の組み合わせに富んだ学習データが求められる．しかし，従来研究の学習データは収録データのみから構成されるため，含まれる参与者組の数に限度がある．以上から，提案手法では，1) ビデオ会話でも有用な特徴量の導入と，2) 学習データ中の参加者組の疑似拡張を行う．ビデオ会話データを用いた次話者予測実験により，提案手法の有用性を検証する．

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

PDF閲覧時に認証を求められる記事がございます（発行後1年間）が，研究会登録メンバーは無料で閲覧可能です．認証のための購読者番号やパスワードは会員マイページにログインし「お知らせ」にてご確認下さい．メンバー以外の方は，storesにて購入いただけます．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）