視覚的質問応答における視線情報を用いた質問の明確化

稲積 駿; 河野 誠也; 湯口 彰重; 川西 康友; 吉野 幸一郎

doi:10.11517/jsaislud.99.0_113

抄録

Visual Question Answering (VQA)のように画像を参照する質問応答や対話では,しばしば指示語の利用により質問に曖昧さが生じる.また日本語のように,言語によってはしばしば項の省略が行われ,問題はさらに複雑になる.こうした質問の曖昧さは,実際にはユーザとの共同注視やユーザの視線といった情報で補完されていることが多い.本研究ではこうした視線情報の参照による質問の曖昧性解消に着目し,視線情報を用いることで質問の曖昧さが解消されるような視線情報付きVQAデータセット(GazeVQA)を提案する.さらに,このGazeVQAの質問に対する回答の精度を高めるため,視線元からの注視対象推定を活用する手法を提案した.GazeVQAを用いた実験では,提案手法のパフォーマンスが注視対象推定を用いない既存モデルよりも上回ることを確認した.

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

PDF閲覧時に認証を求められる記事がございます（発行後1年間）が，研究会登録メンバーは無料で閲覧可能です．認証のための購読者番号やパスワードは会員マイページにログインし「お知らせ」にてご確認下さい．メンバー以外の方は，storesにて購入いただけます．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）