自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
一般論文(査読有)
調理動作後の物体の視覚的状態予測を目指した Visual Recipe Flow データセットの構築と評価
白井 圭佑橋本 敦史西村 太一亀甲 博貴栗田 修平森 信介
著者情報
ジャーナル フリー

2023 年 30 巻 3 号 p. 1042-1060

詳細
抄録

本稿では,調理レシピにおいて,調理動作後の物体の視覚的な状態の予測を目指し,Visual Recipe Flow (VRF) データセットを提案する.VRF データセットは (i) 物体の視覚的な状態遷移と (ii) レシピ全体のワークフローに対するアノテーションから成る.視覚的な状態遷移は動作前後の物体の観測を表す画像の組として,ワークフローはレシピフローグラフとして,それぞれ表現する.ここでは,データセットの構築方法,アノテーション手順について順に説明し,アノテータ間のアノテーション一致率を測ることでデータセットの品質を調査する.最後に,動作前後の画像と物体のテキスト情報を用いたマルチモーダルな情報検索の実験を行うことで,各アノテーション要素の重要性について調べる.

著者関連情報
© 2023 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top