2023 年 30 巻 3 号 p. 1042-1060
本稿では,調理レシピにおいて,調理動作後の物体の視覚的な状態の予測を目指し,Visual Recipe Flow (VRF) データセットを提案する.VRF データセットは (i) 物体の視覚的な状態遷移と (ii) レシピ全体のワークフローに対するアノテーションから成る.視覚的な状態遷移は動作前後の物体の観測を表す画像の組として,ワークフローはレシピフローグラフとして,それぞれ表現する.ここでは,データセットの構築方法,アノテーション手順について順に説明し,アノテータ間のアノテーション一致率を測ることでデータセットの品質を調査する.最後に,動作前後の画像と物体のテキスト情報を用いたマルチモーダルな情報検索の実験を行うことで,各アノテーション要素の重要性について調べる.