2023 年 2023 巻 SWO-060 号 p. 02-
シーングラフ生成 (Scene Graph Generation) は,与えられた画像内のオブジェクトを検出し,検出したオブジェクトのペアごとの視覚関係を検出する.シーングラフ生成は Visual Question Answering (VQA) など画像の視覚理解を必要とするタスクの基礎であり,精度向上させることは重要な課題である.しかし,現在のシーングラフ生成はデータセットが抱えるロングテール問題により精度向上が難しい課題となっている.本研究では,このようなシーングラフ生成の問題に対し,述語の意味に着目したデータサンプリングと二段階の学習を行うことによって精度が向上するか調査を行う.