自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
一般論文(査読有)
BioVL2データセット:生化学分野における一人称視点の実験映像への言語アノテーション
西村 太一迫田 航次郎牛久 敦橋本 敦史奥田 奈津子小野 富三人亀甲 博貴森 信介
著者情報
ジャーナル フリー

2022 年 29 巻 4 号 p. 1106-1137

詳細
抄録

本論文では,生化学分野における一人称の実験映像データセットであるBioVL2データセットを提案する.BioVL2データセットは生化学における4種類の基本的実験に対し,それぞれ8動画撮影した合計32,総時間2.5時間の映像からなるデータセットである.各映像はプロトコルと紐づいており,言語アノテーションとして(1)視覚と言語の対応関係のアノテーション,(2)プロトコル中に現れる物体の矩形アノテーションの2種類のアノテーションを付与している.構築したデータセットの応用例として,本研究では実験映像からプロトコルを自動生成する課題に取り組んだ.定量的,定性的な評価の結果,開発した手法はフレームに映っている物体名をそのままプロトコルとして出力する弱いベースラインと比較して,適切なプロトコルを生成できることを確認した.なお,BioVL2データセットは研究用途に限定してデータセットを公開する予定である.

著者関連情報
© 2022 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top