人工知能学会第二種研究会資料
Online ISSN : 2436-5556
動画キャプション生成とMetaVDを用いた動作認識データセットの拡張
後藤 颯志チャクラボルティ シュデシナ森田 武史吉川 友也山本 泰智江上 周作鵜飼 孝典福田 賢一郎
著者情報
研究報告書・技術報告書 フリー

2025 年 2025 巻 SWO-065 号 p. 03-

詳細
抄録

既存の動作認識データセットでは,多くの場合,各動画に一つの動作ラベルのみが付与されており,動画に含まれる複数の動作を網羅できていない.本研究では,動画キャプション生成とメタ動画データセットMetaVDを用いた動作認識データセット拡張手法を提案する.提案手法は,大規模視覚言語モデルで生成した動画キャプションを基に,大規模言語モデルを用いてMetaVDから関連する動作ラベルを抽出し,それらとequal関係にある動作ラベルも併せて抽出して,対象動画に付与する.評価実験では,HMDB51に含まれる動画に対し,提案手法が付与した動作ラベルの復元率と人手による妥当性の検証により,提案手法の有効性を示す.

著者関連情報
© 2025 著作者
前の記事 次の記事
feedback
Top