動画中の人の動作を入力情報とする動的計画法を用いた言語生成モデル

小林 瑞季; 小林 一郎; Sergio Gudarrama; 麻生 英樹

doi:10.57413/wii.2.0_72

第2回研究会

DOI https://doi.org/10.57413/wii.2.0_72

会議情報

主催: Webインテリジェンスとインタラクション研究会

会議名: WI2研究会

回次: 2

開催地: 大阪大学豊中キャンパス

開催日: 2013/05/19 - 2013/05/20

セッション6：言語と動作モデル

動画中の人の動作を入力情報とする動的計画法を用いた言語生成モデル

小林瑞季, 小林一郎, Sergio Gudarrama, 麻生英樹

著者情報

キーワード: Kinect, 時系列データ, SAX, 対数線形モデル, バイグラムモデル, 動的計画法

会議録・要旨集フリー

p. 72-77

詳細

抄録

本研究では，視覚情報からそれを説明するテキストを確率的に生成する手法を提案する．視覚情報として，Kinectカメラによって捉えられた人の動きの時系列データを採用した．得られた時系列データは，数段階の次元圧縮手法を経たのち，機械学習に適した形に成形される．その後，処理された時系列データとそのデータの示す動作の中間表現のベアに対して，線形対数モデルを用いた機械学習を行う．テキスト生成のための言語資源としては，人の動作のさまざまな言語表現を収集し，それぞれの動作に対して構築されたバイグラムモデルを使用する．本手法では，観測された時系列データから中間表現を選択し，選択された中間表現に対応したバイグラムモデルを選択し，さらに選択されたバイグラムモデルに動的計画法を適用することでテキストを生成する．

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）