2016 年 72 巻 6 号 p. 293-305
音声や足音,扉の開閉音などの様々な音から,音が収録された場所や状況を推定する音響シーン分析の研究が活発に行われている。音響シーン分析の有効な手法として,音の種類の組み合わせと音響シーンの関係を生成過程により記述する音響トピックモデルが知られているが,従来の音響トピックモデルのモデルパラメータ推定はバッチ型アルゴリズムであるため,逐次的に得られる音を分析するには大きな計算機資源が必要となり,日々膨大な量が増え続ける動画データなどの分析は困難であった。本稿では逐次的に得られる音から高精度に音響シーンを分析する手法として,崩壊型変分ベイズの近似手法(CVB0)と崩壊型ギブスサンプリング法のハイブリッド型オンライン手法を提案する。