抄録
本報告では,音声のパワー変化とGMMを用いてFMラジオ放送の中から楽曲が放送されている区間を検出し,且つ民生品へ搭載可能な処理量で動作する楽曲抽出手法を提案する.一般に,楽曲中の音声はDJのトーク中に比べパワーの変化が少ないことが分かっている.この音声パワーの変化を利用して,まず楽曲とDJの境界の候補時刻(変化点)が検出され,検出された変化点の時刻周辺のGMMの解析結果により変化点はDJのトークであるか楽曲であるかに分類される.DJのトークであると判断された変化点と変化点の間隔がある一定時間以上であれば,この区間を楽曲と判定して抽出する.最後に,ユーザビリティの観点から楽曲の切り出しの精度(抽出精度)と放送された楽曲から抽出できた割合(抽出率)を定義し,提案手法の評価を行った.