機械学習を用いて, これまで様々な音声特徴量から音声障害の判別が行われてきた. 本研究では, 音声障害の評価指標として用いられるCepstral Peak Prominence (CPP) を使用し, 音声障害の有無の判定を試みた. CPP は, ケプストラムのピークの高さと, ピークにおけるケプストラムの回帰直線の高さとの差から求める特徴量である. 今回, Saarbruecken Voice Database (SVD)の音声データを使用し,サポートベクターマシン (SVM) で音声障害の有無の判定を行った. CPP を特徴量として分類を行った際, 76.21%の精度で分類が可能であった. また, CPP とメル周波数ケプストラム係数 (MFCC) を組み合わせることで, 最大81.03%の精度が出た. このことから, CPP は, 機械学習を用いて音声障害の有無を判定する際, 有効な音声特徴量であることが示された.
抄録全体を表示