抄録
骨導マイクは,飛行場や船舶のエンジンルームなどの超高騒音下における音声コミュニケーションの手段として用いられる.しかし,このマイクで収録された骨導音声は,空気中の雑音に対して非常に強い耐性をもつ半面,身体や顎骨の振動雑音によってその音質が著しく劣化する.
従来の骨導音声の音質改善は,通常の気導音声と骨導音声のメルケプストラム係数間の対応関係を線形モデルやマッピングコードブックを用いて近似することにより行われてきた.しかし,これらの方法では,気導‐骨導音声間の対応関係を正確に近似できないため,変換の精度が悪い.
本研究では,ニューラルガスネットワークと複数の局所変換モデルを用いた骨導音声の音質改善法を提案する.実際に収録した骨導音声に本提案手法を適用したところ,従来手法と比較してその有効性を確認した.