本稿では,実環境下での話者識別において,様々な背景雑音への頑健性を期待できるモデルとして,マルチSNR部分帯域モデルを提案する。提案モデルは,各部分帯域ごとに異なるSNR(マルチSNR)の白色雑音重畳音声で学習したモデルで構成される。性能評価のため,クリーン部分帯域モデル,クリーン全帯域モデル,マルチSNR全帯域モデルの3モデルを比較対象として,様々な雑音環境及びSNR下においてテキスト独立型話者識別実験を行った。その結果,提案モデルは,低SNRで複雑な雑音環境において,他のモデルよりも高い頑健性を示した。また,識別性能改善法として短時間ブロック単位での尤度計算を導入し,その有効性を確認した。
抄録全体を表示