日本音響学会誌
Online ISSN : 2432-2040
Print ISSN : 0369-4232
DTW単語認識システムにおける聴覚フィルタフロントエンドの評価
小原 和昭平原 達也
著者情報
ジャーナル フリー

1994 年 50 巻 6 号 p. 452-464

詳細
抄録

本論文では聴覚未梢系における信号処理機能を模擬する聴覚モデルをDTW単語認識システムのフロントエンドとして用いた場合の性能を、雑音耐性、残響耐性、及び話者変動耐性を指標として、従来のフロントエンドと比較評価した結果について述べる。聴覚モデルとしては、基底膜でのフィルタリング特性を近似した固定Q型蝸牛フィルタ(FQF)に、適応Q処理(AQF)、側抑制処理(LINH)、及び聴神経の発火間隔ヒストグラムを近似する処理(EIH)を付加したものを用いた。比較対象のフロントエンドとしては、DFTに基づいく等バーク帯域フィルタ(DFT)、及びLPC系の複合特徴量(LPCケプストラム・Δケプストラム・パワー)に基づく重み付き尤度比距離(WLRD)とを用いた。比較評価の結果、LINHを施したAQFとFQF及びEIH等の聴覚モデルフロントエンドは、従来のフロントエンドを越える雑音耐性と残響耐性を与えることが明らかになった。また、以上の末梢系聴覚モデルフロントエンドの話者変動耐性は低く、話者変動には聴覚中枢系・高次系での処理機能を考慮した総合的な聴覚モデルで対処する必要があると推察した。

著者関連情報
© 1994 一般社団法人 日本音響学会
前の記事 次の記事
feedback
Top