抄録
音声パラメータ表示、音声スイッチ、単語音声認識などさまざまな発話音声インタフェースとして応用可能な音声特徴ベクトルのリアルタイム推定エンジンを構築した。10msフレーム周期で推定される時系列ベクトルは65次元の要素からなり、実効値やメルケプストラム成分などの音響レベル、フォルマントやピッチなどの音声特徴量、ニューラルネットワーク出力値としての弁別的音素特徴ベクトル、さらに日本語標準音素に対するベイズ音素距離を成分とする階層的構造を持つ。本稿では、特徴ベクトルの構造、推定方式およびWindowsベース組み込みとしての応用システムについて紹介する。