抄録
本研究では難聴者によるコミュニケーションを補助するための音声可視化システム“観音システム”の構築を目的としている. 音声可視化の手段として本研究ではスペクトル推定によるサウンドスペクトログラムや声の高さ, 強さと音声認識による文字情報の表示を行う. 本システムでは特に文法構造をもたない自由に発話された音声信号を対象とし, かつ単語辞書を用いずに実時間での認識結果の表示を目指している. そこで本研究では音素単位の音声認識を導入する. その際, スペクトル推定法として, Burg法とMinimum Cross- Entropy法を組み合わせた Burg-MCE法を適用し, 音声認識には階層型ニューラルネットワークの一種である時間遅れ神経回路網(TDNN: Time-Delay Neural Network)を適用する.