ニューラルネットワークを用いた日本語母音認識

坪田 明子; 飯島 伸一; 曽禰 元隆; 光井 英雄; 吉田 征夫

doi:10.11485/tvtr.15.54_29

抄録

不特定話者の音声認識を日本語の5母音について、ニューラネットワークを用いて行った。学習認識を行う際の入力データは、音声波形をFFT解析し自乗平均表示したパワースペクトルとした。従って入力データはFFT解析によるばらつきと、個人量によるばらつきを持ち合わせていることになる。このようなばらつきは学習認識に影響を与えるものであるが、学習データを工夫することにより影響を最小限に抑えられ多入力-出力が可能であることがわかった。実際の認識率は5母音平均で94.4%が得られた。極簡単な前処理の入力データを用いニューラルネットワークが3層であることを考慮するとかなりの高認識率であると思われる。

著者関連情報

お気に入り & アラート

閲覧履歴

後続誌

映像情報メディア学会技術報告

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）