不特定話者の音声認識を日本語の5母音について、ニューラネットワークを用いて行った。学習認識を行う際の入力データは、音声波形をFFT解析し自乗平均表示したパワースペクトルとした。従って入力データはFFT解析によるばらつきと、個人量によるばらつきを持ち合わせていることになる。このようなばらつきは学習認識に影響を与えるものであるが、学習データを工夫することにより影響を最小限に抑えられ多入力-出力が可能であることがわかった。実際の認識率は5母音平均で94.4%が得られた。極簡単な前処理の入力データを用いニューラルネットワークが3層であることを考慮するとかなりの高認識率であると思われる。