抄録
我々は,文脈を限定したHMM音声合成技術について研究を進めており,そこで合成される大量の音声を評価する必要がある.合成音声の評価は,従来,人が実際に聞く主観評価を行ってきたが,大量な音声を効率よく評価する方法が望まれている.そこで合成音声の主観評価の効率化を目指し,まずは,HMM音声合成時に設定したテキストとアクセントが正しく表現できているかを音声認識とDPマッチングを用いて事前に客観評価し,後段で主観評価を行う必要のある音声サンプルをシステマティックに抽出する方法を検討した.これは主観評価する音声サンプルの総数を減らし,評価を効率化する効果が期待できるものと考えている.