抄録
音声からの感情認識について検討する.日常自然に表れる感情は多種多様であり,同一の感情の音声であっても更に様々な系統に分類することができる.異なる系統の音声は韻律特徴にも違いが表れると考えられる.従来手法では様々な系統が混在した音声を単一の感情クラスとして学習するため正しい認識結果が期待できない.そこで本稿では特徴空間上で感情を複数の系統に分割することにより認識率を向上させる手法を提案する.4段階の快-不快のラベルを含んだ自然発話音声について処理を行う.同じラベル毎の感情音声の特徴分布をk-means法により複数のクラスに分割する.次に,各々のラベルが含まれる系統を求めるために,分割されたクラス間の距離が最短になる組み合わせを探索する.最後に,同じ系統の音声データをSVMによって学習し,系統毎に認識器を構築する.提案手法により従来手法と比べて認識率が向上した.