抄録
人間の感情は、機械が人間の生活補助をするのに利用できる有用な情報の一つである。なか
でも音声はコンピュータやロボットとの対話などで取得しやすい情報であり、音声を用いた
感情の認識は広く注目を浴びている。音声の韻律特徴を用いた感情認識器の学習では、感情
による変異量を抽出するために単語や文節など数秒から10秒程度の音声に対し特徴抽出を行
う。一方で感情認識システムの利用状況においては自然発話を収録するため、自然発話から
単語抽出をするため感情認識とは別に音節解析や形態素解析が必要となる。そこで本研究で
は、感情が表現される自然発話や単語から0.1秒程度の短い音声を切り出し、韻律特徴を取
り出すことで感情認識を試みる。音声長が短くなるため十分な韻律特徴が音声に含まれなく
なる。また、異なる感情の音声でありながらも類似する特徴をもつ短時間音声が多く取得さ
れる。そこで感情認識に有用な短時間音声の取捨選択法について提案を行う。