システム発話の感情分類による制御を行ったマルチモーダル対話システム

藤後 英哲; 大浦 杏奈; 菊池 浩史

doi:10.11517/jsaislud.96.0_45

抄録

本稿ではテキスト・音声・ジェスチャーを制御したマルチモーダルな対話システムの開発に取り組んだ。本対話システムは応答生成器と感情分類器によって構成されている。応答生成器にはGPT-2を用いた。GPT-2では、学習済みモデルをTwitterから収集したデータによって転移学習をした。感情分類器にはBERTを用いた。BERTの学習では、学習済みモデルを感情分析データセットであるWRIMEによってファインチューニングした。WRIMEでは1つの文章に8つの感情カテゴリのアノテーションがされている。そのためBERTでは多ラベルの学習を行い、分類時には最もスコアの高い感情カテゴリを対話システムの表出感情とした。表出感情を基に、事前に作成したデータセットからジェスチャーと音声の制御を抽出し、システム発話と共に出力した。

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

PDF閲覧時に認証を求められる記事がございます（発行後1年間）が，研究会登録メンバーは無料で閲覧可能です．認証のための購読者番号やパスワードは会員マイページにログインし「お知らせ」にてご確認下さい．メンバー以外の方は，storesにて購入いただけます．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）