人工知能学会研究会資料 言語・音声理解と対話処理研究会
Online ISSN : 2436-4576
Print ISSN : 0918-5682
105回 (2025/11)
会議情報

量子カスケードモデルを用いた効率的な音声対話状態追跡
三輪 拓真小田 悠介大中 緋慧河野 誠也吉野 幸一郎
著者情報
会議録・要旨集 認証あり

p. 58-63

詳細
抄録

複数の機械学習モデルのカスケード実装は個々のモジュールを独立に訓練可能な一方で,前段モジュールの最終仮説を出力した段階でその仮説以外の情報が一部欠損してしまうという課題がある.この問題を解決するため一般的にはN-best 訓練法が用いられるが,Nに応じて訓練・推論コストが増加する課題がある.本研究では音声対話状態を題材に,ASR モデルの出力する各仮説の確率値からなるベクトルを量子機械学習モデルへと入力し,複数仮説の同時処理を行うことで,従来の N -best 訓練法における学習・推論コスト増加を抑制するフレームワークを提案する.提案法を音声対話追跡タスクのデータセットである DSTC2 に適用し,精度を維持しつつ大幅なパラメータ数の削減が可能であることを確認した.

著者関連情報
© 2025 人工知能学会
前の記事 次の記事
feedback
Top