主催: 人工知能学会
会議名: 第105回言語・音声理解と対話処理研究会
回次: 105
開催地: 東京科学大学大岡山キャンパス 蔵前記念会館 くらまえホール
開催日: 2025/11/10 - 2025/11/11
p. 58-63
複数の機械学習モデルのカスケード実装は個々のモジュールを独立に訓練可能な一方で,前段モジュールの最終仮説を出力した段階でその仮説以外の情報が一部欠損してしまうという課題がある.この問題を解決するため一般的にはN-best 訓練法が用いられるが,Nに応じて訓練・推論コストが増加する課題がある.本研究では音声対話状態を題材に,ASR モデルの出力する各仮説の確率値からなるベクトルを量子機械学習モデルへと入力し,複数仮説の同時処理を行うことで,従来の N -best 訓練法における学習・推論コスト増加を抑制するフレームワークを提案する.提案法を音声対話追跡タスクのデータセットである DSTC2 に適用し,精度を維持しつつ大幅なパラメータ数の削減が可能であることを確認した.