主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
近年,リモート会議アプリを通した音声対話データの集音が容易になり,対話解析が普及しつつある.その構成技術として発話をその意図で分類する発話理解(SLU)があり,教師あり学習に基づくモデルが高い精度を持つと報告されている. 教師あり学習では,対話ドメインに応じたデータが必要であるため,低リソースやクラスが不均衡な状況における過学習問題が生じ,その対策として学習サンプルを充実させるデータ拡張が広く用いられている.しかしながら,同義語置換などの従来のデータ拡張手法では,短い文章において,変換結果が元の文意と異なり,性能向上に寄与しないことも多い. 上記課題を克服するために,我々は大規模言語モデル(LLM)を用いた複数の対話データ拡張とその組み合わせの探索方法を提案する.具体的には,操作の組み合わせを拡張ポリシーとみなし,ベイズ最適化によるポリシー探索を行い,モデル性能を向上させる. 商談対話データセットを用いた実験の結果,提案手法は,教師あり学習及びLLM ゼロショット学習を用いたベースラインを超えることが示された.