主催: 一般社団法人 人工知能学会
会議名: 2021年度人工知能学会全国大会(第35回)
回次: 35
開催地: オンライン
開催日: 2021/06/08 - 2021/06/11
本研究では,エンティティに着目したデータ拡張を行う際に,エンティティ間の類似度を考慮することで高品質なデータ生成を目指す.本研究で取り組む質問文の質問カテゴリ推定タスクにおいて,高性能なモデル構築には多様な表現を含む大量の学習データが必要となる.その際,学習用データの収集や正解カテゴリのアノテーションのコストを軽減するため,データ拡張によるデータの自動生成を行う.提案手法ではシードとなる質問中のエンティティを類似エンティティと置換することで新たな質問を生成する.提案手法によって自動生成された質問の品質を評価するため,質問カテゴリ分類タスクの精度評価を行った.評価実験の結果,エンティティの類似度を考慮することで分類精度の向上が確認された.