人工知能学会全国大会論文集
Online ISSN : 2758-7347
第35回 (2021)
セッションID: 2Yin5-03
会議情報

エンティティの類似度を考慮したデータ拡張による質問カテゴリ推定
*欅 惇志太刀岡 勇気
著者情報
会議録・要旨集 フリー

詳細
抄録

本研究では,エンティティに着目したデータ拡張を行う際に,エンティティ間の類似度を考慮することで高品質なデータ生成を目指す.本研究で取り組む質問文の質問カテゴリ推定タスクにおいて,高性能なモデル構築には多様な表現を含む大量の学習データが必要となる.その際,学習用データの収集や正解カテゴリのアノテーションのコストを軽減するため,データ拡張によるデータの自動生成を行う.提案手法ではシードとなる質問中のエンティティを類似エンティティと置換することで新たな質問を生成する.提案手法によって自動生成された質問の品質を評価するため,質問カテゴリ分類タスクの精度評価を行った.評価実験の結果,エンティティの類似度を考慮することで分類精度の向上が確認された.

著者関連情報
© 2021 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top