自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
一般論文(査読有)
ExtraPhrase: 生成型要約のための効率的データ拡張
Mengsay Loem高瀬 翔金子 正弘岡崎 直観
著者情報
キーワード: データ拡張, 要約, 言い換え
ジャーナル フリー

2023 年 30 巻 2 号 p. 489-506

詳細
抄録

大量の訓練データを用いたニューラルモデルは生成型要約タスクにおいて高い性能を達成している.しかしながら,大規模な並列コーパスの構築はコストの観点から容易ではない.これを解決するため,本研究では生成型要約タスクの疑似訓練データを低コストで効果的に構築する手法として ExtraPhrase を提案し,訓練データを拡張する.ExtraPhrase は文圧縮と言い換えの2つのモジュールで疑似訓練データを構築する.文圧縮では入力テキストの主要部分を獲得し,言い換えではその多様な表現を得る.実験を通して,ExtraPhrase は生成型要約タスクの性能を向上させ,逆翻訳や自己学習などの既存の訓練データ拡張手法を上回ることを確認した.また,ExtraPhrase は,学習データが著しく少ない場合でも大きな効果が発揮できることを示した.

著者関連情報
© 2023 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top