主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
近年,テキスト生成AIを用いた自動要約が注目されている.しかしながら,現状の自動要約システムは不完全であり,フェイクを多く含むことが問題視されている.ソーシャルメディアが普及した昨今,フェイクニュースの拡散が社会に与える影響は大きい.したがって,人手によって作られたフェイクを検出するだけでなく,自動要約システムによって生成されたフェイクニュースについても迅速かつ正確に検出できる分類器が求められている.そのような分類器を作成する際,問題となるのが学習データの少なさである.特にフェイクの要約は現実文書にほとんど存在せず,獲得が難しい.そこで本研究では,Round-Trip翻訳を用いた疑似フェイクデータ生成による学習データの拡張を行った.さらに,本手法の有用性を検証するために人手によって作られたデータと,自動要約によって生成されたデータとを用いて評価実験を行った.結果として,提案手法によって生成された疑似フェイクデータを学習に利用することで分類性能が向上していることが確認でき,さらに議事録から他のファクトデータを取り出し学習データとすることで性能をより向上させられることも確認された.