2024 年 31 巻 4 号 p. 1717-1745
本稿では,日本語ニュース記事の要約支援を目的とする,ドメイン特化事前学習済みモデルを用いた編集支援システムについて報告する.具体的には実社会のシステム要件を整理し,既存技術を組み合わせて開発した編集支援システムを,有用性を評価するための検証項目と共に提示する.第一に,特有の文体を再現する目的で「日経電子版」のニュース記事を用いて T5 の事前学習とファインチューニングを行い,学習コーパスのサイズが小さいにもかかわらず,見出しと 3 行要約の生成タスクで一般的なモデルを上回る性能を確認した.次に,発生し得る幻覚の特徴を明らかにするために,構築したドメイン特化 T5 の出力を定量的・定性的に分析した.最後に,クリック率を予測するドメイン特化 BERT も含め,編集システム全体の有用性を議論した.