2024 年 31 巻 4 号 p. 1545-1562
スポーツの試合の放送中,試合に関する多くのコメントがXに投稿されている場合,これらの投稿を読むことで大まかな試合経過の把握が可能である.しかし,投稿の内容は多岐にわたり,これらの投稿から瞬時に試合経過を把握することは容易ではない.そこで,本論文ではサッカーの試合に着目し,試合経過を瞬時に把握できるように X への投稿からスポーツ速報を生成するシステムの構築に取り組む.構築するシステムは,大規模言語モデル T5 をベースに,特定の試合に関連する X への投稿を入力し,一定時間毎に速報,あるいは生成しないことを示す “NaN” を生成するモデルを基本とする.しかし,単純なモデルでは速報の生成数が少ないという問題と同じイベントを指す速報文が複数生成される冗長性の問題という二つの問題が生じる.そこで,生成判定器を利用して速報生成数を制御する機構および過去の速報の内容を考慮して冗長性軽減を行う機構を組み込んだモデルを提案する.