将棋解説文の自動生成には1) 局面や指し手の特徴量から解説すべき対象を特定し2) その対象について自然言語による解説を行うことが必要である. 本研究では,将棋解説文の自動生成のための第一歩として, 将棋解説文に含まれる構成要素を定義し, 人手によるアノテーションで将棋解説文コーパスを作成した. アノテーションの定義と作成したコーパスの統計情報について報告する. また, 作成した将棋解説文コーパスを用いて事前学習言語モデルT5とBERTのファインチューニングを行い, 構成要素ラベルの自動判別が行えるか検証した. T5では, F値のマクロ平均0.769で自動判別ができることを示した. 作成したコーパスは, 解説文が付与された局面や指し手と紐付けられており, 局面と指し手を入力として解説すべき構成要素を判別する課題への活用が期待できる.
抄録全体を表示