主催: 一般社団法人 人工知能学会
会議名: 第34回全国大会(2020)
回次: 34
開催地: Online
開催日: 2020/06/09 - 2020/06/12
Data-to-Textタスクは, 気象予報マップや時系列株価データといった様々な形式のデータからその内容を説明するテキストを生成する研究課題である. ニューラルネットワーク技術の進歩により, 複雑なデータの特徴を捉え, その内容を正確に記述する文章の生成が可能となってきた. しかし, 複数文からなる文書の生成においては, 内容誤りは少ないものの, 同じ話題が複数文に渡って繰り返し言及されていたり, 各文章の話題の一貫性が欠けている文書が生成されてしまう問題があることが知られている. 本研究は, Data-to-Textタスクにおいて, 記述する内容の正確性に加え, 言及する話題に重複が無く, 一貫性のある文書を生成することを目標とする. 本論文では, 言及する話題とその順番を表すトピック系列を予測・付与し, これらの情報に基づくことで生成テキストの一貫性を制御する手法を提案する. 評価実験では, トピック系列を事前にモデルへ与えることで, 話題に重複がなく, 一貫性のあるテキストが生成できるようになることを示す.