人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 4Xin1-71
会議情報

データからの言語生成におけるスタイルと内容の分離
*濵園 侑美上原 由衣石垣 達也宮尾 祐介高村 大也小林 一郎
著者情報
会議録・要旨集 フリー

詳細
抄録

非言語データを入力として文章を生成するdata-to-textのタスクでは,近年さまざまなデータを題材にend-to-end学習を行なうことで,高い生成性能を発揮している.Data-to-textにおいて,特に実世界で得られたデータと文章を用いる場合,入力のデータから目的の文章の属性を予測できず,目的の文章が生成できない場合があると指摘されている.このような予測不可能な属性を含むデータセットを用いる場合,データおよび文章の分析により,不足した属性を獲得し,入力として補うことで,文章の生成精度が向上し,さらにデータの内容をより正しく記述できることが確認されている.つまり,より正しくデータを記述するには,データの他に文章のスタイルを入力する必要があると言える.そこで,本研究ではDisentangledな表現学習による入力文章から文章の内容とスタイルを分離する手法をdata-to-textに適用し,入力データと文章から得られたスタイル表現による文章生成を検証する.さらに,文章から得られたスタイル表現を分類することで,入力データから得られない文章の属性を抽出する方法について検証する.

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top