人工知能学会全国大会論文集
Online ISSN : 2758-7347
第32回 (2018)
セッションID: 1Z1-03
会議情報

系列生成器の訓練のためのエキスパート系列に基づく報酬関数の学習方法の提案
*冨山 翔司岩澤 有祐松尾 豊
著者情報
会議録・要旨集 フリー

詳細
抄録

系列生成器の訓練方法として,敵対的学習と方策勾配法を組み合わせた手法が効果的であることが知られている. この方法では,敵対的学習の識別器を報酬関数としてみる. 本論文では,報酬関数を敵対的学習を用いずに学習する,expert-based reward function trainingを提案する. 提案手法によって学習された系列生成器が,SeqGANやRankGANといったベースラインに比べて良い性能であることを確かめた.

著者関連情報
© 2018 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top