人工知能学会全国大会論文集
Online ISSN : 2758-7347
第33回 (2019)
セッションID: 3Rin2-08
会議情報

決定木とCross-Entropy法を用いた解釈可能な制御方策の学習
*田中 友紀子平岡 拓也鶴岡 慶雅
著者情報
会議録・要旨集 フリー

詳細
抄録

解釈性のある制御方策を学習することは、産業応用における安全性やメンテンナンス容易性の観点で重要である。従来法では、解釈性のある方策を獲得するためにまず期待報酬を最大化するようなブラックボックス方策を用意し、その方策を模倣するように決定木を構築している。しかしながら、ブラックボックス方策の模倣によって得られた決定木方策は必ずしも期待報酬を最大化しない。そこで本研究では、環境から得られる報酬を直接最大化するCross-Entropy法を用いた決定木方策の学習手法を提案する。そして、実験を通じ、我々の提案法によって構築された決定木方策が、従来通りブラックボックス方策の模倣によって獲得された決定木方策よりも高い期待報酬を獲得できることを示す。

著者関連情報
© 2019 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top