知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
ISSN-L : 1347-7986
ショートノート
逆強化学習とファジィ推論に基づくあいまい性を考慮した報酬関数の設計
加藤 優太加納 政芳中村 剛士
著者情報
ジャーナル フリー

2021 年 33 巻 4 号 p. 827-832

詳細
抄録

ロボットの行動則を獲得する方法に逆強化学習を用いて報酬関数を設計する方法がある.ここで,状態空間は,次元数が増えるにつれて指数関数的に大きくなるため,状態空間の広さに対して,観測できる状態遷移数の割合は激減する.部分的な状態遷移情報からでも報酬関数を設計することは可能であるが,得られた報酬関数にはあいまい性が存在することになる.あいまい性を含む報酬関数を用いて学習する場合には,あいまい性を許容可能な報酬関数が必要となる.そこで本稿では,逆強化学習で設計された報酬関数のもつあいまい性をファジィ推論によって数値化する手法を提案する. 実験の結果,提案手法によって,危険度や安全度を考慮した行動系列を学習できる可能性が示唆された.

著者関連情報
© 2021 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top