連続状態空間・連続行動空間での強化学習における状態フィルタの適応的獲得

小山 陽平; 永吉 雅人; 村尾 元; 玉置 久

doi:10.11509/sci.SCI06.0.177.0

抄録

強化学習は，実用化に際して，状態空間を予め適切に設計することが難しいという点が問題点の一つとなっている．この点に留意し，エージェントへの状態入力と行動学習の間に状態フィルタを定義・導入した計算モデルについての検討を進めており，エントロピーを用いた状態フィルタの一実現法を提案している．本稿では，提案手法について連続行動空間へ適用範囲の拡張を試みる．

著者関連情報

お気に入り & アラート

お気に入りに追加
追加情報アラート
被引用アラート
認証解除アラート

閲覧履歴

学校における調理実習で学ばせたいこと
位相角制御方式を用いた励磁突入電流抑制装置の基礎研究
ADGを用いた各種ログファイルからの異常検出ルール抽出 - コンピュータログからの知識獲得（1） -
Optimization of Supercritical Carbon Dioxide Extraction of Eucommia ulmoides Seed Oil and Quality Evaluation of the Oil
膝内側側副靭帯損傷に対して靭帯の修復過程に着目した一症例　―超音波画像診断装置を用いての検討―

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）