類似状態を考慮した行動想起によるサッカーエージェントの強化学習の高速化

高田 英之; 村田 忠彦

doi:10.11509/sci.SCI05.0.166.0

抄録

　本研究では，意思決定の際に類似状態における行動を想起する手法を提案する．すなわち，現在知覚した状態での経験が浅い時にランダム探索を行うのではなく，過去に評価を得た類似状態での行動を用いて試行する．これにより，ランダム探索に比べ成功報酬を得られる可能性が高まり，学習速度の向上が期待できる．また，学習初期においても良い性能を発揮できるため，オンライン学習の性能に対する要求を満たすことも可能である．計算機実験では，サッカーエージェントの協調戦術の獲得を目標とする学習に対して提案手法を適用し，比較実験によりその有効性を示す．

著者関連情報

お気に入り & アラート

お気に入りに追加
追加情報アラート
被引用アラート
認証解除アラート

閲覧履歴

A CASE OF HEMOBILIA DUE TO INVASIVE GROWTH OF HEPATOCELLULAR CARCINOMA INTO INTRAHEPATIC BILE DUCT SUCCESSFULLY TREATED WITH TRANSCATHETER ARTERIAL EMBOLIZATION (TAE)
Low Cholesterol is Associated With Mortality From Stroke, Heart Disease, and Cancer: The Jichi Medical School Cohort Study
鏡視下腱板修復術後における後療法の検討
－早期からの自動介助運動と装具装着期間の短縮－
鼎談（林業経済学会2019年秋季大会シンポジウム　徹底討論：林政の新展開を問う）
Brachial Low-Flow-Mediated Constriction is Associated with Delayed Brachial Flow-Mediated Dilation

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）