ユークリッド空間における連続値入力を扱う強化学習モデル

井ノ上 貴之; 宮島 廣美; 重井 徳貴

doi:10.11527/jceeek.2008.0.629.0

抄録

強化学習とは報酬という特別な入力を手がかりに、環境に適応する機械学習システムを構築する1つの方法である。一般的な教師付き学習とは異なり目標に導く教師が存在するのではなく、目標達成した後に報酬というスカラー情報を用いてシステムを学習する方法である。この強化学習システムに関しては、様々な学習方法が提案がなされているが、離散値の入力を前提としている。しかし、実問題を考える際、連続値を扱うモデルの構築が不可欠である。本稿では、ユークリッド空間上で定義される連続値の入力を、離散化してテーブル形式で表現する方法を提案し、その有効性を示す。

著者関連情報

お気に入り & アラート

お気に入りに追加
追加情報アラート
被引用アラート
認証解除アラート

閲覧履歴

On the Equation of Izumi having a Singular Solution Holomorphic Except at the Origin and a Lacunary General Solution
The Photometric Determination of the Trace Amount of Boron in Iron and Steel
ダイコンの自家ならびに交雑不和合性の遺伝学的研究 (第5報)
Turboexpander Development as an Example of Speed-up Efficiency-up of Turbomachinery

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）