抄録
これまで,我々はマルチエージェントのための強化学習システムとして,
過去の経験を汎用的に利用するための階層型ルールベースを提案してきた.
ルールは,学習層と知識層に分け,学習回数で学習レイヤーを
切り換えて学習していた.
そして,ファイヤパニック問題の実験では未知な環境でも過去の経験を
利用し,再学習性を示すことができた.
そこで,本論文では自動的に未知環境を発見すると学習層を切り換える
システムを導入した.さらに観測状態のアイテムリストと
観測状態のマスクシステムを導入し,過去の経験を利用できるシステム
を実装し,ファイヤーパニック問題に適用した.
今までの結果との比較により,その成果を報告し検証する.