複数の目標が存在する最適制御においては, 制御システムは, これらの目標の実現を目指す複数の制御者からなる.複数の制約条件のもとで環境の変動が事前に予知できない場合に, 競争的あるいは協力的に共存している各々の制御者が, ある種の集団行動を形成する現象は社会システム, 経済システムなどの中でよく見られる.ゲーム理論の立場から見れば, このようなシステムは協力, 非協力ゲームに帰着される.
本研究では, このような複数の目標のもとで動作しているシステムの最適化問題を取り上げ, 複数の静的なランダム環境 (教師) 下で動作している学習オートマトンの集団モデルについて考察し, モデルの定義評価基準などを与え, ランダム環境に適応するための各オートマトンの強化法の構築方法を示す.
集団モデルとしては, 種々のタイプが考えられるが, 本文では, とくに, 協力環境下での非協力ゲームのモデルについて考察し, このモデルの静特性および動特性を議論したうえで
P-modelと
S-modelの二つのタイプの学習オートマトンに対応できる強化法を提案する.また, 強化法の収束性の評明を与え, 簡単なシミュレーション例を用いて, それを検証する
抄録全体を表示