抄録
最近,教師なし学習の一手法として強化学習が注目されている.また,脳信号を用いて機械を制御するBCI(Brain Computer Interface)の研究が推進されている.しかし,脳信号には非同期の自発的活動や反射反応などが混在し,制御には脳と機械にインタフェースモデルを介在させて安定性を確保させる必要がある.本研究では,BCI と強化学習とを融合させることにより,強化学習の内部報酬として脳からの信号反応による示唆を行い,BCI における制御安定インタフェースとして強化学習システムを用いる協調学習システムを提案する.BCI における脳示唆は脳学習の結果として得られ,また,制御や行動決定のために強化学習を用いるので,本システムは脳示唆と強化学習による協調学習を構成しているといえる.ここでは迷路探索を用いて,協調学習の有用性を検討する.