抄録
本稿では,ヘテロジーニアスなロボット間の転移学習において,転移率がもたらす学習への影響を報告する.近年,複数台自律ロボットシステムの実世界応用を目的に,様々な研究プロジェクトが盛んである.中でも,ロボカップなどの動的な環境においては,自律的に効率が良い行動獲得のため,強化学習を用いたマルチエージェントロボットシステムMulti-Agent Reinforcement Learning(MARL)が有効と考える. MARLの課題として,長時間の学習などが挙げられ,解決のために知識の再利用を行う転移学習の有用性が示されている.しかし,異なる性能や構造を持つヘテロジーニアスなロボット間での転移学習では,転移の度合いである転移率の影響に関して議論されていない.そこで我々は,ヘテロジーニアスなエージェント間での転移率の変化がもたらす傾向をシミュレータ上で検証した.