人工知能学会全国大会論文集
Online ISSN : 2758-7347
第36回 (2022)
セッションID: 2O6-GS-5-02
会議情報

二人零和ゲームにおける突然変異付きレプリケータダイナミクスを用いた学習アルゴリズムに関する研究
坂本 充生*豊島 健太郎阿部 拳之岩崎 敦
著者情報
キーワード: エージェント, 機械学習
会議録・要旨集 フリー

詳細
抄録

本研究では,二人零和ゲームにおける突然変異を利用した学習アルゴリズムの帰結を吟味する.既存アルゴリズムの多くはダイナミクスの時間平均をとって初めて均衡に収束する.そこで本研究では,突然変異付きレプリーターダイナミクスに基づく手法Mutant Follow the Regularized Leaderを提案し,実験的に評価した.その結果,このアルゴリズムのダイナミクスが時間平均を取らずに均衡に収束することを示した.

著者関連情報
© 2022 人工知能学会
前の記事 次の記事
feedback
Top