人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 2M5-GS-10-01
会議情報

『ぷよぷよ』における深層強化学習による自己対戦の適応
*福地 昂大三宅 陽一郎
著者情報
会議録・要旨集 フリー

詳細
抄録

近年、ボードゲームだけでなくビデオゲームにおいて、自己対戦を使用することで戦略の獲得に成功している。 本研究では、一人用と対戦用の落ち物パズルゲーム『ぷよぷよ』において、自己対戦と深層強化学習を用いて、戦略を学習させた研究の報告をする。自己対戦とは、エージェント同士が対戦してログを生成し、そのログを用いて学習する手法である。本実験では、Unityを使用してパズルゲームの環境を作成した。そして、強化学習ライブラリML-Agentsと深層強化学習アルゴリズムSACを使用して学習を行った。一人用ぷよぷよでは累積報酬と平均最大連鎖数を用いて評価を行った。一時的に性能は上昇したものの、最終的には少し悪くなってしまった。対戦用ぷよぷよではイロレーティングと平均最大連鎖数を用いて評価を行った。イロレーティングは初期値の1200から3100まで上昇し、最後まで上昇傾向にあった。今後の学習によってさらに強くなることが考えられる。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top