知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
原著論文
SVRを適用したFALCONによるトランプゲームに対する学習実験
笠原 和真二本 健太伊藤 崇高橋 健一稲葉 通将
著者情報
ジャーナル オープンアクセス

2018 年 30 巻 4 号 p. 643-651

詳細
抄録

本論文では,多人数不完全情報ゲームであるトランプゲームのハーツにおいて,FALCON(a Fusion Architecture for Learning, COgnition, and Navigation)を用いた学習エージェントの学習精度を向上させるための手法を提案している.FALCONは,強化学習の手法の1つであるファジイART(Adaptive Resonance Theory)を拡張した機械学習法である.知覚,行動,報酬の全てのベクトルに対して同時に複数のマッピングを学習することにより,知覚状態空間の離散化及び行動規則の学習を同時に行うことができる.既存研究において,トランプゲームのハーツに対するFALCONの有効性が示され,あらかじめ設定されたルールに基づいて行動するエージェントに勝つことに成功している.しかしながら,モンテカルロシミュレーションにより行動を決定するエージェントに勝つことはできなかった.本研究では,学習エージェントの性能向上のための改良として,実際のハーツにおける戦略に基づいた行動種類の変更と,学習時における行動選択に対してサポートベクター回帰による予測を適用する手法を提案する.これらの改良を用いる場合と用いない場合とで学習実験を行い,学習エージェントの性能の比較を行う.

著者関連情報
© 2018 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top