人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 2G4-OS-21d-04
会議情報

類似グラフ環境における事前知識を活用した方策学習のための世界モデル
*河村 和紀池之内 颯都石川 峻弥村上 綾菜河野 慎松尾 豊
著者情報
会議録・要旨集 フリー

詳細
抄録

本論文では、グラフで表される環境において事前知識を有効に活用して最適な方策を求めるための世界モデルに基づく強化学習手法を紹介する。ゲームや交通ネットワーク、知識グラフ、社会ネットワーク、通信ネットワークなど、仮想世界や現実世界においてグラフで表される環境は多い。これらの環境で最適な方策を求めるための手法はいくつかあるが、既存の研究においては、類似した環境下で獲得した事前知識を新たな方策を学習する際に活用できていない。そこで、本研究ではグラフで表される環境に対する事前知識を獲得した状態でより良い方策を学習する手法を提案する。また、グラフで表される迷路ゲームをシミュレーションし、提案手法が事前知識を用いない単純な強化学習モデルよりも性能が良いことを示す。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top