人工知能学会全国大会論文集
Online ISSN : 2758-7347
第34回 (2020)
セッションID: 2M5-OS-3b-01
会議情報

因果効果を用いた不確実環境下における能動的行動選択の効率化
*増井 哲史宮澤 和貴堀井 隆斗長井 隆行
著者情報
会議録・要旨集 フリー

詳細
抄録

一般に、我々生物を含めた自律的なエージェントが対面する環境は、その特性を直接知ることはできず、不確実性を含んでいる。Fristonらが提案した自由エネルギー原理における能動的推論は、そうした不確実な環境に対して行動を起こし介入することで、予測しやすい状態に変化させ環境を知ろうとする枠組みである。しかしPearlの統計的因果推論の考え方によれば、変化の結果を観察するだけでは、自身の介入によって変化したのか、別の要因があってたまたまそう変化しただけなのか、それらの違いを正しく把握することができない。介入しなかったときこうなっただろうという反事実と比較することで、自身の行動の因果効果を定量化できる。本研究では自由エネルギー原理に基づく能動的推論を基に、世界モデルを用いた反事実の近似、および因果効果を用いた学習と意思決定の枠組みを提案する。実験では、シミュレーションを用いて不確実な環境における行動選択の振る舞いを検証した。結果から、他の要因によって突然不確実性が変化するような環境において、因果効果によってその要因の影響を考えて行動選択するような振る舞いが見られた。

著者関連情報
© 2020 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top