報酬最大化を目的とする行動計画・実行・対話・推論の統一的制御機構

一杉 裕志; 中田 秀基; 高橋 直人; 竹内 泉; 佐野 崇

doi:10.11517/pjsai.JSAI2023.0_2Q4OS27b01

第37回 (2023)

セッションID: 2Q4-OS-27b-01

DOI https://doi.org/10.11517/pjsai.JSAI2023.0_2Q4OS27b01

会議情報

主催: 一般社団法人人工知能学会

会議名: 2023年度人工知能学会全国大会（第37回）

回次: 37

開催地: 熊本城ホール＋オンライン

開催日: 2023/06/06 - 2023/06/09

報酬最大化を目的とする行動計画・実行・対話・推論の統一的制御機構

*一杉裕志, 中田秀基, 高橋直人, 竹内泉, 佐野崇

著者情報

キーワード: 階層型強化学習, 汎用人工知能, 行動計画, モデルベース強化学習

会議録・要旨集フリー

詳細

抄録

我々は将来の汎用人工知能の実現に向けて、再帰的強化学習を用いて思考や行動を制御するAIアーキテクチャを開発している。エージェントは統一的な制御のもと、環境に対して行動し、他者と対話し、環境の状態を推論して、報酬の最大化を目指す。将来的には、エージェントが自らの経験に基づいて制御プログラムを合成する機構を実装する予定である。本稿では、まず全体アーキテクチャを説明したあと、その上で動作する行動計画の機構を提案する。我々はプロトタイプシステムを実装し提案機構の動作を確認した。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）