人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 2Q4-OS-27b-01
会議情報

報酬最大化を目的とする行動計画・実行・対話・推論の統一的制御機構
*一杉 裕志中田 秀基高橋 直人竹内 泉佐野 崇
著者情報
会議録・要旨集 フリー

詳細
抄録

我々は将来の汎用人工知能の実現に向けて、 再帰的強化学習を用いて思考や行動を制御するAIアーキテクチャを開発している。 エージェントは統一的な制御のもと、環境に対して行動し、他者と対話し、環境の状態を推論して、報酬の最大化を目指す。 将来的には、エージェントが自らの経験に基づいて制御プログラムを合成する機構を実装する予定である。 本稿では、まず全体アーキテクチャを説明したあと、その上で動作する行動計画の機構を提案する。 我々はプロトタイプシステムを実装し提案機構の動作を確認した。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top