主催: 一般社団法人 人工知能学会
会議名: 2025年度人工知能学会全国大会(第39回)
回次: 39
開催地: 大阪国際会議場+オンライン
開催日: 2025/05/27 - 2025/05/30
近年,大規模言語モデルの能力向上に伴い,外部ツールを用いて環境とインタラクションをするエージェントとしての活用がひろがっており,さらなる性能向上が求められている. 推論ステップごとに報酬を付与するProcess Reward Model (PRM)をエージェントタスクのWebShopに適用し,探索(Beam Search)に活用することでタスク解決精度を向上させることを確認した. また,同程度の計算コストをかけた手法(Majority Voting)よりも安定して高い精度を達成できることが分かり,エージェントタスクにおいてPRMを用いた探索の有効性が示唆された.