人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 3O1-OS-16b-04
会議情報

言語モデルの世界モデル創発に関する検証
プローブを用いた寄与度に基づく枝刈りによる内部表現分析
*西浦 直哉青木 洸士郎武田 大佑熊谷 亘松尾 豊
著者情報
会議録・要旨集 フリー

詳細
抄録

近年,言語モデルにおける世界モデルの出現に関する研究が行われている.その中で,言語モデルとしてオセロの合法的な手を予測することが可能なOthelloGPTを利用した研究がある.この研究は,世界モデル発現に関して,内部表現の介入により洞察を得ている.本研究では,予測に対する寄与値を計算するSHapley Additive exPlanations (SHAP)と内部表現の介入技術,プローブを活用する. 我々は,OthelloGPTとプローブ,SHAPを活用して,現在のオセロの盤面状態に対する内部層のノードごとの寄与値を確認した.その寄与値に基づいて,ノードの枝刈りをおこなった.結果として,寄与値の高いノードから枝刈りするよりも低いノードから枝刈りしたほうが精度が高くなった.この結果は,OthelloGPTが合法一手の予測に,内部表現を活用していることを示唆している.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top