応用的なスポーツ分析が広く行われているが、サッカーなどのゴール型スポーツにおいては、複数エージェントが絡む連続的なデータを扱う必要があり、その包括的な分析は難しい。実際、既存の評価指標の多くはボールの座標やその周辺の統計情報を入力とした静的でシンプルなものであり、前後の試合文脈を考慮した包括的な評価指標は発展途上である。 一方で、近年大規模言語モデル(LLM)が注目されており、自然言語処理分野のみならず、強化学習やマルチエージェント軌道予測などでの有用性も報告されている。しかし、サッカーデータへの応用例は未だ限定的である。 そこで本研究では、言語モデルを用いてピッチ上に存在する選手の観測する状態と選択した行動をトークン化した系列を予測することを通して、選手の行動選択と状態遷移の確率をモデリングする。また、モデルの出力を用いて強化学習の枠組みに基づき各選手やチームの状態行動価値(Q値)を算出し、定量的に評価する枠組みを初めて提案する。