2025 年 9 巻 s2 号 p. s198-s201
近年、ゲームアーカイブ構築が活発化する一方、高コストな工程である目録作成はこれらにおける大きな課題である。本研究ではボードゲームのパッケージ画像からOCRと大規模言語モデルを組み合わせて固有表現抽出を行い、自動メタデータ生成を試みた。アナログゲームミュージアム所蔵資料のうち121件の資料を対象に、人手による目録データを正解とし、自動生成されたメタデータの精度を適合率・再現率・F1値を用いて定量的に評価した。その結果、バーコード、プレイ時間やプレイヤー人数といったパッケージ上で定型的に表現される属性は高い精度で抽出可能で、現状でも実務での利用が期待できる。一方、責任表示などは抽出精度に課題があり、正規化やエンティティリンキングといった手法の改善が求められることが分かった。本研究を通して、LLMと人手の目録作成を組み合わせたハイブリッドフローが、信頼性と低コスト化を両立しうる有効なアプローチであることが示された。