金融LLM構築における継続事前学習モデルのマージ評価

上田 健太郎; Portet Francois; 諏訪 博彦; 安本 慶一

doi:10.11517/jsaisigtwo.2025.CSS-001_29

抄録

モデルマージは，新たなLLMを構築する上で重要であるが，微調整モデルのマージとは異なり，継続事前学習(CPT)モデルのマージはほとんど検討されておらず，その可能性は明らかでない．本研究では，CPTエキスパートを統合して金融特化LLMを構築するケーススタディを通じ，このギャップの解消に取り組む．マージ効果の分析のための評価フレームワークと全18タスクからなる金融ベンチマークを設計する．主要な3つのマージ手法を用いて評価する．実験の結果，CPT中に失われた能力は，ベースモデルとマージすることで回復する可能性や，複数CPTモデルの統合により，個々のモデルの性能を上回る可能性が確認された．

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

第二種研究会の全記事は認証なしでアクセス可能です．また，各記事の著作権は原則として著者に帰属します．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）