言語モデル性能評価のための日本語金融ベンチマーク構築と各モデルのパフォーマンス動向

平野 正徳

doi:10.11517/jsaisigtwo.2023.FIN-032_28

抄録

大規模言語ﾓﾃﾞﾙ(LLM)の発展とともに､分野や言語に特化した言語ﾓﾃﾞﾙの構築の必要性が議論されてきている｡その中で､現在の大規模言語ﾓﾃﾞﾙがどの程度の性能を発揮するかを分野に特化して評価するﾍﾞﾝﾁﾏｰｸの必要性が高まっている｡そこで､本研究では､日本語かつ金融分野に特化した複数ﾀｽｸからなるﾍﾞﾝﾁﾏｰｸの構築を行い､主要なﾓﾃﾞﾙに対するﾍﾞﾝﾁﾏｰｸ計測を行った｡その結果､現時点ではGPT-4が突出していることと､構築したﾍﾞﾝﾁﾏｰｸが有効に機能していることを確認できた｡一方で､それ以外のﾓﾃﾞﾙのﾊﾟﾌｫｰﾏﾝｽも向上してきており､それらのﾓﾃﾞﾙのﾊﾟﾌｫｰﾏﾝｽ動向についても報告する｡

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

第二種研究会の全記事は認証なしでアクセス可能です．また，各記事の著作権は原則として著者に帰属します．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）