人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 1B3-GS-2-03
会議情報

大規模言語モデルの論理構造の把握能力と予測モデルの生成
*田中 冬馬江本 直史弓林 司
著者情報
会議録・要旨集 フリー

詳細
抄録

この研究の目的は, 大規模言語モデル(LLMs)が論理構造を理解する能力(Ability to Understand the Logical Structure: AULS)を理解することである. 本論文では, まず, In-Context Learning(ICL)に触発されて開発された「帰納バイアス学習(IBL): Data Set2Code Model」という方法を紹介する. 次に, 以前の研究で取り上げられていないGPT-4-Turbo, GPT-3.5-Turbo, およびGemini Proなどの複数のモデルにIBLを適用し, それらが生成する予測モデルの精度と特性を比較検討する. その結果, すべてのモデルがIBLの能力を持っていることが示された. 特に, GPT-4-Turboは従来のGPT-4と比較して顕著な精度向上を達成した. さらに, GPT-NとGemini Proが生成する予測モデルの性能のばらつきに差があることが明らかになった.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top