GPT-4による足し算実験から示唆されるLarge Language Modelsの課題

岡谷 基弘

doi:10.11517/jsaisigtwo.2023.AGI-024_02

抄録

本論文では、OpenAIのGPT-4の10桁の加算能力を評価する。多種多様なタスクに対応可能なGPT-4は、10桁の加算に対して60%の正答率に留まることが確認された。ステップバイステップの加算過程を示すプロンプトの追加による正答率の向上は確認できなかった。これは、LLMが異なる概念から共通性を抽出する能力に欠けていることを示唆しており、LLMの進化に重要な示唆を提供する。

著者関連情報

お気に入り & アラート

お気に入りに追加
追加情報アラート
被引用アラート
認証解除アラート

閲覧履歴

発行機関からのお知らせ

第二種研究会の全記事は認証なしでアクセス可能です．また，各記事の著作権は原則として著者に帰属します．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）