抄録 近年急速に発展した大規模学習モデルの開発は目覚ましく,歯科教育分野への応用が模索されている.本研究では,OpenAI社が開発したChatGPT-3.5とGPT-4に歯科医師国家試験を解答させ,正答率を比較・評価した.
厚生労働省のホームページから歯科医師国家試験問題を入手し,図表,画像などを含む問題以外を対象とした.ChatGPT-3.5およびGPT-4にプロンプトと問題を入力して,必修問題,一般問題(領域A,領域B,領域C)の正答率を評価した.
必修問題:288問,一般問題:500問,領域A:314題,領域B:92問,領域C:94問について,ChatGPT-3.5とGPT-4との正答率に大きな違いを認め,すべての問題・領域でGPT-4が有意に高い正答率を示した.問題文の指示する正答数別において,「すべて選べ」以外は,GPT-4の正答率がGPT-3.5よりも有意に高いことが示された.
ChatGPTによる歯科医師国家試験の問題解決能力について,GPT-4はGPT-3.5を凌駕しており,画像や図表を含まない問題において,領域Bを除き,歯科医師国家試験に合格できる能力を有しており,歯学教育支援ツールとなりうる可能性があることが示唆された.
抄録全体を表示