テキスト生成のためのより良いLLM評価器： プロンプト出力のシーケンスと最適化の影響

朱 冠肇; 陳 宜珮; 中山 英樹

doi:10.11517/pjsai.JSAI2024.0_2G5GS604

第38回 (2024)

セッションID: 2G5-GS-6-04

DOI https://doi.org/10.11517/pjsai.JSAI2024.0_2G5GS604

会議情報

主催: 一般社団法人人工知能学会

会議名: 2024年度人工知能学会全国大会（第38回）

回次: 38

開催地: アクトシティ浜松＋オンライン

開催日: 2024/05/28 - 2024/05/31

テキスト生成のためのより良いLLM評価器：プロンプト出力のシーケンスと最適化の影響

*朱冠肇, 陳宜珮, 中山英樹

著者情報

キーワード: 大規模言語モデル, プロンプト, 会話評価

会議録・要旨集フリー

詳細

抄録

大規模言語モデル(LLM)は、テキスト生成タスクにおいて、生成されたテキストにスコアを割り当てる評価者として普及しつつある。しかし、LLMの評価者は一貫したスコアを与えることができない。本研究では、プロンプトのデザインがLLMの採点に与える影響を、特に主観的な対話品質評価タスクに焦点を当てて調査する。我々は、プロンプト内の出力順序に関する指示が、特定のLLMの得点分布に大きく影響することを発見した。この発見は、主観的な評価を必要とするタスクにおいて、微妙なプロンプトのデザイン要素が与える影響を浮き彫りにしている。私たちの分析は、LLMを採点者として使用する際の効果的なプロンプト・デザインの理解を深めることに貢献する。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）