人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 4Xin2-66
会議情報

外部知識なし/モデル内部秘匿/低温度固定状況でのデータ拡張を用いたサンプリングによる日本語LLMの幻覚検知
*中井 諒馬石川 琉聖橋本 俊甫井上 博之
著者情報
会議録・要旨集 フリー

詳細
抄録

大規模言語モデル(LLM)が入力に対し不正確な応答をする現象は幻覚(Hallucination)と呼ばれ,LLMの社会実装における重大な問題である.外部知識を利用せずにモデルの入出力インタフェースのみを利用し,サンプリングベースで幻覚検出を行う手法にSelfCheckGPTがある.SelfCheckGPTではサンプリングを行う際にLLMの温度パラメタを上昇させる必要があるが,Web版のChatGPTのようにLLMサービスの中には温度パラメタを設定できないものも存在する.特に正確な応答をするよう設計されたLLMサービスでは,その温度が低温度に固定される可能性があるため,SelfCheckGPTの性能が悪化する可能性がある.本研究では,低温度固定状況下における幻覚検出の性能を改善するため,サンプリング時にプロンプトに対してランダム文字列の追加もしくは逆翻訳によるデータ拡張を施す手法を提案し,日本語LLMを対象に実験した.その結果,低温度固定状況下でSelfCheckGPTより良い性能を発揮することが分かった.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top