人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 2I5-GS-10-04
会議情報

コスト削減手法を取り入れたRAGによる質問応答システムの提案
*増田 嶺岩本 和真道信 祐成北 健志竹原 一駿安藤 一秋亀井 仁志最所 圭三喜田 弘司
著者情報
キーワード: 検索拡張生成, ChatGPT
会議録・要旨集 フリー

詳細
抄録

Retrieval-Augmented Generation (RAG) は,外部の情報を大規模言語モデルと結びつけることで,組織内のドキュメントなどに対応した質問応答を可能とする技術である. 近年は,ChatGPTとRAGを組み合わせた質問応答サービスも普及しつつある. 一方で,GPT-4などの高性能なモデルを大規模な環境で利用する場合,入力トークンの増加によって,APIのコストが高くなる傾向にある. 本研究では,回答生成の前にGPT-3.5などの低コストなモデルを用いて,ドキュメントから必要な情報のみを選択する追加ステップを導入することを提案する. これにより,回答生成時に利用するトークン数が減少し,GPT-4における利用コストを抑えることが可能となる. また,提案手法を用いた結果と従来手法の結果を比較し,その効果を検証した. 結果として,提案手法が精度を保ちつつ,コストを抑えることを確認した.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top