人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 4A1-GS-6-05
会議情報

大規模言語モデルとシソーラスを融合した特許文書を対象とする検索クエリ拡張
*森 楓野中 尋史邊土名 朝飛河野 誠也吉野 幸一郎丸崎 恒司片岡 翔太郎
著者情報
会議録・要旨集 フリー

詳細
抄録

特許検索とは,特許データベース内に存在する技術や発明.発明者,及び申請者に関するデータを調査するプロセスを指す.特に,特許侵害が裁判で認められれば,高額の賠償金やライセンス料を求められる可能性があるため,先行技術調査が重要である. ただし,特許文書は独自の語彙で構成され,かつ文書数が膨大なため,調査には膨大なコストがかかる.網羅的な検索を目指し,検索クエリを拡張する手法等がいくつか存在するが,総じて少数の特許にのみ存在する複雑な語彙に対応できない課題を抱えている. そこで本研究では,シソーラスと大規模言語モデル(LLM)を組み合わせたクエリ拡張を提案する.本研究ではLLMの出力傾向や既存のシソーラスとLLMによって生成される新たな単語の独立性や共起率に焦点を当て,手法に関する基礎的な分析を行った.結果として,大規模言語モデルで生成された新たな単語は,既存のシソーラスとの共起度が低かった.大規模言語モデルにより新たな語彙の生成に成功し,特許文書の独自の語彙や複雑な表現に対応した,網羅性の高い特許検索が実現できる可能性が示唆された.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top