主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
特許検索とは,特許データベース内に存在する技術や発明.発明者,及び申請者に関するデータを調査するプロセスを指す.特に,特許侵害が裁判で認められれば,高額の賠償金やライセンス料を求められる可能性があるため,先行技術調査が重要である. ただし,特許文書は独自の語彙で構成され,かつ文書数が膨大なため,調査には膨大なコストがかかる.網羅的な検索を目指し,検索クエリを拡張する手法等がいくつか存在するが,総じて少数の特許にのみ存在する複雑な語彙に対応できない課題を抱えている. そこで本研究では,シソーラスと大規模言語モデル(LLM)を組み合わせたクエリ拡張を提案する.本研究ではLLMの出力傾向や既存のシソーラスとLLMによって生成される新たな単語の独立性や共起率に焦点を当て,手法に関する基礎的な分析を行った.結果として,大規模言語モデルで生成された新たな単語は,既存のシソーラスとの共起度が低かった.大規模言語モデルにより新たな語彙の生成に成功し,特許文書の独自の語彙や複雑な表現に対応した,網羅性の高い特許検索が実現できる可能性が示唆された.