特許調査においては調査目的により程度の差はあれ再現率(網羅性)重視で検索集合を作ることを前提としている。ただし再現率重視だとノイズは増加する。
本報告では再現率重視の検索集合からテキストマイニング手法を応用して適合率重視で抽出/ソートを行い、スクリーニングを支援する手法として下記検討を行った。
(1)キーワードのネットワーク分析による重要語(特徴語)抽出
(2)キーワードを用いて計算した公報の類似率によるネットワーク分析
(3)適合率を重視した特許調査への応用
キーワード解析は iPS 細胞をテーマにして日・中文で比較検討した。中国特許公報より抽出したキーワードをネットワーク分析して重要な中国語キーワードセットを選択する。重要な中国語キーワードセットを用いることで検索集合の適合率向上に有用である。さらにダウンロード集合の類似率ソートを用いた手法を提案する。
抄録全体を表示