機械学習を用いた効率的な特許調査 ニューラルネットワークの特許調査への応用

安藤 俊幸; 桐山 勉

doi:10.11514/infopro.2017.0_83

第14回情報プロフェッショナルシンポジウム

セッションID: A31

DOI https://doi.org/10.11514/infopro.2017.0_83

会議情報

主催: 一般社団法人情報科学技術協会

会議名: 情報プロフェッショナルシンポジウム

回次: 14

開催地: 東京都千代田区（国立研究開発法人科学技術振興機構　東京本部別館）

開催日: 2017/11/30 - 2017/12/01

A31

機械学習を用いた効率的な特許調査

ニューラルネットワークの特許調査への応用

*安藤俊幸, 桐山勉

著者情報

キーワード: ニューラルネットワーク, 機械学習, 分散表現, doc2vec, word2vec, 類似度, 特許調査, 先行技術調査, 特許情報解析, 可視化

会議録・要旨集フリー

詳細

抄録

ニューラルネットワークを利用した機械学習を用いて効率的な特許調査方法を検討した。特に先行技術調査を念頭に特許検索競技大会2016の化学・医薬分野の問２（ガスバリア性包装用フィルム）を例題として選択しデータセットを作成して前半ではスクリーニング過程の再現率曲線に影響を与える要因を実験的に検討した。
後半はニューラルネットワークの機械学習を用いて単語の分散表現で文書の固定長ベクトルが得られるdoc2vecの学習モデルを使用して公報の類似度を計算する手法を検討した。その結果単語の出現頻度と出現順序を考慮したモデルPV-DMを使用すると非常によい類似度計算ができることがわかった。公報の類似度計算精度が向上すると特許調査において効率的なスクリーニングが可能となる。
本報で検討した分散表現ベクトル（doc2vecの出力ベクトル）を使用して各特許公報間の関係の可視化もできるので精度の高い動向調査に応用可能である。特許調査の精度を上げるには前処理の形態素解析による「分かち書き」が重要になる。

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）