主催: 一般社団法人 情報科学技術協会
会議名: 情報プロフェッショナルシンポジウム
回次: 14
開催地: 東京都千代田区(国立研究開発法人 科学技術振興機構 東京本部別館)
開催日: 2017/11/30 - 2017/12/01
ニューラルネットワークを利用した機械学習を用いて効率的な特許調査方法を検討した。特に先行技術調査を念頭に特許検索競技大会2016の化学・医薬分野の問2(ガスバリア性包装用フィルム)を例題として選択しデータセットを作成して前半ではスクリーニング過程の再現率曲線に影響を与える要因を実験的に検討した。
後半はニューラルネットワークの機械学習を用いて単語の分散表現で文書の固定長ベクトルが得られるdoc2vecの学習モデルを使用して公報の類似度を計算する手法を検討した。その結果単語の出現頻度と出現順序を考慮したモデルPV-DMを使用すると非常によい類似度計算ができることがわかった。公報の類似度計算精度が向上すると特許調査において効率的なスクリーニングが可能となる。
本報で検討した分散表現ベクトル(doc2vecの出力ベクトル)を使用して各特許公報間の関係の可視化もできるので精度の高い動向調査に応用可能である。特許調査の精度を上げるには前処理の形態素解析による「分かち書き」が重要になる。