情報プロフェッショナルシンポジウム予稿集
第17回情報プロフェッショナルシンポジウム
会議情報

07
特徴量のカプセル化と重み付けによる特許調査精度向上検討:
DESKBEEにおける形態素解析の問題回避と重み付け
田畑 文也
著者情報
会議録・要旨集 フリー

p. 37-42

詳細
抄録

AI(人工知能)を用いて特許調査の効率化が検討されているが、なかなか思ったように精度が出ない場合も多い。本検討では、アイ・ピー・ファイン(株)のDESKBEE®を用いて、特許調査精度を向上させる手段を検討した。

半導体薬液特許を母集団とし、フッ酸の有無で正解・ノイズと分け、どのようにすれば精度が向上するか調べた。今回の特徴量であるフッ酸について、同義語の用語統制を行ったが、まだ十分な精度が得られず、その原因が形態素解析起因の問題であると考えた。そこで、DESKBEEで用いられている形態素解析システム(MeCab)が、日本語処理において、アルファベットの文字列を一塊の文字列として処理する特性を利用して、フッ酸を“AAAA”などと、一塊のアルファベットの文字列に置き換え(カプセル化)、形態素解析起因の問題を回避し、劇的に精度を向上できることを見出した。

また、特徴量の重み付けとして、カプセル化した“AAAA”を、“AAAA、BBBB” や “AAAA、BBBB、CCCC”などと、複数の形態素が近くに存在するような形に読点”、“で区切って連続させると、正解・ノイズの分離精度が上がり、特徴量を重み付けることができることを見出した。これらの精度向上方法は、DESKBEEだけでなく、いろいろなAI系ツールでも同様に使える可能性あるので、ここに報告する。

著者関連情報
© 2020 一般社団法人 情報科学技術協会
前の記事 次の記事
feedback
Top