主催: 一般社団法人 人工知能学会
会議名: 第34回全国大会(2020)
回次: 34
開催地: Online
開催日: 2020/06/09 - 2020/06/12
医療機器関連の特許や審査書類は大量にあるが、大半が紙媒体の申請でデジタル化されていない。これらを自動的にデジタル化し、解析することで新たな知見を得られる可能性がある。そのため、医療機器関連の特許や審査書類をデジタル化し、半自動分類をするシステムを構築した。 Adobe Acrobat DCを用いて特許書類をデジタル化し、形態素に分解する。形態素の重要度をTF-IDF法を用いて計算し、誤変換の頻度の高いワードを抽出する。その後、RNNを用いてテキストデータを大分類4種、小分類127種に分類する。これらを自動的に行うRPAシステムをPythonベースで構築した。その結果、高い分類精度を得ることができた。