情報の科学と技術
Online ISSN : 2189-8278
Print ISSN : 0913-3801
ISSN-L : 0913-3801

この記事には本公開記事があります。本公開記事を参照してください。
引用する場合も本公開記事を引用してください。

知的財産の調査・分析におけるAI技術の活用
クラリベイトの取り組む自然言語処理技術と画像認識技術
宮田 和彦外山 澄子
著者情報
ジャーナル フリー HTML 早期公開

論文ID: 2024-011

この記事には本公開記事があります。
詳細
発表概要

昨今生成AIは急速な広がりを見せており,知的財産に関する調査分析でもAIを活用する期待は高く,様々なAIを活用したツールが各社から発表されている。クラリベイトは,キュレーションされた特許コンテンツであるDerwent World Patents Index(DWPI)を擁しており,これをベースにLLM(大規模言語モデル)を構築したAI Searchを開発してリリースを待っている。そして60年以上にわたり蓄積してきた特許情報を活用することで信頼されるAIの実現を目指していく。

さらに,意匠調査では,AI技術による画像認識をベースとするDesign Visionを提供し多くの知財庁で審査に活用されており,これらイノベーションに貢献するクラリベイトのAIへの取り組みも紹介する。

1. はじめに

知的財産の分野においても,生成系AIは急速な広がりを見せており,様々なワークフローの効率化や自動化,正確性の向上などが期待されている。一方で,法的な権利に関する情報や未公開の情報を扱う場合も多いことから,その仕組みや結果への信頼性について高いレベルが要求される領域であるといえる。Clarivate(クラリベイト)は,「人類のもつ創意工夫の力を解放することにより,世界中の偉大なブレークスルーを加速させる」をビジョンとして,様々なセクターで研究開発やそれを社会実装するために必要なコンテンツやサービスを長年提供してきている。

この発表では,知的財産の調査・分析において求められる信頼性を担保しつつ,AI技術を活用していく取り組みの事例を紹介する。

2. 特許調査におけるAI技術の活用

自然言語処理(NLP)におけるAIの活用の歴史は長く,翻訳や構文解釈などに広く応用されている。特許コンテンツであるDerwent World Patents Index(DWPI)では抄録等作成時のキュレーションに,弊社内部でAIによるNLPを活用し効率化を図ってきた1)。DWPIは,発明の技術的内容について,独自のタイトルや抄録をテキストデータとして有しており,多くのユーザーからの信頼を得てきた1)3)

現在開発中のAI Searchは,このDWPIによってトレーニングされたAIであり,DWPIタイトル,抄録及び請求項等をベースにして大規模言語モデル(LLM)を作成している,これを活用することで,特許文書をより包括的に正確な概念で検索することを可能とする。

技術内容を自然言語により入力することで,その技術的内容の文脈を把握した検索でき,結果は関連性が高い順に表示される。さらに,各結果レコードにおいて,最も関連性のある対応するテキスト情報をハイライト表示することができる。

さらに,検索時には,他のフィールド(CPC,公報発行日等)と組み合わせて,AI Searchの結果を絞り込むことも可能である。

そして,検索のために入力する文章は,AIの学習等に使われることは一切ないことを表明している。DWPIのキュレーションされたデータを中心にAIモデルを作っていることや,関連性の高い個所を明示することで,信頼性を担保している。

予稿執筆時には,開発中のステータスでチューニングを重ねているが,当日の発表では,実際に最新のバージョンで,どのような入力からどのような結果が出力されるかをお見せしていきたい。

図1  「AI Searchの概要図(Derwent Innovation)」

3. 意匠調査におけるAI技術の活用

弊社のAIによる画像認識技術は,顔認識ソフトウェアの原理を利用して,芸術作品,図形,さらには3Dデザインを視覚的に検索できるTrademarkVision社の技術を2018年に導入したことにはじまる。名前の通り商標の画像検索からスタートして,現在は意匠画像検索にチューニングされた「Design Vision」として主に官公庁向けに提供している2)

意匠検索はその分類コードが国ごとに異なり,図形的特徴が分類に反映されていない場合も多く,キーワードや意匠分類等,書誌事項の検索では最終的に,検索の実行や人の目によるスクリーニング等に多大な労力を掛けている背景があり,特許と比較すると画像検索のニーズが大きい注1)

「Design Vision」は,現在69の国や地域の意匠における8,000万枚以上の画像を取得してこれによりAIモデルを構成する。意匠の図面は,出願の方式が決まっていて「正面図」「側面図」「斜視図」「断面図」など様々な視点があるが,視点の違いを考慮した検索が可能となるよう学習されており,複数の図面を一度に読み込み検索を行うことを可能としている。さらに自動的に輪郭判断して切り抜く機能を実装している。また,意匠分類や出願人などでの絞り込みも可能である。結果は類似性の高いものから表示される。

そして,特許と同様に,アップロードされた画像はAIの学習に使われることは一切なく,履歴も検索者が完全に削除可能である。国際分類等で整理された意匠情報の画像データをベースにAIモデルを作っていることで,信頼性を担保している。

発表では,実際にいくつかの画像からどのような結果が出力されるかをお見せしながら,意匠の画像検索の意義について論じたい。

本年この「Design Vision」が米国特許商標庁(USPTO)の意匠特許審査官が用いるツールとして採用され今後審査に活用されていく2),また,他の特許庁や公的DB注2)での利用実績もあるものであり,これらグローバルユーザーからのフィードバックで,より良いAI画像検索モデルを構築していけるだろう。

図2  「意匠画像検索の概要図(SERION)」

4. おわりに

今回紹介したAIを活用した検索技術は,どちらもチャットライクな対話型AIとは異なるものであり,知的財産の権利範囲に相当する自然言語や画像を入力して,より近い結果を返す仕様である。弊社は,自然言語処理や画像認識に関するAI技術などを蓄積してきており,今後,誰でも使いやすいユーザーインターフェースを目指して対話型AIの開発も考えられているが,まだまだ知的財産領域におけるAIの利活用の先が読みにくい黎明期であると捉え,今回このような紹介とさせて頂いた注3)

弊社では,他にも知財の係争(審判/裁判)に関するコンテンツや学術文献,医薬品等開発情報に関するコンテンツも擁していて,今後,AI技術を使って異なるデータ間の連携や融合を促進していくことで,ユーザーに対して新しい切り口での情報を提供できると考える注4)。このような部分の可能性についても当日議論できれば幸いである。

注1)  特許はその権利範囲や対応する詳細な説明が文言(自然言語)で表され,国際特許分類も長く多くの国で使われている。一方,意匠は,物品の概観を保護するもので,その権利範囲は「図面」を基準として文言による説明は参考とされる。

注2)  オーストラリア特許庁の公的DB「Australian Design Search」では,このDesign Visionを一部活用した画像検索システムを導入し誰でも利用可能である。 https://search.ipaustralia.gov.au/designs/search/quick

注3)  学術文献Web of Scienceのプラットフォームでは「Web of Science Research Assistant」として,対話型AIの提供を開始している。 https://clarivate.com/blog/beyond-discovery-ai-and-the-future-of-the-web-of-science/

注4)  「Design Vision」では意匠の先行技術調査で活用可能な特許図面の一部を画像検索の対象とする枠組みを実装する準備がある。化学分野で論文情報と特許情報とをクロスオーバーで検索可能なソリューションも開発中である1)

参照文献
 
feedback
Top