情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
Derwent World Patents Index(DWPI)抄録の評価の試み 日本語特許公報を例に
松谷 貴己岡 紀子小林 伸行加藤 久仁政
著者情報
ジャーナル フリー HTML

2013 年 56 巻 4 号 p. 208-216

詳細
著者抄録

世界48の国・地域の特許を収録したDerwent World Patents Index(DWPI)は,サービス開始から50年を迎えた。この半世紀の間にわたる特許情報の提供,利用環境は劇的に変わったが,付加価値型二次データベースとして世界中の企業等で特許調査に利用されている。DWPIの特徴は,専門家による抄録,それも特許固有の情報要素を反映した構造化抄録と各技術分野に応じた独自の分類等の付加索引にある。ここでは,この構造化抄録に注目して,日本の特許公報を対象に評価検討した。構造化抄録のフィールドには,必須フィールドとオプションフィールドがあるが,必須の3フィールド,すなわちNovelty,Advantage,Useについて評価検討し,いくつかの知見を得たので報告する。

1. はじめに

世界48の特許発行機関(国・地域)の特許および2つの国際的な技術公開誌を収録したDWPI(Derwent World Patents Index)は,1963年注1)から世界の特許を収録している特許調査において重要なデータベースである。DWPIは製作元であるトムソン・ロイター社(当時はDerwent社)では各技術分野の専門家による標題および第三者抄録を作成し,技術分野ごとに独自に考案された分類(Derwent Class,Manual Code)を付与し,化学分野(Chemical Patent Index: CPI)にはさらに化学物質に対応した化学物質索引(低分子化合物には,ケミカルフラグメンテーションコード,高分子化合物には,ポリマーインデキシングコード)を付加している。そのため,高精度かつ効率的な特許検索が行えるとして,調査担当者から根強い信頼を得てきた。

DWPIの特徴は,標題,抄録,索引にあるが,ここではDWPI独自の抄録に着目し,専門家による第三者抄録の価値を評価した。

2. DWPIの構造化抄録

DWPIの抄録の最大の特徴は,他のデータベースにはみられない独自の構造化抄録にある。この構造化抄録は,特許公報を構成している明細書全文の構造に基づいて考案されている。

特許公報は,情報の単位や順序は別にして基本的にどの特許公報発行機関でも,同様な情報要素から構成されている。すなわち基本情報は書誌的事項,請求項,詳細な説明,図面等から構成されており,この情報要素をいかに利用者が望む形に作り変えるかが付加価値型二次データベースの特徴となる。

1999年08週から,Derwent社(現トムソン・ロイター社)は,DWPIの抄録を特許固有のフィールドに分けた構造化抄録に変更した。これにより,それまでの抄録に比べて,各特許情報の発明の把握がしやすくなった。DWPIの構造化抄録は,大きく3つに分かれている(表13)。そのうちのTechnology Focus抄録とExtension抄録は,各技術分野によって専門的なフィールドに細分化されており,抄録の内容そのものもかなり異なる。また,一部はCPI購読会員注2)のみ利用可能である。Technology Focus抄録は,20の技術的観点から発明の実施形態を詳細に記述し,従属クレームおよび明細書の「発明の詳細な説明」に記載される好適な条件を要約したものである。Extension抄録は,DWPIの化学分野(CPI)の特許に対してのみ作成され,利用は,トムソン・ロイター社のCPI購読会員のみに限定されているオプションフィールドである。

表1 3つの抄録とAlerting抄録のフィールド
抄録 フィールド 説明・定義 備考
Alerting抄録 Novelty 発明の新規性に関する部分で,メインクレームを中心に発明の特徴を法的専門用語を除いて記述したもの。メインクレームに相当するもので,ほとんどの場合,請求項1の内容である。 必須
Detailed Description Noveltyで十分に説明できなかったメインクレームの詳細な説明をここで表現している。新規物質のマーカッシュクレームのような複雑なクレームは,ここでブレークダウンしてわかりやすくまとめられている。また,独立クレームがある場合には,Independent Claims,またはAn Independent Claimとして別途記述される。 オプション
Activity 生理学的な活性を要約した部分で,化学物質(Chemical)や生物化学物質(Biological)の医薬,動物薬,農薬分野の発明の場合に作られる。この部分は,生理活性に持ちうる用語定義の一貫性が保たれている。 オプション
Mechanisms of Action 化学物質(Chemical)や生物化学物質(Biological)の医薬,動物薬,農薬分野の発明の場合に作られるが,作用機序が記載されていない場合は,none givenの記述が入る。 オプション
Use 発明の用途が記述されるが,もし,用途の記述がない場合は,none givenの記述が入る。 必須
Advantage 発明がこれまでの先行技術に比べて優れている点を記述したもので,構造化抄録の中でも最も特徴のある部分。発明の優位性が記述され,発明の狙いを理解するのに最も価値のある部分である。 必須
Description of Drawings Engineering分野の発明に重要な図面とその説明の情報で構成されている。化学分野では,化学構造式がこれに相当する。 オプション
Technology Focus 抄録 この抄録は,各技術分野の特徴を記述するフィールドで発明の内容によって必要に応じて表2のフィールドが作成されている。 オプション
Extension 抄録 この抄録は,化学分野の特許特有の実施例や出願の中で重要な化学物質等のフィールドが表3のように設けられている。このフィールドはオプションである。 オプション
表2 Technology Focus抄録のフィールド
フィールド 説明・定義
Agriculture 農薬,肥料の化合物,組成物(製法は除く)
Imaging and Communication 画像技術,印刷,インク,印刷媒体,放送等
Biology 生物学的な物質,イムノアッセイ
Industrial Standard 工業規格との比較がある場合
Biotechnology 遺伝子工学
Inorganic Chemistry セラミックス,ガラス以外の無機物質
Ceramics and Glass ガラス,セラミックス,耐熱性物質
Instrumentation and Testing 化学分析,試験,医療機器
Chemical Engineering 大規模な化学品の生産,加工
Mechanical Engineering 加工機械,機器類
Computing and Control 自動工程,環境関連
Metallurgy 金属精錬,金属加工,合金等の製造
Electrical Power and Energy 電力発電,原子力発電,放射能
Organic Chemistry 医農薬などの有機化合物の合成
Electronics 電子回路,装置
Pharmaceuticals 薬理効果のある化合物・組成物
Environment 環境管理,浄水処理,下水処理
Polymers ポリマーすべての種類やポリマーの製造
Food 食品,醸造,動物飼料
Textiles and Paper 繊維および紙の製造
表3 Extension抄録のフィールド
フィールド 説明・定義
Wider Disclosure クレームを超える技術的な開示があった場合に記述されるフィールドで,分割,継続,一部継続出願で記述される場合がある。
Administration 医薬品や動物薬の発明での投薬量。投薬方法について記述される。
Specific Substances 新規性に関係する化学物資を記述するフィールドで,代表的な化学物質をピックアップしている。ただし,すべての新規性に関わる化学物質を記述しているわけではない。
Example 実施例の中から代表的な一例を例示している。Technology Focusで既に開示されている場合は,重複のないように記述されている。
Definitions Detailed Descriptionフィールドのマーカッシュ構造で表現された化学物質から具体的な官能基に特定された記述がある場合に作成される。一般的には,マーカッシュクレームの従属クレームから作成していることが多い。

DWPIは世界中の特許を収録しており,どこの国のどんな言語の特許であっても,すべて英語で抄録を作成していることから,異なる複数の言語の公報を取り上げて英語抄録の品質を評価するのが理想である。しかし,複数の言語を十分に解釈できるかという課題があることから,ここでは日本特許を対象とした。DWPIで日本を含めて世界の特許を調査する場合,検索結果に含まれる日本特許の抄録の品質を確認する際の参考になると考えた。

3. 検討手法

トムソン・ロイター社では,日本の公開特許および日本語のPCT(Patent Cooperation Treaty:特許協力条約)に基づく国際出願は,機械翻訳(Machine Assisted Translation: MAT)によって日本語明細書全文の英語訳を作成し,これをもとに抄録・索引作業を実施している。ここではMATについての詳細な評価は避け,公報の日本語原文とDWPIの構造化抄録をフィールドごとに評価検討した。

対象公報としては,DWPIでベーシック注3)の日本公開特許,または,日本語で公開になったPCT公報を選択した。技術分野による偏りを避けるため,CPIのセクション注4)から,日本特許の重要性が高くトムソン・ロイター社の主要ユーザーの技術分野でもある高分子,医薬品,農薬,一般化学の4分野を選択した。各分野における,新規物質,製造法,組成物,用途特許等,発明の違いによる影響も考慮してサンプル公報を抽出した。データ作成年度による品質差も考慮し,2007年,2008年,2009年,2010年の4年間を対象にした。以上の条件で選択した4技術分野各4件,各年度16件の4年度分,合計で64件の特許公報を評価対象とした。

次に,DWPIの構造化抄録から,評価対象フィールドを選択した。DWPIのフィールドは必須フィールドとオプションフィールドに分けられており,ここでは,必須フィールドであるNovelty,Advantage,Use の3フィールドに着目した。評価は特許1件ごとに表4のような一覧表を作成して行った。

表4 評価表の例
No. 2007-B-1
AN 2008-E37624
出願番号 JP 2007-127292
公開番号 JP 2007326855
発明の名称 新規配糖体
出願人 三菱瓦斯化学
WPI 抄録項目 WPI 抄録 明細書記載
Novelty A steroid glycoside (1), is new. 【特許請求の範囲】
【請求項1】
 一般式(1)で表されるステロイド配糖体。
Advantage The steroid glycoside has antitumor activity or anticancer agent sensitivity activity. The steroid glycoside can be obtained in high purity with high yield. 【発明の効果】
【0009】
 本発明により,一般式(1)で表される新規ステロイド配糖体,並びにその製造方法および製造物を提供することが可能となる。より具体的には,・・・・分画手段で精製することにより,抗腫瘍活性または抗癌剤感受性増強活性を有するステロイド骨格を持った新規強心配糖体を提供することができる。
【0012】
 用いる抽出溶媒としては,・・・しかも高い回収率を与える点で好ましい。抽出溶媒量としては,・・・抽出する方法が適当である。・・・・抽出率若しくは抽出純度の点で,1~20重量%,より好ましくは2~10重量%に管理されることが望ましい。・・・のものであってもよい。
【0015】
 より高純度の比活性の高い抗腫瘍活性画分または抗癌剤感受性増強活性画分を単離する場合,・・・・なく,目的とする抗腫瘍活性または抗癌剤感受性増強活性を有するステロイド配糖体が高純度かつ収率よく分画できる条件を適宜選択すればよい。
Use As antitumor agent, cardiotonic and anticancer agent sensitivity enhancer (all claimed). 【請求項7】
 請求項1または2に記載の配糖体を有効成分とする抗腫瘍剤。
【請求項8】
 請求項1または2に記載の配糖体を有効成分とする強心剤。
【請求項9】
 請求項1または2に記載の配糖体を有効成分とする抗癌剤感受性増強剤。

4. 結果

対象特許64件の構造化抄録の各フィールドが,その定義に従って記述されているか,また,特許公報の発明の内容を簡潔に表現し,わかりやすい抄録になっているかについて評価した。

4.1 結果の概要

評価結果の一覧を表5に示す。構造化抄録の特徴を生かし,特に優れていると判断した個所のある抄録は8件,3フィールドのいずれかに何らかの問題があった抄録は34件,優れているが,問題個所もあったものが2件,残りの20件は適正と判断した。

表5 結果の一覧表

4.2 フィールドごとの特徴

(1) Novelty

Noveltyのフィールドはすべての特許で作成され,ほとんどは請求項1が記述されていた。新規性に相当する部分として請求項1が発明を代表している事実からすると,これは妥当である。ここでの問題点は,請求項1のみでは,新規性を表現しきれていない発明について,7件の抄録の記載内容に不足がみられたことである。

優れた抄録としては,請求項1だけでなく,新規性の説明に必要な下位の請求項2以下を含め,新規性を記述した抄録も存在した。また,抄録の問題個所は,日本語でも難解な表現になっており,請求項1の記載が複雑で多岐にわたっていたため,MATでの誤訳に起因するものと考えられる。

(2) Advantage

AdvantageフィールドはDWPIの価値を最も発揮するフィールドであるにもかかわらず64件中4件で作成されていなかった。それも,医薬品,農薬というトムソン・ロイター社にとっては最大の価値を生む技術的核心部分であった。Advantageフィールドの問題点は,当該発明の進歩性を十分に説明すべき個所にもかかわらず,記述不足が目立ったことである。

たとえば,AN: 2008E37743では,「The thiocarboxylic acid-S-(tetrahydropyran-3-yl) ester having improved yield is manufactured with high safety.」としているが,発明の主題は,「3,4-ジヒドロ-2H-ピランとチオカルボン酸を,アルコール系溶媒または芳香族系溶媒中で反応させることにより,チオカルボン酸S-(テトラヒドロピラン-3-イル)エステルを安全かつ工業的に製造できることを見出した」点であり,下線部に発明の特徴がある。これが記述されていない。

このフィールドは,発明の効果から作成されている例が多く,優れたものは,請求項や産業上の利用可能性,発明が解決しようとする課題など明細書全文から主題をくみとって作成されていた。

例として,AN: 2010F18721「The near-infrared absorption composition efficiently absorbs light of near infrared region but does not absorb light of visible region. The composition has reduced discoloration and photo degradation. The composition provides resin kneaded materials having excellent light resistance, bleeding resistance with respect to compounds, and storage stability.」を挙げる。これは,「【発明の効果】【0015】本発明の近赤外線吸収組成物は,高い不可視性と堅牢性とを有し,かつ光劣化による変色が少ない。本発明の近赤外線吸収塗布物,及びその樹脂混練物は,前記近赤外線吸収組成物を用いてなるので,高い不可視性と堅牢性とを有し,かつ光劣化による変色が少ない。【0133】(前略)前記近赤外線吸収化合物及び前記紫外線吸収剤の析出や長期使用によるブリードアウトが生じることがない。また,本発明の樹脂混練物は,近赤外線吸収フィルタや容器として用いることができ,近赤外線等に弱い化合物などを保護することもできる」から作成されている。

(3) Use

Useのフィールドは64件すべての抄録で作成されていた。判断で優れていると評価された抄録のうち,7件はこのフィールドの高評価によるものである。これらは,発明の主題を的確に捉え,主たる用途を記述した抄録であった。一行記載注5)の用途は含まれていなかった。

一方で,このフィールドは問題点の多いフィールドでもあり,記述過多が目立ったフィールドであった。請求項,実施例の用途を正確に記述していない抄録が他のフィールドと比較して多く見られた。例として,AN: 2008N09904を挙げる。「As an agrochemical, preferably insecticide and acaricide (claimed), or killing pest such as Nilaparvata lugens, Myzus persicae, Spodoptera litura, Plutella xylostella (diamondback moth), Adoxophyes, Scirtothrips dorsalis, Oulema oryzae (leaf beetle larva), Liriomyza trifolii or Tetranychus urticae and rust mite in plants such as rice, tomato, Brassica campestris and cucumber.」とあるが,実施例は,ナミハダニ,ミカンハダニ,コナガで薬害がないことの証明にイネ,トマト,コマツナ,キュウリの茎葉散布除草試験およびタイヌビエ,ホタルイの種子の発芽阻害発現試験を行ったものであり,抄録の内容は実施例と異なる。Novelty,Advantageでみられた抄録の記述不足とは対照的であった。

4.3 技術分野ごとの特徴

(1) 高分子

検討対象の抄録16件のうち,優れているか適正と判断した抄録が9件と半数以上を占めた。Novelty,Advantage,Useの各フィールドでの問題の偏りは見られなかった。

(2) 医薬品

Noveltyでは優れた抄録,問題のある抄録は各1件と全体に記述は適正であった。Advantageは作成されていない抄録が3件,また,公報のどこから引用したのか確認できなかったものが1件あり,半数に問題があった。Useは,よくまとまっているものが3件,一般的な記載で意味のないものが2件,不適切な記載が1件で,約3分の1に問題があった。このセクションは,全体を通してみると,約3分の2近くの抄録に問題個所があった。

(3) 農薬

Novelty,Advantage,Useの各フィールドに問題があった。Advantageでは,発明の特徴に対して一般的なexcellentといった意味のない記述が散見され,具体的な記述が不足していた。また,Useの記述過多が7件もあり,この中には,特許でよく出てくる一行記載の用途を記述した例も見られた。これに不足2件を加えるとUseでは,適正な抄録は7件と少ない。他の分野に比べて問題個所の多い分野であった。

(4) 一般化学

4つの技術分野では,問題の少ない分野であった。優れている抄録,適正な抄録が全体の3分の2以上を占めていた。問題としては,Advantageの記述不足が4件あった。

5. 考察

DWPIの構造化抄録64件のうち,発明の新規性を記述したNoveltyは問題個所があまりなく,利用するうえでの注意点は少ないと考える。しかし,この部分は請求項1を基本として作成されているため,付加価値型二次データベースとしての特徴は出しにくいフィールドである。

Advantageは,発明の進歩性を記述する重要な部分で,専門家ならではの力が発揮できる部分である。このフィールドでは,医薬品,農薬分野で作成されていない事例が見つかった。また,同技術分野を中心に抄録の記述不足が散見された。

特に問題点が多く見つかったフィールドはUseで,医薬品,農薬分野では,記述不足も見られたが,記述過多が32件中12件とかなり高い割合であった。この分野は,明細書の記載内容に一行記載の用途や,製剤特許のような汎用性のある発明で可能性のある分野への拡大記載が一般に行われているため,それを発明の主題の用途と勘違いしているものとみられる。

また,全体に,技術分野によるばらつきが見られたが,年度による抄録の品質のばらつきは見られなかった。

6. まとめ

DWPIは専門家によって作成された構造化抄録とトムソン・ロイター社独自の標題と技術分類を付加した特許二次データベースである。医薬品の特許を収録し始めて50年が経過した。この半世紀に及ぶ特許情報の環境の変化,特にこの10年の変化は目覚ましく,激変と言っても過言ではないだろう。

これまで,提供側の情報環境を利用者として見てきたが,実は最も大きく変化したのは利用側で,特許という発明に最も身近にいる技術者・研究者が最大の直接利用者になってきた。特許情報はこれまで,一部の知財等の専門家のみが取り扱うある種,閉鎖的な環境にあったが,特許公報の電子化は,いわゆるエンドユーザーが直接の利用者になることを可能にした。

特許公報の電子化はまた,特許という情報の価格を大きく変えることになった。DWPIに代表される付加価値型二次データベースは,専門家の頭脳労働による,いわばカスタムメイドのデータベースである。自動化やマスプロ生産には向かず,人的資源も限られているのが実情である。一方,電子化公報の全文データベースは,全文検索エンジンの進歩とデータのストレージコストの低減化により,多くの新規機関が参入した。特許公報の発行機関である各特許庁は情報公開の立場から無料で特許を公開するに至り,特許情報を事業とするにあたっては,付加価値の創造と提供形態による利便性の向上という2つの方向性が明確になった。そして,年々,特許公報の記載内容が複雑化し,特に請求項の記載が多岐にわたるなど,特許公報の選別,読み込みに技術者・研究者が要する時間は増大してきている。

そこで,調査担当者だけでなく,多くのエンドユーザーにとって調査結果の判断にこのDWPIの構造化抄録が今後ますます重要になり有効に活用されていくものと考える。

7. おわりに

今回はDWPIの構造化抄録,3フィールドについて公報と比較して評価検討したが,いくつかの問題が見つかった。抄録は「読むものとしての価値」とキーワード検索の際の「検索キーとしての価値」という2つの側面と,近年では,テキストマイニングの技術の進歩によって情報分析の対象項目としての側面も加わり,ますます重要なフィールドとなっている。これらのことを考慮した抄録作成が必要である。

今回は検討していないが,検索面では,抄録の質がキーワード検索の結果に直接影響する。DWPIで漏れのない検索を行おうとしたらキーワードのみでは無理なことは自明であるが,より適合率の高い検索を目指す場合は,質の高い抄録の作成は十分に意義がある。また,DWPIの構造化抄録のフィールドの特性を生かした特許情報の分析の場面でも質の高い抄録は分析結果の精度を向上させる。

DWPIの構造化抄録のNovelty,Advantage,Useの必須3フィールドのみを評価したが,DWPIには標題,専門分野ごとに抄録のオプションフィールドもあり,総合的な評価を機会があれば実施してみたいと考える。

現状のDWPIの抄録の品質にはばらつきのあることが判明したので,今後さらなる品質の向上を図り,より信頼性の高いデータベースの提供を期待する。

謝辞

本稿は,日本アグケム情報協議会2011年度オンライン研究会で行ったテーマをもとにまとめた。寄稿に当たり,トムソン・ロイター社のツー・ツォン(Charry/Chong CHU)氏には資料提供等でご協力いただいた。ここに感謝の意を表したい。

本文の注
注1)  1963年は医薬分野,1965年から農薬分野,1966年から高分子分野,化学全般は1970年以降の収録。

注2)  2013年5月現在,化学分野(CPI)のマニュアルコード,化学物質索引(ケミカルフラグメンテーションコード,ポリマーインデキシングコード)はCPI購読会員のみ利用可能である。それ以外の部分については非CPI購読会員も利用できるが,利用料金は異なる。

注3)  最初にトムソン・ロイター社が収録した特許をベーシック(基本)特許と位置づけ,抄録・索引を作成する。ベーシック特許の優先権データと同じデータがある特許をDWPIでは,原則,対応特許とする。

注4)  CPIはセクションAからMまでのIを除く12のセクションに分かれている。

注5)  実験による裏付けのない予測による記載。

参考資料

  1. a)   “DWPI抄録の形式”. トムソン・ロイター. http://ip-science.thomsonreuters.jp/products/dwpi/faq/abstract/, (accessed 2013-05-23).
  2. b)   Thomson Reuters. Overview of DWPI value add. Thomson Reuters. 2012.
  3. c)   Thomson Reuters. DWPI & the editorial process overview. Thomson Reuters. 2012.
  4. d)   オールト, デビット. 新規DWPIオンラインファイル開発の概要. 情報管理. 2000, vol. 42, no. 10, p. 867-875.
  5. e)   Larner, Brian. The DWPI editorial process: How we add value to our patent data. Thomson Reuters. 2009.
  6. f)   Adams, Robert. "DWPI update". Thomson Reuters. 2008. http://ip-science.thomsonreuters.jp/media/ps/dwpi/latest/DWPI_Update-July_2008_v1.0.pdf, (accessed 2013-05-23).

 
© 2013 Japan Science and Technology Agency
feedback
Top