2016 Volume 58 Issue 12 Pages 919-923
2015年10月に公開された経済協力開発機構(OECD)によるオープンサイエンスの進捗状況や課題に関するレポートを紹介する。本レポートは,WWWがパブリックドメインで公開されてから22年が経過したにもかかわらず,科学のデジタル化とオープン化はいまだに苦戦しているとする立場から,各国の状況を評価している。また,UNESCOや欧州連合(EU),世界銀行といった国・地域を超えた機関の取り組みや,オルトメトリクス(altmetrics),オープン査読,市民科学の広がりなど,オープンサイエンスに関するさまざまなトピックが盛り込まれている。通読することによってオープンサイエンスの現状が見渡せる貴重なレポートであるといえよう。
レポートはエグゼクティブサマリーと4章で構成され,第1章はオープンサイエンスの理論的根拠,第2章は論文のオープンアクセス,第3章は研究データの公開,そして第4章はオープンサイエンス政策に焦点を当てている。多数の調査研究に基づく報告であり,本文中で主要な当事者(key actor)として論及されている(1)研究者,(2)政府省庁,(3)研究資金提供機関,(4)大学や公的研究機関,(5)図書館,リポジトリ,データセンター,(6)民間非営利団体,財団,(7)民間の学術出版社,(8)企業にとって有益かつ示唆に富む内容となっている。
本稿は,レポートの章立てに沿って主要な項目について紹介する。ただし,カッコつき数字で示した小見出しは必ずしもレポートの見出しとは一致しておらず,紹介者が複数の見出しをまとめた箇所もある。また,レポート全体の総括として,エグゼクティブサマリーの第4節にある主要な結果と政策メッセージを(レポートとは順番を入れ替えて)最後に紹介する。
科学研究の公開性は,科学における効率の向上,研究の検証による透明性と質の向上,技術革新の加速,経済への波及効果,地球規模の課題への効果的な取り組み,共同研究の推進,市民科学の促進などと関連づけられることが多い。特に発展途上国は,オープンアクセスの恩恵を受けるとされている。
(2) 論文へのアクセス過去10年で,学術論文におけるオープンアクセス論文の相対的なシェアが拡大していることが明らかにされている。しかし,分野によってオープンアクセス論文の比率や,ゴールドオープンアクセス(出版社による公開)とグリーンオープンアクセス(著者によるセルフアーカイブ)の比率が異なる。図1にみられるように,物理学・天文学,地球科学,数学,社会科学などでは,グリーンオープンアクセスが盛んに行われている。特に,生物医学を対象としたPubMed Central(PMC)と物理や数学系のarXivの影響は大きい。さらに,グリーンによるセルフアーカイブまでのエンバーゴ(公開猶予期間)も分野によって異なることが明らかにされている。つまり,論文のオープンアクセスは進化しているものの,分野による差が著しいといえる。

研究やデータの公開による経済的価値の推定が試みられている。オーストラリアの公的機関による研究成果へのアクセシビリティの増加は,20年間で約90億豪ドルの利益を生み出すとされている。また,米国の連邦研究機関に義務付けられるパブリックアクセスポリシーの効果は,30年間で約16億米ドルに相当し,さらにエンバーゴがなければ最大17.5億米ドルに達すると推定されている。うち約10億米ドルが米国経済に直接役立ち,残りは他国に対する経済的波及効果につながるという。その金額はオープンアクセスのアーカイビングにかかる推定費用をはるかに上回る。Jiscによる調査では,英国の3つのデータセンターの経済的影響は,投資額に対して30年間で約2倍から10倍になると見積もられている。
オープンアクセスによる出版には,いくつかの形式がある。第1章で紹介したゴールドオープンアクセスの特殊なタイプとしてハイブリッドモデルがある。これは,著者や所属機関がAPC(論文出版加工料)を支払うことによって,特定の論文をオープンアクセスにする方式であるが,雑誌の購読料とAPCの2重払い,価格,ライセンス付与,エンバーゴといった問題が指摘されている。
OECDの調査によれば,ゴールドオープンアクセスに必要な費用を支給する国や機関が多いにもかかわらず,大半の国ではグリーンオープンアクセスが優勢である。一方で,主要な学術雑誌への掲載を希望する著者もみられる。こうした状況において,SCOAP3イニシアチブは,高エネルギー物理学の論文をオープンアクセス化することを目的として,学術出版社を対象としたAPCの入札を行った。
(2) オープンアクセス出版と知的財産権保護著作権などの知的財産権のあり方は,オープンアクセスの推進に深くかかわる。たとえば,権利の強さやタイプは,公開された情報の使用の制限につながる。その枠組みとして,リブレ(libre,自由)とグラティス(gratis,無償)があるが,リブレはより広い利用が可能であり,クリエイティブ・コモンズ・ライセンスのCC BYまたはCC BY-SAに対応すると考えられる。
また,著作権の例外規定やフェアユースによって使用範囲の拡大や制限の緩和も行われる。英国は著作権法に第29A項を追加して,非営利目的の研究であれば,テキストマイニングおよびデータマイニングのための複製は著作権の侵害にならないこととした。
データはタイプやサイズ,利用方法,長期的価値によって大きく異なる。研究において特に重視される4種類のデータがある。
公開されたデータの品質は,活用のためにも重要である。OECDのガイドライン(2011)では,(1)関連性,(2)正確性,(3)信頼性,(4)適時性,(5)アクセシビリティ,(6)解釈可能性(適切なメタデータ等によってユーザーがデータを理解し,容易に利用・分析できること),(7)一貫性の7項目が挙げられている。しかし,多くの科学コミュニティーでは,論文と違ってデータ品質を評価する標準的なプロトコルがまだ存在しない。
(3) データ共有のインセンティブ:データ引用データの品質を保つための適切なキュレーションには多大な費用と時間がかかるため,そのインセンティブとしてデータ引用の取り組みが進められている。ODEプロジェクトは,データ引用に関する優れた実践および課題として以下の項目を挙げている。
データジャーナルは,データ引用やデータ作成者へのクレジットを可能にする手段であるといえる。データジャーナルには,データセットの解説を中心としたデータ論文が掲載されるため,他の研究者が公開されたデータセットを引用する手がかりとなる。また,データ引用を推進する機関として,DataCite,ORCID,figshare,Dryad Digital Repository,ResearcherIDが挙げられている。
(4) OECD加盟国におけるデータ保護の枠組み国際的なデータベースの保護の枠組みとして,「知的所有権の貿易関連の側面に関する協定(TRIPS協定)」第10条(コンピューター・プログラム及びデータの編集物)の(2),および「著作権に関する世界知的所有権機関条約(WCT)」第5条(データの編集物)がある。また,EUや日本,韓国では,それぞれデータベース権が認められている。一方,米国はデータセットに対する知的所有権保護の枠組みがなく,オランダはデータベース権(スイ・ジェネリス権)の行使を規制しているなど,国によってデータ保護の法制度が異なる。
こうした状況で,データの提供者や利用者が,その都度権利の判断や確認をすることは困難であり,再利用を妨げる。研究や学習を目的として,データベースをテキストマイニングやデータマイニングに用いる場合,(その国の)著作権やデータベース権の例外事項に該当するかどうかは明らかではない。クリエイティブ・コモンズのライセンス4.0によって利用可能な範囲を明らかにしておけば,こうした曖昧さを減じることができる。ただし,クリエイティブ・コモンズのライセンスは,営利・非営利の区別に問題があると指摘されている。
オープンサイエンスを実現するための要素として,インフラストラクチャー,スキル,法的枠組みが挙げられ,それぞれについての各国・地域の動向が示されている。
(1) インフラストラクチャーOECD非加盟国を含む多くの国・地域は,オープンサイエンスの推進に必要なインフラストラクチャーに投資している。フィンランドは,オープンサイエンス推進のためのインフラストラクチャー・ロードマップを作成した。中国はデータと論文アーカイブのためのオンラインプラットフォームを構築した。アルゼンチンは,研究者の履歴,論文および所属機関に関する情報を含むSICyTARデータベースを構築した。チリとメキシコは,論文とデータ共有のための複数の国営リポジトリに投資を行っている。スペインには,研究者などが自由に論文のアーカイブを行うことができる国営リポジトリとインフラストラクチャーがある。ポーランドは,複数のオンラインポータルやバーチャル図書館を構築している。また,欧州委員会(EC)はEUおよびその加盟国のリポジトリやプラットフォーム構築の促進に積極的に取り組んでいる。日本の例としては,科学技術振興機構によるJ-STAGEが紹介されている。
(2) データ関連スキルの向上オープンサイエンスを実現するためには,データを作成し公開するスキル,そして公開されたデータを活用するスキルが重要である。ICTのスキルは国・地域によって差があるが,教育カリキュラムによって強化する必要がある。また,すべての分野の科学者が,オープンアクセスのリポジトリやアーカイブの使用法,メタデータの構築法,作成するデータのクリーニング,管理などに必要なスキルを習得し,保持する必要がある。
こうしたスキル開発のための取り組みの一部を表1に示す。国・地域や機関レベルの取り組みに加えて,欧州全域を対象としてオープンアクセスやオープンデータの教育活動を行うFOSTER注1)のような組織もある。
| フィンランド | 教育文化省 データ管理ガイドの公開 |
| ポーランド | OCEAN(ワルシャワ大学) e-インフラストラクチャー,ビッグデータ分析 |
| フランス | Digital Scientific Library オープンアクセス,オープンデータに関する専門職の作業部会 地域教育ユニット オープンアクセスとオープンデータの講習会の開催 |
| 米国 | OSTP 指令 科学データ管理に関する教育や労働力開発への支援 NIH データ分析のためのスキル開発 |
| カナダ | オープンガバメント2.0 科学研究へのアクセス向上のための資金援助 国民のデジタルスキルとコンピテンシーの構築など |
| 英国 | Data Capability Strategy データ分析,データ共有スキルのための人材育成 大学,高等教育機関 ビッグデータ関連の博士課程,センター設立 Open Data Institute オープンデータの促進,イベントや講習会の開催 |
| インド | 情報工学センター オープンサイエンスの意識向上を目的としたワークショップ |
| ドイツ | ヘルムホルツ協会 研究データの維持管理に関する講習会や研修の定期的な開催 |
※本文p.93-95 より紹介者作成
オープンサイエンスを推進するために,複数の国・地域で知的所有権の規則や例外措置についての修正案が議論されている。ドイツは2013年に著作権法が修正され,公的資金援助を受ける研究者は最長12か月のエンバーゴ経過後,出版社に使用権を譲渡したとしても,自身の論文をアップロードする法的権利を保持できるようになった。英国は,教育や非営利の研究目的での資料の複写や記録の再利用に対する自由の幅を広げる著作権法の修正案が議会を通過した。
レポートの要旨として,エグゼクティブサマリーに13項目の政策メッセージを提示している。
レポートを通じて,オープンサイエンス,特にデータのオープン化については,品質の標準化やインセンティブが不十分であるといった課題が明らかにされていた。データの再利用にかかわる著作権や知的財産権の問題は繰り返し登場し,国際的な法整備の必要性やクリエイティブ・コモンズ・ライセンスの活用が提案されている。各国・地域の人材育成の取り組みは,日本にとって参考になるだろう。
オープンサイエンスの実現によって,その学術的価値に加えて経済的な価値が国・地域を超えて波及することも示されていた。具体例として,2008年にNASAの衛星画像を無料で公開したところGoogle Earthなど多くのサービスによって活用され,データの使用量が年間1万9,000シーンから210万シーンにまで増加したことが紹介されている。研究開発費は国・地域や機関によって大きく異なる。また,研究や教育は,国・地域別の論文生産性や大学ランキングなど,地域や機関といった単位で比較されることが多い。しかし,オープンサイエンスの価値は国・地域を超えて発揮される。オープンサイエンスの実現によって,科学のフラット化が加速することを期待している。
(筑波大学大学院図書館情報メディア研究科 池内有為)