情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
レポート紹介
レポート紹介 『オープンデジタルサイエンス:最終調査報告書』
林 和弘
著者情報
ジャーナル フリー HTML

2016 年 59 巻 6 号 p. 393-398

詳細

[このレポートについて]

このレポートは,昨今政策的に注目されているオープンサイエンスについて,「デジタルテクノロジー」に着目し,デジタルテクノロジーを広範囲に活用することで生み出される研究やイノベーションを,オープン「デジタル」サイエンスと銘打って調査と論考をまとめたレポートであり,欧州委員会(EC)から公開された。オープンデジタルサイエンスの概念整理を試みつつ,研究資金の獲得から成果公開までの,あらゆる科学的なワークフローの段階において,デジタルツールがどのように実践で使われるか,その構成要素の分析を行い,6つのシナリオの作成を通して,科学と社会のあり方を含めて今後の将来像をイメージしやすくしている。そして,オープンサイエンスがどれだけ進んだのか測定できる指標候補の提示で締めくくられている。以下,付録を含め9章95ページに及ぶ内容について,誌面の都合もあり,主にエグゼクティブサマリーを要約する形で紹介する。なお,本稿は厳密な翻訳ではなく,筆者による解釈も含まれている点に留意いただければ幸いである。

1. オープンデジタルサイエンスとは

オープンデジタルサイエンス(以下,ODS)は,デジタル技術の幅広い活用によってもたらされる,科学研究やイノベーションにおける新しくオープンな実践活動のことを指す。デジタル技術を活用することによって,データ,手法,結果,研究に携わる者,あるいは出版物においてオープン化が進み,データやアクセス,計算の観点から手法が大規模化することに重点が置かれることでODSが進む。この調査研究の基礎となるビジョンは,デジタル技術を活用した科学に関する活動のうち,根底から変わりうるものが顕在化しているかどうか,そして,それが科学と社会の関係をどのように変えているかを探索するものである。

2. この調査の目的

この調査研究は,どんなプレーヤーがODSにかかわるか,新しい活動が科学と社会にどのように影響するかを分析し,先のビジョンをどのように実践していくかを知り,また,どう監視していけばよいかについての示唆を得ることが目的である。そのために,オープンサイエンスの影響と浸透の程度を評価するための指標を確認し,長期間にわたって観察できる指標の提案が必要になる。また,特に,オープンでデジタルな科学研究がより広い社会と政策に与える結果の分析を目指している。

この調査研究の3つの目標は以下のとおりである。

  • •   ODSのビジョンの検証と調整
  • •   オープンサイエンスの浸透の程度とその影響を計測するメトリクスの開発
  • •   最近の科学に関する新しい手法のベスト・プラクティスの紹介

3. 手法

この調査研究は,オープンサイエンスの概念に関する文献調査や,ODSに関連する現在の慣行や組織,およびメトリクスに関する既存の調査に基づいている。オープンサイエンスがもたらすと期待される進展をより深く理解してもらうために,現在の傾向も分析した。26人の専門家のインタビューによってオープンサイエンスの概念に対する洞察,現在の慣行や傾向を知ることができた。Webサイトwww.opendigitalscience.euで中間結果を発表し,(Web上の)ディスカッション・フォーラムが科学コミュニティーからのフィードバックの収集に一役買った。グラーツ,リスボン,ブリュッセルで行われた会議やイベントで開催されたワークショップでは,6つのシナリオに関する議論を行い,シナリオを大きく改善した。さらに本調査研究の諮問委員会とワークショップを行って重要な示唆とフィードバックを得た。メトリクスの課題についてオンラインアンケートを作成し,それぞれの分野の専門家に送った。確定前の初動のアンケート結果およびその時点で導かれている結論をオンラインで公開し,コミュニティーからのフィードバックを得ている。

4. オープン(デジタル)サイエンスのコンセプト

この調査研究は,もともと「ODS」の概念に焦点を当てたものである。この概念が,科学的プロセスを現在根本から変えようとしていることに何の疑いももたずにデジタル技術が果たす役割を強調しているが,ODSの概念は広く受け入れられておらず,また,広く用いられてもいない。

科学の断片化が進み,国際化,イノベーションと応用に重点が置かれているグローバルな科学の実態に即して,ODSが検討されている。オープンデータのムーブメントに限らず,科学に関する活動のさまざまな段階で,より広く国民にオープンにするという新しい傾向が生まれている(1)。これは,市民科学,オープンイノベーション,オープンアクセスなどの概念につながり,科学の質とメリットをどう評価するかという新しい手法(オルトメトリクス)や,資金調達の新たな方法(たとえば,クラウドソーシング)につながることにもなる。

また,ODSは他の用語,たとえば,オープンサイエンス(非デジタルであることを含む),デジタルサイエンスとScience2.0(デジタルツールを強調している),e-Science(しばしば高性能計算およびその他に焦点を当てる),市民科学(一般の人々の研究への参加)やオープンアクセス(出版物をオンラインで,通常はフリーアクセスで読めるようにする)と区別する必要がある。ODSおよび関連分野の重要性の高まりは,オープンデータとオープンアクセスの成長だけでなく,世界中の科学者によるODS関連の用語の使用が増えていることによって証明されている。ODSはデジタルネイティブであり,情報通信技術(ICT)と親和性が高い。たとえば,(ICTの支援によって)グループ単位でネットワークが簡単に形成され,コミュニケーションなどの限界費用がゼロになる効果や,モデリングとシミュレーションが進展するだけでなく,コミュニケーションの双方向性が高まり,長距離間で仕事ができる状況も指している。

ODSは,新たな情報通信技術の進展によってだけ進むのではなく,新しくて安価なセンサー技術と,より安価でより強力なICTの活用で徐々に発展し,増加するデジタルデータによって進む点にも注目する必要がある。科学者は(論文を)出版しないといけない,あるいは知識は知財として商業化されるべきというプレッシャーがある中で,電子ツールを使う科学者のネットワークが増大することは,ODSが進展するうえで重要な後押しとなっている。結局のところ,研究者の自己イメージが変わり,いわゆる「デジタルネイティブ」が成熟していくことが,このエリアの未来を変える駆動力となっている。

図1 新しくオープンな科学的実践活動が影響を及ぼしうる,科学研究プロセスの各段階

5. ヨーロッパと世界のODS

オープンサイエンスの実践を分析すると,多大な課題への対応が必要なことがわかる。ODSは急速に進化しており,また多数のプロジェクト,イニシアチブ,組織が活発に活動し,科学的研究のワークフローのほぼすべての段階についてデジタル技術の活用による革新を検討している。1は,現在の傾向を示すために,研究プロセスのそれぞれの段階におけるICTの活用事例を示している。

科学研究に役立つ一般的なツールやデジタルツール開発に使えるデジタル技術がまだ急速に発展していることから,オープンサイエンスがこの状況の影響を強く受けて変わり続けていく可能性は高い。他のデバイスと基本的に接続可能な新しいデバイスが幅広く世にリリースされる傾向があり,研究者や科学者が直接影響を受け,新たな試みや活動を生み出す。あるいは,分散コンピューティングとクラウドサービスが浸透することで,科学者をさらに支援する可能性がある。それは研究データやその処理,また,オープンかつインタラクティブなプロセスを管理するうえで役立ち,あるいは創造活動やマネジメント,科学研究プロジェクトの評価速度を向上させていくだろう。新しいツールができることで,大規模な分散処理ネットワークを介した処理の仮想化が促進される。それは現在も変わり続けるツールの要件に応じて,おそらく現状に合わせながら作られている。データの保存に関しては,データの作成(発生)場所に格納するのか,クラウドに依存するのかについては,どちらも持続することになる。しかしわれわれはまた,データ格納量に限界があることをわかっており,また,データはすでに作成(発生)場所で処理されることもわかっている(たとえば,衛星データ)。

もっと面白いこととして,おそらく,(学術情報流通に関係ない)大規模なソフトウェアとクラウドサービスプロバイダが,小規模,大規模のデータ解析に参入する可能性があると示している。それらのツールは非常に強力で,利便性も比較的高い可能性がある。すでに現在,Googleがデータの統計的分析のためのソリューションを提供しており,大規模なデータベースを使った可視化と検索ができるようになっている。これらのアプリケーションは必ずしも,研究者のために必須の要件をすべて満たしてはいない。たとえば,作業原則は完全に明確ではなく,データベースも容易には入手できない。しかし,ツールは無料で利用でき,強力で信頼性があり,多くの場合,インパクトを与える効果的なグラフィックスを備えている。この利便性には抵抗しがたく,たとえODSに批判的な科学者であっても受け入れざるをえない。

表1 デジタルサイエンスにおけるICT技術の活用
段階 ICTの活用
トピックの選定,
研究資金の獲得
オープンピアレビュー,
研究用クラウドファンディング,
オンライン課題解決データベース,
オープンイノベーションシステム
科学研究を支援する一般的なクラウドファンディングプラットフォーム:
 Kickstarter※1,Indiegogo,Goteo,RocketHub
特定の科学研究のためのクラウドファンディングプラットフォーム:
- https://experiment.com
- https://ilovescience.es (ES)
- https://walacea.com (UK)
- https://fundscience.org.au/ (AU)
データ集積 ビッグデータ,
新センサーシステム,
IoTによる自動データ集積,
実験ロボット,
市民との交流
Safecastという国際プロジェクトでは,データを用いて人々の活動の強化を目的にしている。放射線のレベルをマッピングする,センサーのネットワークを構築するなど,人々にデータ集積の貢献をしてもらい,そのデータを自由に活用できるようにしている。
-http://blog.safecast.org/
データ分析,
仮説・理論の設定
人工知能の活用や統計学的手法を用いた知識の発見,
データマイニング,
双方向性のある可視化データによる分析;
計算機を活用した新しいインフラ(共有,分散コンピューティングを含む),
市民との交流
認知システム
- http://www.ibm.com/smarterplanet/us/en/ibmwatson/は自然言語で出される質問に答えられる人工知能コンピューターシステムである。
Wiki調査
- http://www.allourideas.org/ではソーシャルデータ収集の新しい方法作成に注力している。
協業,議論,評価,批評の反映 新しい電子形式によるディスカッション,粒度の小さな知識の集積,
市民や芸術家との交流,
新しいメトリクス,
評判・推薦システム
柔軟で使いやすいハードウェアとソフトウェアを活用した,オープンソースの電子プロトタイピングプラットフォーム。これは,アーティスト,デザイナー,愛好家や,インタラクティブなオブジェクトや環境を作ることに興味をもつ人向けに用意されている。
-arduino.ccは柔軟に利用できるオープンソースのハードウェアで,Arduino boardsを誰でも,簡単に使用,再利用できる。これはオープンソースのソフトウェアとハードウェアを超えたオープン性に基づく共有に関するコミュニティー形成につながっている。
出版 オープンアクセス出版,
オープンデータ(データの再利用),
オープンソースソフトウェア(ソフトウェアの再利用),
オープンメソドロジー,
共同執筆,
新しいメディアの活用
・DOAJ(Directory of Open Access Journals) はオープンアクセスジャーナルのリストを掲載しているWebサイトであり,Infrastructure Services for Open Accessによって維持運営されている。約1万ジャーナルの登録がある※2
・http://arxiv.orgは科学論文の電子プレプリントサーバーで,2014年末までに100万論文以上を登載している。ピアレビューはされていないが,ある程度の統制はとれており,2014年は1月当たり8,000論文以上が投稿されている。
・ResearchGateは700万人を超えるユーザーを擁する研究者のためのソーシャルメディアサービスである。論文を共有し,研究者間で質疑応答をし,共同研究相手を探す仕組みを持っている。
他の見地,角度 オープンな手法,
オープンな教育資源
PublicLab※3は廉価なDIY技術を用いて,環境,社会,政治に対する人々の見方を変えていこうとする実践コミュニティーである。

※1 https://www.kickstarter.com/discover/tags/science

※2 Adams, Caralee (5 March 2015). "Directory of Open Access Journals introduces new standards to help community address quality concerns".

※3 http://publiclab.org/

6. オープンサイエンスの将来シナリオ:そのインパクトと浸透の程度

デジタルサイエンスの潜在的な影響をより正しく理解するために,6つのシナリオが作られている。これらのシナリオは,将来の予測として読むものではない。これらは,どんな将来が起こりうるか,また,そうなるには何が必要かについての見通しを記述したシナリオである。特に,それぞれの将来を考慮したときの注目すべき特徴を強調している。また,これらのシナリオは専門家との議論を刺激し活発にするためにも使われたものである。これら6つのシナリオは,オープンサイエンスのさまざまな側面について指摘している。

・ScienceFlexシナリオ

市民科学プラットフォームが,プロの研究者や市民科学者に対して継続的に協業(cooperation)することを支援(support)する世界を記述している。これは,低コストのセンサーを構築し,シームレスに統合されたオープンデータとツールを,市民科学の活動で利用するという将来ビジョンに基づくものである。

・InnoSpeedシナリオ

特に中小企業のために,オープンサイエンスがどのように技術革新を駆動するかについて記述している。これは,ICTを通じて科学的知識へのアクセスを改善し,科学者ではないが技術的に有能なイノベーターに, より実践的に活用してもらうための支援方法を示している。セマンティック検索および多言語システムを通じた相互運用性に関する技術的な課題について述べている。

・BlurredBoundsシナリオ

学界と産業界の間の境界がほとんどなくなる近い将来を記しており,組織が精力的にプロジェクトを作成し,仮想のグローバルプロジェクトチームを構成してスタッフを募集する世界について述べている。

・Digital Studiesシナリオ

デジタルでオープンな科学が大学の教育活動をどのように変えるかについて詳しく説明している。非常に権威のあるいくつかの組織がもつ国際的分校と,教育に特化した専門業者(ニッチサプライヤー)に分割される見通しについて議論している。教育が新しくなり,これまでにない教育の受け方を認めるようになることによって,一人の女性が子どもをもつ母親でありながら新たなキャリアパスを開拓していく,というシナリオである。

・Policy Dialogueシナリオ

将来の政策立案者が過去に行った選択がよかったかについての洞察を提供している。このシナリオが描くのは,未来の2人の政策立案者が,現在行っている判断と過去に行ったオープンサイエンスのインセンティブおよび政策をどう選択したかについて振り返るものである。

・Ancient Nowシナリオ

技術の将来の観点からオープンサイエンスの課題について説明している。信頼に関する広範囲の問題について,人々がネットワークでつながるときに起きる問題や,古いシステムの扱いや相互運用の際に課題となるもの,そして,メトリクスに関するものを取り扱っている。このシナリオでは,ある教師が,多くの使える技術がすでにあるにもかかわらず,その要素を簡単に組み合わせることができなかったという,過去に起きたオープンサイエンスで協働しようとする際に起こる種々の問題について語っている。

7. メトリクス:オープンサイエンスに含まれ,その実現に向けたプロセスを測る新しい指標

インタビューと文献レビューを通じて,われわれは研究業績をどう評価するか見直すプロセスへと明らかに入っていることがわかった。しかしながら,この見直しのプロセスがどこに行き着くかは,まだ明確ではない。パフォーマンス指標に関して専門家の間で得られているコンセンサスは,単に研究業績と人気/品質値(たとえば被引用数)を定量的に考慮するだけでは,時代に合わなくなっている。オープンでデジタルを活用した科学によって新しく生み出される指標を用いて改善する必要がある。そこで,デジタルサイエンスのさまざまな側面の測定が可能な指標のセットを開発して,議論を加えた。さらに,34人の専門家にアンケートを行った。

提案された指標は,さまざまな研究の側面を測定するように,概念化とデータ収集/作成,データ分析,普及(出版),レビューと評価,評判システムと信頼,オープンサイエンスのスキルと認識について,そして社会と科学をも考慮して構造化されている。2は,オープンサイエンスがどこまで進んだかを観察するために有用であると判断した,コア指標を示している。

表2 コア指標
指標 クラスター
研究助成対象の活動で生まれたデータ/ソフトウェアコードの規定を義務化し,データ(交換)の基準に準拠していることを義務化している研究助成団体の割合 データ集積
公的に(共同)資金を供給されたプロジェクトによって作成される全データ/コードのうち,オープンにデータ/コードにアクセスできるのが何%か データ集積
機械可読データ/メタデータの割合 データ集積
メタデータの質(バージョン管理,量,データフォーマット,領域の記述等) データ集積
すべての利用可能なデータ(公的に(共同)資金を供給された研究の結果として)のうち,何%がそのデータの説明のためのメタデータを利用可能か データ集積
シミュレーション結果の有用性(モデル,データ,コード) データ集積
提供されるオープンデータサービス(の種類) データ集積
(長期にわたり)保証されたデータが利用可能になっているか(持続性に関する計画が利用可能か)(はい/いいえ) データ集積
研究プロセスにおけるオープンスタンダードの割合(%)(データのたとえば提供に関する基準+メタデータ,モデリング,共有モデル,ビジュアライゼーション) 普及,拡散
フリーライセンスで出版された割合(%)(パブリックドメイン,帰属,共有の全種類) 普及,拡散
審査基準として再現性と透明性を含んでいる,ピアレビューの割合(%) レビュー
データ通信がキャリアアップのための基準として認識されているか(はい/いいえ) 評判システム
オープンサイエンスに熟練している研究人材/研究分野の割合(%) スキル
オープンサイエンスに積極的な研究人材の割合(%) スキル
オープンサイエンスのスキルが含まれているカリキュラムの割合(%)(高等教育以前のものも含む) スキル
標準を意識している研究人材の割合(%)(オープンサイエンスに関する標準があるか,どのように支持を得ているか) スキル
標準に精通している研究人材の割合(%) スキル
オープンサイエンスの誓約に署名した研究者の数 スキル
オープンサイエンスの誓約に署名した研究機関の数 スキル
提案(オープン提案,オープン提出,公開審査)を求める際にどれだけオープンであるか 科学と社会
オープンサイエンスに関与する市民の増加割合(%) 科学と社会
アカデミア以外に研究成果を普及させ,伝えることが標準となっているか(はい/いいえ) 科学と社会
公的なデータ/メタデータのセットが手頃な価格で提供されているか 科学と社会

8. 結論

デジタル技術とオープンサイエンスの双方がこれからも変わっていくことを考慮すると,オープンな研究の未来がどのように形作られるかについて,より詳しい議論を継続する必要がある。各関係者の方針の調和もこの議論には不可欠で,一部の領域では政策立案全体からの議論を調整する必要がある。オープンをうたっていることもあり,これらの議論は参加型のプロセスが求められ,オンラインツールが重要な役割を果たすべきである。

また,一貫性のある,より調和のとれた環境を開発するために規制の枠組み作りにも注力する必要がある。たとえば,オープンな出版に関して,またそれだけでなく,オープンデータに関しても,より一貫性をもって実現できるアプローチが求められる。研究機関と資金提供のスキーム全体を通してだけでなく,科学領域が違えば異なるアプローチがあることを認識することも重要である。

そして,新しいツールやプラットフォームが出現し続けていることを踏まえ,また,ODSへの関心が強いことから,社会の関与や産業界の展開を通じて,今が堅牢で持続可能な新しい科学を形成するチャンスである。

[紹介者によるコメント]

「オープンサイエンス」というものが何を指すのかが,語る人によって変わる現在,本レポートは「デジタル技術」を軸として,科学研究の変革と社会に対する影響の調査と分析を行っており,その点において議論が比較的明確になっている点が特徴である。現在,世界に歩調を合わせながら公的資金を用いた研究成果の利活用を中心に置いている日本のオープンサイエンス政策から見ても,オープンサイエンスの将来像や,オープン化の指標の提示など,今後のオープンサイエンス政策に大いに参考になる内容となっている。オープンサイエンスの定義が定まらないまでも,最終的にはサイエンスのあり方が変わりうるという点においてはビジョンを同じくしており,ICTの発展が研究者,産業,社会の変容を促し,引き続きステークホルダー間のよいコラボレーションを生み出し,ボーンデジタルの社会に向けて徐々にではあっても着実に変わっていくことが示唆される内容であった。

(文部科学省 科学技術・学術政策研究所 科学技術予測センター 林 和弘)

 
© 2016 Japan Science and Technology Agency
feedback
Top