2017 Volume 60 Issue 7 Pages 530-533
ジャパンリンクセンター(JaLC)によって2016年6月に設立された「研究データ利活用協議会」(Research Data Utilization Forum: RDUF)注1)は,日本における研究データ利活用の推進を目的に掲げて活動している。
このたび,設立1周年の節目にあたって,今後,協議会の活動をさらに発展させるための方策を得ることを目的として,「『研究データ利活用協議会』公開シンポジウム:オープンサイエンスを巡る世界の最新動向」を開催した(図1)。当日は公的研究機関,民間企業,大学などから174名の参加者が集まり,2つの基調講演と7つの報告および,6つのグループに分かれてグループディスカッションを行った。
本稿では,当日のプログラムの中から基調講演,各分野からの最新動向の報告,グループディスカッションについてまとめた。本会合のプログラムについてはRDUFのWebサイト(http://japanlinkcenter.org/rduf/doc/170626_00_program.pdf)を,研究データ利活用に関するこれまでの活動については「情報管理」に掲載された集会報告1)を参照されたい。
はじめに,丸山修一氏(文部科学省)から「文部科学省におけるオープンサイエンスに関する諸施策紹介」と題して講演があった。講演要旨は次のとおりである。
科学技術基本計画における記載が,論文等のオープンアクセス(平成23~27年度)から,それに研究データも含めたオープンサイエンス(平成28~32年度)へと変化してきた。文部科学省では,それに対応した基本的施策として,論文のエビデンスとしての研究データの公開(具体的には,国立情報学研究所(NII)の実施するJAIRO Cloud for DataやCiNii for Data),研究成果の散逸の防止(具体的には,ジャパンリンクセンターにおける永続的識別子DOIの登録),研究成果の利活用(具体的には,学協会におけるライセンスポリシーの明確化),人材の育成および確保(具体的には,データ関連人材育成プログラム)を推進していく。オープンデータに関して,特に研究データは一律にオープンにすべきとは考えておらず,行政側からもオープン・クローズの考え方を説明していく必要がある。評価については,現段階では伝統的に論文のみが評価されるしくみになっているが,オープンサイエンスにより科学の進め方を変えていこうというフェーズになっているため,学会等のコミュニティーの中で評価システムについて議論していく必要がある。
続いて,高木利久氏(東京大学)から「データ共有の先行事例の紹介」と題して講演があった。講演要旨は次のとおりである。
生命科学分野では,10年ほど前からデータ共有が行われるようになった。当時は,欧米諸国と比較して受け皿となる中核のデータベースセンターがなく,小規模プロジェクトから発生するデータの集約が必要という事情があったためである。また,生命科学分野では,数式や法則で表現できないことや,統計解析のパワーアップによりデータ共有による研究加速が顕著という特徴があることも,研究データ共有が先行して進んだ理由として挙げられる。データ共有の効果測定としてわかりやすい例は,共有されたデータによりどれくらいの論文が書かれたかということである。EBI(The European Bioinformatics Institute)による調査では,データ共有は,研究開発に一定の価値と影響を与えたことが報告されているが2),生命科学分野は探索空間が非常に大きくデータの網羅性が十分ではないため,実験をせずにデータだけで新たな知識を得るということは困難ではないかと考えている。実際のところ,生命科学分野では,この10年間はデータ駆動型ではなく,技術駆動型で研究が進んできている。
引き続き各分野から,以下のような報告があった。
研究データ利活用を担う各機関(図書館,データセンター,研究助成機関など)の抱える課題や経験などを共有し合うことにより,各機関における研究データ利活用の一助とすることを目的としてグループディスカッションを行った。今回は参加者の属性などから事務局が6つのグループを用意し,参加者は希望するグループに参加した。各グループから挙げられた課題等を以下に紹介する。
研究データ利活用協議会では,設立1年目は6つのイベントを開催したが,今回,今までの集客数を超える174名もの参加があり,研究データ利活用への関心の高まりを感じた。また,今回の参加者のうち,およそ4割は研究データ利活用協議会関連のイベントに初参加で,特に企業からの参加者が増えており,着実に裾野が広がってきていることが感じられた。
各分野からの報告では,それぞれの分野の特性に応じたデータ活用が行われていることが明らかとなった。具体的には,ライフサイエンス分野や地球科学分野では実験や観測で得られたデータの共有により,実験や観測の重複を省こうとしている一方,材料科学分野では数式により生み出した大量のデータを用いて,データサイエンスにより新たな知識を得ようとしている。このように分野の壁を越えて共にデータの利活用について考える場というものはこれまでにはなく,データ共有を考えていくうえで貴重であると感じた。
グループディスカッションでは,オープンサイエンスを担う現場における課題の棚卸しを行った。
今後,研究データ利活用協議会では,参加を希望するRDUF会員を募って,小委員会を設置する予定である。これらの課題について小委員会の場で深掘りされ,日本におけるオープンサイエンスのスタンダードが形成されることを期待している。
(科学技術振興機構 知識基盤情報部 余頃祐介,住本研一)