Journal of Information Processing and Management
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
Meeting
Research Data Utilization Forum (RDUF) Open symposium
Yusuke YOGOROKenichi SUMIMOTO
Author information
JOURNAL FREE ACCESS FULL-TEXT HTML

2017 Volume 60 Issue 7 Pages 530-533

Details

開催情報

  • 日程   2017年6月26日(月)
  • 場所   科学技術振興機構(JST) 東京本部別館1階ホール(東京都千代田区)
  • 主催   研究データ利活用協議会

1. はじめに

ジャパンリンクセンター(JaLC)によって2016年6月に設立された「研究データ利活用協議会」(Research Data Utilization Forum: RDUF)注1)は,日本における研究データ利活用の推進を目的に掲げて活動している。

このたび,設立1周年の節目にあたって,今後,協議会の活動をさらに発展させるための方策を得ることを目的として,「『研究データ利活用協議会』公開シンポジウム:オープンサイエンスを巡る世界の最新動向」を開催した(1)。当日は公的研究機関,民間企業,大学などから174名の参加者が集まり,2つの基調講演と7つの報告および,6つのグループに分かれてグループディスカッションを行った。

本稿では,当日のプログラムの中から基調講演,各分野からの最新動向の報告,グループディスカッションについてまとめた。本会合のプログラムについてはRDUFのWebサイト(http://japanlinkcenter.org/rduf/doc/170626_00_program.pdf)を,研究データ利活用に関するこれまでの活動については「情報管理」に掲載された集会報告1)を参照されたい。

図1 会場の様子

2. 基調講演

はじめに,丸山修一氏(文部科学省)から「文部科学省におけるオープンサイエンスに関する諸施策紹介」と題して講演があった。講演要旨は次のとおりである。

科学技術基本計画における記載が,論文等のオープンアクセス(平成23~27年度)から,それに研究データも含めたオープンサイエンス(平成28~32年度)へと変化してきた。文部科学省では,それに対応した基本的施策として,論文のエビデンスとしての研究データの公開(具体的には,国立情報学研究所(NII)の実施するJAIRO Cloud for DataやCiNii for Data),研究成果の散逸の防止(具体的には,ジャパンリンクセンターにおける永続的識別子DOIの登録),研究成果の利活用(具体的には,学協会におけるライセンスポリシーの明確化),人材の育成および確保(具体的には,データ関連人材育成プログラム)を推進していく。オープンデータに関して,特に研究データは一律にオープンにすべきとは考えておらず,行政側からもオープン・クローズの考え方を説明していく必要がある。評価については,現段階では伝統的に論文のみが評価されるしくみになっているが,オープンサイエンスにより科学の進め方を変えていこうというフェーズになっているため,学会等のコミュニティーの中で評価システムについて議論していく必要がある。

続いて,高木利久氏(東京大学)から「データ共有の先行事例の紹介」と題して講演があった。講演要旨は次のとおりである。

生命科学分野では,10年ほど前からデータ共有が行われるようになった。当時は,欧米諸国と比較して受け皿となる中核のデータベースセンターがなく,小規模プロジェクトから発生するデータの集約が必要という事情があったためである。また,生命科学分野では,数式や法則で表現できないことや,統計解析のパワーアップによりデータ共有による研究加速が顕著という特徴があることも,研究データ共有が先行して進んだ理由として挙げられる。データ共有の効果測定としてわかりやすい例は,共有されたデータによりどれくらいの論文が書かれたかということである。EBI(The European Bioinformatics Institute)による調査では,データ共有は,研究開発に一定の価値と影響を与えたことが報告されているが2),生命科学分野は探索空間が非常に大きくデータの網羅性が十分ではないため,実験をせずにデータだけで新たな知識を得るということは困難ではないかと考えている。実際のところ,生命科学分野では,この10年間はデータ駆動型ではなく,技術駆動型で研究が進んできている。

3. 各分野からの報告

引き続き各分野から,以下のような報告があった。

  • ■   地球観測データ分野
  • 村山泰啓氏(情報通信研究機構)は,地球・惑星科学では生命科学分野と同様に観測・実験データは歴史的資産であり,学協会でのデータ取り扱いポリシーの策定が進んでいる国・地域や分野があることを紹介した。

  • ■   極域データ分野
  • 矢吹裕伯氏(国立極地研究所)は,データ出版誌である「Polar Data Journal」3)の創刊と,論文誌との違いを紹介した。

  • ■   マテリアルサイエンス分野
  • 伊藤聡氏(物質・材料研究機構)は,材料分野は他の分野と異なり基礎方程式がしっかりしているため,計算により大量のデータをつくり出すことができ,これにより,量子材料学の知識がなくても新規物質をつくり出すことができるようになったということを紹介した。また,データを共有する研究者のインセンティブについては,評価だけではなく,自らのデータを共有すれば自分の研究が加速するようになることも大きなインセンティブとなる,すなわち,自分のデータをデータベースに入れると,機械学習などにより自らが入れたデータに付加価値が付いて戻ってくるということも重要ではないかとの考えを提示した。

  • ■   ライフサイエンス分野
  • Jason Haga氏(産業技術総合研究所)は,コメのゲノム研究では,研究者自身がデータをアップロードして共有できるシステムが活用されており,それらのデータには,インターネット上でアクセス可能なハンドルシステム(Handle System)の永続的識別子が付与され,論文等で引用できるようにしていることを紹介した。

  • ■   データ基盤分野
  • 込山悠介氏(国立情報学研究所)は,欧米のデータ基盤の紹介と日本でのデータ管理基盤サービスの紹介,研究室で管理している小さなデータの取り扱いの重要性を説明した。

  • ■   政策分野
  • 林和弘氏(文部科学省 科学技術・学術政策研究所)は,オープンサイエンスに関する欧米視察を踏まえ,オープンサイエンスの推進には,安全・安心なデータ共有文化づくりが必要であることを述べた。すなわち,簡便で信頼できる基盤の整備と,利用例づくり(サービスデザイン,ライセンス,マシンリーダブル)が必要ということである。

  • ■   将来に向けて
  • 最後に,まとめとして村山氏から,近代科学をけん引してきた欧州においても,オープンサイエンスについては取り組みを始めたばかりなので,わが国でも一緒に悩んで推進していくことで先行者利益を享受できるのではないかとの考えが示された。

4. グループディスカッション

研究データ利活用を担う各機関(図書館,データセンター,研究助成機関など)の抱える課題や経験などを共有し合うことにより,各機関における研究データ利活用の一助とすることを目的としてグループディスカッションを行った。今回は参加者の属性などから事務局が6つのグループを用意し,参加者は希望するグループに参加した。各グループから挙げられた課題等を以下に紹介する。

  • (1)図書館におけるオープンサイエンスの支援
  • 退職する研究者から研究データ(場合によっては紙媒体のものもある)を預かってもらいたいという要望が寄せられることがあり,このようなデータに関する取り扱い(公開・非公開,ライセンス条件等)が定まっていない。

  • (2)研究機関における情報基盤の企画運営
  • (有期プロジェクトなど)資金がなくなったら運営できなくなってしまうサービスの継続性をどのように確保していくのか,研究データを出す側のインセンティブ(被引用情報の提供などデータ活用状況の把握),ライセンスする人は誰であるべきか,ライセンスの内容(ライセンスする側の観点,ライセンスを受ける側の観点),データの持ち分が複数者になった場合のライセンスなど,決めるべきことは多い。

  • (3)データリポジトリの企画運営,メタデータ検討
  • 分野の違いによるリポジトリの運営の違いや,データ共有のためのリポジトリのあり方。

  • (4)研究データの生成・保管
  • データを出力する装置によって「出力される」項目が異なる。自分の研究にメリットがない限り,そのすり合わせは行わない。データのハンドリングには暗黙知が必要。単にデータをオープンにしただけでは十分には活用されない。

  • (5)データサイエンス研究
  • 企業の生産性向上に必要なデータとは何か。データサイエンティストとはどのような研究者なのか。

  • (6)データマネジメントプラン(DMP)の運用
  • データマネジメントは研究者が自発的に行うべきものだが,現状はガイドラインもない状況である。一方,研究機関が求めるDMPと,資金提供機関が求めるDMPには,狙いなどにずれがある。

5. おわりに

研究データ利活用協議会では,設立1年目は6つのイベントを開催したが,今回,今までの集客数を超える174名もの参加があり,研究データ利活用への関心の高まりを感じた。また,今回の参加者のうち,およそ4割は研究データ利活用協議会関連のイベントに初参加で,特に企業からの参加者が増えており,着実に裾野が広がってきていることが感じられた。

各分野からの報告では,それぞれの分野の特性に応じたデータ活用が行われていることが明らかとなった。具体的には,ライフサイエンス分野や地球科学分野では実験や観測で得られたデータの共有により,実験や観測の重複を省こうとしている一方,材料科学分野では数式により生み出した大量のデータを用いて,データサイエンスにより新たな知識を得ようとしている。このように分野の壁を越えて共にデータの利活用について考える場というものはこれまでにはなく,データ共有を考えていくうえで貴重であると感じた。

グループディスカッションでは,オープンサイエンスを担う現場における課題の棚卸しを行った。

今後,研究データ利活用協議会では,参加を希望するRDUF会員を募って,小委員会を設置する予定である。これらの課題について小委員会の場で深掘りされ,日本におけるオープンサイエンスのスタンダードが形成されることを期待している。

(科学技術振興機構 知識基盤情報部 余頃祐介,住本研一)

本文の注
注1)  研究データ利活用協議会:http://japanlinkcenter.org/rduf/

参考文献
  • 1)  余頃祐介. 集会報告 「研究データ利活用協議会」公開キックオフミーティング. 情報管理. 2016, vol. 59, no. 7, p. 490-493. http://doi.org/10.1241/johokanri.59.490, (accessed 2017-07-07).
  • 2)  Beagrie, N.; Houghton, J. The value and impact of the European Bioinformatics Institute: Full report January 2016. Charles Beagrie. https://beagrie.com/static/resource/EBI-impact-report.pdf, (accessed 2017-07-07).
  • 3)  南山泰之, 照井健志, 村山泰啓, 矢吹裕伯, 山地一禎, 金尾政紀. データジャーナル『Polar Data Journal』創刊の取り組み:極域科学データの新たな公開体制構築に向けて. 情報管理. 2017, vol. 60, no. 3, p. 147-156. http://doi.org/10.1241/johokanri.60.147, (accessed 2017-07-07).
 
© 2017 Japan Science and Technology Agency
feedback
Top