情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
集会報告
DataCite2014年年次会議 ~データに価値を与える~
中島 律子武田 英明
著者情報
ジャーナル フリー HTML

2014 年 57 巻 9 号 p. 686-689

詳細

  • 日程   2014年8月25日(月),26日(火)
  • 場所   Inist-CNRS(French Institute for Scientific and Technical Information ) Vandoeuvre-lès-Nancy, France
  • 主催   DataCite

1. はじめに

DataCite注1)は,デジタルオブジェクト識別子(Digital Object Identifier: DOI)を登録する機関(Registration Agency: RA)の1つである。DOIを管理する国際DOI財団(International DOI Foundation, IDF)はRAとして世界に9機関を認定している。RAそれぞれにDOI登録ポリシーがあり,そのポリシーを大別すると特定の種類のコンテンツを扱うRAと,コンテンツの種類によらず国や地域のコレクションを扱うRAがある。DataCiteは前者で,主に研究データに対してDOIを登録する1)

ジャパンリンクセンター(Japan Link Center: JaLC)は日本に基盤を置く唯一のRAであり,日本発の学術コンテンツ情報を収集し,普及・利用を促進する目的で2012年から活動を行っている。JaLCは,科学技術振興機構(JST),物質・材料研究機構(NIMS),国立国会図書館(NDL),国立情報学研究所(NII)の4機関によって共同で運営されており,運営委員会(委員長:武田英明NII教授)が意思決定を担っている。これまで,主に学術論文に対してDOIの登録を行ってきたが,今後は,登録コンテンツの対象を拡大して,研究データをはじめとする他の研究情報についてもDOIを登録する計画である。研究データについては,DataCiteと連携してDOI登録を行うため,2014年3月にJaLCはDataCiteの会員となった。

2. 会議概要

2013年まで夏季会議として行われてきたDataCiteの定例会議2)は,2014年は年次会議および設立5周年の記念大会として拡大して行われた。テーマは,「データに価値を与える:アドボカシー,ガイダンス,サービス(Giving value to data: advocacy, guidance, services)」であった。2日間にわたり,2つの基調講演,5セッションに分けての21講演,テクニカルハンズオンセッションが行われた注2)。参加者は約100名で,各国,各機関での取り組みが紹介された。質疑応答や会議前後でのコミュニケーションが活発に行われ,盛況であった。

3. プログラム概要

基調講演では,研究データに対するDOI登録を最初に行ったDKRZ(ドイツ気象センター)のMichael Lautenschlager氏から,研究データにDOIを登録することに取り組んだこの10年と,DataCiteを組織してからの5年間の歴史についての総括がなされた。活動は2000年ごろからドイツ研究振興協会の資金援助を受けて行われ,主にドイツの図書館および研究所が主体であった。検討にあたっての指針は,科学データは可能なかぎり科学文献と同様に扱えるようにすること,すなわち対象データは,出版後は変更せず,適切な粒度をもつものとすることであった。この期間は,サービス運用,分野拡大,国際展開,持続性とビジネスモデルなどが主に検討された。2009年には6か国7会員によるNPOとしてDataCiteが設立された。現在は,19か国31会員に発展している。

以下,セッションごとに印象に残った発表を紹介する。

セッション1:データポリシー

研究者,図書館員,出版社等からなるコミュニティーForce11注3)のData Citation Synthesis GroupのSarah Callaghan氏は,同グループによるデータの引用に関する原則の紹介(Joint Declaration of Data Citation Principles)注4)を行い,支持を呼びかけた。その原則は,クレジットやデータへのアクセス,相互運用性等の8項目からなる。具体的な実践方法として,NERC Earth Observation Data Centreにおける実例を示しながら,引用を行う際の記述方法,引用されるデータの備えるべき条件や,データを同定する際のIDとしてDOIを使用することの理由およびDOIに対応するメタデータを記述するランディングページのあり方について説明した。

Andrew Treloar 氏(Australian National Data Service)からは,オーストラリアにおける研究データの管理・共有の取り組みが紹介された。研究者のモチベーションをどのようにあげるかが課題であるが,簡単な対策はないと述べつつ,研究データの共有が研究業績としての評価,特にデータの重要性が論文より評価されたり,ファンドに対する成果としての評価,さらにテニュアトラック審査における評価などにつながるような仕組みを構築したいという発言があった。

セッション2:研究者とそのデータ支援サービス

JaLCからは共同運営委員長である武田が現状および今後の計画について発表を行った(1)。JaLCが現在DOI登録の対象としているのは学術論文であるが,今後,研究データやe-ラーニング教材等へと対象コンテンツを拡大していく。研究データについては特に,JaLCを介してDataCiteに登録メタデータを送信し,DOIを登録する経路をもつ予定であり,その運用方針を確立するために実験プロジェクトを立ち上げて日本の各分野の主要な研究機関と協力して進めていくことを紹介した。質疑では,日本語のメタデータが付けられたデータでも,基本的なメタデータ要素は英語に翻訳して流通させることを期待するとの声があった。

スイス連邦工科大学チューリッヒ校のBarbara Hirschmann氏は,スイスの大学等にDOI登録サービスを提供し,とりまとめてDataCiteに登録するという運用フローを紹介した。これはJaLCの会員制度(正会員が準会員をとりまとめる)と類似している。この中で,プレプリントにDOIを登録することについて,混乱を招くという理由で図書館員から反対があったが,議論の末,登録することになったという話があった。JaLCでも同様の議論があった3)ことを考えあわせて興味深かった。

図1 JaLCからの発表の様子

セッション3:技術の進展のための連携

CERNのLars Holm Nielsen氏からは,EUで開発されCERNで運用されている研究成果共有のためのオープンリポジトリZENODO注5)について,GitHubや高エネルギー物理分野のデータベースINSPIREとの連携機能等が紹介された。

Fred Merceur氏(Ifremer:フランス国立海洋開発研究所)は,Argoプロジェクトについて発表した。世界の海の温度と汚染を観測するために3,000個以上のフロートにより測定されるデータはほぼリアルタイムで公開され,DOIがそのデータのスナップショット単位で登録されている。Ifremerでは,DOIを活用して機関リポジトリやデータリポジトリ,研究者ディレクトリをリンクしている。

ドイツのHumboldt大学Maxi Kindling氏と米国Purdue大学Michael Witt氏は共同で,それぞれリポジトリディレクトリre3data.orgとDatabibの紹介を行い,両者の連携状況を説明した。両者とも600程度のリポジトリを登録しており,しかも重なりがほとんどないことから,連携のメリットは大きい。今後は統合される予定とのことである。

セッション4:文脈における引用

トムソン・ロイター社のNigel Robinson氏は,同社のData Citation Index(DCI)を紹介した。世界各地の1,100以上のデータリポジトリからメタデータを収集し,標準化,登録を行い,引用をカウントできるようにする。DataCiteとのパートナーシップ構築を進めており,これによりDataCiteと協力関係にあるリポジトリのメタデータをDataCiteが取りまとめ,DCIに連携するとのことである。

そのほか,BioMed CentralのデータジャーナルGigaScienceや,ドイツ国立科学技術図書館の研究データ保存プロジェクトの紹介など,興味深い発表が多数行われた。

4. 所感

各機関・プロジェクトの事例紹介については,ポリシー構築,データリポジトリ関連,アプリケーション開発等の取り組みに関連するものが多かった。ポリシー関連は,まだ各所で試行錯誤を行っている段階で,確立するまでには時間がかかりそうだが,分野によっては,徐々に進みつつあるという印象を受けた。一方で,アプリケーションは次々に開発されており,DOIをことさら議論するというよりも,DOIを基盤とした活動についての報告が多かった。特にデータリポジトリについての取り組みは活発に行われている様子であった。

日本では,研究データに対するDOI登録とその活用の取り組みをこれから始めようとしているところであり,本会合で紹介された活用事例を聴き,追いつくのは大変そうだという実感をもった。しかし一方で,先行している各機関もそれぞれ試行錯誤してここまで進んできたということもわかった。

文献データとは異なり,さまざまな形態がありうる研究データの取り扱いにあたっては,分野や日本の状況に合わせた検討が必要であることを感じた。

(科学技術振興機構 中島律子,国立情報学研究所 武田英明)

本文の注
注1)  http://www.datacite.org

注2)  http://datacite.inist.fr/?Programmeにプログラムと発表資料がある。

注3)  https://www.force11.org/

注4)  https://www.force11.org/datacitation/

注5)  https://zenodo.org/

参考文献
 
© 2014 Japan Science and Technology Agency
feedback
Top