情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
集会報告
ジャパンリンクセンター活用の為の対話・共創の場(第2回) ~研究データへのDOI登録~
福山 樹里
著者情報
ジャーナル フリー HTML

2015 年 58 巻 2 号 p. 145-147

詳細

  • 日程   2015年2月27日(金)
  • 場所   JST東京本部別館
  • 主催   ジャパンリンクセンター運営委員会

1. はじめに

ジャパンリンクセンター(Japan Link Center: JaLC)は,日本で唯一のDOI(Digital Object Identifier)登録機関(Registration Agency: RA)である。科学技術振興機構(JST),物質・材料研究機構(NIMS),国立情報学研究所(NII),国立国会図書館(NDL)の4機関によって共同で運営されており,運営委員会(委員長:武田英明NII教授)が意思決定を担っている。

2015年2月27日,JaLCは研究データへのDOI登録をテーマに対話・共創の場(第2回)をJST東京本部別館で開催した。当日は定員を超える参加者が集まり,7つの報告と活発な意見交換が行われた。本稿では,研究データの管理,特にDOI登録とメタデータに関する諸課題について,当日のプログラムから3つの報告を中心にまとめた。本会合のプログラムについてはJaLCのWebサイト(http://japanlinkcenter.org/top/)を,研究データとDOIの関係やこれまでの活動については『情報管理』に掲載された集会報告等1)4)を参照されたい。

2. 研究データへのDOI登録実験プロジェクト

武田委員長とJaLC事務局の中島律子氏(JST)から,プロジェクトの概要と進捗状況が報告された。

2014年12月,JaLCは新システムJaLC2をリリースした。従来のJaLCは,雑誌掲載論文,予稿集,学位論文等のジャーナル論文のみをDOIの登録対象としていたが,JaLC2では,書籍,e-Learning教材,研究データへのDOI登録が可能になった。しかし,研究データへのDOI登録にはさまざまな課題が想定されており,DOIの効果的な活用のためには,関係者による課題解決に向けた検討を要する。

そこでJaLCでは,研究データへのDOI登録の開始に先立ち,想定される課題の抽出とその解決,運用方法の確立,DOIの活用方法等の検討を目的として,2014年10月から1年間の予定で「研究データへのDOI登録実験プロジェクト」(以下,プロジェクト)を実施することにした。公募により,7機関(+千葉大学附属図書館)9プロジェクトが参加している。プロジェクトは,計画書を作成したところであり,今後,報告書,登録ポリシー,登録手順書の作成が予定されている。

研究データの公開と共有への関心が国際的に高まりをみせる現在,その管理や引用の点からDOI登録の必要性が広く認識されつつある。その一方で,具体的な方法については未知の部分がある。武田委員長によると,研究データを世界的に自由に流通させるためには,標準化が必要である。特に,データのお品書きともいえるメタデータ,そのメタデータの書き方を標準化するメタデータ・スキーマ,研究データをグローバルに一意に識別できる識別子(ID),データを取り出しやすいよう標準的なソフトウェアを用いたリポジトリ,これら4点が重要である。研究データへのDOI登録については,国際的なRA(Registration Agency)であるDataCiteが先行している。そのため,JaLCのプロジェクトでは,DataCiteを参考にメタデータ・スキーマ等の検討を進めている。

また,現在検討中の課題として,定常的にDOI登録を行うための運用フロー,持続的なアクセスを保証するための方法,データセット単位やプロジェクト単位といったDOIを登録する粒度,ランディングページに記載すべきメタデータ,長期的な観測データや軽微な追加のような場合のバージョン管理,ジャーナルの論文採択において研究データのDOI引用を条件とするよう働き掛けるといったDOIの活用促進等をあげた。論文や出版物とは異なり,目に見える形がなく,個体としての境目もない研究データに特有の課題があり,また,DOIのプレフィックスを発行する対象となる「データの公開者(publisher)」とは誰なのか,大学や研究機関なのか,その一部局なのか,あるいはプロジェクトなのか,といったDOI登録以前の課題もある。さらに,課題を検討する過程で,データの作成・保存・修正・公開・破棄(非公開化),メタデータの作成・修正,DOI登録,といったデータのライフサイクルを考慮する必要性と,それぞれの段階で対応すべき担当者や担当機関とは誰なのか,研究者か,研究補助者か,リポジトリの運営者か,図書館か,という,研究活動の全体にかかわる研究データ管理の難しい問題にも取り組まなければならないことが明らかになったと述べた。

3. プロジェクト参加機関の取り組み

意見交換の参考となるプロジェクト参加機関での事例として,2つの取り組みが紹介された。

1つ目は,NIIの北本朝展氏が,東京大学や国立環境研究所等で運用している地球環境情報統融合プログラム(DIAS-P)について紹介した。DIAS-Pではデータセットのようにクリックしてダウンロードする単位でユニークな番号を付与しており,この単位でのDOI登録を計画している。ただし,データセットの定義はデータ作成者の定義に従うため,統一基準は定めておらず,データセットの識別子が約200件あるのに対してデータファイルは約4,000万件あるというように,粒度にギャップが生じているとのことである。

2つ目は,国立極地研究所の矢吹裕伯氏が,同研究所の北極域データアーカイブについて紹介した。同氏によると,研究データへのDOIの登録によってデータセンターの提供データが一覧できるようになることで,データの品質確保への意識が高まると考えられる。また,論文と同様,データについても引用情報が整理されて業績評価の対象となれば,DOI登録は,データ提供者とデータセンターの双方にとって大きなインセンティブになりうるとのことである。

北本氏と矢吹氏が共通して指摘していたのは,研究データの管理においては国際的な相互運用性の確保が重要だということである。2つの取り組みで採用したメタデータ・スキーマは,いずれも地理空間メタデータの国際的な標準となっているISOに基づいており,研究データにDOIを登録しているDataCiteのメタデータ・スキーマとの類似度が高く,それゆえにDataCiteとの相互運用性が確保されている。JaLCのメタデータ・スキーマが,DataCiteと互換性の高い標準に基づいたものとなれば,メタデータの変換は容易に行うことができ,国際的な相互運用性も確保できるだろうとのことである。

4. 対話・共創(意見交換)

報告等を踏まえて,約30分間の対話・共創(意見交換)が行われた。意見交換では,研究者にとって何がデータ公開のインセンティブになるのかという問いに対して,参加者からさまざまな発言があった。まずは,「公開されたデータからデータ作成者をたどれるような仕組みが必要だ」との指摘があり,これをきっかけとして,「データの作成者と貢献者のそれぞれに個人名がきちんと入るとよいのではないか」「IDを活用して機械可読にすることで自分のデータセット一覧のような集計が可能になるとよいのではないか」といった意見が出された。また,「データの作成者には観測技術員やメタデータ作成者等の関係者全員の名前を記述する方法もあるのではないか」「データのライフサイクルの各段階で関与した人の名前を記述してはいかがか」といった提案や,機関として作成するデータの場合は問い合わせ対応の観点から組織名を記述することがあるといった事例などが寄せられた(1)。

図1 当日の会場の様子

5. 今後に向けて

本会合では,プロジェクトでの検討課題に対する結論が示されたわけではないが,研究データに携わるさまざまな関係者が,研究データの管理や公開,引用における課題について,それぞれの経験や意見を持ち寄り共有することができた。村山泰啓氏(情報通信研究機構)が「オープンサイエンスの推進とData Citation Principles」で報告されたように,研究データの公開と共有において重要なのは日本の科学の発展という目的を果たすことであり,そのために必要な再検証の機会を提供する基盤として,また,自由な科学的批評の土壌として,研究の成果物であるデータに立ち戻ることが可能な環境を整備することである。DOIはその基盤となりうる原理の1つであり,プロジェクトが喚起した課題は,研究者コミュニティーとその関係者の前に,研究活動全体にかかわる課題として立ち現われていると感じた。本会合では,時間的な制約のため,意見交換を十分に行うことはできなかったが,プロジェクトの概要と検討課題を共有した本会合の参加者が自由に発言できる意見交換の場が,今後も継続的に設けられ,DOIの効果的な活用につながることを強く期待する。

また,プロジェクト参加機関の公募は締め切られているが,JaLC事務局によれば運用上可能な範囲で追加の参加が可能とのことである。関心のある機関には,研究データ管理の基盤作りの検討にぜひ参加していただきたい。

(JaLC普及分科会,国立国会図書館 福山樹里)

参考文献
 
© 2015 Japan Science and Technology Agency
feedback
Top