60 巻 (2017) 10 号 p. 748-752
iPRES(International Conference on Digital Preservation)は,デジタルデータの長期保存とマネジメントに関する国際会議である。2004年の中国北京での開催を皮切りに,毎年世界各地で開催されている。今回は14回目の開催で,“Keeping cultural diversity for the future in the digital space - from pop-culture to scholarly information”と題して,京都で開催された注1)。当初は2011年に筑波で開催される予定であったが,東日本大震災の影響で急きょシンガポールで開催されることになったこともあり,今回は念願の日本での初開催となった。会議では,ポップカルチャーを含む文化資源や研究データの長期保存を中心に,保存のワークフローやフレームワーク,システムやツール,取り組み事例について報告があった。ヨーロッパ,北米,アジア,オセアニアを中心として250名程度が一堂に会し,59におよぶセッションの中で議論が交わされた(図1)。以下では,興味深かったセッションの概要を報告する。
近年,公費の助成を受けた研究では,研究の結果得られたデータをオープンにすることが,世界の多くの研究助成機関により求められている。データシェアリングにより多くの研究者が恩恵を授かることになるが,研究者個人のレベルでは自身のデータをオープンにすることには消極的である。その理由として,2016年に研究者を対象に実施された調査1)では,知的財産や秘密の問題,公開したデータに対して誤った理解がされるかもしれないこと,倫理上の問題,どこにデータを保存すべきかわからないなどが挙げられていた。また,データシェアリングに関する課題について,2014年のRDAヨーロッパのレポート2)では,“Perhaps the biggest challenge in sharing data is trust: how do you create a system robust enough for scientists to trust that, if they share, their data won't be lost, garbled, stolen or misused?”(データを共有するうえでの最大の課題は信頼である。つまり,データが失われたり,盗まれたり,誤用されたりすることのないように,科学者がデータを共有するには,どのようにシステム(制度設計など)を強固にしていくのかということである)と掲げられている。
研究助成機関は,データ共有を進めるため,信頼できるリポジトリにデータを登録することを求めている。そのため,昨今ではより多くのデータが急速に利用可能になっている。それ故,公開されているデータセットの質に対する要求も高まってきた。2017年9月,ICSU World Data System(ICSU-WDS)とData Seal of Approval(DSA)は,データリポジトリの認証機関(Certification Organization)である CoreTrustSealを立ち上げた。認証の要件として,組織(ミッションやスコープ,ライセンス,アクセスの継続性),技術(技術インフラ,セキュリティー),デジタルオブジェクトマネジメント(データの信頼性,評価,データ保存手順書,データの質,ワークフロー,データへのID,データ利活用)などの項目が挙げられている。また,2014年にFAIR(Findable, Accessible, Interoperable, Reusable)の原則が出され,現在では多くのステークホルダーに受け入れられている。
2.2 Research Data Management Organiser. A tool to support the planning, implementation and organisation of research data management / Speakers: Claudia Engelhardt, Harry Enke, Jochen Klar, Jens Ludwig and Heike NeurothResearch Data Management Organiser(RDMO)プロジェクトは,German Research Foundation(DFG)によって2015年に設立され,Leibniz Institute for Astrophysics Potsdam(AIP),Potsdam University of Applied Sciences(FHP),Karlsruhe Institute of Technology(KIT)Libraryの参画により,研究のサイクル全体における研究データマネジメントを補助するツールを開発することを目的に活動している。
このたび,研究データマネジメントを計画・実施するサポートツールを開発し(https://rdmo.aip.de),最初のバージョンを2017年4月にリリースした。このツールの特徴として,研究プロジェクトごとに継続的にデータを管理でき,研究者,プロジェクトコーディネーター,IT部門,データ管理者などさまざまなステークホルダーからアクセスができ,DMP(Data Management Plan)などさまざまな目的に応じてデータをエクスポートできることなどが挙げられる。
2.3 Getting persistent identifiers implemented by ‘Cutting in the middle-man’ / Speakers: Remco van Veenendaal, Marcel Ras and Marie Claire Dangerfield近年,文化遺産のデジタル保存のコミュニティーにおいて,持続的なアクセスを保つため,PID(Persistent Identifiers: 永続的識別子)の重要性が指摘されるようになってきた。しかしながら,PIDの利点を正確に知らなかったり,導入初期は維持に要する経費への恐れがあったりするため,文化遺産の保存機関においてはPIDの導入にはためらいがある。このような背景のもと,オランダの文化遺産を取り扱う機関が連携し,DHN(Dutch Digital Heritage Network)を結成し,2015年9月から2017年6月まで,PIDプロジェクトを実施した。このプロジェクトでは,次の3点に焦点を当てた。
まず,PIDに関する理解の向上のため,PIDを導入している機関を訪問し,ベストプラクティスの収集を行った。そして,PIDを導入していない機関向けにワークショップを開催した。また,PIDを導入するためのロードマップを作成した。さらに,PIDについて広く知ってもらえるように雑誌記事で紹介したり,SNSやYouTubeで動画を配信したりした。動画はいずれも2~3分の長さで,ポイントを押さえて初心者にもわかりやすくまとめられている注2)。
PIDの重要性を理解してもらった後は,各機関は最適のPIDを選択する。PIDには,たとえば,Archival Resource Keys(ARKs),Digital Object Identifiers(DOIs),the Handle System,OpenURL,Persistent Uniform Resource Locators(PURLs),Uniform Resource Names(URNs)などがあり,どれを選択するかは,その後も長期間にわたり影響してくることから重要である。そのため,このプロジェクトではPID Guideを作成した。ガイドの作成にあたっては,国内の次の専門家の協力を得た。
PID Guide(http://www.ncdd.nl/en/pid-wijzer/)は,クリエイティブ・コモンズCC0で自由に利用できる。PID Guideの利用者91名に対してアンケートを行った(図2)3)。
その結果,博物館ではHandle,図書館ではURN:NBN,研究機関ではDataCite DOIとHandleがそれぞれ好まれる傾向にあることがわかった。
イリノイ大学(University of Illinois)付属図書館のHeidi J. Imker氏より,同図書館における研究データマネジメントの事例が紹介された4)。米国ではOSTP memoにより公的研究の成果に由来する研究データは自由にアクセスできるようにしておかなければならないこととされている。それを受けて,NSF(米国国立科学財団),DOE(米国エネルギー省),DOT(米国運輸省),FDA(米国食品医薬品局),NASA(米国航空宇宙局),USGS(米国地質調査所),NIH(米国国立衛生研究所)などの研究助成機関は,DMPの提出を義務づけている。イリノイ大学付属図書館では,研究データのライフサイクルに応じたきめ細かなサービス体制(Illinois Data Bank)を構築し,(1)Planning,(2)Performing,(3)Publishing,(4)Archivingというライフサイクルに応じたサービスを提供している(図3)。
このIllinois Data Bankの取り組みは,2016年に開始されたばかりである。人員はフルタイムが4名(ディレクター1名,キュレーター2名,リポジトリ担当1名),パートタイムのボランティアが4名であり,まだまだ小規模である。イリノイ大学には教員が約3,000人所属しているが,この全員をサポートできる体制には程遠い。
iPRESは,デジタル長期保存という切り口で,文化財から,ゲーム,研究データまでをも取り扱う,マルチドメインの国際会議であり,Q&Aセッションやフリータイムには,学際的かつ国際的な議論が交わされた。参加者は研究者ばかりでなく,デジタル保存は国家主導で行われることが多いことから,各国・地域の政策担当者も多く集い,国際的な情報交換の場ともなっていた。今回は古都京都での開催であったことも影響してか,文化財の長期保存に関するセッションが多く設けられていた。今回が14回目の開催であったが,デジタル保存そのものの事例紹介が多く,その後の活用を見据えてPIDを付与するといったところまでの議論に至っているものはそれほど多くはなかった。一方,PIDに関する独立したセッションは前回に続けて今回も設けられていたことから,主催者側はそのあたりの展開も意識しているものと考えられる。しかし,PIDのセッションへの参加者は15名程度と少なく,現状においてはiPRES参加者の関心はそれほど高くはないと感じられた。デジタル長期保存におけるPIDの浸透について,今後の議論の展開も注目に値する。
(科学技術振興機構 知識基盤情報部 余頃祐介)
Choosing the most suitable Persistent Identifier : https://www.youtube.com/watch?v=rvJVvazpTuQ
Implementing Persistent Identifiers : https://www.youtube.com/watch?v=1M2Eut-Obcg