情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
集会報告
集会報告 International Conference on Digital Preservation 2017(iPRES 2017)
余頃 祐介
著者情報
ジャーナル フリー HTML

2018 年 60 巻 10 号 p. 748-752

詳細

開催情報

  • 日程   2017年9月25日(月)~29日(金)
  • 場所   京都大学国際科学イノベーション棟(吉田キャンパス本部構内,京都府京都市)
  • 主催   京都大学
  • 後援   東京大学空間情報科学研究センター,立命館大学アート・リサーチセンター,人間文化研究機構,情報知識学会,人文科学とコンピュータ研究会,人文系データベース協議会,The Pacific Neighborhood Consortium(PNC),The Electronic Cultural Atlas Initiative(ECAI),京都国際マンガミュージアム,京都精華大学国際マンガ研究センター

1. はじめに

iPRES(International Conference on Digital Preservation)は,デジタルデータの長期保存とマネジメントに関する国際会議である。2004年の中国北京での開催を皮切りに,毎年世界各地で開催されている。今回は14回目の開催で,“Keeping cultural diversity for the future in the digital space - from pop-culture to scholarly information”と題して,京都で開催された注1)。当初は2011年に筑波で開催される予定であったが,東日本大震災の影響で急きょシンガポールで開催されることになったこともあり,今回は念願の日本での初開催となった。会議では,ポップカルチャーを含む文化資源や研究データの長期保存を中心に,保存のワークフローやフレームワーク,システムやツール,取り組み事例について報告があった。ヨーロッパ,北米,アジア,オセアニアを中心として250名程度が一堂に会し,59におよぶセッションの中で議論が交わされた(1)。以下では,興味深かったセッションの概要を報告する。

図1 会場の様子

2. セッション概要

2.1 FAIR Data in trustworthy data repositories / Speaker: Ingrid Dillo(Data archiving and networked services, Netherlands)

近年,公費の助成を受けた研究では,研究の結果得られたデータをオープンにすることが,世界の多くの研究助成機関により求められている。データシェアリングにより多くの研究者が恩恵を授かることになるが,研究者個人のレベルでは自身のデータをオープンにすることには消極的である。その理由として,2016年に研究者を対象に実施された調査1)では,知的財産や秘密の問題,公開したデータに対して誤った理解がされるかもしれないこと,倫理上の問題,どこにデータを保存すべきかわからないなどが挙げられていた。また,データシェアリングに関する課題について,2014年のRDAヨーロッパのレポート2)では,“Perhaps the biggest challenge in sharing data is trust: how do you create a system robust enough for scientists to trust that, if they share, their data won't be lost, garbled, stolen or misused?”(データを共有するうえでの最大の課題は信頼である。つまり,データが失われたり,盗まれたり,誤用されたりすることのないように,科学者がデータを共有するには,どのようにシステム(制度設計など)を強固にしていくのかということである)と掲げられている。

研究助成機関は,データ共有を進めるため,信頼できるリポジトリにデータを登録することを求めている。そのため,昨今ではより多くのデータが急速に利用可能になっている。それ故,公開されているデータセットの質に対する要求も高まってきた。2017年9月,ICSU World Data System(ICSU-WDS)とData Seal of Approval(DSA)は,データリポジトリの認証機関(Certification Organization)である CoreTrustSealを立ち上げた。認証の要件として,組織(ミッションやスコープ,ライセンス,アクセスの継続性),技術(技術インフラ,セキュリティー),デジタルオブジェクトマネジメント(データの信頼性,評価,データ保存手順書,データの質,ワークフロー,データへのID,データ利活用)などの項目が挙げられている。また,2014年にFAIR(Findable, Accessible, Interoperable, Reusable)の原則が出され,現在では多くのステークホルダーに受け入れられている。

2.2 Research Data Management Organiser. A tool to support the planning, implementation and organisation of research data management / Speakers: Claudia Engelhardt, Harry Enke, Jochen Klar, Jens Ludwig and Heike Neuroth

Research Data Management Organiser(RDMO)プロジェクトは,German Research Foundation(DFG)によって2015年に設立され,Leibniz Institute for Astrophysics Potsdam(AIP),Potsdam University of Applied Sciences(FHP),Karlsruhe Institute of Technology(KIT)Libraryの参画により,研究のサイクル全体における研究データマネジメントを補助するツールを開発することを目的に活動している。

このたび,研究データマネジメントを計画・実施するサポートツールを開発し(https://rdmo.aip.de),最初のバージョンを2017年4月にリリースした。このツールの特徴として,研究プロジェクトごとに継続的にデータを管理でき,研究者,プロジェクトコーディネーター,IT部門,データ管理者などさまざまなステークホルダーからアクセスができ,DMP(Data Management Plan)などさまざまな目的に応じてデータをエクスポートできることなどが挙げられる。

2.3 Getting persistent identifiers implemented by ‘Cutting in the middle-man’ / Speakers: Remco van Veenendaal, Marcel Ras and Marie Claire Dangerfield

近年,文化遺産のデジタル保存のコミュニティーにおいて,持続的なアクセスを保つため,PID(Persistent Identifiers: 永続的識別子)の重要性が指摘されるようになってきた。しかしながら,PIDの利点を正確に知らなかったり,導入初期は維持に要する経費への恐れがあったりするため,文化遺産の保存機関においてはPIDの導入にはためらいがある。このような背景のもと,オランダの文化遺産を取り扱う機関が連携し,DHN(Dutch Digital Heritage Network)を結成し,2015年9月から2017年6月まで,PIDプロジェクトを実施した。このプロジェクトでは,次の3点に焦点を当てた。

  • •   文化遺産保存組織におけるPIDsの重要性に対する理解の向上
  • •   文化遺産におけるPIDsの活用に関する理解の向上
  • •   文化遺産収集管理におけるPIDsの導入に係る技術的支援

まず,PIDに関する理解の向上のため,PIDを導入している機関を訪問し,ベストプラクティスの収集を行った。そして,PIDを導入していない機関向けにワークショップを開催した。また,PIDを導入するためのロードマップを作成した。さらに,PIDについて広く知ってもらえるように雑誌記事で紹介したり,SNSやYouTubeで動画を配信したりした。動画はいずれも2~3分の長さで,ポイントを押さえて初心者にもわかりやすくまとめられている注2)

PIDの重要性を理解してもらった後は,各機関は最適のPIDを選択する。PIDには,たとえば,Archival Resource Keys(ARKs),Digital Object Identifiers(DOIs),the Handle System,OpenURL,Persistent Uniform Resource Locators(PURLs),Uniform Resource Names(URNs)などがあり,どれを選択するかは,その後も長期間にわたり影響してくることから重要である。そのため,このプロジェクトではPID Guideを作成した。ガイドの作成にあたっては,国内の次の専門家の協力を得た。

  • •   Delft University of Technology(DataCite DOI),
  • •   SURFsara(Handle System)
  • •   The National Library of the Netherlands(URN: NBN namespace)

PID Guide(http://www.ncdd.nl/en/pid-wijzer/)は,クリエイティブ・コモンズCC0で自由に利用できる。PID Guideの利用者91名に対してアンケートを行った(23)

その結果,博物館ではHandle,図書館ではURN:NBN,研究機関ではDataCite DOIとHandleがそれぞれ好まれる傾向にあることがわかった。

図2 利用しているPIDについてのアンケート結果

2.4 Research lifecycle based Research Data Management requirements and its alignment with institutional, domestic and international contexts / Chair: Shoji Kajita, Speakers: Shoji Kajita, Kazutsuna Yamaji, Heidi J. Imker

イリノイ大学(University of Illinois)付属図書館のHeidi J. Imker氏より,同図書館における研究データマネジメントの事例が紹介された4)。米国ではOSTP memoにより公的研究の成果に由来する研究データは自由にアクセスできるようにしておかなければならないこととされている。それを受けて,NSF(米国国立科学財団),DOE(米国エネルギー省),DOT(米国運輸省),FDA(米国食品医薬品局),NASA(米国航空宇宙局),USGS(米国地質調査所),NIH(米国国立衛生研究所)などの研究助成機関は,DMPの提出を義務づけている。イリノイ大学付属図書館では,研究データのライフサイクルに応じたきめ細かなサービス体制(Illinois Data Bank)を構築し,(1)Planning,(2)Performing,(3)Publishing,(4)Archivingというライフサイクルに応じたサービスを提供している(3)。

  • (1)Planning
  • DMP作成の段階から,研究者の補助をしている。具体的には,1~2日程度でコンサルタントを行ったり,テンプレートを用意したりしている。研究助成機関ごとに言葉遣いなどが若干異なることから,それらに対応するためのノウハウの提供も行っている。
  • (2)Performing
  • 研究データを保存するためのインフラを提供している。このインフラは,研究者に$96/TB/yearを負担してもらうコストリカバリーモデルを採っている。インフラの提供だけでなく,60~90分程度のセミナーを開催し,研究者のデータ保存技術の向上に努めている。
  • (3)Publishing
  • IDの登録,メタデータの付与などにより,学術界,産業界からのデータの閲覧性を高めるようにしている。
  • (4)Archiving
  • 長期保存のための手段も提供している。

このIllinois Data Bankの取り組みは,2016年に開始されたばかりである。人員はフルタイムが4名(ディレクター1名,キュレーター2名,リポジトリ担当1名),パートタイムのボランティアが4名であり,まだまだ小規模である。イリノイ大学には教員が約3,000人所属しているが,この全員をサポートできる体制には程遠い。

図3 大学全体および国内外の横断的な研究データ管理のフロー図

3. おわりに

iPRESは,デジタル長期保存という切り口で,文化財から,ゲーム,研究データまでをも取り扱う,マルチドメインの国際会議であり,Q&Aセッションやフリータイムには,学際的かつ国際的な議論が交わされた。参加者は研究者ばかりでなく,デジタル保存は国家主導で行われることが多いことから,各国・地域の政策担当者も多く集い,国際的な情報交換の場ともなっていた。今回は古都京都での開催であったことも影響してか,文化財の長期保存に関するセッションが多く設けられていた。今回が14回目の開催であったが,デジタル保存そのものの事例紹介が多く,その後の活用を見据えてPIDを付与するといったところまでの議論に至っているものはそれほど多くはなかった。一方,PIDに関する独立したセッションは前回に続けて今回も設けられていたことから,主催者側はそのあたりの展開も意識しているものと考えられる。しかし,PIDのセッションへの参加者は15名程度と少なく,現状においてはiPRES参加者の関心はそれほど高くはないと感じられた。デジタル長期保存におけるPIDの浸透について,今後の議論の展開も注目に値する。

(科学技術振興機構 知識基盤情報部 余頃祐介)

本文の注
注1)  iPRES2017 : https://ipres2017.jp/

注2)  PIDに関する動画:What are Persistent Identifiers? : https://www.youtube.com/watch?v=AUvMLzdgB3Y

Choosing the most suitable Persistent Identifier : https://www.youtube.com/watch?v=rvJVvazpTuQ

Implementing Persistent Identifiers : https://www.youtube.com/watch?v=1M2Eut-Obcg

参考文献
 
© 2018 Japan Science and Technology Agency
feedback
Top