アーカイブのネットワークとしては,欧州のEuropeanaと米国デジタル公共図書館(Digital Public Library of America:DPLA,以下,DPLA)が有名である1)。このDPLAの年次大会にあたるDPLAfest 2015が,2015年4月17日,18日に,インディアナ州の州都インディアナポリスで開かれた注1)。この会議に参加したので報告する。
DPLAは,2013年4月18日に公開された米国各地に存在する図書館アーカイブの統合利用システムである(図1)注2)。これは,すでに実績のある欧州のEuropeana(http://www.europeana.eu/)をモデルとしている2)。これまで個別に散らばっていた図書館アーカイブを,一度に検索・閲覧できるようにし,さらには高度利用も可能にしようとする試みである。
これによれば,DPLAはハブ(Hub)と呼ばれる州ごとの図書館システム(A State Library System)や,全米規模のアーカイブ(Aggregated Collection)からメタデータを収集し(OAI/PMH),直接検索やユーザーアプリケーションで検索できるようにし,その結果,もとのコレクションを閲覧・利用できる仕組みである。現在,図書館システムはサービス・ハブ,全米規模のアーカイブはコンテンツ・ハブと呼ばれる。対象となるデータは,写真,手稿,書籍,新聞,聞き取り(oral history)その他の音声ファイル,ストリーム・ビデオなどである。
当初(2012年10月)予定していたサービス・ハブと,2015年4月時点でのサービス・ハブ,コンテンツ・ハブは表1のとおりである注4)。
サービス・ハブの多くは州単位のアーカイブで,その州のさまざまなアーカイブを統合して提供する。たとえば,North Carolina Digital Heritage Centerには155館のパートナーがいる。コンテンツ・ハブは博物館,美術館,国立公文書館などで,自分のデータのみを提供するハブである。
DPLAのコンテンツ数は開設時240万件であったが,丸2年経って1,600機関からの995万9,000件に成長した。会議中に2周年記念のセッションがあったが,そこで追加の登載があり,ちょうど1,000万件を突破したとの発表があった。
2年前にはサービス・ハブの数は5か所であったが,今は17か所となった。しかし,まだ全米をカバーしているわけではないので,継続的な努力が必要である。
コンテンツの出所としては公共図書館が24%,大学図書館が22%,博物館が11%,歴史協会が10%,文書館が6%となっている(図3)3)。最近の特徴としては,オーディオ・ビジュアルのアーカイブが増えたことがある。
事務局長のDan Cohenの発表によれば注5),最近の事業の拡大としては,HathiTrust注6)との協力により,電子書籍の活用を進め始めていること,Learning Registry,教育テレビネットワークのPBS(Public Broadcasting Service),LearningMediaとの協力により,教育現場での活用に力を入れていること,などである。
DPLAは全米各地の図書館や博物館,その他のアーカイブ機関の共同プロジェクトである。その推進力は,(1)理事会や事務局を支えるリーダーとサポーター,(2)サービス・ハブである州単位のアーカイブやコンテンツ・ハブ機関およびコンテンツ作成機関,(3)コア・システムの開発を支える技術者とAPIを利用するハッカー,(4)図書館員と利用者の4者から成っていると思われる。したがって今回の会議も次のようにそれら4者のニーズに応えるものとなっている。
(1)DPLAの発展のための戦略的な活動
(2)ハブやコンテンツ作成機関の経験交流と提案
(3)技術者のためのハッカソン
(4)図書館員と利用者のためのセッション
それぞれのカテゴリーのセッション・テーマは表2のとおりである。
以下,主なセッションの内容について報告するが,注記のローマ数字は表2のセッション・テーマに対応する。
DPLAでは教育機関での利用に力を入れている。DPLAではWhiting Foundationの助成により,DPLAをK-12(幼稚園児から12歳まで)教育現場に活用する研究を行った(i)。その成果は報告書として公開されている4)。結論としては,DPLAのような歴史文化資源を有効に活用するためには,特定の目的に特化したコンテンツのキュレーションとアウトリーチ活動が重要である。つまり,学校の利用者が的確なコンテンツに迅速にアクセスできること,またそのコンテンツが文化的歴史的文脈にきちんとはまっていることである。今後教育関係機関と協力して応用を進めていくことが重要であるとしている。
実践的には,DPLAを「驚きと発見の場」として利用したり,「テーマを設定した学習」,「生徒の自主研究」などに活用したりできるとする報告がある(iii)。
(2) Wikipediaとの提携一般にアーカイブのコンテンツは,Wikipediaで引用されると劇的にアクセス数が増加する。Wikipediaとしても,出典としてオリジナルのコンテンツへのリンクが増えることは品質向上のため好ましい(v)。WikipeDPLAはGoogle Chromeのプラグインであるが,これをインストールするとWikipediaの記事にDPLAへのリンクが表示される。たとえば,「Sankeien, Yokohama」をクリックすると,DPLAにあるコンテンツにリンクする(図4)。
デジタル・アーカイブを構築する際に,著作権は大きな問題となる。この点はDPLAにとっても同じである。こうしたアーカイブ機関のために,「図書館,文書館,その他のアーカイブ機関が孤児著作物を含むコレクションを構築する際のフェア・ユースの利用実施基準」注7)が2014年12月に作成された。DPLAもこれを適用する(viii)。
図書館,公文書館,その他の歴史資料機関が孤児著作物を含むコレクションのデジタル化を行う場合,フェア・ユースを利用することにより,かなりの著作権問題を解決できる。まず,これらアーカイブ機関においては,資料のデジタル保存は孤児著作物を含めフェア・ユースによって許されていると考えている。次に公開にあたっては,一定の手順が必要なものの,これらの機関では,孤児著作物や著作権のあるコンテンツを含むコレクションのオンライン公衆アクセスが原則としてフェア・ユースで許されていると考えている。
また,なるべくコンテンツはCC-BYのような広範な利用を認めるアクセスが好ましいが,現実にはコンテンツによっては複雑な権利記述がある。Europeanaはこうした権利の種類を簡略化しており,DPLAもEuropeanaと協力して権利記述の標準化に取り組んでいる(ix)。
3.2 ハブやコンテンツ作成機関に関するセッション (1) 実施例この関係のセッションではさまざまな発表があった。ハブの実践例については(xi),スライド[Hubs Showcase Slides]を参照していただきたい注8)。
興味深い例としては,5,000万ページの新聞記事の電子化を行ったNorth Carolina Newspapersや,地理メタデータの付与基準を作成したMountain West Digital Libraryがあった。
(2) その他これからハブとして参加しようとする機関のためのセッション(xi),職員の訓練(xii),デジタル化の実際(xv, xviii),メタデータの品質(xiii),リンクト・オープン・データ(xvi)などさまざまなセッションが行われた。
3.3 技術者のためのセッションDPLAでもEuropeanaでも,設計の当初からAPIを各方面の技術者に活用してもらうことにより,多角的な利用を発展させるという戦略をとっている。したがって「ハッカソン」と呼ばれる技術者(ハッカー)の経験交流会は会議の重要な部分で,今回は1日半の会議日程をフルに使って行われた(xx, xxi)。DPLAのAPIはEuropeanaを参考にしており,「AND, OR, ワイルドカード(*),フィールド指定,年代指定,地理指定」もできる。DPLAのApp Libraryがある(http://dp.la/apps)。
3.4 図書館員・利用者のためのセッション (1) 電子書籍電子書籍は今回の会議の大きなトピックで,合計5回のセッションが行われた。HathiTrustやInternet ArchiveのDPLA参加により,多量の電子書籍が利用可能になっている。こうした電子書籍リソースを図書館でどのように活用するかが討論された(xxii, xxiii)。
(2) デジタル人文学ショーケースここでは主としてHathiTrustのコンテンツを活用してどんな研究ができるかの報告があった(xxvii)。たとえば,イリノイ大学のLoretta Auvilらは,Bookwormというプログラムを使ってHathiTrustの電子化された書籍の全文やメタデータを解析して,年とともに動詞の不規則活用(burnt)が規則活用(burned)に置き換えられていく様子などを示した。
(3) DPLAその他の家族史資源移民と奴隷の国,米国では,国立公文書館やその他のアーカイブを利用する目的の大部分が自分のルーツを調べる家系調査である。現在利用できるツールにはLouisiana Genealogy,Internet Archive Genealogy,The USGenWeb Projectなどがある。これらは住民台帳,教会信者台帳,奴隷台帳,センサス,埋葬記録,死亡広告,興信録などを電子化したものである。今後DPLAがこれらのプロジェクトと協力できる可能性がある(xxvi)。
インディアナポリスといっても,ほとんどの人は簡単にイメージできないかもしれない。自動車レースの「インディ500」はこの近郊で行われる。
DPLAfesの開会式は,市の中心にあるインディアナポリス中央図書館で,その後大学図書館などいくつかの会場に分散して分科会が開かれた(図5)。
前述したように,この会議は発表の場というよりは議論の場であって,関係者がDPLAの課題や今後の進め方について熱く発言していた。したがって,なかなか外部の人間にはついていきにくいところがある。日本でこのようなプロジェクトができるかというと簡単ではない気がする。図書館が協力して進めているプロジェクトとしては,大学図書館による機関リポジトリ連合が成功例の1つである。ただし,これも国立情報学研究所(NII)の強いリーダーシップがあってのことであろう。ハッカーのプロジェクトとしてはCode4Lib JAPANがあるが,彼らもDPLAやEuropeanaのような活躍の場を十分与えられていない気がする。日本におけるデジタル・アーカイブの発展モデルについてはこれから議論が必要である。
Europeanaもそうであるが,DPLAも活用を語るフェーズに入ってきた。Wikipediaとの連携は非常に期待がもてると感じた。
また米国でのアーカイブ活動はフェア・ユースで厚く守られているということを実感した。わが国ではTPPによる著作権保護期間延長が語られる中,そのような安全網もなく,先の見えない思いである。
(東京大学大学総合教育研究センター 時実象一)