情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
視点
視点 メディアを超えるアノテーション
神崎 正英
著者情報
ジャーナル フリー HTML

2016 年 59 巻 7 号 p. 479-484

詳細

読書メモと注釈

電子書籍ツールのおかげで,メモの整理が随分便利になった。印を付けた箇所はあらためてカードに抜き書きせずとも,(制約はあるものの)コピー&ペーストで引用すればよい。論文のPDFにも,ハイライトやメモを加えてあとで利用できる。

ウェブの情報も,ブックマークのコメントだけでなく,特定箇所を切り抜き保存したりメモを貼り付けるための方法がいろいろ工夫されてきた。写真や動画に一言加えて共有できるサービスもたくさんある。

これらはいずれも,ある作品に対して外部から説明を加える注釈(アノテーション)注1)の一種と考えることができる。だから情報の基本形は共通であるはずなのだけれど,実際はそれぞれが独自の方法を採っていて,相互運用性はない。文献PDFへのメモと,ウェブページでマークした部分と,ファクシミリ画像に加えた注釈を,メディアを横断して検索することは今のところ非常に難しいのだ。

注釈のモデル

先日,ホテルの星評価について検討中というSchema.org注2)のプロジェクト・リーダーと話をしながら,モデリングの例題を思い返していた。たとえば「ホテルAの評価が4.5である」という情報の記述を考えよう。

単純なモデルなら,「ホテルA--評価-->4.5」と直接表現してもよいかもしれない。しかしこの形では,別のサービスで同じホテルAの評価が3.5とされているときに話がややこしくなる。両者を合わせると2つの評点が混在して,どちらを信じてよいのかわからなくなってしまう(1)。

客観的な事実ではなく,「それは誰の意見である」といった関係の説明も必要な場合は,2のような間接型の記述が必要だ注3)。これならば,異なるサービスの評価を合成しても混乱することがない。実際Schema.orgでも評価(Review)は間接型で定義されている。

前回取り上げた「ベートーベンの第九交響曲終楽章のフェルマータにディミヌエンドがあるかどうか」注4)を表現するのも,同様に考えることができる。そこで紹介したように,この箇所は出版譜によって扱いが異なって,ディミヌエンドを採用する楽譜もあれば,そうでないものもある。1の直接型ではどちらが正しいのかという問題になってしまうが,2の間接型で楽譜(校訂者)ごとの判断として説明するなら,異なる扱いが併存しても矛盾はない。そして前回の「楽譜の校訂は注釈だ」という考えを踏まえると,これはまさに注釈表現モデルの基本形でもあるといえる。

図1 直接型記述モデル
図2 間接型記述モデル

Annoteaの試み

ウェブは初期の頃からコラボレーションや知識共有の可能性を広げる空間とみなされ,そのツールとしての注釈が注目されていた注5)。さまざまな独自提案や実装が存在する中,注釈モデルと語彙の標準案を提示したAnnoteaプロジェクトが2000年秋にW3Cでスタートする。ブラウザAmayaにその機能が組み込まれ,作成した注釈はサーバーに保存してどこからでも取り出して再現できた注6)

Annoteaは3のような注釈モデルを用いた。中心に置かれた円が注釈を示すリソースで,それが右上の対象文書をannotatesし,右下のbodyでその注釈内容に結び付ける間接型である。さらに対象文書内のハイライト箇所をcontextとしてXPointer注7)で表し,文書URIとの組み合わせで注釈対象を識別している。共同作業や知識共有で重要な,その注釈をいつ誰が作成したかという情報は,created,dc:creatorで示された注8)

このAnnoteaモデルに対応して,Mozilla/FirefoxのアドオンAnnozillaなどいくつかのツールが公開される。国際ワークショップも毎年開かれてしばらく盛り上がりを見せるのだが,実験プロジェクトであったAnnoteaは,残念ながら2006年頃にはほぼ活動を停止してしまった。

Annoteaが対応していなかった画像などの注釈はもちろん,テキスト注釈も含め,独自ツール中心の状況はまだしばらく続く。注釈データはそれぞれのシステムの「サイロ」の中にとどまっていた注9)

図3 Annoteaの注釈モデル

モデルの標準化Web Annotationへ

アノテーションの課題を再考し相互運用性の高い仕組みを実現しようと,Open Annotation(以下OA)プロジェクトが2009年に立ち上げられた注10)。ウェブ文書だけでなく画像や映像への注釈も視野に,ティム・バーナーズ=リーが提唱して注目されていたLinked Dataの考え方をも取り入れようという意欲的な取り組みだ。

翌年に仕様のアルファ版が出され,2013年にはOA Core仕様が公開されている。Annoteaと同様の構造を出発点に,annotates(対象文書)とcontext(文書内のハイライト箇所)の2つで表現していた注釈対象の記述を,メディア・フラグメントをURIに用いるなどしてひとつにまとめた。また範囲指定などURIだけでは表現できない対象は,その先にセレクタを置き,必要な部分指定方法を用いて記述する注11)4)。

これと並行してOpen Knowledge Foundationが注釈作成用のJavaScriptライブラリであるAnnotatorと,その注釈を保管するウェブサービスAnnotateItを2012年に公開し,OAプロジェクトに参加する注12)。こうして誰もが標準的な方法による注釈を利用できる環境が整い始めた。

標準注釈モデルへの関心の高まりは,2014年のA W3C Workshop on Annotations開催に結び付く。そしてその成果を受けてW3CにWeb Annotation(以下WA)作業部会注13)が正式に設置され,OAをベースに本格的な標準化作業が始まった。仕様は2017年早々にもW3C勧告となる見込みだ。

図4 Open Annotationの注釈モデル

アノテーションツールの利用

OAにせよWAにせよ,その仕様を直接用いた注釈記述への期待もさることながら,異なるツールのデータを共有・再利用するための橋渡しの役割が重要である。個々のツールはそれぞれの工夫をこらしたデータ設計を採用しても,この共通モデルへの翻訳を可能にすることで,相互運用性が確保できるわけだ。

たとえば自分の欲しい機能を備えたウェブ注釈ツールが見つからないなら,Annotatorライブラリを利用して自作してもよい。PDFへの注釈は,Annotatorを拡張したサービスであるHypothes.is注14)の機能が利用できる。対象に応じてツールを使い分けつつ,それらの注釈データをWAに変換して手元に持ってくれば,すべてのアノテーションを一貫した形で処理可能だ。さらにWAモデルはRDF表現との対応が定義されているから,注釈をRDFデータベースに取り込んで自在に操作できる注15)

今回の記事も,資料に加えた注釈を試作ツールでいろいろな形に表示しながら,内容を組み立ててみた。注釈を集めて並べ替えたり加工したりという作業は,カードでの整理が柔軟な力を持っていたことを思い出させてくれる(5)。

今回のモデル検討の出発点でもあった,同じ対象に関する複数意見の区別と比較もツールの重要な役割だ。すでに読書端末などでも他の人のメモを閲覧する機能が提供されているが,注釈標準モデルに対応したツールは,同一対象への注釈を識別してポップアップで表示を束ねるなどの処理ができるだろう(6)。

図5 試作ツールの利用例(1)
図6 試作ツールの利用例(2)

IIIF,そして多様なメディア

WAは多様なメディアを注釈対象にできる。これに呼応する形で最近注目を集めているのが,手稿や文化遺産のデジタル画像利用の相互運用を図るInternational Image Interoperability Framework(IIIF)だ。IIIFは画像提供の仕組みであるImage API,画像をツールで利用するためのメタデータ記法を定義するPresentation API,これらを用いた検索プロトコルのSearch APIを策定している注16)

このPresentation APIは,2010年末に初期モデル案が提唱された共有カンバス(Shared Canvas)を発展させたものである。一つの物理対象(書物のページなど)に対して抽象的な「カンバス」を用意し,そこに解像度の異なる画像や複数の注釈テキストなどを重ね合わせて,資料・知識を共有するという方法だ。この記述にWA(OA)が適用されているのだが,注釈対象(target)はカンバスであって,テキストのみならず画像も注釈内容(body)とする考え方が興味深い(7)。Presentation APIは構文を変え,カンバス内に画像やテキストを置くような記述を取るが,背後にあるのは共有カンバスと同様のWA注釈モデルである。

この数年,各国・地域の博物館や図書館が,デジタル画像のIIIF対応に取り組み始めている。IIIFを扱えるツールも増え,複数の機関のデジタル画像を一つのビューアで閲覧できるようになってきた注17)。IIIFメタデータ(マニフェストと呼ぶ)はWAのRDF表現に変換できるので,他のWAによる注釈との組み合わせが可能だ。RDFデータベースに格納すれば,冒頭で述べた文献注釈と画像注釈の横断検索も容易に実現する。

EPUBでの注釈にWA/OAを用いる仕様案や,ビデオ注釈用のAnnotator拡張の試みなど,注釈の標準はメディアを超えて広がりつつある注18)。これらを統合的に扱えるようになれば,共同作業にも知識共有にも大きな恩恵がもたらされるだろう。個人的にも,あの電子テキストとデジタル画像を結び付けよう,この古典の訳や注解をWAモデルで表現しようといったお楽しみプロジェクトが,陰に陽に進行中である。

図7 Shared Canvasのモデル

執筆者略歴

  • 神崎 正英(かんざき まさひで)

サントリー広報部時代に同社ウェブサイトの提案・構築を行ったことなどをきっかけに,文書構造表現/データモデルの設計や標準化の方向に進み,黎明期(れいめいき)セマンティック・ウェブのプロジェクトにかかわってきた。慶應義塾大学文学部講師を兼務。休日コントラバス奏者としての芸歴は三十数年。

本文の注
注1)  注釈とは,「本文の中の語句をとりあげて,その意味を解説すること。またその説明。注解」(日本国語大辞典)とテキスト読解のための説明を指すことが多く,Annotationも「テキストや図版に加える説明的ノート」とほぼ同様だが,ここでは対象を画像や動画などにも広げ,「対象(の一部)に外部から加える説明」という意味で用いる。後述するWeb Annotation仕様では“the act of creating associations between distinct pieces of information”(別々に存在する情報の間に関連を生み出す行為)として,写真や動画へのコメント,SNSポストでウェブページに言及することもアノテーションだとしている。つまりウェブにおいては,注釈対象と注釈内容はレイヤが異なるだけでなく,物理的にも別の場所やメディアに分かれていてよく,必要に応じてツールがそれらの「関連」を表現することになる。なお本稿では「注釈」と「アノテーション」は同じ意味で用いる。

注2)  Schema.orgは,ウェブのさまざまなものごとを曖昧さなく記述するために,600近くに及ぶクラス(Book,Photograph,Carなど,ものごとを表す型)とそこで用いるプロパティ(ものごとについて記述する属性)を定義し,共有を図る語彙で,GoogleやYahoo!をはじめとする検索エンジンが支持していることから,広く利用されている。

注3)  図1=直接型は対象(ホテルA)と評価値の間の二項関係。図2=間接型は図1における「評価」という関係(矢印)をノード(円)にしてN項関係を導入したものにあたる。いつ,誰がなど関連情報を追加し,それぞれの「評価」を判断する材料を提供できる。Defining N-ary Relations on the Semantic Web:http://www.w3.org/TR/swbp-n-aryRelationsなどを参照。

注4)  『情報管理』Vol. 59 (2016) No.3 p.189-192:http://doi.org/10.1241/johokanri.59.189 フェルマータは動きを止めてその音を長く延ばすこと,ディミヌエンドは音をだんだん弱くすることを示す記号。

注5)  たとえば1995年にはWorkshop on WWW and Collaborationが開催され,そこからW3C(World Wide Web Consortium)でwww-annotationメーリングリストが始まっている。W3Cはウェブの標準仕様を策定したり方向性を議論したりするために1994年に設立された組織で,ウェブの創始者であるティム・バーナーズ=リーがディレクタを務める。W3Cで議論がまとまった標準仕様は勧告(Recommendation)として公開される。またW3Cは数多くのメーリングリストを運営しており,そこでは仕様策定に関する意見や技術の応用方法提案などを,誰でも投稿し議論することができる。

注6)  Annotea Project:https://www.w3.org/2001/Annotea/ モデルを記述する語彙Annotea Annotation Schemaや,ブックマークを注釈として表現するAnnotea Bookmark Schemaが定義された。AmayaはW3Cでさまざまなプロジェクトの実証に用いられてきた謹製ブラウザ。Annoteaサーバーも含め,これらはオープンソースとして公開された。

注7)  XPointer Framework:https://www.w3.org/TR/xptr-framework/ 名前付け(id属性)に加え,要素のツリー構造を利用して文書内の位置を示す方法。URIのフラグメント識別子として用いることができる。XMLのための仕組みだが,id属性がない要素を識別する手段として,HTMLを含む注釈対象への応用が期待された。ただXPointerだけではウェブ文書の変更に対応できず,注釈が迷子になるという難点があった。

注8)  dc:は,文書などの作品のタイトル/作者といったメタデータを記述する汎用語彙,Dublin Coreの基本15要素(http://dublincore.org/documents/dces/)を表す。dc:dateは最終更新を示すために用いられているが,この時点ではまだ拡張された語彙であるDC Terms(http://dublincore.org/documents/dcmi-terms/)は定義されていなかったため。後述の新しい標準モデルでは,作成日時,更新日時はそれぞれdcterms:created,dcterms:modifiedとなっている。

注9)  データを公開せずにツールやサービスの内部だけにとどめているものを「サイロ」と呼ぶ。ティム・バーナーズ=リーが提唱したLinked Dataは,このサイロを開け放ち,データがリンクしてウェブを構成することを目指している。

注10)  Open Annotation Collaboration:http://www.openannotation.org/ 設立に携わったのは英米豪の大学や図書館,学術情報サービスJSTORの関係者たち。

注11)  メディア・フラグメント(https://www.w3.org/TR/media-frags/)は画像,オーディオ,動画などのマルチメディア・コンテンツ内の特定箇所を指し示すための仕様で,2012年にW3C勧告となった。たとえば画像の部分は矩形領域の左上の座標と幅,高さを組み合わせてxywh=160,120,320,240などと表現する。URIのフラグメント識別子として用いることで,画像の領域やビデオの特定箇所を識別したりリンクしたりできる。これだけでは十分に表現できない部分対象は,OAではセレクタを用いて示す。これによって多様な部分記述に対応できる他,複数のセレクタを組み合わせて,編集による対象位置の変化もある程度の追跡が可能だ。

注12)  Annotatorはオープンソースで,現在http://annotatorjs.org/で最新版やドキュメントが公開されている。AnnotateItはhttp://annotateit.org/

注13)  Web Annotation Working Group:https://www.w3.org/annotation/ データモデルの他,語彙,プロトコルの仕様策定が進められており,いずれも2016年8月現在で勧告候補となっている。なおOpen Annotationは,2012年にW3Cのコミュニティ・グループ(技術仕様などの議論のためにW3Cがコミュニティに提供する場)となって,OA Coreはコミュニティ草案として公開された。

注14)  Hypothes.is:https://hypothes.is 2011年にThe Internet, peer reviewedとして予告ウェブサイトが開設され,2014年末にサービスが始まった非営利の注釈サービス。Annotatorをベースにカスタマイズした仕組みで,ブラウザに読み込んだPDFに対しても注釈を与えられる。

注15)  Annotea,OAの注釈モデルは直接RDFを用いて記述されていたが,WAは標準構文にJSON-LDを採用して,RDFを意識しないウェブ・アプリケーションなどでも利用しやすくしている。JSON-LDで必須の“@context”キーによって,WA語彙によるRDF表現へのマッピングが提供されており,容易にRDFグラフを取り出すことができる。

注16)  IIIF:http://iiif.io/. スタンフォード大,英国図書館,オックスフォード大ボドリアン図書館,フランス国立図書館などによって2012年初めに始まった活動で,同年Image APIの1.0が出され,Presentation APIが続いた。なおIIIFは「トリプル・アイ・エフ」と読むと仕様に記されている。

注17)  IIIFのサイトで,対応ツールや応用例が多数紹介されている。複数機関の画像を並べて表示,比較できるツールもあるし,多くは注釈機能も備えている。最近では,バチカンのデジタル図書館(http://digi.vatlib.it/)がIIIFに対応して話題となった。

注18)  Open Annotation in EPUB http://www.idpf.org/epub/oa/ はまだ草案段階。ビデオ注釈は https://github.com/CtrHellenicStudies/OpenVideoAnnotation など。

 
© 2016 Japan Science and Technology Agency
feedback
Top