2017 年 60 巻 4 号 p. 261-270
現在,オープンデータの取り組みは世界的に広がりをみせており,実際の利用例の開拓を目的としたコンテストは注目を浴びている活動の一つである。日本国内で最初期から活動を継続しているコンテスト「Linked Open DataチャレンジJapan」は,Linked Dataに力点を置いているだけでなく,協賛者のデータを使った応募作品を作るハッカソン等イベントを共催で開催できる特典をスポンサーに用意するなど特色ある制度が存在する。本稿では,コンテストの運営者の視点に加えて,スポンサー・データ提供で協賛したデータ提供者の両方の視点から,コンテスト形式でのオープンデータ普及活動の実例を紹介する。LODチャレンジのこれまでの歩みと2016年の開催報告,JST(科学技術振興機構)との共催のイベント開催の様子とコンテストにデータを提供することのメリット,そして今後の展望と課題について述べる。
現在,世界的にもオープンデータの取り組みが広がりをみせており,国内においても政府による推進,社会課題解決,科学技術発展,ビジネス化などさまざまな影響と目的によりその取り組みが活発化している。特に注目を集めている活動の一つとしてオープンデータに関するコンテストがあり,コンテストでのデータ提供や作品応募等を通じてオープンデータの普及に直接的または間接的に貢献している。国内において大規模かつ継続的に行われているコンテストとして,本稿で紹介する「Linked Open DataチャレンジJapan(LODチャレンジ)」注1)や,自治体データの活用により地域課題解決を目的とした「アーバンデータチャレンジ」注2)が存在する。さらに2016年にはデータ活用による地域課題解決とオープンガバナンスを目的とした「チャレンジ!!オープンガバナンス」注3)が新たに開催されている。その他,過去には自治体や民間企業主催のさまざまなオープンデータコンテストが開催されている。
LODチャレンジはオープンデータ構築と活用の取り組みを表彰するコンテストであり,Linked Open Data(LOD)注4)の公開と活用にチャレンジする点が他のコンテストとの違いであり特徴である。LODとはオープンデータをResource Description Framework(RDF)形式で機械可読化かつ構造化し,データ同士をリンクさせたものであり,Web技術標準化団体のWorld Wide Web Consortium(W3C)により推奨されている。
本稿では,LODチャレンジのこれまでの歩みに加えて,2016年度に開催されたLODチャレンジ2016の全体報告と今後の展望について述べる。さらに,プラチナスポンサーである科学技術振興機構(JST)との連携イベントを例に,コンテスト型のオープンデータ普及推進活動について報告する。なお,1,2,4章は江上,3章は渡邊が執筆した。
LODチャレンジはオープンデータ構築と活用の取り組みを表彰するコンテストであり,2011年より毎年開催し2016年で6回目の開催となる。さまざまな分野でLODの仕組みづくりやデータづくりにチャレンジしている人々に活動発表の場を提供し,コンテスト形式で評価し合うことで,その相乗効果として,価値のある新しい技術・サービスの創出につなげることを目指したコンテストである1)。LODチャレンジは「アイディア」「データセット」「アプリケーション」「ビジュアライゼーション」「基盤技術」の5つの応募部門に分かれている。LODはまだ歴史が浅くデータや基盤が十分に整っていないため,優れたデータや基盤技術も表彰する点が他のコンテストと比較して特徴的である。開催趣旨として「Open=つながる」のコンセプトを掲げており,これはデータをオープンにすることでデータ同士,データとアイデア,データとアプリ等のつながりや,さまざまな活動に取り組む参加者同士のつながりをつくり,オープンデータをきっかけとしたコミュニティー形成を支援するというものである。すなわち,データをオープンにすることは,さまざまなモノ・コト・ヒトがつながるきっかけになるというメッセージを発信してきた2)。
LODチャレンジの運営主体である任意団体,LODチャレンジJapan実行委員会は,産学官から集まった有志メンバーにより結成されている。実行委員会の発足はセマンティックWeb委員会注5)に端を発し,セマンティックWebコンファレンス2011注6)を契機に同委員会が母体となり実行委員会が設立された2)。その後,LODやオープンデータ推進に関心のある有志が集い,さらには過去の受賞者の中からも本委員会に加入する形で成長を続け,2016年3月現在では31名がLODチャレンジ実行委員として活動している。
2.2 近年の取り組み2015年からは「参加型オープンデータ」の推進に向けて新たに以下の施策3)を実行した。
まず,プラチナスポンサー(協賛金:30万円)のメリットが大きくなるよう,プラチナスポンサーの希望に沿った共催イベントを企画する特典を設けた。LODチャレンジはスポンサーの希望に沿った形でプログラムの企画や告知,その他雑多な内容を担当する。スポンサーの要望には独自のデータセット,API,基盤技術などを広め,活用事例を増やしたいというものが多い。2015年にはプラチナスポンサー5団体のうち4団体が,2016年には5団体のうち2団体がこの特典を使用した。うち一つは後述するJSTとの共催イベントである。
次に,よりオープンな作品の応募を増やすために審査基準を公開した。以下に2016年度の審査基準を示す。Iはアイディア部門,Dはデータセット部門,Aはアプリケーション部門,Vはビジュアライゼーション部門,Bは基盤技術部門の審査項目である。
一般的なコンテストにも含まれる審査基準に加え,(4)(5)(8)(10)は「Open=つながる」のコンセプトを重視した特徴的な項目も含んでいる。
さらに,応募ページにKnowledge Connectorを採用した。応募ページでKnowledge Connector上の作品の引用や,外部コンテンツの埋め込みなどのカスタマイズが可能になっており,今まで以上に作品のアピールが可能になった。さらにユーザー同士のコンタクトを取ることも容易になり,新たなコミュニティー形成の可能性が高まった。
その他公式サイトの独自ドメイン(lodc.jp)への移行やGit管理などのシステム上の変更も行い,現在のLODチャレンジに至る。
2.3 LODチャレンジ2016の開催報告2016年度のLODチャレンジ(LODチャレンジ2016)は2016年10月1日から2017年1月15日までを作品応募期間として開催した。2016年9月17日にはLODチャレンジ開催に向けたキックオフシンポジウムを開催し,2017年3月11日には受賞作品表彰を行う授賞式シンポジウムを開催した(図1)。作品応募期間と各シンポジウム開催時期は毎年ほぼ同様のスケジュールで行っている。また前述のとおり,2015年度からプラチナスポンサーの希望に沿った共催イベントを企画するという特典を設け,2016年度は2つのスポンサーがこの特典を活用し12月にイベントを共催した。その他,主催・共催イベントを計13件,協力・後援イベントを18件開催している。結果として2016年度はアイディア部門70作品,データセット部門49作品,アプリケーション部門73作品,ビジュアライゼーション部門20作品,基盤技術部門16作品の計228作品の応募があった。そのうち 各部門から最優秀賞,優秀賞を1作品ずつ計10作品,テーマ賞11作品,プラチナスポンサー賞5作品,ゴールドスポンサー賞2作品,パートナー賞5作品が受賞作品として表彰された。受賞作品の中には複数の賞を受賞しているものもある。受賞作品の一覧を表1から表3に示す。
賞名 | 作品名 | 受賞者 |
---|---|---|
アイディア部門最優秀賞 | 可視化法学 | 芝尾幸一郎 |
アイディア部門優秀賞 | 郷土かるたで地域おこし・教材作成 | 高橋菜奈子 |
データセット部門最優秀賞 | GSJ LD | 内藤一樹 |
データセット部門優秀賞 | 農作業基本オントロジーに基づく農作業名称のデータ | 朱成敏,武田英明,法隆大輔,竹崎あかね |
アプリケーション部門最優秀賞 | Sakepedia:日本酒を飲んで,オープンデータをつくろう | 飯島照之,板垣真太郎 |
アプリケーション部門優秀賞 | 観光語彙基盤を用いた新宮町LODの作成と意味検索システムの開発 | 槇俊孝,髙橋和生,松前洋祐,坂井大輝,山下拓弥,橋本雅史,浦田清寛,永家鉄也,山口明宏,若原俊彦 |
ビジュアライゼーション部門最優秀賞 | bibliomaps ビブリオマップ神戸版 | 杉本達應 |
ビジュアライゼーション部門優秀賞 | マイっぷ | 服部洋明,兼松篤子,遠藤守 |
基盤技術部門最優秀賞 | Tweet2LinkData | 小池隆 |
基盤技術部門優秀賞 | Simple LODI | 上田洋 |
賞名 | 作品名 | 受賞者 |
---|---|---|
データサイエンス賞 | 世界最高精度のオリジナル犯罪予測アルゴリズムを用いた先端防犯プラットフォーム | 梶田真実,梶田晴司 |
IoT賞 | 加速度センサーを用いた地震計測ネットワーク 震度計測センサーユニット 加速度センサーユニットで観測された地震情報 加速度センサーで観測された地震波形のビジュアライズ |
横浜市立大学 金研究室 |
公共LOD賞 | With Kids | Team Ikeda-A |
公共アプリケーション賞 | 地域密着型 子供向け本お薦めアプリ「なによも?」 | 子ども応援隊 by CODE for IKOMA |
教育LOD賞 | 教科書LOD | 江草由佳,高久雅生 |
エンターテインメントLOD賞 | 声優LOD | 関井祐介,江上周作,飯島照之 |
LODプロモーション賞 | オープンデータのうた | ししょまろはん |
アクセシビリティ賞 | 三島コロッケ電話 | Code for Numazu |
学生奨励賞 | CSV-X: A Linked Data Enabled Schema Language, Model, and Processing Engine for Non-Uniform CSV | Wirawit Chaochaisit |
学生奨励賞 | 通勤・通学情報を可視化することによる混雑緩和策の検討 | tantan |
学生奨励賞 | NISHIMARO DIARY | 本間知生 |
賞名 | 作品名 | 受賞者 |
---|---|---|
朝日新聞社賞(株式会社朝日新聞社) | My 防災ノート | 佐野大河,木村汐里 |
NTTレゾナント賞(NTTレゾナント株式会社) | インバウンド対応観光アプリAfter Fiver(汎用版) | AfterFiver開発Team |
科学技術振興機構賞(国立研究開発法人科学技術振興機構) | JST-LODCクエリソン成果 | 「JSTリンクト・データ(大規模文献情報・シソーラス)を使い倒そう!」参加者一同 |
Inspire the LOD賞(株式会社日立製作所および株式会社日立コンサルティング) | エリアベンチマーキング:統計LODで似ている町を探してみよう | オオイシナオヤ |
LOD for 地方創生賞(富士通株式会社) | 観光語彙基盤を用いた新宮町LODの作成と意味検索システムの開発 | 槇俊孝,髙橋和生,松前洋祐,坂井大輝,山下拓弥,橋本雅史,浦田清寛,永家鉄也,山口明宏,若原俊彦 |
オントロジー賞(オントロノミー合同会社) | 農作業基本オントロジーに基づく農作業名称のデータ | 朱成敏,武田英明,法隆大輔,竹崎あかね |
Yahoo! JAPAN賞(ヤフー株式会社) | 震度計測センサーユニット | 横浜市立大学 金研究室 |
5つ星オープンデータ賞(株式会社jig.jp) | DisasterAvoidance | crssnky |
ししょまろはん賞(ししょまろはんラボ) | キロク乃キオク | ハウモリ |
Statistics Japan賞(総務省統計局,独立行政法人統計センター) | 政府統計API利活用支援システム「API Search Engine」&「StatApiMagic.js」 | 林正洋 |
DBpedia賞(DBpedia Japanese) | PROLOQL Extension | NBKN |
LinkData.org賞(一般社団法人リンクデータ) | 教えてN子さん | 秋山梓 |
2016年度の受賞作品で特に注目を集めた作品をいくつか紹介する。
アプリケーション部門最優秀賞の「Sakepedia」は日本酒検索のアプリケーションであり,Wikipediaのようにアプリの使用者がデータを登録する機能を備えている。さらに使用したデータの「日本酒&酒蔵のデータ」は2015年度に同作者が応募したLinked Dataであり,この作品の応募をきっかけに開発協力者が現れてアプリの開発に至っている。これは,作品により人と人がつながり,LODチャレンジのコンセプトである「Open=つながる」を体現した例といえる。今後も応募作品を通じた新たなコミュニティー形成が期待される。
データセット部門最優秀賞の「GSJ LD」は,産業技術総合研究所地質調査総合センターが整備する地質情報のLinked Dataである。地質というこれまでになかった分野のデータを,参照解決可能なLinked Dataとして公開したことは高く評価されている。科学研究分野という観点から,今後J-GLOBAL knowledge注8)との連携も期待できる。
基盤技術部門優秀賞の「Simple LODI」はRDFデータとPHPサーバーを用意するだけで,DBpediaのようなLOD提供サイトの構築が可能になるツールである。これは,データをLODとして公開する際の基本原則の1つである,「すべてのURIにアクセスできるようにする」という参照解決の技術的課題をクリアするうえで有用なツールである。
このようなLOD公開に際して参入障壁を下げる作品は2011年度アプリケーション部門最優秀賞の「LinkData」注9)や2012年度アプリケーション部門最優秀賞の「SparqlEPCU」注10)などがあり,どちらもその後の応募作品に多く使われている。「Simple LODI」も同様にLODの増加に寄与する可能性が考えられる。
2016年度は昨今の情勢を考慮して,新たなテーマ賞としてIoT賞,データサイエンス賞,AI賞をあらかじめ設定した。結果としてAI賞については該当なしとなったが,データサイエンス賞,IoT賞には各賞の特徴を表す作品が受賞している。IoT賞に関しては大学の研究室単位で複数応募した作品群が受賞している。2016年度は他にも同一研究室から複数の作品を応募するケースがみられ,学生からの応募が増えたことが一つの傾向である。割合としては2015年度の応募では全体のうち学生からの応募は29%であったが,2016年度では全体の39%に増加した。
応募作品の分野別の割合を図2に示す。2015年度と比較して生活,観光,ツールの上位3つの順に変わりはなかった。一方で,農林水産業と科学が割合を大きく伸ばしている。農林水産業の割合が増加した要因としては関連データセットの増加,IoT賞の創設,「農業生産物の選択の幅を広げるノーバ(エピソード2)」注11)が2015年度にLOD推進賞を受賞したことによる農業コミュニティーの活性化などが考えられる。科学の割合が増加した主な要因はJSTとLODチャレンジの連携イベントである。
LODチャレンジの初回開催の2011年当時は,国内におけるオープンデータの認知度が低く,オープンデータの普及推進活動がLODチャレンジの役割の1つとして大きいものであった。その結果として現在までに行政・自治体,民間企業,アカデミア,個人から多くのオープンデータやその活用作品が応募された。2016年度までの応募作品総数は1,387作品まで達し,そのほとんどがLODを含むオープンデータに関する作品である。さらに,オープンデータに関するコンテストとして,前述した「アーバンデータチャレンジ」「チャレンジ!!オープンガバナンス」が立ち上がり,国内におけるオープンデータの定着が感じられる。
今後のLODチャレンジの方針としては,他のコンテストと比較して独自の特徴である“Linked”(データ同士がリンクしている点)を強く意識し,“Linked” Open Dataやその活用作品の応募を増加させる取り組みを行っていきたい。そのため,LODに関する技術情報の発信や勉強会イベントの主催・共催・後援を2016年度に増して行うことを検討している。また,これまではRDFやクエリ言語のSPARQL Protocol and RDF Query Language(SPARQL)などのLOD基礎技術の説明や,プログラミングを必要としない既存ツールの使い方等に重点を置いた入門者向けのイベントを行うことが多かった。これからはプログラミングも使用しながら,“Linked”故にもつ拡張性,柔軟性,統一性等を活用して新たな価値を生む作品を増やすイベント企画にも力を入れていきたい。LOD独自のメリットを活用した作品例が増えて認知されることで,各所で公開されるデータがPDF,Word,ExcelからLODに変化していき,さらにLODを活用して新たな価値を生む作品の応募が増える。このようなLOD構築と活用を循環させ,社会的価値を創出するエコシステムの形成に寄与するような作品は,積極的に表彰していきたいと考えている。
LODチャレンジ2016では,JSTはプラチナスポンサーおよび,データ提供パートナーとして協賛した。本章ではJSTが公開しているデータや2016年12月19日に行われた共催イベントについて,スポンサーとしての共催の立場から述べる。
3.1 JSTの公開データとLODチャレンジへのデータ提供JSTでは,これまで長年にわたって文献(学術論文等),研究者情報,科学技術用語,化学物質など研究開発において重要となるさまざまな科学技術情報(JSTデータ)について整備,そしてこれらを流通する基盤を構築してきた。近年では,第4期科学技術基本計画4)における「知識インフラ」構想を受けて,単なる基盤整備だけでなく,他機関のサービスとの連携やデータの二次利用等,オープンイノベーション・オープンサイエンスといった将来の潮流を見据えた取り組みにも力を入れている。
たとえば,J-GLOBAL注12)はJSTデータを一元的に検索できるサービスだが,一部情報について検索が可能なWebAPIを独自のライセンス(商用利用を禁止するなど)で公開しており,独立行政法人工業所有権情報・研修館のJ-PlatPat注13)や国立国会図書館の国立国会図書館サーチ注14)等では,J-GLOBALの情報をサービスの向上に活用している。また,機械判別・データ共有が容易なRDF形式でのデータ整備についても取り組みを進めてきた5)。公開サービスとしては,J-GLOBAL knowledgeを2015年5月にリリースし,化学物質のデータをクリエイティブ・コモンズ・ライセンスCC BYのライセンスで公開した。さらに,JSTデータを用いたデータ分析を競うコンテストである「データサイエンス・アドベンチャー杯」(第1回はSAS Institute Japan株式会社との共催)を2013,2014年度に開催し,民間企業や研究者,学生などから応募作品が寄せられた。このように,JSTが保有する情報について,データマッシュアップ等も含めて活用方法を外部から募る活動を行ってきている。
LODチャレンジへのデータ提供は,2015年度からJ-GLOBAL knowledgeの立ち上げによりデータ提供パートナーとして協賛しており,JSTの化学物質データを用いた作品「関西のおばちゃん(Babazon)」が,2015年度審査員特別賞チャレンジデー賞を受賞している。2016年度は,すでに公開している化学物質に加えて,文献(発行年2006~2015年,国内誌のみ),科学技術用語,資料の情報についてもLODチャレンジ応募作品への利用を目的にJ-GLOBAL knowledgeのSPARQLエンドポイント注15)の利用を許諾する独自ライセンスで公開した。中でも膨大な量をもつ文献データは公開範囲を過去10年の国内誌に限定しながらも,約680万レコード(書誌),約90億トリプル注16)という非常に大きなデータセットとなっている。
3.2 共催イベントの開催JSTデータは,学術論文など専門的な内容のものであり,主な利用者である文献調査等の業務を行っている方のほとんどはLinked Dataに関する知識がないと考えられた。そこで,利用促進のためのイベント「JSTリンクト・データ(大規模文献情報・シソーラス)を使い倒そう!」(2016年12月19日 昼の部13:30~,夜の部18:00~)を,JST東京本部(東京都千代田区)でLODチャレンジ実行委員会と共同で開催することとなった。参加者自身が,その場でJ-GLOBAL knowledgeで使えるクエリ(検索式)を作るクエリソンを中心としたイベントであり,データの中身とSPARQL等の双方の知識をインプットすることが目的である。JSTデータについてハンズオンで学ぶようなイベントは過去に例がなく,JSTとしても新しい試みであった。
イベントのプログラムは,知識をインプットする講演とクエリソンの2部構成とした。講演の前半は,JSTのデータの概要や,文献と科学技術用語,文献と化学物質など異種の情報がどのようにリンクしているか,J-GLOBAL knowledgeのサイト利用方法等を説明。後半では,SPARQL入門と題して,Linked Dataの基本的な考え方(RDBとの違い)や,DBpedia Japaneseのデータセットを用いた実例を交えてSPARQLの文法などをLODチャレンジ実行委員から紹介した。クエリソンでは,参加者それぞれの興味に応じていくつかのグループに分かれて実施。自然言語処理や知識ベースとしての利用を検討するグループなど非常に高度なグループから,ほぼ初心者で構成されたものまでレベルも興味も幅広い組み合わせとなった。このクエリソンで生まれたクエリの一例を図3に示す。各人が作成したクエリは最後にクエリ集としてまとめられ,参加者全員の作品としてLODチャレンジへ応募された(図4)。
プログラム構成は,参加者のSPARQLに関する知識レベルに応じて有効に時間が使えるよう配慮して,JSTデータの説明を冒頭に配置し,習熟者は直後からJ-GLOBAL knowledgeで検索が始められる構成とした。また,JSTデータ活用のヒントとなるよう,クエリのサンプルだけでなく,Webブラウザ上で動作する簡単なプログラムや,応募作品のサンプルも用意し,LODチャレンジへの参加を促すよう工夫も行った。
当日は,昼の部・夜の部合わせて,延べ47人の参加があった。Linked Dataの知識レベルは幅広く,SPARQLという言葉さえ聞いたことがない方から当該分野の専門家まで参加があった。初心者の参加者からは,「ついていくのが大変だった」という声もあり,おのおののレベルに合わせたフォローの難しさを痛感している。また,細かく参加者をみていくと,大学・民間企業の研究者(開発者),URA等研究支援職,学生(大学・高校)など,多様な所属から参加があり,多様な観点からJSTデータについて興味をもってもらったことがうかがえる。
今回のイベントでは,JSTとして初の試みにもかかわらず,大きなトラブルなく終了し無事に目的を達成することができた。企画段階から当日の運営まで協力いただいたLODチャレンジ実行委員会には大きく助けられた。プログラムの構成やサンプル作成に対するアドバイス,当日のクエリソンの取りまとめなど,これまで多くのイベントを運営してきた実行委員会がもつノウハウには学ぶべきところが非常に多く,今後の取り組みの参考になったと感じている。
現在,J-GLOBAL knowledgeでのデータ公開は限定的だが,JST内部では研究資金配分機関として興味のある,研究開発における萌芽(ほうが)領域の抽出や研究者の探索等6)で試行的な取り組みが行われている。こうした視点では,統計LOD注17)等のデータが今後拡充することで,マッシュアップによって面白い分析が可能になるかもしれない。しかし,LODチャレンジのようなコンテストでは,データ提供者では思いつかない,参加者自身のニーズから作品が生まれるところに面白さがあると感じている。今回のデータ提供では,JSTデータを利用した作品は5作品と多くはない結果となったが,アイディア部門に応募された「高校生研究を手助けするためのサイト」注18)などはそのよい例だろう。
加えて,コミュニティーとしてのLODチャレンジにもデータ提供者として大きな期待がある。コンテストはデータ利用者のニーズなどを拾う絶好の機会なのはもちろんだが,同時に他のデータ提供者と実例を交えて情報交換できる場でもある。特にLinked Dataでのデータ公開はオープンデータの本命であるが,利用者側に求められる知識があまり普及していないため,利用者拡大が進まないことがデータ提供者の共通の悩みであったりする。データの整備・継続性,公開方法,広報,ライセンス等データ公開に際して考慮すべきことは多い。うまくいった先行事例など有益な情報が蓄積されていってほしいと考えている。
今後も,JSTデータの有効活用について,外部の知見を生かす方法も含めさまざまな可能性を探っていきたい。
本稿ではLODチャレンジのこれまでの歩みとJSTとの共催イベント,さらに実行委員会とスポンサーの視点から今後の展望について述べた。LODチャレンジは新たな施策を実行しながら開催を重ね,オープンデータをきっかけとしたコミュニティー形成の場を提供してきた。結果としてオープンデータとその活用事例や新たなコミュニティーが増加し,コンテスト形式はオープンデータの普及推進活動として有効であったといえるだろう。また,さまざまな背景をもつ参加者が注目するこの場にデータや基盤を提供し,それらのリソースを活用するイベントを開催することで,データ提供者が想定していなかった新たな価値の創出につながることが確認できた。一方でオープンデータにとどまらずLODの公開とその活用例の増加につなげることが課題である。
今後はLOD関連作品の増加と新たな価値の創出に向けて,新たな施策を打ち出しながらコンテスト型普及推進活動を継続していきたい。
2016年電気通信大学大学院 情報システム学研究科博士前期課程修了。同年より同大学院 情報理工学研究科博士後期課程に在籍。セマンティックWebを専門に研究。LODチャレンジ実行委員。情報処理学会,人工知能学会各学生会員。
科学技術振興機構 情報企画部 情報分析室 主査。主としてJ-GLOBAL knowledge等の情報基盤の構築と調査・分析業務に従事。