本論文では,Linked Open Data (LOD) のためのSPARQLクエリ共有システム を提案する.LODは様々な応用が期待されるが,膨大かつ多様なデータセット であるため,適切なクエリを作成するのは容易ではない.提案システムは, SPARQLクエリを共有し検索・推薦可能にすることで,一部の熟練ユーザが作成 したSPARQLクエリの多くのユーザが利活用できるようにする.
データの概要記述を用いた、データ活用シナリオを創造するワークショップ技 法により、公開非公開を問わず有用なデータが共有・取引されるデータ市場の 創出を目指す。本稿では、非公開データの概要記述を介してデータをRDFで結 び付ける仕組みを提案する。
データジャケットを用いたイノベーションゲーム(IMDJ)は、最低限のメタデー タ情報のみを公開してデータ間の関係を可視化し、これを元にデータの組み合 わせ・分析案を提案し、評価し合うゲーム形式のワークショップである。その 中で得られた提案と要求を背景にデータ分析・可視化を行う手法が生まれたプ ロセスについて、可視化手法Tangled Stringを例にとって論じる。
生命科学データベース横断検索では、主に日本国内の生命科学系分野の公開デー タベースを網羅的に収集している。データベースを対象としたクローリングで は、Googleでもヒットしないディープウェブの範囲を発見するための工夫や、 利用者に意味のあるデータの選定、運用側の法的判断が必要となる。本プロジェ クトで考案されたワークフローと実施結果について紹介する。
ライフサイエンス統合データベースセンター(DBCLS)ではこれまでにライフサ イエンス辞書(LSD)をRDF化すると共にDBpediaへのリンクを日英それぞれ構築 し、リンクトデータを構築してきた。一方でDBCLSでは、NatureやScience 、 Cellなどの生命科学分野においてトップジャーナルといわれる学術誌に掲載さ れた、日本人が著者である論文を対象として、著者本人による日本語のレビュー 記事を掲載する新着論文レビューを発行している。今般、当該レビュー記事の 文章構造を既存語彙を用いてRDF化するとともに、記事中に書かれているLSD 見出し語を機械的に抽出してリンクトデータを構築した。本データの利用例と してMeSHツリー構造に基づく特定の語彙が多く使われる記事を検索するシス テムを紹介する。