2017年9月の特集は「データベースの設計,構築,活用」です。
「データベース」の定義は,著作権法第二条の十の三によれば「論文,数値,図形その他の情報の集合物であつて,それらの情報を電子計算機を用いて検索することができるように体系的に構成したもの」とあります。また,データベースは一定の要件のもと,著作物として保護されることが定められており(同法第十二条の二),データが体系的に集まることで新たな価値を生むことは法的にも自明となっています。
では,望ましい「体系化」とはどのようなものでしょうか。データは検索するためだけではなく,そのデータを利活用する,あるいは長期保存するために整理されますが,その構造は一様ではありません。データのサイズやフォーマット,あるいは社会的な配慮を要するデータの存在など,データベースの構造は形式面,内容面の違いに大きく依存します。そして,近年におけるデータベースに関わる理論面の進展やその実践によって,データベースに求められる機能や得られる価値も変わり始めています。「望ましい」体系化は,今どう移り変わっているのでしょうか。
本特集では,上記のようなデータベースの変容を多角的に見つめ,その潜在的な価値を再考するという特集趣旨のもと,7人の方々から異なる視点の論考をいただきました。
データベースを「設計」する,という視点において,慶應大学文学部の谷口祥一氏からは,データベースを設計するための概念モデル構築について論考をいただきました。また,株式会社教育測定研究所の西原史暁氏からは,利活用を前提としたデータ形式の設計に役立つ「整然データ」の概念につき,詳細な解説をいただきました。
データベースを「構築」する,という視点において,北海少年院庶務課の那須昭宏氏からは,刑事情報連携データベースの構築事例についてご寄稿いただきました。また,国立国会図書館電子情報部の木目沢司氏,情報通信研究機構の村山泰啓氏からは,データの長期保存の事例としての国立国会図書館インターネット資料収集保存事業(WARP)の利用や,電子情報の長期保存の規格であるOAIS参照モデルに関する考察をいただきました。
最後に,データベースを「利用」する,という視点において,OKA情報技術コンサルテーションの岡紀子氏からは,「データベースの検索」を根底においた検索の歴史,技術やノウハウの紹介をいただきました。また,東邦大学習志野メディアセンターの眞喜志まり氏からは,医学・薬学系分野の出版特性を反映したデータベースの検索手法につき,詳細な解説をいただきました。
いずれも,様々なデータを背景に構築されたデータベースのあり方が現された論考であり,「ある単一の検索システムをデータベースと呼ぶ」伝統的な理解を超える幅広さが示されています。
本特集が,広くデータの取り扱いに関心のある全ての方々にとって,「データベース」をより深く理解し,今後のあり方を考える一助となることを期待します。
(会誌編集担当委員:南山泰之(主査),増田智子,長屋俊,水野翔彦)
データベースおよびメタデータの設計プロセスを概観し,その中で特に概念モデル構築(概念設計)の重要性を論じる。簡略な事例を取り上げ,1)実体関連モデルを用いた概念モデル構築の概要を示し,2)その後の論理設計・物理設計に該当する2a)リレーショナルモデルによるデータベーススキーマ設計,および2b)レコードとそのデータ項目からなるメタデータのスキーマ設計について,概念モデルからの変換を含めて解説した。特に,対象とする世界や事象を構成する要素とその関連を明らかにし,それらに対する必要な働きかけとそれによって実現する要求などの検討と定義を含む概念モデル構築の重要性を強調した。
本稿では整然データという概念について紹介し,それがどのように有用かを議論し,その限界についても触れる。整然データとは,①個々の値が1つのセルをなす,②個々の変数が1つの列をなす,③個々の観測が1つの行をなす,④個々の観測ユニットの類型が1つの表をなすという条件を満たす表型のデータである。これは,データ利用者にとって有用な概念であり,特にデータ分析用のプログラミング言語であるRを使う際には重要になってくる。この概念はデータ利用者だけでなく,データ提供者にとっても有用なものであり,データ共有の際にも応用できる。
刑事局(検察庁),矯正局及び保護局では,刑事情報に関するデータベースを各々作成している。再犯防止に関する施策へ対応するため,法務省ではこれらのデータベースで管理されているデータのうち必要なデータを連携させ,有効活用することを検討している。本記事では,このようなデータ連携を行う「刑事情報連携データベース」の構築について報告する。特に,重要と思われる名寄せについて詳述する。
インターネットの普及以降,ウェブサイトで多くのデータベースが公開されているが,内容やURLの変更,サイト閉鎖等により長期的なアクセスが保証されず,とくに調査研究において調査結果の根拠として用いる上で大きな課題となる。本稿では,2002-2014年に運用された国立国会図書館データベース・ナビゲーション・サービス(Dnavi)に収載されていたデータベース情報について,2017年時点でのアクセス可否を調査した結果を報告する。またデータベースの長期保存の方法について,国立国会図書館インターネット資料収集保存事業(WARP)の利用や,電子情報の長期保存の規格であるOAIS参照モデルを参照した考察を行う。
データベースの検索の主人公である情報専門家について,書誌情報データベースの時代を振りかえりながら,基本となる職務を情報検索のプロセスに沿って総括した。現在の情報専門家としての役割は,企業の要となる立ち位置であることを理解し,発揮すべき資質として3C能力について述べ,情報専門家が関係する部署には,エンドユーザ,データベース製作者,自社組織があるが,それぞれに対して果たすべき役割について説明した。最後に情報専門家の将来像について,一つは企業活動の牽引者たる生き方を,他方は企業から飛び出し独立した情報専門家としての生き方を提言した。その場合着目すべき対象は,企業内情報であると考えている。
システマティック・レビューにおいては,網羅的・系統的な文献検索が不可欠な作業として求められる。本稿では,システマティック・レビューの理解に必要となるキーワード,EBMとコクランについて紹介したのち,システマティック・レビュー,特にシステマティック・レビューにおけるデータベースの選択・検索について概説する。システマティック・レビューの文献検索は,データベースごとに特徴と機能,注意点を理解したうえで,検索式を設定することが重要である。また,システマティック・レビューやシステマティック・レビューに利用でき得るリソースの情報収集とアップデートを継続することも必要である。
ISIの創始者であり,情報産業界の巨人であるDr. Garfieldが2017年2月26日,91歳で亡くなった。同業界におけるDr. Garfieldの功績は枚挙にいとまがない。私は,公私ともに約半世紀に亘り彼と親交を深めてきた。今回は,友人としての観点から巷間には知られていないDr. Garfieldのあるがままの人物像,また,数々ある業績・商品群を生み出した背景を,彼のエピソードを通じて綴ってみた。