2025年2月号では,「マシンフレンドリーな情報基盤の整備」と題した特集を企画しました。
「機械可読」は比較的早くから存在する言葉ですが,近年のデータ分析の隆盛や生成AIの普及により意味を変えつつあるように思います。機械によるデータ処理は,人間では気が付くことが難しいパターンや特徴を見出し,新しい研究課題の発見や社会課題の解決につながるなどデータの新たな可能性を開くことができます。データを提供する機関は,人間だけではなく機械にとっても処理・分析がしやすい形式やルールを定め,これに準拠した形でデータを構築・公開することが一層求められていくと言えるでしょう。本特集ではこのようなデータを「マシンフレンドリー」と称し,今後の情報基盤整備を進める上で重視すべき観点として取り上げます。
まず,データ提供・公開機関がどのような点に留意して「マシンフレンドリー」な情報基盤を整備していくべきかに関して,WebAPIとデータセットを事例として取り上げました。林賢紀氏には,図書館分野でのWebAPIの利用の目的や利点をご紹介していただくとともに,設計プロセスや運用時の留意点について具体的に触れていただきました。櫻井美穂子氏には,行政分野におけるデータセット整備についてご執筆いただきました。また,データの利用価値を高める上で障壁となるデータを公開する側,使う側双方の課題にふれつつ,いかにデータに対する意識を変えていくかという見取り図を示していただきました。
データ公開と並行して,ユーザコミュニティへのアプローチも重要です。古川泰人氏には,民間・公共APIの特徴や課題,活用のための取り組みについてご執筆いただき,公共APIを「デジタルの井戸」として改善・提供し続けることの必要性に触れていただきました。谷口紗恵氏には,東京大学社会科学研究所附属社会調査・データアーカイブ研究センターにおける社会調査データの利活用支援のための様々な取り組みについてご執筆いただきました。
「『人と機械が読む時代』を迎えつつある」1)とされた時から数年を経て,新たな読者としてのマシン(機械)の存在は,より身近に意識されるようになったのではないでしょうか。人と機械が協働して新たな成果やサービスを作り出していくための基盤整備を進めるうえで,本特集がその一助となることを願います。
(会誌編集担当委員:村田祐菜(主査),青野正太,尾城友視,水野澄子)
1) 科学技術情報整備審議会.第五期国立国会図書館科学技術情報整備基本計画策定に向けての提言-「人と機械が読む時代」の知識基盤の確立に向けて-.2021,p.9,doi:10.11501/11631622.
図書館分野では所蔵資料の発見可能性を向上させるため総合目録等の構築が行われてきたが,WebAPIの活用によりメタデータの収集や提供が容易に,かつ効率的に行えるようになった。本稿では,Webサービス同士を連携させるためのAPIであるWebAPIについて,図書館分野での利用を例にその目的や利点を紹介した。さらに,標準的に利用されているWebAPIやデータフォーマットの利用による相互運用性の確保や,利用者向けドキュメントの整備と公開による利便性の確保など,WebAPIの整備にあたり設計プロセスや運用時の留意事項を解説した。
今日の日本,特に行政分野においては,データを“資源化”する発想を持つ必要がある。行政が保有するデータはバラバラに管理され,連携が必要な時に連携できず,ましてや機械判読可能な形として公開されていない。データの資源化にはデータ形式・項目の標準化と,データを様々なステークホルダーが活用できる環境整備が必要である。前者は政府のベース・レジストリやGIFとして近年取り組みが始まった。後者はオープンデータとして2012年以降,国が音頭を取って推進しているが,まだ真の意味で自治体の現場に浸透しているとは言い難い。データを扱う現場が,データの生み出す社会的価値を実感できるような取り組みが求められている。
国内外における民間APIと公共APIの特徴とエコシステムを整理し,特に公共APIがデジタル社会に与える影響と持続可能性に向けた課題について考察する。民間APIは企業間の連携を促進し,新たなビジネスモデルやサービスを生み出す一方で,運用維持コストや収益化に関する課題が存在する。また,公共APIは,市民サービスの向上や社会課題解決に向けた重要なツールであり,運用ガイドライン,社会的価値の指標,技術進化へのコストの課題を抱えつつも,社会的役割の重要さは拡大している。デジタル社会基盤における「デジタル公共財」としての役割を果たすため,国家戦略に基づく継続的な公共APIへの取り組みが重要である。
日本における研究データ管理・利活用の取り組みが加速している。本稿ではデータ利活用の事例として,東京大学社会科学研究所附属社会調査・データアーカイブ研究センター(CSRDA)の取り組みを紹介する。CSRDAではSSJデータアーカイブを通じて大学,研究機関,官公庁などから広く社会調査データを預かり,学術利用目的のために提供している。さらに,データの寄託者と利用者に対する表彰事業,データの分析手法にかんする研究会やセミナーの開催,国内外の他機関との連携にも注力している。データ利活用はデータ作成者と利用者の双方にとってメリットが多いが,それを支援する専門家人材の育成・確保も急務である。
近年,研究のオープン化や研究公正強化の視点から,研究データ管理(Research Data Management,RDM)の重要性が高まっている。大学院生は研究者のキャリアとしての初期段階にあたる。彼らが,この時期にRDMの知識を習得し,自身の研究活動に適用できるようになることは,非常に重要である。しかし,大学院生へのRDM教育においては,RDMの重要性や具体的な実践方法を効果的に理解させる手法が模索されているのが現状である。本稿では,大学院生が自身のRDMについて説明できる能力を養うために設計した「RDMヒアリングシート」と,それを活用したRDM啓発の取り組みについて述べる。