論文ID: 2024-005
機関リポジトリは論文のみならず研究データの公開でも期待されている。名古屋大学では共同研究プロジェクトで機関リポジトリと連携してデータの可視化や検索性向上を図っている。九州大学でもこのプロジェクトに参加して,機関間並びに研究者と図書館職員の協力の下,これまで技術的,業務量的に対応困難だった研究データ公開に向けて,GakuNin RDMとChatGPTを活用してメタデータの登録作業を実施した。
九州大学国際宇宙惑星環境研究センター(i-SPES: International Research Center for Space and Planetary Environmental Science)では,2024年2月に地磁気観測データのメタデータを九州大学の機関リポジトリ注1)で公開した。機関リポジトリにおける研究データのメタデータ登録を効率化する取組みとして,GakuNin RDM注2)を使ったメタデータスキーマ変換及びChatGPTを使ったファイルフォーマット変換の2つを紹介する。
IUGONET(Inter-university Upper atmosphere Global Observation NETwork) 注3)では,国内の研究所や大学が協力し,大気の風速や温度,地磁気や太陽活動指数等,各機関が世界中で収集する1,200件以上の観測データを検索・解析できる。名古屋大学ではこれらのデータを他分野の研究者やシチズンサイエンスでも活用できるよう図書館職員も参加する共同研究プロジェクトを開始し,まずは名古屋大学が提供する観測データ284件を自らの機関リポジトリで検索可能とした1)。次に,i-SPESが提供する観測データ180件を対象に,同じ取組みを九州大学でも再現できるか検証した。
2.2 GakuNin RDMを使ったメタデータスキーマ変換登録対象のメタデータが宇宙科学分野のSPASE(Space Physics Data Search and Extract)メタデータモデルに従って記述されており,名古屋大学で開発されたPythonコードを実行して機関リポジトリで用いられる汎用的なJPCOARスキーマに変換する必要があった。その際,業務上利用実績のあったGakuNin RDMのデータ解析機能を実行環境とした2)。クラウド上に仮想環境を構築できるため手軽に安心してPythonコードを実行でき,その実行過程をプロジェクトのメンバー間で共有することもできた。
2.3 ChatGPTを使ったファイルフォーマット変換登録対象のメタデータが180件のXMLファイルに記述されており,これをシステムがサポートするCSV又はExcelの一括登録用フォーマットに変換する必要があった。名古屋大学とはシステムが別でフォーマットも異なり同じ変換手段が使えないため,ChatGPTを活用して複数のXMLファイルからタイトルや作成者名,作成日,識別子,緯度・経度等,データを項目別に抽出するPowerShellスクリプトを作成した。また,抽出したデータをExcelに手作業でコピーすることで一括登録用ファイルを作成した。
2.4 機関リポジトリへのメタデータの登録i-SPESが提供する地磁気観測データのメタデータ180件を上記の手順で機関リポジトリに登録した(図1)。同じ手順で更新作業もできた。
次の課題は機関リポジトリで用いられるOAI-PMHによるメタデータの外部流通である。CiNii Research注4)で検索可能になるほか,DataCite DOIを付与すればData Citation Indexへの収録も可能となる3)。
また,プロジェクトでは名古屋大学でのパイロット的な取組みを九州大学で踏襲でき,他のIUGONET参加機関への展開にも期待がかかる。IUGONETと機関リポジトリではメタデータが各々標準化されたスキーマに準拠しているため,工夫すれば連携可能とわかった。世の中には様々なメタデータスキーマが存在しており注5),他の研究分野でも同様の取組みが待たれる。
GakuNin RDMやChatGPTにより,専門的なスキルをもたない図書館職員でも技術的なハードルをある程度乗り越えられるようになってきた。また,今回のプロジェクトで所属機関や研究者と職員の立場の違いがあってもメタデータスキーマ等の標準化された枠組みを通して共通の課題をもち,解決方法を共有できるとわかった。今後も業務DXや他機関,教員との協働を進め,機関リポジトリのサービスを発展させ,データ利活用の期待に応えていきたい。