情報の科学と技術
Online ISSN : 2189-8278
Print ISSN : 0913-3801
ISSN-L : 0913-3801

この記事には本公開記事があります。本公開記事を参照してください。
引用する場合も本公開記事を引用してください。

研究データメタデータの機関リポジトリ登録におけるGakuNin RDMとChatGPTの活用事例
芦北 卓也阿部 修司堀 優子平野 かおる岡村 菜々子清水 敏之
著者情報
ジャーナル フリー HTML 早期公開

論文ID: 2024-005

この記事には本公開記事があります。
詳細
発表概要

機関リポジトリは論文のみならず研究データの公開でも期待されている。名古屋大学では共同研究プロジェクトで機関リポジトリと連携してデータの可視化や検索性向上を図っている。九州大学でもこのプロジェクトに参加して,機関間並びに研究者と図書館職員の協力の下,これまで技術的,業務量的に対応困難だった研究データ公開に向けて,GakuNin RDMとChatGPTを活用してメタデータの登録作業を実施した。

1. はじめに

九州大学国際宇宙惑星環境研究センター(i-SPES: International Research Center for Space and Planetary Environmental Science)では,2024年2月に地磁気観測データのメタデータを九州大学の機関リポジトリ注1)で公開した。機関リポジトリにおける研究データのメタデータ登録を効率化する取組みとして,GakuNin RDM注2)を使ったメタデータスキーマ変換及びChatGPTを使ったファイルフォーマット変換の2つを紹介する。

2. 機関リポジトリにおける研究データのメタデータ登録

2.1 IUGONETと共同研究プロジェクト

IUGONET(Inter-university Upper atmosphere Global Observation NETwork) 注3)では,国内の研究所や大学が協力し,大気の風速や温度,地磁気や太陽活動指数等,各機関が世界中で収集する1,200件以上の観測データを検索・解析できる。名古屋大学ではこれらのデータを他分野の研究者やシチズンサイエンスでも活用できるよう図書館職員も参加する共同研究プロジェクトを開始し,まずは名古屋大学が提供する観測データ284件を自らの機関リポジトリで検索可能とした1)。次に,i-SPESが提供する観測データ180件を対象に,同じ取組みを九州大学でも再現できるか検証した。

2.2 GakuNin RDMを使ったメタデータスキーマ変換

登録対象のメタデータが宇宙科学分野のSPASE(Space Physics Data Search and Extract)メタデータモデルに従って記述されており,名古屋大学で開発されたPythonコードを実行して機関リポジトリで用いられる汎用的なJPCOARスキーマに変換する必要があった。その際,業務上利用実績のあったGakuNin RDMのデータ解析機能を実行環境とした2)。クラウド上に仮想環境を構築できるため手軽に安心してPythonコードを実行でき,その実行過程をプロジェクトのメンバー間で共有することもできた。

2.3 ChatGPTを使ったファイルフォーマット変換

登録対象のメタデータが180件のXMLファイルに記述されており,これをシステムがサポートするCSV又はExcelの一括登録用フォーマットに変換する必要があった。名古屋大学とはシステムが別でフォーマットも異なり同じ変換手段が使えないため,ChatGPTを活用して複数のXMLファイルからタイトルや作成者名,作成日,識別子,緯度・経度等,データを項目別に抽出するPowerShellスクリプトを作成した。また,抽出したデータをExcelに手作業でコピーすることで一括登録用ファイルを作成した。

2.4 機関リポジトリへのメタデータの登録

i-SPESが提供する地磁気観測データのメタデータ180件を上記の手順で機関リポジトリに登録した(図1)。同じ手順で更新作業もできた。

図1. メタデータ登録例

3. メタデータ流通への期待

次の課題は機関リポジトリで用いられるOAI-PMHによるメタデータの外部流通である。CiNii Research注4)で検索可能になるほか,DataCite DOIを付与すればData Citation Indexへの収録も可能となる3)

また,プロジェクトでは名古屋大学でのパイロット的な取組みを九州大学で踏襲でき,他のIUGONET参加機関への展開にも期待がかかる。IUGONETと機関リポジトリではメタデータが各々標準化されたスキーマに準拠しているため,工夫すれば連携可能とわかった。世の中には様々なメタデータスキーマが存在しており注5),他の研究分野でも同様の取組みが待たれる。

4. おわりに

GakuNin RDMやChatGPTにより,専門的なスキルをもたない図書館職員でも技術的なハードルをある程度乗り越えられるようになってきた。また,今回のプロジェクトで所属機関や研究者と職員の立場の違いがあってもメタデータスキーマ等の標準化された枠組みを通して共通の課題をもち,解決方法を共有できるとわかった。今後も業務DXや他機関,教員との協働を進め,機関リポジトリのサービスを発展させ,データ利活用の期待に応えていきたい。

注1)  九州大学学術情報リポジトリ(QIR) https://www.lib.kyushu-u.ac.jp/papers/ (参照 2024-05-07)

注2)  GakuNin RDM https://support.rdm.nii.ac.jp/ (参照 2024-05-07)

注3)  IUGONET http://www.iugonet.org/index.jsp (参照 2024-05-07)

注4)  CiNii Research https://cir.nii.ac.jp/ (参照 2024-05-07)

注5)  RDA Metadata Standards Catalog (MSC) https://rdamsc.bath.ac.uk/ (参照 2024-05-07). 「RDAメタデータ標準カタログ(日本語訳)」 https://www.janul.jp/ja/projects/sirc (参照 2024-05-07)

参照文献
 
feedback
Top