デジタルアーカイブ学会誌
Online ISSN : 2432-9770
Print ISSN : 2432-9762
フルペーパー 研究論文
デジタルアーカイブにおける複数メタデータセット間の関連付けの自動化に関する検討:「大江健三郎文庫自筆原稿デジタルアーカイブ」を事例として
阿達 藍留大向 一輝
著者情報
ジャーナル オープンアクセス

2025 年 9 巻 3 号 p. e25-e31

詳細
抄録

本研究は、デジタルアーカイブ構築におけるメタデータ作成の効率化を目的として、「大江健三郎文庫自筆原稿デジタルアーカイブ」の実際のデータを対象に、複数の手法でデータセット間の関連付けの工程を再現し専門家による作業結果との一致率を評価した。書誌情報の完全一致、文字列の類似度の比較、大規模言語モデル(LLM)を用いた手法を比較検証した結果、刊行日の完全一致による手法が比較的高い正答率と短い処理時間を示した。一方、LLMを用いた手法は最も正答率が高い反面、処理時間が極めて長いという課題があった。これらの知見を基に、複数手法を組み合わせることで、正答率と処理時間のバランスが改善されることを実証した。

著者関連情報

この記事はクリエイティブ・コモンズ [表示 4.0 国際]ライセンスの下に提供されています。
https://creativecommons.org/licenses/by/4.0/deed.ja
前の記事
feedback
Top