情報知識学会誌
Online ISSN : 1881-7661
Print ISSN : 0917-1436
ISSN-L : 0917-1436
東北大学総合知デジタルアーカイブ(ToUDA):収録資料の特徴とAI活用の展望
片倉 峻平塚越 柚季半澤 智絵柳原 幸子
著者情報
ジャーナル フリー

2025 年 35 巻 2 号 p. 227-232

詳細
抄録

 東北大学は,学内組織の所蔵資料データを一箇所に集約し,横断的かつ網羅的に一括検索ができるようなプラットフォームを目指した「東北大学総合知デジタルアーカイブ( ToUDA)」を, 2024年に公開した.現在の参加組織は附属図書館・史料館であるが,今後は博物館などにも範囲を広げる予定である.組織の多様性ゆえに,収録資料はその膨大な量に加え,言語,書写形態(手書き・活字など),時代などにおいて多様な特徴を持つ.これらの資料の特徴を適切に分類し,また記述内容をテキストデータ化する試みは不可欠であり,そのために AI技術の活用が期待されている.
 本稿では ToUDAの概要および収録資料の現状を紹介するとともに,大量かつ多様な資料の自動分類や OCR(光学文字認識)処理によるテキストデータ化を,どのように実現することが望ましいのか,またそのために必要なアプローチについて議論する.

著者関連情報
© 情報知識学会
前の記事 次の記事
feedback
Top