AI技術が社会に対して多大な影響を与えつつある中で、デジタルアーカイブとの関連についても多角的に検討を行う必要が生じている。本稿では、特集「デジタルアーカイブとAI」の総論として、基本的なAIの仕組みを解説するとともに、近年の本学会の研究発表や関連分野における動向を概括し、各論の位置づけを示す。また今後の課題について議論する。
組織や分野を横断してのデータの検索や二次利用の促進において統一的なメタデータの整備は重要である。しかし、その配信基盤であるデータカタログにおいては、分散運用が主流となる一方、連携の要となるメタデータの品質が低く、担い手であるデータキュレーターも不足している。ここで、整備率が高い説明文・タイトルといった基本属性から横断検索に必要なメタデータを自動生成することができれば、これらの課題の解決につながる。この報告では筆者らが2023年に発表した生成AIを応用したメタデータ生成に関する2つの研究を紹介し、LLMを利用した基本的な情報抽出およびLLMと知識グラフを併用したメタデータ補完について、その可能性と課題を明らかにする。
デジタルアーカイブに搭載された資料画像から、テキストデータや図版といった情報を自動抽出し、利用者に提供することは、AI技術(機械学習技術)の高度化に伴って、全文検索対応やアクセシビリティ改善の観点で近年注目を集めているアプローチである。国立国会図書館はNDLラボという実証実験の場を有している。これまで機械学習技術を応用した情報抽出手法の実験的な機能の実装と公開を行い、開発の過程で得られた知見や利用者の反応を国立国会図書館デジタルコレクション等の要件検討に反映してきた。本稿では情報抽出技術の解説にくわえ、NDLラボで実際に各技術を組み込んだ実験サービス等を運用して得られた知見を紹介する。
画像AI技術の急速な進展により、デジタルアーカイブの画像資料の活用可能性が広がりつつある。代表的な画像AI技術である畳み込みニューラルネットワーク(CNN)とVision Transformer (ViT)が、画像認識や特徴抽出にどのように利用できるのかを解説し、類似画像の分類を例として示す。応用事例として、画像アーカイブ探索支援Webアプリケーションについて詳述する。このアプリケーションでは、画像の類似性に基づく画像配置と自然言語AI技術を用いたメタデータの類似性に基づく画像配置を併用することにより、視覚的およびテーマ的に関連する資料を効果的に探索できる。
本稿では、コプト語の機械翻訳システムの性能比較と、言語復興におけるその役割について考察する。まず、代表的な機械翻訳システムであるCoptic Translator、Claude 3 Opus、GPT-4oの性能を評価し、Claude 3 OpusとCoptic Translatorが高い翻訳品質を達成していることを明らかにする。次に、コプト語復興の歴史を振り返り、個人の情熱と学術・宗教コミュニティの支援が運動を支えてきたことを指摘する。その上で、機械翻訳がコプト語の学習リソース拡充やデジタルアーカイブ化、コプト語版Wikipedia等を通じた情報発信に寄与する可能性を論じる。ただし、技術の負の側面への倫理的配慮や、人間の営みを代替するものではないことにも留意が必要である。コプト語の真の復興のためには、話者自身が言語の価値と可能性を体現していくことが何より肝要であり、機械翻訳はそのための補助的ツールと位置づけるべきだと結論づける。
デジタルアーカイブ機関が生成AIにデータを学習させたり、生成AIを利用してデータやコンテンツ等を出力する際には、著作権等の法律問題が生じ得る。本稿では、デジタルアーカイブ機関で想定される設例をもとに、生成AIと著作権に関する主な法的論点を解説する。
「デジタルアーカイブ憲章」で定義されているデジタルアーカイブは、人々の情報資産をデジタル媒体で保存、共有、活用する仕組みを指す。そこで、本稿では、情報資産を適切に扱うことが出来る、デジタルアーカイブに相応しいプラットフォームについて考察する。参考例として、世界で初めてオンラインによる写真のライセンスを始めたプラットフォームの先駆者であるGetty Imagesと、誰でも編集に参加出来るフリーの多言語インターネット百科事典であるウィキペディアを取り上げることで、デジタルアーカイブのプラットフォームのイメージを具体化する。
記事:齋藤 歩. アーカイブズの発見とそのさき. デジタルアーカイブ学会誌. 2024, 8(2), p.92 https://doi.org/10.24506/jsda.8.2_92
以下の通り訂正します。
p.94
誤 残リク箱
正 残り7箱
東北地方太平洋沖地震の震災関連資料(以下、資料)を対象とした図書館アーカイブは、アナログ媒体が中心で、OPACによって管理されているため利活用に課題がある。そこで著者らは、震災学習の成果を記録するとともに検索性向上に繋げる資料循環型モデルを導出するとともに、その要素技術について検討してきた。本研究では、資料循環型モデルに基づくデジタルアーカイビングシステムの有用性について評価する。開発されたシステムを用いた震災学習プログラムの実践を通して、資料のレビュー結果や新規に作成されたデジタル資料がシステムにアーカイブされ、資料の利用活性化と検索性向上に貢献可能であることが示された。このことから、構築されたシステムの一定の有用性が確認された。
近年、デジタルアーカイブの技術の進歩により、バーチャル博物館の作成、および公開が広まっている。本研究ではバーチャル博物館の作成手法の違いが与える利用者への印象の違いを定量的に調査した。全天球画像とMatterportによって荏原製作所の所有する製品展示室のバーチャル博物館を作成し、体験したユーザーにシステムの操作性、および心理的要因の2要素からなるアンケ-ト調査を実施した。その結果、システムの操作性に対する評価は両者ともに優れているとなり、心理的要因に対する評価は全ての項目でMatterportによるバーチャル博物館が優れていた。
すでにアカウントをお持ちの場合 サインインはこちら