2020 年 4 巻 2 号 p. 191-194
本論では、人文学研究目的で収集したデータを機械学習データセットに修正して公開する過程で生じる問題について、美術史学の研究データを機械学習データセットとして再構築した「顔コレデータセット」を事例に解決方法を提案する。「顔コレデータセット」の元となる「顔貌コレクション(顔コレ)」では、美術作品に登場する顔貌をIIIF画像から収集し、メタデータを付与することで、検索性と再利用性のあるデータを提供している。しかしこれを機械学習データセットとして公開することを考えると、複数の機関が公開する画像を収集する点や、宗教的な内容などを含む点にも配慮する必要が生じる。そこでデータ配布、出展表示、利用ガイドラインを中心に検討を加え、原典画像公開者とデータセット利用者の双方に有益な公開方法を考案した。