2023 年 33 巻 2 号 p. 174-179
近年,行政機関等の組織が所有する様々なデータをLODとして公開し,利活用することが盛んになってきている.LOD化の際には,リンク元とリンク先のデータセットのデータを逐一確認し,リンク元データの一つ一つに適切なリンク付けを行う必要がある.その際,リンク先候補を人手で探すのはコストが高い.そこで,本研究ではLODを記述するRDFの主語にリンクしている文字列の類似度を編集距離に基づいて求め,その類似度を主語の類似度として推薦するリンク先データ候補を選出する.また,総当たりでの処理は処理コストが高いため,特徴ベクトル法を用いた索引付けを適用することを提案し,その実験結果について報告する.