主催: 一般社団法人 人工知能学会
会議名: 2025年度人工知能学会全国大会(第39回)
回次: 39
開催地: 大阪国際会議場+オンライン
開催日: 2025/05/27 - 2025/05/30
データ統合において,スキーママッチングなどのタスクは不可欠である一方で,そのコストは高く,さまざまな自動化手法が求められている.本研究では,コンテキスト情報を利用した埋め込み手法を提案し,実用・業務的データセットにおけるマッチング性能の向上を図る.本手法は,EmbDIをベースとし,Sentence-BERT によってコンテキスト情報であるカラムの説明文を活用することで,カラムの類似度に基づいたエッジを生成し,四部グラフを構築する.9つの異なるデータセットを用いた実験の結果,本手法は特に数値データをはじめとした固有表現の多いデータセットにおいて,EmbDI を上回る性能を示した.これらの結果から,コンテキスト情報を考慮した埋め込み学習が高精度なスキーママッチングに有効であり,より正確なデータ統合の実現に寄与することが示唆される.本研究により,実世界のデータ統合環境においては,コンテキストに関するメタデータを考慮することの重要性が示された.