抄録
近年,半構造データはビッグデータの一つとして扱われ,それらを対象とした知識発見手法の開発が期待されている.本論文では,半構造データの一つである木構造データに対する知識発見問題を扱う.木構造データに対するパターン表現として項木パターンがある.これは超辺置換により共通構造を柔軟に表現するが,超辺の次元次第でパターン照合問題がNP困難になる.一方,山田ら(2011)は,辺縮約に基づく木構造パターン(木縮約パターンと呼ぶ)を導入した.木縮約パターンは頂点を変数とみなすので,項木パターンとは異なる共通構造表現が可能である.本論文では,木縮約パターンが正データから多項式時間推論可能であることを示す.