データから得られたクラス分類ルールは,縦覧のための公開が要求される.その公開されたルールと自機関が所有するデータから抽出されたルールを組み合わせることで,より効果的で有用な分類器を構築できると期待される.しかし,公開されたルールは元データの地域性や特殊性などによりバイアスがかかっている可能性がある.これに十分に配慮した適切な公開ルールの利用法を検討する必要がある.しかし,このようなバイアスを考慮して,自機関が所有するルール集合と公開ルールを組み合わせ,有用な分類器を構築する研究はほとんどない.本論文では,2クラス分類問題を取り上げ,自機関が所有するルールとともに公開ルールも有効に活用する混合モデルアプローチを提案する.すなわち,所有するルールと公開ルールから求められる二つのスコア分布を結合するため,混合モデルの考え方を適用する.スコア分布は,所有するルールと公開ルールのそれぞれにLERSアルゴリズムを適用することにより求められる.LERSアルゴリズムにより,それぞれのクラスに分類したい対象がどの程度帰属するかを示すスコアが求められる.正規化されたスコアからEMアルゴリズムにより最適な混合比率を求め,分類器を構築する.提案法の有用性を評価するために,四つの実データを用いた数値実験を行う.考えられる四つの手法と比較され,提案法の有用性が示される.
抄録全体を表示