ラフ集合非決定情報解析RNIA(Rough Set Non-deterministic Information Analysis)はカテゴリカルな表データを解析するための数学的枠組みであり,ラフ集合理論に情報の不完全性・非決定性を追加した枠組みと考えられる.RNIAでは,通常の表DIS(Deterministic Information System)からルールを生成するDIS-アプリオリ法,欠損値(または非決定情報)を含む表NIS(Non-deterministic Information System)から確実ルール・可能性ルールを生成するNIS-アプリオリ法が提案・実現されている.今回,RNIAの体系を利用しNISにおける欠損値補完と機械学習機能の実現を目指す.欠損値が多く含まれる表データでは,通常,ルール生成は難しいと考えられるが,NIS-アプリオリ法では閾値を調整しながら確実ルールを生成でき,属性間の依存関係を把握できる.この性質を利用し,欠損値が存在する属性を決定属性とする確実ルールを生成し,取得した確実ルールによって欠損値を補完する手法,SRI法(Self-obtained Rule-based Imputation procedure)を提案する.この手法は教師無し学習であり,背景知識や追加情報は要らない.また,欠損値を含む属性ごとにSRI法を適用すれば,NISから逐次的にDISを学習する機能を実現できる.この枠組みをルール生成による機械学習MLRG(Machine Learning by Rule Generation)と呼ぶ.実験を通してSRI法の妥当性や特性を示し,機械学習MLRGの可能性を考察する.
抄録全体を表示