抄録
機械学習の多くの手法では,インスタンス間の類似度の設計が最も重要となる.特に,SVMによる教師付学習,調和関数法による半教師付学習,種々のクラスタリング手法による教師無し学習などにおいては,カーネル行列(Gram 行列)が中心的な役割を果たす.このカーネル行列において,インスタンス間の距離またはその距離を用いたガウス関数が類似度としてよく用いられている.同じラベルを持つデータは近くに配置され,異なるラベルのデータは遠くに配置されるような線形データ分布の場合,従来の類似度を用いた機械モデルの学習は容易である.しかしデータ分布が非線形の場合,その学習は困難となる.本稿では,非直交基底ベクトルの内積を用いたインスタンス間の類似度(距離)を提案するとともに,その類似度を用いた空間折畳みモデルを提案する.パターン認識問題に適用し,提案した空間折畳みモデルが機械学習に有効であることを確認した.