主催: 一般社団法人 人工知能学会
会議名: 第34回全国大会(2020)
回次: 34
開催地: Online
開催日: 2020/06/09 - 2020/06/12
実数属性に対する閾値を用いた分岐条件を各ノードにもつ決定森は、同じ属性かつ類似した閾値の条件をまとめて条件共有化を行うことにより単純化できる。我々は、決定森に属する各決定木上の訓練データに対する決定パスを、できるだけ変えずに分岐条件の共有化を行うことにより、精度の劣化を抑えながら単純化を行うアルゴリズムMin_DBNを開発した(PKDD ECML2019で発表)。本稿ではこのMin_DBNを、バギング、ブースティング、ランダムサブスペース法に基づく様々なアンサンブル学習法で構築した分類・回帰を行う決定森に適用した場合の効果について、実験により有効性を検証する。実験の結果、extremely randomized trees, ランダムフォレストなど、ランダム性の高いものほど効果は大きいが、データによってはAdaBoostで作成した決定森に対しても効果があることがわかった。また、バギング系のアンサンブル学習法に対し、学習時に用いられた木毎の訓練データのみをその木に適用する改良法を提案し、有効性が実験により確認された。