抄録
近年、DNAマイクロアレイの実用化に伴いて、機械学習の手法を用いて、DNAマイクロアレイデータからがんの予後を予測する報告が増え、複数の弱分類器を利用したモデルが公表されている。しかし、複合型学習分類器を用いた報告がまだ少ない。本研究は、先ずLasso回帰で重要な特徴を抽出して、その後、乳がん患者の5年生存率予測における複合型アルゴリズムであるスターキング法の有効性を六つ単一分類器(サポートベクトルマシン、ロジスティック回帰、ランダムフォレスト、XGboost、 GBDT、k近傍法、)と比較検証するとともに、5年生存率に影響する因子の探索・分析を行った。評価指標ACC, TPRとAUCによって、スターキング法の性能が単一分類器より良いことを確認できた。