2022 年 39 巻 3 号 p. 3_67-3_81
機械学習を用いたデータ分析のニーズが高まるにつれ,分析者の不足が顕在化している.ビジネスの現場では,多忙なため事前に十分な知識を身につける時間を確保することの困難な実務者が,人材不足のため分析業務に従事しなければならないこともある.我々はこのような実務者のために,PythonのOSSツールMALSSを開発している.先行研究であるMALSSは教師あり機械学習における特徴量エンジニアリングとプロトタイピングのプロセスを自動化することで,知識の不足した分析者でも正しい手順で分析を行うことを可能とする.さらに,分析後にモデルの性能評価結果と正しい分析手順,分析時の注意点を分析レポートとして出力することで,分析の中身をブラックボックスとせず,分析者の知識習得を支援する.しかし,分析後のレポートでは,入力される訓練データやモデルの学習・評価結果に応じた分析中の支援が困難であるという課題がある.そこで本論文では,MALSSを拡張し,入力データやモデルの学習・評価結果に応じた分析支援機能をツール化した.模擬データ分析実験および知識確認テストにより,提案手法は従来手法と同等以上の知識習得支援が可能であり,かつ訓練データやモデルの学習・評価結果に応じた分析支援を可能とすることで従来手法より質の高い分析が可能であることを確認した.