2014 年 16 巻 2 号 p. 45-58
医療情報システムや院内システムを含めた各種システムの開発において,システムの信頼性や性能等を予測するためには,既存データを知識ベースとして用いて予測器を作るというアプローチがしばしば採られる.しかしながらその予測器の性能は対象の特性に依存するために事前に最適な予測器を見つける事は難しい.ソフトウェアのerror-proneモジュール(errorの存在の可能性の高いファイル)の予測でも同様に種々の手法が提案されているが,一意に最適となる手法はなく,検査対象毎に最適な手法を選択する必要がある.Zhiminは予測精度を,ある閾値でTrue/Falseに分け,適切な訓練データおよびアルゴリズムを選択する手法を提案している.本論文ではZhiminが提唱した手法を応用して,より適切にマイニングを行うためにプロジェクトの特徴量を導入することを提案し,3種類の実験に基づき,その効果を実証した.本提案手法はより一般的に種々の最適予測器の識別に利用できる.