ほとんどすべての機械学習はA/Bテストである

成田 悠輔; 矢田 紘平

doi:10.11517/pjsai.JSAI2020.0_2I5GS205

抄録

機械学習を利用した意思決定を行う際、過去に使われたことのない新しい意思決定アルゴリズムの性能を予測したい場面が多々ある。私たちは、過去に使われたアルゴリズムの下で蓄積されたデータを用い、新たなアルゴリズムの評価を行う方法を提案する。この方法は次の観察に基づく。機械学習を利用して意思決定を行う場合、そこから生成されるデータには、選択がランダムに行われるA/Bテスト的状況が含まれるという観察だ。例えば、多くの確率的な強化学習・バンディットアルゴリズムは選択をランダムに行うため、ほとんどA/Bテストそのものである。また、教師付き学習で予測された何らかのスコアがある基準値を上回るかどうかで選択を変えるアルゴリズムを考える。この場合、基準値付近では、ほぼ同じ状況であるにもかかわらず異なった選択が行われるため、同じくA/Bテスト的状況とみなせる。私たちはこの観察を一般の機械学習アルゴリズムについて定式化し、アルゴリズムが自然に生成したデータを用いてアルゴリズムを改善する手法を提示する。この手法が使える場面は、ウェブ広告配信から裁判の判決や金融機関の審査、そしてデータ駆動教育・医療まで多岐にわたる。

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）