主催: 一般社団法人 人工知能学会
会議名: 2018年度人工知能学会全国大会(第32回)
回次: 32
開催地: 鹿児島県鹿児島市 城山ホテル鹿児島
開催日: 2018/06/05 - 2018/06/08
この論文では、大規模データからのデータサンプリングの手法について議論している。我々は、低確率事象を強調するために、一般化相対誤差を導入し、その誤差を最小にする最良のサンプリングの重みを導出する。我々の議論は、大偏差理論を基礎としている。最良のサンプリングの重みに対して、一般化相対誤差が大きく減少することを、実際の数値実験で確認した。我々は、またデータサンプリングにWang--Landau法を用いることも提案する。Wang--Landau法は、元データの分布の効率的な推定に有用なだけでなく、統計誤差を抑制する。