主催: 一般社団法人 人工知能学会
会議名: 2021年度人工知能学会全国大会(第35回)
回次: 35
開催地: オンライン
開催日: 2021/06/08 - 2021/06/11
トランザクションデータベースに頻出するパターンを効率的に列挙するアルゴリズムとしてFP-growth法があり、データベースから有用なパターンを得ることができる。しかし巨大なデータセットに対する実行時間は依然問題である。そこで本研究では、メニーコアマシン上での共有メモリ型システムにおけるFP-growth法の並列処理によって高速化を行う。並列化はタスク並列のアプローチを取り、各タスクはFP-Treeから条件付きトランザクション集合を取得し、条件付きFP-Treeを構築後、次の分岐に対するタスクを生成する。タスクの並列処理ではWork-Stealingによる動的負荷分散を行ってスレッド間のロードバランスを向上させる。その際、条件付きFP-Treeに基づくタスク量推定を行ってスケジューリングコストを軽減する。また、計算資源を効率的に使用するために、ガーベジコレクションを持たないコンパイル型言語であるRustを用いて実装する。実験の結果、多くのベンチマークデータにおいてJava実装と比べたときのメモリ消費の軽減と、既存手法を上回る速度向上が得られることを確認した。