抄録
Bisector treeは、任意の点の静的な空間インデックスを探索するための計算幾何学に基づくデータ構造である。提案手法では、N次元空間における高速かつ正確な最近傍探索や、空間内に存在する任意の2点間の距離の測定を可能にする。われわれは、Bisector treeのアルゴリズムを実装したオープンソースライブラリを一般に公開している(https://github.com/UnixJunkie/bisec-tree)。本アルゴリズムでは、近傍に存在するいくつかの分子が、同じバケット(分割領域)に分類される。(最大の)バケットサイズは、ユーザー定義のパラメータである。また、分類木を構築する過程で良いバンテージポイント(素性と域値の組み合わせ)を見つけるため、次のクエリを効率的かつ迅速に設定するための2つの学習法を提案している。本発表では、数百万にも及ぶ分子クエリに対する空間インデックスを探索し結果と、提案手法の応用例について報告する。