主催: 日本ソフトウェア科学会
文書群同士,単語群同士,または文書群と単語群間の類似性を計算する手法として,連想計算による検索エンジンGETAが実現されている.ここでは,連想計算により文書群と単語群の間から最も類似度の高いn個の要素を得る問題を対象とする.
連想計算の並列分散化は,ある確率以上で正しい結果を返す確率的な連想計算関数についてGETA上で既に行なわれているが,データである文書群と単語群のなす行列を,行か列の一方向にしか分割することができない.
本研究では分割をデータ並列の視点から階層的に捉え,確率的な連想計算関数の再定式化を行なう.これにより行と列との両方向にデータを自由に分割できるようになる.また,データ並列の枠組を実現した並列スケルトンを用いて実装を行い,その有効性を評価する.