抄録
本研究ではGPU計算においてCUDA化したCADMAS-SURF/3Dのさらなる高速化を目的としてMPIに対応したハイブリッド並列化を行い,その適用性と検証結果を報告する.前回の課題のデータ再配置オーバーヘッドを解消し、シングルプロセスでは最大800%の高速化を達成した。CUDA対応MPIライブラリによって非常に簡便な方法でハイブリッド化が可能であることがわかった。アルゴリズムの正当性を検証しながらハイブリッド化を行ったが、未知の原因により収束性に問題があり検討課題となった。収束がうまくいけばハイブリッド化により更なる高速化の可能性があることがわかった。