Abstract
Intel Xeon Phiプロセッサが科学技術計算用のメニーコアプロセッサとして注目を集めている.私たちは,高い並列性能を持つ分子軌道計算プログラムSMASHを用い,DFT計算に関して第一世代Phi (Knights Corner)上のネィティブモードで性能評価を行った.その結果,実60コアから論理120コアへ増分したマルチスレッディングの領域でも1.4倍程の加速が得られることが分かった.これは,第二世代Phi (Knights Landing)でも好ましい性能が得られると期待させるものである.
Tables

Table 1. Timing data of DFT calculations for adamantine.

Table 2. Timing data of DFT energy calculations (cc-pVDZ).

Table 3. Timing data of DFT gradient calculations (cc-pVDZ).
参考文献
- [1]  
W. A. de Jong, E. Bylaska, N. Govind, C. L. Janssen, Phys. Chem. Chem. Phys., 12, 6896 (2010).  
- [2]  
K. Yasuda, J. Comput. Chem., 29, 334 (2008).  
- [3]  
I. S. Ufimtsev, T. J. Martínez, J. Chem. Theory Comput., 4, 222 (2008).  
- [4]  
R. Olivares-Amaya, M. A. Watson, R. G. Edgar, L. Vogt, Y. Shao, A. Aspuru-Guzik, J. Chem. Theory Comput., 6, 135 (2010).  
- [5]  
A. E. DePrince, 3rd, J. R. Hammond, J. Chem. Theory Comput., 7, 1287 (2011).  
- [6]  
W. Ma, S. Krishnamoorthy, O. Villa, K. Kowalski, J. Chem. Theory Comput., 7, 1316 (2011).  
- [7]  
C. M. Isborn, N. Luehr, I. S. Ufimtsev, T. J. Martínez, J. Chem. Theory Comput., 7, 1814 (2011).  
- [8]  
A. Asadchev, M. S. Gordon, J. Chem. Theory Comput., 8, 4166 (2012).  
- [9]  
Y. Miao, K. M. Merz, Jr., J. Chem. Theory Comput., 9, 965 (2013).  
- [10]  
H. J. Kulik, N. Luehr, I. S. Ufimtsev, T. J. Martinez, J. Phys. Chem. B, 116, 12501 (2012), TeraChem.  
- [11]  
H. Umeda, T. Hanawa, M. Shouji, T. Boku, Y. Inadomi, IPSJ. J. -, Comput. Syst., 6, 26 (2013), (ACS).
- [12]  
T. Yoshikawa, H. Nakai, JSMS Meeting 2013, 4E01.
- [13]  
"Intel Xeon Phi Coprocessor High-Performance Programming”, J. Jeffers, J. Reinders, 2013, Elsevier.
- [14]  
Intel Xeon Phi − Knights Landing,<http://intel.ly/1pxYAKE>.
- [15]  
"Intel Xeon Phi Processor High Performance Programming, 2nd Edition Knights Landing Edition”, J. Jeffers, J. Reinders, A. Sodani, 2016, Elsevier.
- [16]  
V. Mironov, M. Khrenova, A. Moskovsky, ISC High Performance 2015, LNCS, 9137, 113 (2015).
- [17]  
E. Apra, M. Klemm, K, Kowalski, SC14 presentation, <http://bit.ly/1GVWwV3>.
- [18]  
E. Aprà, J. Chem. Theory Comput., 12, 1129 (2016).  
- [19]  
H. Honda, Y. Inadomi, J. Maki, IPSJ. J. -, Comput. Syst., 7, 15 (2013), (ACS).
- [20]  
Y. Okiyama, T. Nakano, K. Yamashita, Y. Mochizuki, N. Taguchi, S. Tanaka, Chem. Phys. Lett., 490, 84 (2010). 
- [21]  
Y. Mochizuki, K. Yamashita, K. Fukuzawa, K. Takematsu, H. Watanabe, N. Taguchi, Y. Okiyama, M. Tsuboi, T. Nakano S. Tanaka, Chem. Phys. Lett., 493, 346 (2010). 
- [22]  
Y. Yamazaki, S. Saitou, Y. Mochizuki, H. Umeda, Y. Shigeta, SCCJ Spring Meeting 2015, 1P01.
- [23]  
K. Ishimura, “SMASH” - parallelized MO program, <http://smash-qc.sourceforge.net/>.
- [24]  
S. Saitou, Y. Mochizuki, K. Ishimura, SCCJ Spring Meeting 2016, 1P01.
- [25]  
S. Tanaka, Y. Mochizuki, Y. Komeiji, Y. Okiyama, K. Fukuzawa, Phys. Chem. Chem. Phys., 16, 10310 (2014).  
- [26]  
K. Ishimura, K. Kuramoto, Y. Ikuta, S. Hyodo, J. Chem. Theory Comput., 6, 1075 (2010). 
- [27]  
A. D. Becke, J. Chem. Phys., 98, 5648 (1993). 
- [28]  
P. C. Hariharan, J. A. Pople, Theor. Chim. Acta, 28, 213 (1973). 
- [29]  
T. H. Dunning, Jr., J. Chem. Phys., 90, 1007 (1989). 
- [30]  
Argonne Supercomputer Roadmap, <http://bit.ly/20s8zBJ>.
- [31]  
Univ. Tokyo & Tsukuba Univ., Oakforest-PACS system, <http://www.cc.u-tokyo.ac.jp/system/ofp/>.
- [32]  
A. Tiwari, K. Keipert, A. Jundt, J. Peraza, S. S. Leang, M. Laurenzano, M. S. Gordon, L. Carrington, ACM Digital Library, <http://bit.ly/2aKlTD0>.
- [33]  
K. Keipert, G. Mitra, V. Sunriyal, S. S. Leang, M. Sosonkina, A. P. Rendell, M. S. Gordon, J. Chem. Theory Comput., 11, 5055 (2015).