Journal of Computer Chemistry, Japan
Online ISSN : 1347-3824
Print ISSN : 1347-1767
ISSN-L : 1347-1767
速報
並列分子科学計算プログラムの電力制約下における性能最適化
稲富 雄一井上 弘士
著者情報
ジャーナル フリー HTML

2016 年 14 巻 6 号 p. 201-202

詳細
Abstract

Power is the most important resource on the next-generation supercomputers, and they will be operated under power constraint. Therefore, there is a need to maximize performance of HPC application under power constraint. To do such optimization, we've developed and reported a method to improve performance by power allocation for each processor, which is called the variation-aware power budgeting. In this study, we carried out large-scale performance evaluation of a proposed method for two mini-applications related to molecular science, Modylas-mini and NTChem-mini. As a result, our method can improve their performance under power constraint up to 1.99 times speedup compared to conventional power constraint.

1 研究目的

現在世界中で開発が行われている次世代スーパーコンピュータ(スパコン)では消費電力が最も重要な資源であり,将来のスパコンでは電力制約を適用して運用される可能性がある.このような電力制約が適用されたスパコン(電力制約適応型スパコン)では,一般に,アプリケーションプログラム(アプリ)は電力制約下で実行される.ところが,全く同一のカタログ性能を持つプロセッサ間でも製造ばらつきに起因する消費電力ばらつきが存在し,そのような消費電力ばらつきのあるプロセッサに一律の電力制約を適用するとプロセッサ間での処理性能ばらつきが生じることが知られている.我々はそのような消費電力ばらつきを考慮して与えられた消費電力を各プロセッサへ適切に配分して,並列アプリ実行で利用しているプロセッサの処理性能を均質化することで実行性能を向上させるための電力配分手法を考案し,いくつかのアプリを用いて性能評価を行ってきた.

本稿では,我々が提案している電力配分手法の概要と,分子科学関係の2つのミニアプリ [1](Modylas (-mini)とNTChem (-mini))に提案手法を適用した場合の性能評価結果を報告する.

2 方法

ばらつきを考慮した電力配分手法の要点は,①アプリ依存,プロセッサ依存である実行時消費電力と性能の関係式( = 電力性能モデル)の推定手法と,②各プロセッサへの電力配分に基づいて電力を制御する方法(制御ノブ)の選択,の2点である.本研究では,小規模ベンチマークプログラムをシステム内の全プロセッサを用いて実行した結果から得られたアプリ非依存の消費電力ばらつき情報と,対象アプリを1プロセッサで実行して得られたアプリ依存の消費電力情報を用いて電力性能モデルを構築した.制御ノブについては,インテル社製プロセッサに搭載されているRAPLを用いたCPU電力キャッピングと動作周波数制御の2種類を試みた(提案手法の詳細については文献 [2]を参照).また,使用電力一定という条件下でプロセッサの処理性能(≒動作周波数)が等しくなるように各プロセッサに電力を配分した.

3 結果

Figure 1に提案手法適用前と適用後のModylasの各プロセッサでの実行時間とモジュール消費電力を示す(ここで,モジュールとはCPUとそれに直接接続されているDRAMの組みを意味する).横軸は実行時間を表しており,非電力制約時の実行時間で正規化している.縦軸はモジュール消費電力である.図中のCmの値はモジュールに対する(平均)電力制約値である.Vpは最大消費電力ばらつきを,Tmは正規化した実行時間の全モジュールにおける最大値を表している.この図で各モジュール平均50W電力制約時の結果を全プロセッサ一律電力制約(従来手法)適用時と消費電力ばらつきを考慮した提案手法適用時を比較すると,モジュール間消費電力ばらつき(Vp値)が提案手法適用前の1.21から1.54と増加しているが,実行時間は3.29から2.08と短縮されており,全消費電力一定の下で各モジュールに対して異なる電力配分を行うことで,実行性能が1.57 ( = 3.29/2.09)倍向上している.また,Figure 2に示しているNTChemの結果を見ると,モジュールあたり平均40Wの電力制約適用時では,提案手法を適用することで1.99 ( = 2.55/1.28)倍の性能向上を達成することが出来た.

Figure 1.

 Performance and power consumption data for Modylas before (upper) and after (lower) applying our power budgeting.

Figure 2.

 Performance and power consumption data for NTChem before (upper) and after (lower) applying our power budgeting.

このように,モジュール間の消費電力ばらつきを考慮した電力配分を行うことで,電力制約時のアプリ実行性能が改善されることが確認できた.

Reference
  • [1]   N. Maruyama, S. Suzuki, K. Mikami, Y. Komuro, S. Takizawa, M. Matsuda, Fiber Miniapp Suite. fiber-miniapp.github.io.
  • [2]   Y. Inadomi et al., “Analyzing and Mitigating the Impact of Manufacturing Variability in Power-Constrained Supercomputing”, Technical Paper, SC'15, Austin (USA).
 
© 2016 日本コンピュータ化学会
feedback
Top