Journal of Computer Chemistry, Japan
Online ISSN : 1347-3824
Print ISSN : 1347-1767
ISSN-L : 1347-1767
4 巻 , 4 号
選択された号の論文の9件中1~9を表示しています
研究論文
  • 長嶋 雲兵, 佐々木 徹, 大谷 泰昭, 上原 正光, 塚田 捷, 村上 和彰
    2005 年 4 巻 4 号 p. 131-138
    発行日: 2005年
    公開日: 2006/03/14
    ジャーナル フリー
    研究現場,設計開発現場におけるコスト対性能比に優れた化学計算専用計算機を開発した.これは,計算物理,計算化学,等の各計算科学分野が有する計算上の独自性を反映した専用/準専用システムというコンセプトに立脚し,価格対性能比に優れたコモディティ・ハードウェアとシステムLSI(大規模集積回路)技術を駆使した高性能専用ハードウェアを組み合わせることで実現可能であった.研究開発期間は平成12年度~16年度の5年の間である.
    本稿では,「科学技術計算専用ロジック組込み型プラットフォーム・アーキテクチャ技術をもちいた化学計算専用計算機」の開発と得られた成果について概要を報告する.
  • 佐々木 徹, 村上 和彰
    2005 年 4 巻 4 号 p. 139-146
    発行日: 2005年
    公開日: 2006/03/14
    ジャーナル フリー
    専用計算機を開発する際には、システム開発のターンアラウンドが大きな問題となる。一般にハードウェアの開発がプロジェクトの進捗を律速するが、特に専用LSIを作成する場合LSIが完成してから専用ボードを作成し、その後デバイスドライバ、通信ミドルウェア等のシステムソフトウェアの作成、アプリケーションプログラムの移植を行うため、システムが完成した時には性能・機能などの面で既に陳腐化していることも少なくない。
    そこで、専用計算機の開発ターンアラウンドを改善するために、システム開発を二段階に分けて行い、専用LSIとソフトウェアを並行して開発した。第一段階では専用LSIの開発と並行して汎用CPUに専用LSIの機能をエミュレーションさせるプロトタイプシステムを用いてソフトウェア開発を行い、第二段階では専用LSIを実際にシステムに組み込むという方式を採った。また、複数のアプリケーションに対応するため、プラットフォームシステムはアクセラレータボード上に同一のCPUを搭載し、システムソフトウェアも共通化した。その結果、GAMESS(MO)、ABINIT-MP(MO)、Car-Parrinello(DFT)、DV-Xα(DFT)、GSMAC-FEM(CFD)など多くのアプリケーションに対する専用機を比較的短期間に開発することができた。
  • 佐々木 徹, 別役 潔, 樋口 高年, 長嶋 雲兵
    2005 年 4 巻 4 号 p. 147-154
    発行日: 2005年
    公開日: 2006/03/14
    ジャーナル フリー
    Car-Parrinello(CP)法による第一原理計算における計算時間の大部分は電子状態ベクトルの三次元FFT演算に費やされる。そこで、FFTを専用ロジック化し、FPGAを4個用いたボード上に実装した。FFT単体性能を実測したところ、2.4GHzで動作するXeonを搭載したPCと比較して、ボードあたり10倍程度の性能が実測された。消費電力まで考慮すると50倍の性能比となる。このボードをCP計算に利用することで、ボード2枚(FPGA8個相当)あたり、前述のXeon 1CPUにおけるCP計算と比較して10倍の高速化が実現される。CPコードをさらに高速化するため、FFTとGram-Schmidt直交化を動的再構成可能な単一のFPGAにおいて実行する手法を提案する。
  • 中村 健太, 本田 宏明, 梅田 宏明, 小松 晴信, 村上 和彰
    2005 年 4 巻 4 号 p. 155-164
    発行日: 2005年
    公開日: 2006/03/14
    ジャーナル フリー
    近年、分子シミュレーションのような大規模科学技術計算が盛んに行われるようになっている。特に、非経験的分子軌道法は、新素材、高性能材料、医薬品等の開発に利用されており、これからもますます発展する分野である。しかし非経験的分子軌道法に基づく分子シミュレーションは、その計算量が膨大であるために、研究者が設計したい大規模分子への適用が容易ではない。
    そこで我々は、「現実を反映した大規模分子系」の分子軌道計算を、「低コスト=パーソナルユース」で実現すべく、非経験的分子軌道法による分子軌道計算を高速に実行する専用並列計算機システムの開発に取り組んでいる。本稿では、我々が開発した分子軌道計算専用並列計算機システム、および、専用計算機システムに搭載する、電子反発積分計算専用 LSIの概要を紹介する。
  • 本田 宏明, 小原 繁
    2005 年 4 巻 4 号 p. 165-174
    発行日: 2005年
    公開日: 2006/03/14
    ジャーナル フリー
    Honda, Yamaki, Obaraが提案した縮約ガウス関数を基底関数に用いた分子積分の一般漸化表式を概観し、その表式に基づいて電子反発積分を効率良く高速計算するアルゴリズムを提案し、電子反発積分<ppss>について詳述した。一酸化炭素分子の電子反発積分についてGAMESSと計算時間を比較し、1.5∼2.0倍の高速化が達成された。また、このアルゴリズムは電子反発積分以外の種々の分子積分にも適用でき、多様な理論化学研究の場において役立つものと期待される。
  • 稲富 雄一, 小原 繁, 長嶋 雲兵
    2005 年 4 巻 4 号 p. 175-178
    発行日: 2005年
    公開日: 2006/03/14
    ジャーナル フリー
    本論文では、分子軌道計算で最も時間のかかる2電子反発積分の計算を新小原法[6, 7]とVertical Recurrence Relation (VRR)[5]とHorizontal Recurrence Relation (HRR)[8]のhybridアルゴリズムをもちいた2種類のプログラムで行い、Pentium4 (3.6GHz, EM64T, 1GB L2 cache) 上で浮動小数演算数や必要クロックサイクル数などのプロセッサイベントを計測することにより、その性能を評価した。
    新小原法プログラムの浮動小数点演算数は、hybrid法のそれに比べ20%ほど少ないが、性能はhybrid法プログラムの方が高かった。これは、新小原法プログラムのメモリアクセス回数がhybrid法プログラムに比べ3倍ほど多く、キャッシュミスは25倍も多いことに起因する。このように浮動小数演算数が少なくても、メモリアクセスが多くなることで、計算速度が大きく低下することが分かった。したがって、2電子積分を高速に行うためには、演算数だけでなく、中間積分などを保存、利用するためのメモリアクセス数を減少させる工夫が必要である。
  • 梅田 宏明, 稲富 雄一, 本田 宏明, 長嶋 雲兵
    2005 年 4 巻 4 号 p. 179-188
    発行日: 2005年
    公開日: 2006/03/14
    ジャーナル フリー
    分子軌道計算専用計算機を効果的に稼働させるための並列フォック行列生成アルゴリズムを開発し、プラットフォームシステム上に実装した。階層構造を持つプラットフォームシステム上ではホストPCとボード上の専用LSI間の通信には非常に大きなコストが必要となるが、多段の動的負荷分散を実装することで通信を局在化しつつ効果的な負荷の分散を実現した。SH4 CPUを63個使ったプラットフォーム評価システム上でのベンチマーク計算では99%を超える非常に高い並列性能を得ることができた。
  • 稲富 雄一, 佐々木 徹, 長嶋 雲兵, 村上 和彰
    2005 年 4 巻 4 号 p. 189-196
    発行日: 2005年
    公開日: 2006/03/14
    ジャーナル フリー
    膨大な2電子積分の一部をメモリに保存して、2回目のSCFサイクル以降再利用する計算手法(partially direct SCF, PDSCF)法を提案し、PCクラスタを用いて、その性能評価を行った。非常に簡単な改良であるにもかかわらず、PDSCF法を用いたFock行列作成時の並列処理の性能を大きく向上させることが分かった。また、積分値1つ当たりの計算コストを考慮すると、軌道量子数の和が小さな(ss,ss)タイプの積分から保存したほうが有利であることも分かった。この計算手法を用いることで、我々が開発してきた2電子積分専用LSIを多数搭載し、ディスクレス構造を採るFock行列作成のための超並列専用計算機でも、高い効率を保ったまま並列計算ができる。
  • 稲垣 祐一郎
    2005 年 4 巻 4 号 p. 197-202
    発行日: 2005年
    公開日: 2006/03/14
    ジャーナル フリー
    分子力場法をベースとした薬物候補化合物の仮想スクリーニングのための統合環境Xsiを開発した。創薬の手法として、ターゲット蛋白質の構造情報を用いないLigand Based Drug Design(LBDD)と、ターゲット蛋白質の構造情報を用いるStructure Based Drug Design(SBDD)の二通りがある。Xsiはこの両手法をひとつのプラットフォーム上に一体化させ、専用のスクリプト言語Xsi-Scriptによりユーザーが機能を自由に組み合わせることにより様々な解析フローを実現できる統合環境となっている。
    LBDDの中心的機能の低分子の配座生成部分について、SH4版EHPCシステムを用いて、階層型並列化を行い、CPU21個で並列化効率96.6%が得られた。
    更に、SBDD機能を用いて、c-ABLとリガンドの再ドッキング試験を行い、Root Mean Square Deviation 0.13Åが得られている。
feedback
Top