日本計算工学会論文集
Online ISSN : 1347-8826
ISSN-L : 1344-9443
2010 巻
選択された号の論文の21件中1~21を表示しています
  • 平林 久義, 佐藤 雅弘
    2010 年 2010 巻 p. 20100001
    発行日: 2010/02/10
    公開日: 2010/02/10
    ジャーナル フリー
    粒子法では,近傍粒子探索に時間がかかるため,一般には空間を一様な大きさの格子(一様グリッド)に区切って近傍粒子探索を高速化する手法をとる.しかし,一様グリッドを用いた場合,空間を格子に分割する数に比例してメモリ使用量が非常に大きくなる問題がある. そこで本報告では,線形リストを用いて一様グリッドのデータを保持する方法を提案する.本手法で水柱の崩壊シミュレーションを行った結果,線形リストを用いることでメモリ使用量が約90%削減された.
  • 櫛田 慶幸, 武宮 博
    2010 年 2010 巻 p. 20100002
    発行日: 2010/03/02
    公開日: 2010/03/02
    ジャーナル フリー
    現在、ハイパフォーマンスコンピューティング (HPC) 分野で使われる計算機は二つの壁に面しているといわれている。すなわち、Memory Wall とPower Wall である。Memory Wall とは、メインメモリからプロセッサに対してデータの供給が間に合わず、プロセッサが本来もつ性能を発揮できないことをさし、Power Wall はプロセッサに供給する電力を向上させることで達成してきた性能向上が頭打ちになっている事をさす。Memory Wall に対する対策は、Out of Order 実行、投機的実行、プリフェッチなど、必要となるデータの到着を待たず出来るだけ多くの計算を完了しておくことや、あらかじめ必要なデータを準備しておくことであった。しかしながら、これらの方法は本来必要な計算以外に、データのロード/ストアに必要な計算を増加させるなど、計算回路の複雑さを増加させ、また結果として必要な電力消費量が増加し、Power Wall が顕在化してきた。この二つの壁を克服するため、software controlled memoryとSIMD 計算を組み合わせる方法が開発されてきた。特に、Cell プロセッサは、現在世界最高性能であるスーパーコンピュータ、Roadrunnerに搭載されており、高い性能を発揮することが確認されており、今後のHPC 用のプロセッサとして重要な位置を占めることが期待できる。多くの数値計算はメモリへのアクセスがとても頻繁に行われることが普通である。これは、例えば、有限要素法などの手法が、スカラー計算機に比べベクトル計算機で効率よく動作する事でよく理解できる。Cell を含め、多くのプロセッサは一つのシリコンチップ上に多数の処理装置を搭載してゆくことが予想されるため今後ますます相対的なメモリバンド幅は狭くなっていく。これを踏まえれば、有限要素法などをマルチコアプロセッサ上で用いた場合でも高い性能を発揮する手法を開発する事は重要である。他方、Cell は今後急速にその性能を向上させることができるため、現在のプロセッサに比べ非常に高い計算性能を有することが期待される。このため、現在のプロセッサと同じ計算時間でより大きな問題を扱うことができるようになる。しかしながら、一つのプロセッサが扱うメモリ空間の大きさは、計算性能ほど急速に向上しない。このため、計算機をバランスよく利用するためには、ソフトウェアの点からメモリ利用量を低下させる必要がある。そのため、本研究では有限要素法を用いたポアソン方程式ソルバーについて、以下の二点を達成する手法を開発した。1. Cell の上でメモリアクセスを減らしながら計算を行うことの出来る手法を開発し、通常の手法に比べ高速化を達成する。2. 有限要素法に必須の連立一次方程式の求解において、係数行列を陰的に扱うことでメモリ使用量を削減する。その結果、1.については、Cellに搭載されている通常のスカラープロセッサーであるPPUに実装した通常の有限要素法に対し、計算用プロセッサであるSPUを利用時に最大10倍程度の加速を得た。2.については、約5倍程度の大規模計算を行うことが可能であると試算した。
  • 小橋 敏浩, 文屋 信太郎, 藤井 秀樹, 吉村 忍
    2010 年 2010 巻 p. 20100003
    発行日: 2010/03/19
    公開日: 2010/03/19
    ジャーナル フリー
    近年,交通シミュレーションで大域的な交通流を扱う必要性が強まっている.従来広域交通を扱う際には計算コストの制約から,マクロモデルと呼ばれる交通流を連続体近似したシミュレータが多く用いられているが,それでは交通現象に対する精緻性が不十分で,限られた定量性しか得られない場合もある.そのため,広域性と精緻性を両立したシミュレータが必要となるが,計算コストが障害となり両者を十分に満足するシミュレータは存在しない.一方,著者らの研究室では知的マルチエージェント型シミュレータMATES(Multi-Agent based Traffic and Environment Simulator)の開発を行っている.MATESでは知的マルチエージェントモデルを採用し,道路ネットワークの構築には仮想走行レーンやレーン幅の概念を導入することで,交差点,単路を問わず各交通主体の挙動を精緻に再現することが可能である.但し現行のMATESは逐次処理であり,自動車数が数万台以上の広域交通は計算時間が障害となり扱うことが困難である.そこで本研究では,MATESにおける広域シミュレーション実現のための並列化手法の検討,実装,評価を行った.まず,MATESにおける処理が道路ネットワーク上において局所性を有することに注目し,通信量の削減のために並列化手法として領域分割法を採用した.更に,隣接領域境界付近におけるエージェントの参照関係を確保するための境界の処理方法,そのような境界処理において通信すべきデータや通信量,及びエージェントの領域間移動による演算負荷の不均一化に対処するための動的領域分割法について検討を行った.その後小~中規模の検証実験を行い,一定以上の広域性かつ道路構造に不規則性を有する道路環境において動的領域分割法が有効であることを示した.また,スーパーリニアスピードアップなどにより60並列で最大84倍の並列加速率を得るなど,本研究の並列化手法が有効であることを確認した.最後に,関東地方と同規模の広域道路ネットワークを用いたシミュレーションを行い,高い並列加速率により並列処理が効率的に行われていることを確認すると共に,動的領域分割法の有効性について改めて議論した.また,この規模の0.5時間のシミュレーションが60並列で3時間強で終了することを確認し,本研究の成果が広域シミュレーションへ適応可能であることを示した.
  • 布引 英治, 鷲尾 巧, 久田 俊明
    2010 年 2010 巻 p. 20100004
    発行日: 2010/05/21
    公開日: 2010/05/21
    ジャーナル フリー
    個々人の大動脈瘤などの大動脈疾患リスクを評価する際, 有限要素法を用いた大動脈壁の応力解析は有効な手段であると考えられる. しかし従来の3次元超弾性有限要素解析手法は, 無負荷形状の推定や生体内物性パラメータの決定が困難であるがゆえに複雑性・不確定性を有し, 臨床の現場における実用的診断ツールにはなり難い. そこで本稿では, 内圧を受ける任意の曲面構造について, 内圧と変形後の形状のみから膜応力分布を解析する手法を新たに提案する. この手法は, 無負荷形状の推定や生体内物性パラメータの決定の手続きが不要であるにも拘わらず軸対称問題から大きく外れた曲面構造を簡便かつ精度よく解析できるため, 胸部大動脈などを中心に臨床の現場に広く応用される可能性がある. 本稿では本解析手法の定式化, 及びこれを円環モデルや大動脈モデルに適用した解析例について述べる. また, 本解析手法の結果の有効性を従来の3次元超弾性解析結果と比較することにより実証する.
  • 渡邊 育夢, 岩田 徳利, 中西 広吉
    2007 年 2010 巻 p. 20100005
    発行日: 2010/05/25
    公開日: 2010/05/25
    ジャーナル フリー
    テンソル内部変数を持つ有限ひずみ弾塑性問題に対して,散逸エネルギー最大化の原理により内部変数の発展方程式を導出する枠組みを適用した。導出された発展方程式を移動硬化下負荷面モデルへ適用し,数値解析のための陰的応力更新アルゴリズムとコンシステント接線係数を導出した。既往の非線形移動硬化モデルでは背応力の発展方程式として構成式を定義するが,本論文で掲示するアプローチでは背応力はテンソル内部変数の関数として与え,それは異方硬化特性を表現し得る形式の構成式として定義される。最後に,数値解析例として単軸引張圧縮試験のシミュレーションを行い,実験的に知られる異方的な非線形移動硬化特性を表現できることを示した。
  • 荒川 隆, 吉村 裕正
    2010 年 2010 巻 p. 20100006
    発行日: 2010/06/01
    公開日: 2010/06/01
    ジャーナル フリー
    カップラーは気候モデルなどの巨大・複雑なシミュレーションモデルにおいて個々の要素モデルを結合するソフトウェアである.本研究では,気候モデルMIROCの大気モデルとエアロゾルモデルをカップラーで結合し性能を評価した.データバッファリングの有無,補間計算の有無によって4ケースを測定し,データバッファリングが結合のボトルネックとなるという結果となった.従って,本研究のような3次元の大容量データ交換を必要とする結合においては,バッファリングを行わない直接的なデータ交換を行う機能がカップラーには不可欠である.
  • 西浦 泰介, 阪口 秀
    2010 年 2010 巻 p. 20100007
    発行日: 2010/06/01
    公開日: 2010/06/01
    ジャーナル フリー
    GPUの様な共有メモリ型超並列計算機を用いて個別要素法 (DEM) を高速化するためには,並列プロセスによるメモリへの書き込み競合を防ぐアルゴリズムが必要である.本研究では,接触候補ペアリストの作成および接触力の総和計算を並列実行する際に生じるメモリへの書き込み競合を防止する手法として,1) 粒子番号をセル番号でソートしてペアリストを作成する方法と,2) 接触力参照表を用いて力の総和計算を行う方法を提案した.その結果,粒子回転や表面摩擦,転がり摩擦など,高粒子濃度でのDEMに必要な接触ロジックを持ち合わせることで必然的に計算負荷が大きくなる3次元DEMであっても,CPU計算と比べて最大で50倍程度計算速度が加速された.さらに,倍精度計算の速度が単精度計算と比べて著しく低いGT200ベースのGPUであっても,粒子間距離の計算部分のみを倍精度計算に変更することで,計算時間を単精度計算と比べて1.3倍程度の増加に抑えながら倍精度同等の計算精度が得られるようになった.
  • 西浦 泰介, 阪口 秀
    2010 年 2010 巻 p. 20100008
    発行日: 2010/06/01
    公開日: 2010/06/01
    ジャーナル フリー
    粒子径分布を有する粒子群を扱う個別要素法 (DEM) を,GPUなどの共有メモリ型超並列計算機を使用して高速計算する時に,粒子径分布が広くなるにつれてメモリ使用量の急激な増加や,接触候補ペアの作成効率が低下する問題が有った.本研究では粒子径分布が広い粒子群を扱うDEMを,共有メモリ型並列によって高速化するために,メモリの書き込み競合を回避しつつ,1) 粒子番号を粒子径でソートして接触候補ペアリスト作成時のセル探索を効率化する方法と,2) 接触力の総和計算で用いる接触力参照表に必要なメモリ使用量を抑制する方法を開発した.その結果,最小粒子径と最大粒子径の差が10倍もある多成分系粒子群の振動充填に対するDEMであっても,単成分の場合と同程度のメモリ使用量に抑えながら,CPU計算よりも遥かに効率的なGPU計算を可能にした.
  • 山中 晃徳, 小川 慧, 青木 尊之, 高木 知弘
    2010 年 2010 巻 p. 20100009
    発行日: 2010/06/07
    公開日: 2010/06/07
    ジャーナル フリー
    鉄鋼材料をはじめとする様々な材料中での組織形成過程を予測可能な強力なシミュレーション手法としてPhase-Field法が活発に研究されている. 特に, Multi-Phase-Field(MPF)法は多結晶・多相材料中における凝固や相変態による組織形成過程を記述するシミュレーション手法として提案され, 発展している. 本研究では, GPUを用いることによりMPFシミュレーションの計算性能が向上することを示すため, CUDAを用いてMPF法のプログラムコードを新たに開発した. さらに, 数値計算およびメモリ面でコストの大きいMPF法をGPU上で計算するために, APT法を採用しメモリ使用量を低減した. 開発したプログラムコードを用いて, 2次元粒成長シミュレーションを行い, 1GPUでの基本計算性能を評価した. その結果, GPU上のシェアードメモリを有効に利用することで, 1GPUのみでCPU1コアでの計算性能に比べて約5.3倍の高速化を実現し, MPFシミュレーションの高速化手法としてGPUを用いることが有効な手法の一つであることを確認した.
  • 今村 純也, 棚橋 隆彦
    2010 年 2010 巻 p. 20100010
    発行日: 2010/07/02
    公開日: 2010/07/02
    ジャーナル フリー
    本稿はSMAC (Simplified MAC) 法, HSMAC (Highly SMAC) 法をHelmholtz-Hodgeの定理に基づいて考察し, これら方法を改良した修正HSMACスキームを提案することを目的とする. 流れ解析では2Dの限定された問題以外厳密解は知られていない. その中で, 流れ関数での解析例としてGhiaらの2Dキャビティ解があり, 多くのスキーム開発で参照されて厳密解に近いことが認められている. Ghiaらの方法は流れ関数と渦度を用いて, Rotational成分をHelmholtz分解に基づいて求める古典的な流れ関数-渦度法である. その解は速度Uと圧力Pを用いるPrimitive Variable法とも一致することから, 同時に非圧縮流れではDilatational成分が微小であることも判る. 望月らはその解を可視化実験で確認している. 2D実験は現実には困難なことから, z方向に非常に長いプロポーションの3Dキャビティで代替している. HSMAC法は3D計算法が確立していることから3Dキャビティの計算が可能である. そこで, 望月らの可視化実験の目的とは逆に, 同じプロポーションのキャビティで3D計算し,その対称断面の速度プロファイルを2D解と比較することで3Dスキームを検証することを考えた. 数値計算結果は, Re数100では比較的良好に一致するものの, Re数1000ではかなりのずれを生じる. また, ずれの程度は格子数を増加させても著しくは改善されない. 本研究の検討はこの認識点からスタートしている. さらに, 線形要素のほかノードあたり4自由度の不完全3重3次要素でも検証した. 2Dでは双3次要素の解はGhiaらの解をほぼ完全に再現する. 3Dでも同様と期待した. しかし, 期待とは逆に3DではGhiaらとのずれはむしろ3次要素の方が大きい. そこで本稿では, SMAC法でのスカラーポテンシャル要素の役割をHelmholtz分解に基づき考察して, 修正SMAC法および修正HSMAC法を提案する. 提案するスキームは, 上述のz方向に長い3Dキャビティで数値的に検証する.
  • (その1 ; 大変位弾性問題への適用)
    仲村 岳, 弓削 康平
    2010 年 2010 巻 p. 20100011
    発行日: 2010/08/12
    公開日: 2010/08/12
    ジャーナル フリー
    自動車の衝突安全性能評価試験ではハニカム材による可変形バリアが利用されている.したがって,ハニカム材のクラッシュ特性を精度良く評価できるモデル化手法が望まれる.一般的にハニカム材のモデル化は,材料試験による等価構成則の使用やハニカム構造を細かな要素で再現する手法がとられるが,複雑な変形に対する再現性や計算機負荷の高さが問題となり得る.そこで,均質化法と自動車のクラッシュ解析で一般的に利用されている陽的時間積分法によるクラッシュ解析プログラムを開発し問題の解決を試みる.さらに連成型マルチスケール解析の計算機負荷の高さを緩和するアルゴリズムを提案し,定量的精度や計算時間について数値例により比較し報告する.検証した問題では細かな要素によるモデル化と同等の精度で計算時間を大幅に削減できることを確認した.
  • 永井 学志, 池田 翔太, 胡桃澤 清文
    2010 年 2010 巻 p. 20100012
    発行日: 2010/08/09
    公開日: 2010/08/09
    ジャーナル フリー
    本論文では,硬化セメントペーストのマクロな圧縮強度を評価するために,周期境界条件のもとでの非局所型の非線形ボクセル有限要素解法を構成した.すなわち,a) 筆者らがこれまでに提案してきた3次元ミクロ構造モデルに,新たに局所的な引張破壊を考慮することにより,硬化セメントペーストのマクロな圧縮強度を評価しうる非線形ボクセル有限要素解法を構成し,b) 数値解の妥当性 (ベリフィケーション) と物理現象の再現性 (部分的なバリデーション) という両視点から,本解法の適用可能性を検討した.数値実験の結果,マクロな応力-ひずみ関係で圧縮ピークまでの数値解が妥当なものであることを示した.また,硬化セメントペーストの実測画像から統計的に作成したミクロ構造モデルと,C-S-H相の実測Young率を用いることで,圧縮強度のw/cと材齢による傾向が再現可能なことを示した.
  • 大地 雅俊, 越塚 誠一, 酒井 幹夫
    2010 年 2010 巻 p. 20100013
    発行日: 2010/09/07
    公開日: 2010/09/07
    ジャーナル フリー
    An explicit algorithm of a particle method is proposed to analyze incompressible flow with free surface. The calculation is stable when the Courant numbers with respect to the sound speed and the flow velocity are less than 1.0 and 0.2, respectively. Thus, Mach number of 0.2 is the optimum to speed up the calculations. The leading edge position of collapse of a water column shows good agreement with that using the semi-implicit algorithm. The explicit algorithm is more effective as the number of particles n increases because the calculation time is O(n1.0) where n is the total number of the particles. The calculation is accelerated by multi-core CPU and GPU.
  • 松本 圭太, 若島 幸司, 肖 鋒
    2010 年 2010 巻 p. 20100014
    発行日: 2010/10/06
    公開日: 2010/10/06
    ジャーナル フリー
    本論文では、流体中の固体を取り扱うために,面積分平均値と体積分平均値を基本変数として用いた最も簡単なマルチモーメント有限体積法であるVSIAM3(Volume/Surface Integrated Average based Multi Moment Method)の定式化に対してImmersed Boundary法(IBM)の適用し,そしてその有用性について述べる.IBMとは,固体が与える影響を非圧縮性流体の運動方程式に物体力(momentum forcing),連続の式に発散修正項(mass source/sink)を考慮した定式化をおこなった手法である.物体力は物体境界において境界条件を満たすように与えられる力であり、発散修正項は物体上で保存則を満たすように与えられる.数値計算において複雑形状を取り扱う場合,一般的に非構造格子では,格子生成が非常に複雑であるといわれている.それに対し,IBMではCartesin格子を用いているため,PCのメモリーやCPUを節約することができ格子生成は非常に簡単でき,格子生成が容易である.また,物体力のみを考慮して得た解では,境界を含むセルで保存則は満たさない.発散修正項は,そのセルに対しても保存則を満たさすように連続の式に与えられる.これは,物体を含むセルにおいて流体のみの連続の式となるように与えられる.物体境界の取り扱いにはlevel-set関数を用いる.この方法は格子形状に依存しない方法なので,さまざまな任意形状の物体を取り扱うことができ,多数の物体を扱うことも容易である.また,移動境界問題に対しても,格子の再構築なしで移動する複雑境界を取り扱うことができる.このIBMの有用性を確かめるため,2次元円柱周りの流れ,3次元球周りの流れ,より複雑な形状を用いた流れについて計算を行う.さらに,移動境界問題に対してIBMの拡張を行い,さまざまな数値テストを行った.物体力,保存項それぞれに物体の速度を考慮することで,移動境界の取り扱いを可能にする.数値テストとして,移動する物体によって生じる流れ(円柱のin-lineあるいはcross-flow振動),流体と物体が相互に作用する流れ(Vortex-Induce Vibration)について計算を行った.最後に,熱対流問題に対してもIBMの適用を行い,2次元あるいは3次元に対する有用性について検証する.さまざまな数値テストによって提案した手法が非常に有効であることを確認することができた.今度本手法が多くの工学的分野において流体/固体の相互流れの解析などに対して効果的なツールであることを期待する.
  • 澤田 有弘, 手塚 明
    2010 年 2010 巻 p. 20100015
    発行日: 2010/10/19
    公開日: 2010/10/19
    ジャーナル フリー
    本稿では,将来流体構造連成解析へ拡張可能な手法という位置付けで,Lagrange未定乗数法とX-FEMによる流れの連続・不連続境界条件の組み込みに手法に関する基礎的検討を行った.提案内容は,基本境界条件を埋め込むためのLagrange未定乗数節点を流体要素との交差点に位置させない手法と,X-FEMの領域積分にガウス積分をそのまま適用する手法を組み合わせた手法であり,その性能検証と限界把握を固定・移動境界問題にて行った.示された結果は,通常の境界適合メッシュによる解析手法より多少の精度低下が見られるものと考えられたが,未定乗数要素と流体要素のガウス積分点を十分取ることで,精度低下を最小限に抑えることができることを示した.本手法の利点は,連成解析への拡張を視野に入れた場合,構造解析用のLagrangeメッシュをそのまま未定乗数メッシュに用いることができ,付加的な連成解析用の未定乗数メッシュの構築を必要としないことである.特に幾何学的に複雑となる大変形・大移動問題に対しては,複雑な幾何学処理を必要としない本手法の利点は増すものと考えられる.一方,未定乗数要素と流体要素に適用するガウス積分点が不十分な場合には,提案手法は著しい解析精度の低下を招くため,適用には注意が必要であることも示した.
  • 近藤 雅裕, 越塚 誠一
    2010 年 2010 巻 p. 20100016
    発行日: 2010/11/11
    公開日: 2010/11/11
    ジャーナル フリー
    粒子法による薄板計算モデルを開発した。薄板の曲げに関して客観性のある弾性ひずみポテンシャルエネルギーを定式化し、ハミルトン力学に基づいて粒子の運動方程式を導出することで、線形運動量、角運動量、エネルギーの保存性に優れた手法を開発した。正方形の薄板の振動解析において振動周期の理論解との一致を示した。
  • 澤田 有弘, 手塚 明
    2010 年 2010 巻 p. 20100017
    発行日: 2010/11/12
    公開日: 2010/11/12
    ジャーナル フリー
    本稿では,流体と非線形構造物の連成解析において課題となる大変形・大移動問題への対応を目的に,流体は空間固定のEulerメッシュ,構造は変形追従のLagrangeメッシュとし,流体と構造の支配方程式を構造節点上のLagrange未定乗数法で強連成定式化する解析手法を提案する.これと共に,本手法のようにEuler-Lagrange型の連成解析手法で一つの課題となる流体と構造の連成境界に,適切な境界不連続化モデルを与える一手法として,ヘビサイド関数とエッジ関数によるX-FEMに基づく拡充内挿を適用することを提案する.層流中に設置された糸へ流体励起振動が発生する問題の解析により,ALE法と提案手法の比較,及び境界不連続化モデルの有無による比較で本手法の有効性を示す.境界モデルの差異による解析結果への影響や効果同定のため,不連続化の効果が鮮明化される二流体領域問題への適用も示す.本研究論文は,X-FEMに関わらず,他の手法の開発や評価にも有用な情報を与えるものと考えられる.
  • 杉原 健太, 青木 尊之
    2010 年 2010 巻 p. 20100018
    発行日: 2010/12/03
    公開日: 2010/12/03
    ジャーナル フリー
    GPUは演算性能が高いばかりでなくメモリバンド幅も広いため, CUDAのリリースによって格子系の流体計算などさまざまな分野でGPUを用いた高速計算の研究(GPGPU)が行われるようになっている. 本研究では流体の移流現象を記述する移流方程式に対して1次~6次精度有限差分法や5次精度WENO法を適用し, GPUによる実行性能の検証および評価, 複数GPUでの新たな並列計算方法の開発, 大規模高次精度移流計算の複数GPUを用いた並列計算での高速化と強スケーラビリティの検証を行う. 本研究は東京工業大学 学術国際情報センターのスーパーコンピュータ TSUBAME Grid Clusterを利用して行われた. NVIDIAのCUDAを用いてGPU上に実装する上で, 以下の方法を導入する. Global memoryへのアクセス回数を低減するためにx, y方向のデータをSM内のShared memoryをソフトウェアマネージド・キャッシュとして利用し, 各Thread内で閉じているz方向のデータはThread内の変数(Register ファイル)に格納し, 計算の高速化を図る. 3次元的に計算空間分割しBlockの数を増やすことでSMの並列実行効率を高める. 3次元領域分割法によるGPU並列計算により並列数の増加に伴い, 境界bufferのデータサイズを減少させ通信時間を短縮させる. 計算領域を7つのKernelに分け非同期実行することによる「計算Kernel, Device-Host間通信, MPI通信」3つのオーバーラップ技法を提案する.本論文では演算密度(flop/byte)と実行性能との関係に注目した評価を導入し, 低次から高次精度の差分を用いた移流計算を例に評価の妥当性を検証した. 高次精度手法は低次よりも演算密度が高く実行性能を引き出し易いことが明らかになった. また, GPU並列計算では3次元領域分割を使用し, 7個のstreamによる非同期実行によるkernel関数, MPI, Device-Host通信のオーバーラップ技法の提案をした. これらにより, 高次精度移流計算において60GPUで7.8TFlopsという非常に高い実行性能を達成した. 本研究によって以下の新しい知見が得られた. GPUの実行性能は演算密度(flop/byte)で有効な評価ができる. Shared memoryを用いたデータの再利用により演算密度は高くなり実行性能が向上する. 1GPUの実行性能が1CPU coreに比べて数十~百倍高速であり, 複数 GPUの場合はMPI通信に加えてDevice-Host間通信も必要になるため計算時間の中で通信時間の占める割合が高く, 高速化におけるボトルネックになる. 複数GPU計算において, 3次元領域分割が有効である. 本論文で提案した技法は移流計算に限らず直交格子でのさまざまなステンシル計算(例えば拡散方程,Jacobi法等の反復解法)にも適用可能であり, 汎用性が高いといえる.
  • 小野寺 直幸, 青木 尊之, 杉原 健太
    2010 年 2010 巻 p. 20100019
    発行日: 2010/12/17
    公開日: 2010/12/17
    ジャーナル フリー
    乱流など低波数から高波数までを含んだマルチ・スケールの現象に対して高精度な数値計算を行うには, 高次精度の計算手法が必要となる. 最も精度の高い計算手法としてスペクトル法が挙げられ, 乱流の直接計算(DNS:Direct numerical simulation)が行われている. しかし, スペクトル法は周期境界条件など単純な境界しか扱えず, 一般的な問題に適用することが難しい. 差分法はスペクトル法に対して精度の面で劣るが様々な問題に適用できるため, 非圧縮流体や圧縮性流体に対して多くの計算手法が提案されている. 高次精度の離散化を構築する方法として, 情報の範囲(ステンシル)を広げることが考えられる. それに対し, マルチモーメント法は一つの従属変数に対して複数のモーメントを定義することで離散化の精度を上げる. 保存型IDO(IDO-CF)法は格子点上の値に加えて積分値を定義することで, 有限体積法と同様に保存則を満たす. IDO-CF法は圧縮性流体や非圧縮性流体など様々な問題に適用されており, 2次元の一様等方性乱流計算においてスペクトル法に匹敵する解像度を得ている. コンパクト差分法(CD法)は格子点上の値に加え空間微分値を陰的に定義することで離散化の精度を上げる. 補間関数上に陰的に定義された空間微分値は時間積分とは無関係に対角行列を解くことで求められ, 同じ精度の一般的な離散化と比較しても4次精度のPade法では1/4程度の誤差となる. また, フーリエ解析により波数空間の解像度においても高波数領域での解像度が非常に高いことが分かる. 本研究では格子点の値と積分平均値など複数の従属変数を陽的に定義する保存型IDO法に, 格子点の値に加えて空間微分値を陰的に定義し拘束条件より定まる対角行列を解くCD法を適用することで, より高次精度の離散化手法を提案した. IDO-CF法にCD法を適用した計算手法では格子点上の空間微分値のみCD法を用いて解かれるため, 全自由度に対して半分の大きさの対角行列を解くだけでよく, さらにコンパクトなステンシルにおいて従来のIDO-CF法よりも高い精度を得ることが可能となる. 本研究では従来の4次精度のIDO-CF法(IDO-CF4)にCD法を適用することで6次精度計算手法(IDO-CD6)と8次精度の計算手法(IDO-CCD8)を提案した. さらに, フーリエ解析を用いて離散化精度を解析した結果, IDO-CF法にCD法を適用することで, 従来の4次精度IDO-CF法に比べ1階微分値, 2階微分値の解像度が高波数領域で劇的に改善した. 実問題としてMaxwell方程式と非圧縮性Navier-Stokes方程式について計算を行った. Maxwell方程式を解く電磁場伝搬の問題に本手法を適用した結果1次元の波の伝搬の誤差において, IDO-CD6およびIDO-CCD8は同じ精度の差分法のCD法と同様の結果を得た. 2次元一様等方性乱流計算ではスペクトル法のエネルギースペクトルの値との比較を行った. 格子点数がN=1282と少ない場合においてIDO-CCD8の誤差がIDO-CF4に比べ1/3程度, またIDO-CD6の誤差は2/3程度となる. 格子点数をN=5122と増やすことで, いずれのIDO-CF法においても誤差は減少し, 高波数の先端部分を除いた波数領域においてスペクトル法の結果と良く一致した. 格子解像度の打ち切り波数に近い高波数領域においては, 従来のIDO-CF法の4次精度の離散化ではスペクトル法の結果よりもエネルギースペクトルを大きく見積もってしまうが, IDO-CCD8ではそのような高波数領域においてもスペクトル法と良く一致した. 以上からCD法を用いたIDO-CF法はコンパクトなステンシルで高次精度の離散化が可能であり, 差分法のCD法に比べて解くべき微分値行列の大きさが半分にもかかわらず, 差分のCD法と同様の結果を得ることができる. また, 従来のIDO-CF法より高波数領域で微分値の解像度が非常に高くなるため移流方程式に対して少ない格子数で良い解を得られ, 乱流現象など高波数の波を多く含む現象に対して本論文で提案した手法は非常に有用性の高い手法であるといえる.
  • 藤岡 奨, 牛島 省
    2010 年 2010 巻 p. 20100020
    発行日: 2010/12/16
    公開日: 2010/12/16
    ジャーナル フリー
    VOF法による混相流の数値計算においては、精度の良い界面形状予測のためには移流計算における数値拡散が課題である。本論文では,移流計算によって数値拡散したスカラー分布を修正する数値拡散抑制フィルタ(ANDフィルタ)という新しい手法を提案した.VOF関数が0と1の間の値を取るという仮定のもと,ANDフィルタはスカラー勾配方向にスカラー移動を行い,数値拡散したスカラー分布を修正する.手法の有効性を確認するために1次元及び2次元の検証計算を行い,その結果はANDフィルタの有効性を示した.
  • ―大変形を伴う非線形複合構造システムへの適用―
    秋田 剛, 高木 亮治, 嶋 英志
    2010 年 2010 巻 p. 20100021
    発行日: 2010/12/24
    公開日: 2010/12/24
    ジャーナル フリー
    一般に構造計算に用いられる数値解析モデルには,部材の物性値や荷重条件など種々のモデルパラメータが含まれる.これらのパラメータは構造物の製造時の誤差や周辺環境の不確定性など様々な要因から不確定性を含んだものとなる.構造設計では,モデルパラメータの持つ不確定性を適切に評価したうえで,安全性や信頼性を確保する必要がある.モデルパラメータの不確定性を評価するためには,多数の運用データにもとづく経験則を用いるか,試験データを利用した統計的なパラメータ推定が必要とされる.数値解析モデルが線形に近くモデルパラメータの数も少ない場合,最小二乗法などの一般的な方法で試験データから容易にパラメータ推定を行うことができる.一方,例えば展開宇宙構造物のように非線形性が強く不確定なモデルパラメータの数が非常に多い場合,推定に多大な労力を要する.本論文では,近年提案された非線形問題を対象とした有力な状態推定方法であるアンサンブルカルマンフィルタを大変形を伴う非線形複合構造システムのモデルパラメータ推定へ適用し,その有効性を検証した.具体的な適用対象として,ヒンジ部に不確定性を有するペナルティバネを設置したケーブルとリブからなる展開構造システムを考え,アンサンブルカルマンフィルタを用いたペナルティバネ定数推定の数値実験を行った.実験結果からアンサンブルカルマンフィルタの設定パラメータである観測ノイズ,システムノイズ,粒子数等で真値への収束状況は異なるものの,本論文による方法で概ね良好な推定結果を得られることを確認した.
feedback
Top