【前へ】

第3章 ハイエンドコンピューティング研究開発の動向

3.4.3 非圧縮性一様等方性乱流の大規模直接数値シミュレーション

横川 三津夫 委員

1. はじめに
 乱流の微細渦構造を直接数値シミュレーション(DNS)によって捉えようとする研究は、スーパーコンピュータの出現により飛躍的に発展した[1]。近年では、さらに計算性能を増大させるために複数の計算プロセッサを協調動作させる並列計算機が開発され、乱流研究ばかりでなく多くの計算科学の分野においてその高い計算能力を発揮している。特に、並列ベクトル型スーパーコンピュータ上でフーリエ・スペクトル法による109自由度を持つ非圧縮性一様等方性乱流シミュレーションが実現したが、これは計算機ハードウェア及び並列プログラミングなどソフトウェア技術の進展に依るところが大きい。しかし、21世紀を迎えた時点では、計算性能及びメモリ容量の制約から計算格子点数10243のDNSが限界であった。
 超高速並列計算機システム「地球シミュレータ」は、数値シミュレーションにより地球変動現象の解明を目指すこと、すなわち仮想地球を計算機上に実現することを目的として、1997年から開発してきたSMP(Symmetric Multi Processors)クラスタ型の大規模並列計算機システムである[2]。2002年2月に完成し稼動し始めた。計算機システムの性能に対する一つの指標であるフロップス値(1秒間に可能な浮動小数点演算数)で示せば、地球シミュレータの理論ピーク性能は40テラフロップスであり、実効性能では世界的標準ベンチマークテストプログラムLINPACKにおいて35.86テラフロップス(ピーク性能比87.5%)を達成した。現時点において世界最高速のスーパーコンピュータである。地球シミュレータの高い計算性能と大きなメモリ空間を用いれば、1011自由度乱流DNSが実現可能であり、乱流研究が大きく進展するに違いない。

2. 地球シミュレータ
 
地球シミュレータは、640台の独立動作可能な計算機(ノードと呼ぶ)が単段クロスバスイッチによって結合されている(図1)。各ノードは、ピーク性能8ギガフロップスのベクトル型計算プロセッサ8個が16ギガバイトのメモリシステムを共有するSMPであり、ノード間データ転送のための制御機構を持つ。計算プロセッサの総数は5120個、メモリ容量は10テラバイトである[3]。
 大規模科学技術計算向きのスーパーコンピュータの要件として、ノード単体に対しては、浮動小数点演算性能、高速動作可能なメモリ素子、それらの性能に見合うプロセッサとメモリ間のデータ転送性能が挙げられる。また、複数ノードをネットワークで結合したクラスタにおいては、ノード間の高いデータ転送性能が重要である。地球シミュレータでは、ノード単体で64ギガフロップスの演算性能、同一バンクアクセスタイムが24ナノ秒の高速DRAM素子、8個のベクトルプロセッサとメモリ間における256ギガバイト/秒のデータ転送性能を有しており、バランスよいシステムに成っている。また任意の2つのノード間最大転送性能は12.3ギガバイト/秒であり、ノード間ネットワーク全体では約8テラバイト/秒の類を見ない高いデータ転送性能を持っている[4]。

 これらの性能を実現するために最先端の計算機製造技術が用いられた。ベクトル型計算プロセッサには、0.15ミクロンのCMOS LSI加工技術と銅配線技術が用いられ、従来複数のLSIで構成されていたベクトルプロセッサ部を約2cm四方の1チップ大型LSIで実現した。また、配線幅及び配線間隔25ミクロンのビルドアップ基板加工技術や大型LSIを搭載するためのベアチップ実装技術など、最先端のパッケージング技術を用いて高密度実装を実現するとともに、大型LSIから発生する約140Wの発熱に対して沸騰型ヒートシンクにより冷却した。これらの技術により開発開始時点の同じ性能のスーパーコンピュータと比較して、体積で1/50、消費電力で1/10を達成した。

【次へ】