第2章 米国のハイエンドコンピューティング研究開発動向
(1)ASCI計画
DOEの国家核安全保障管理局(National Nuclear Security Administration:NNSA)が実施しているASCI計画(Advanced Simulation and Computing Initiative[2])は、1995年の発足以来、米国のハイエンドコンピュータ開発の中心的な役割を担っており、当ワーキンググループでは過去の報告書においてASCI計画の状況を毎年報告してきた。最近になっても”Red Storm”、”Purple”、”Blue Gene/L”などの計画が次々と発表されるなど、相変わらず積極的な投資が目立っている。以下では本計画の下で開発されているシステムの最新状況について述べる。
1)ASCI Q
ロスアラモス国立研究所(LANL)に設置されるASCI Qは、HP(旧コンパック)のAlphaサーバES45をベースにしたクラスタシステムで、当初2002年にピーク性能30TFlopsのシステムが完成する予定であった。現在1/3規模のシステム(4,096プロセッサ/1,024ノード)が2セット(QA、QB)完成した段階にあり、これらの2セットがそれぞれLINPACKベンチマークで7.73TFlopsを記録してTop 500リストの2位と3位に登場している。しかし、残りの1/3であるQCが設置され、さらにシステム全体が統合されるのがいつになるかは不明である。一足先に完成した地球シミュレータや後述するASCI PurpleとBlue Gene/Lの発表の影響で影が薄くなった感は否めない。2)ASCI Red Storm
Red StormはCRAY, Inc.により開発、製造される予定のスカラー型システムである。サンディア国立研究所に納入され、2004年8月から運用を開始する。AMDのOpteronプロセッサ(SledgeHammer)を10,368個使用し、ピーク性能は41.5TFlops(LINPACK性能目標は14TFlops以上、ASCI Redの7〜8倍)と発表されている。(SC2002での発表資料による。)3)ASCI PurpleとBlue Gene/L
2002年11月19日にIBMにより開発、製造されるASCI PurpleおよびBlue Gene/L(昨年度の報告書で紹介済み)がローレンス・リバモア国立研究所(LLNL)に納入されることが発表された。
ASCI PurpleはIBMのPOWER5プロセッサを12,544個使用し(64 CPUx196ノード) 、ピーク性能は100TFlops、主記憶容量50テラバイト、ディスク容量2ペタバイト(約2,000兆バイト)という巨大なシステムである。ASCI Purpleは2004年末までに運用を開始する予定である。
Blue Gene/LはIBMが最終的にペタフロップスを目指しているBlue Gene計画の最初のシステムであり、2005年までに完成する予定である。Blue Gene/Lは1チップ上に2プロセッサ(700MHz)を実装し、これと256MBのメモリで1ノードを構成する。さらに65,536ノード(131,072プロセッサ)を3次元トーラス接続して、ピーク性能360TFlopsを実現するとしている[3]。過去このように多数のノード(65,536ノード)から成るシステムは例が無く、さらにノードあたりのメモリが256MBと小さいため、高い実効性能を出すためには、これまで以上に高度なタスク割り当て制御が必要と思われる。
図2.3にSC2002で発表されたBlue Gene/Lの構成概念図を示す(昨年度報告書に掲載したものから若干の変更あり)。詳しくはSC2002における発表論文[1]を参照されたい。
また、Blue Gene/Lの後にもきわめて意欲的な計画が続いている。Blue Gene/Pは2006年〜2007年にピーク性能1PFlops(実効性能300TFlops)、Blue Gene/Qは2007年〜2008年にピーク性能3PFlops(実効性能1PFlops)を実現するとしている。にわかには信じがたい計画だが、もしこれが予定通り実現されるとすれば、わが国のメーカはとても太刀打ちできないに違いない。
(2)その他
ASCI計画とは別に、地球シミュレータ対抗を強く打ち出しているものに、ローレンス・バークレイ国立研究所(LBNL)、アルゴンヌ国立研究所(ANL)およびIBMが共同で提案しているBlue Planet計画というものがある[2]。その目標は、2005年末までに地球シミュレータの2倍の実効性能のシステムを、半分のハードウェアコストで実現するというもので、ピーク性能は150TFlops、少なくとも数種類の実科学計算コードで40〜50TFlopsの実効性能を実現することを目指している。
IBMのPOWER5を科学技術計算向けに改良したものを16,384プロセッサ使用し、またVirtual Vector Architecture(ViVA)と呼ぶ疑似ベクトル処理(CRAY X1等でも使用している、ノード内の複数CPUを連動させてベクトル処理を行う機能)を採用する。プロセッサをPOWER6、7とアップグレードすることにより2009年にはペタフロップスを目指すとしている。この計画が実行に移されるかどうかは、今のところ不明であるが、もし実施されるとすれば、将来はBlue Gene計画と統合されるものと思われる。