地球シミュレータ
地球シミュレータ(ちきゅうシミュレータ、英: テンプレート:En)は、NEC製のSX-9/Eベースのスーパーコンピュータシステムである。8個のCPUでメモリを共有する計算ノード160台(1280CPU)を2段のクロスバースイッチで結合した構成となっている(以上は俗に2代目などと呼ばれている現行システムのスペック)。
神奈川県横浜市金沢区の海洋研究開発機構 (JAMSTEC) 横浜研究所に設置されている。
目的・経緯
地球規模の環境変動の解明・予測、さらにバブル崩壊により著しく落ち込んでいた日本のHPCリテラシー維持を目的として、科学技術庁(1998年度当時)が600億円を投じて開発を開始し、2002年3月15日に運用を開始した。計算科学の有効性を世界に示すとともに、地球温暖化や地殻変動など、文字通り地球規模でのシミュレーションに利用され、気候変動に関する政府間パネルの2007年ノーベル平和賞受賞にも大きく貢献した。2009年3月に新システムへの更新を完了し、4月から本格運用を開始している。公募により、地球科学、先進・創出分野での共同利用が行われている他、2007年からは産業界による成果専有型の有償利用も可能となっている。
構成
102.4GFLOPSの性能を持つCPU8個と128GBのメモリを持つベクトル計算機ノード(地球シミュレータではPNと呼ばれる)160台を2段のクロスバースイッチでファットツリー状に接続し、最大理論性能131TFLOPSを実現している。
なお、SX-5をベースとした旧システムでは、1ノードは8GFLOPSのCPU8個、16GBのメモリからなり、640ノード(5120CPU)を単段クロスバースイッチで接続、最大理論性能は40.96TFLOPSであった。旧システムのCPUチップはスカラープロセッサ、ベクトルプロセッサ数十チップからなるSX-5を1チップLSI化したもので、SX-6は地球シミュレータをベースに開発された。
ソフトウェア環境
OSはNECのSUPER-UXを独自拡張したものであり、プログラミング言語としてはFortran 90・C/C++が利用できる(いずれも地球シミュレータ用のコンパイラが用意されている)。並列化にあたっては、「ハイブリッド並列化」と「フラット並列化」の二つのプログラミングモデルがある。前者はノード間並列化をMPI、ノード内並列をマイクロタスクまたはOpenMPで記述する一方、後者はノード間・ノード内の両方の並列化をいずれもMPIで書く。一般的には前者はパフォーマンス重視、後者はプログラミング効率重視のモデルとされている。ユーザはこれらの並列化に対応したプログラムをバッチジョブとして投入する。名前が与えるイメージとは裏腹に、GRAPEのような問題特化型ではなくあくまで汎用計算機であるので、地球科学とは直接にかかわりのない分子動力学計算などにも利用されている[1]。
性能
2002年6月にLINPACKベンチマークで実効性能35.86TFLOPSを記録し、スーパーコンピュータの計算性能の世界ランキングであるTOP500で第2位の IBM テンプレート:Interlang に5倍の差をつけてトップを獲得して[2]以来、2004年11月に IBM Blue Gene に首位を明け渡す[3]まで、5期連続でトップを維持した。これは全640ノードの内638ノード(5,104プロセッサ)を用いて得られたもので、ピーク性能に対する実測性能比は87.2%となる。ASCI Whiteが7.226TFLOPS(ピーク性能12.288TFLOPS:ピーク性能比58.8%)であったのと比較して、理論ピーク性能に対する実効性能の比が非常に高く、ベクトル計算機特有の高速メモリシステムおよび単段クロスバーネットワーク接続[4]によるものと分析された。
維持費
旧システムの維持費用は年間約50億円(内訳は電気代約5億円、ガス・水道代1億5000万円、保守費用45億円)であった。消費電力は約6MWで、実アプリケーションの性能を確保するための高速メモリとネットワークに必要な電力とされた。
地球シミュレータのような専用のベクトルプロセッサを用いた計算機は、近年主流となっているPCクラスタに比べ価格性能比が低く、性能当たりの消費電力が多いとされる。ベクトル計算機とPCクラスタは得意分野の違いもあり、単純比較することは必ずしも適切ではないが、例えば2006年から運用開始された東京工業大学のTSUBAMEは、2002年に運用開始時の地球シミュレータと比較して導入費用は20分の1、電気代は5分の1、計算速度は1.6倍(LINPACK性能比)である(現在はどちらも新システムに更新し、それぞれ性能が向上している)。
現状
現在、地球シミュレータの単体能力を改善し、多目的に活用を図ることを目的として、スカラプロセッサからなるサーバを併用している。また、日本の学術研究のインフラストラクチャであるSINET3に接続し、遠隔利用を可能にしている。AVS, Mathematica, Maple等の商用ソフトウェアやオープンソースソフトウェアも利用可能である。
新システムへの更新
コストを抑え、さらに性能向上を図るため、2008年度に維持費とは別に5億円を計上し、6年間185億7600万円のレンタルにより新機種のSX-9/Eに更新し、ピーク計算能力を旧システムの3.2倍となる131TFLOPSに引き上げた。これにより、設置面積は半分の650平方メートル、電気代は従来の7-8割程度となる[5][6] 。さらに、2009年6月にはLINPACKベンチマークで122.4TFLOPS(実行効率93.38%)を達成した。これは2008年11月発表のTOP500リストで実行効率世界1位、実行性能日本1位、世界ランキング16位に相当する[7]。また、LINPACKを補完し、多面的な観点から性能を評価する目的で開発された性能指標を競うDARPA HPC Challenge Award Competitionにおいて、2009年11月には4部門(Global HPL, Global RandomAccess, EP STREAM, Global FFT)のうちEP STREAM、 Global FFT部門で3位[8]、2010年11月にはGlobal FFT部門で1位を獲得した[9]。
脚注
- ↑ テンプレート:Cite journal
- ↑ TOP500 List, June 2002
- ↑ TOP500 List, Nov.2004
- ↑ 多数のマシン(あるいは、PU:ProcessUnit)同士を結合するネットワーク結合部にスイッチを配する。その結合方法が、マシン(PU)単位で観ると1対1結合であり転送速度は高速である(ワンステップで転送出来る)。その特徴より、理論ピーク性能に対する実効性能の比が他のネットワーク結合方式に比べて非常に高い。その反面、スイッチの数がマシン(PU)の数の2乗に比例するため、マシン(PU)の数が増える分スイッチを増やすのは予算的に難しくなる。また、多数のスイッチの同調を取りづらくなる特徴を持つ。
- ↑ 地球シミュレータの更新について、海洋研究開発機構計算システム計画・運用部、2008年11月14日
- ↑ 「地球シミュレータ」:計算能力毎秒131兆回 機種更新、毎日新聞、2009年2月27日
- ↑ 新型「地球シミュレータシステム」、LINPACKベンチで122.4TFLOPSを達成、マイコミジャーナル、2009年6月4日
- ↑ 「地球シミュレータ」がHPCチャレンジアワードの2指標で第3位を受賞、海洋研究開発機構、2009年12月1日
- ↑ 地球シミュレータがHPCチャレンジアワードの1指標で第1位を獲得、日本電気、2010年11月17日