現代スーパーコンピュータのアーキテクチャと性能分析

エクサスケール時代:現代スーパーコンピュータのアーキテクチャと性能分析(2025年6月)

画像クリックでインフォグラフィックサイトに遷移します

第1章:世界のハイパフォーマンスコンピューティングの現状(2025年6月)

現代のコンピューティングは、エクサスケールという新たな時代に突入した。これは、科学技術計算の能力が歴史的な閾値を超えたことを示すだけでなく、計算科学のパラダイムそのものが変容しつつあることを意味する。本章では、2025年6月時点のTOP500リストに基づき、世界のハイパフォーマンスコンピューティング(HPC)の全体像を概観し、主要なシステム、技術的傾向、そして地政学的な力学を明らかにする。

1.1 エクサスケール時代の定義

エクサスケールコンピューティングとは、1秒間に$10^{18}$回(1エクサフロップス)以上の浮動小数点演算を実行できる計算能力を指す 1。この性能は、気候変動の精密な予測、新薬の開発、宇宙の起源の解明といった、人類が直面する最も複雑な課題に取り組む上で不可欠なツールとなる。

2025年6月に発表された第65回TOP500リストによれば、世界には公式に3つのエクサスケールシステムが存在する。米国のEl Capitan、Frontier、そしてAuroraである 2。これら3システムはすべて米国エネルギー省(DOE)の国立研究所に設置されており、計算科学におけるリーダーシップを維持するための国家的な戦略投資の成果を明確に示している 2。この3つのシステムが揃ったことで、エクサスケール時代は概念から現実のものへと移行し、科学研究の新たな地平を切り拓いている。

1.2 TOP500の階層構造

現在のHPCの階層構造を理解するためには、TOP500リストの上位システムを精査することが不可欠である。このリストは、高密度行列積の求解速度を測定するHigh-Performance Linpack(HPL)ベンチマークの結果に基づいて、半年ごとに世界のスーパーコンピュータをランク付けするものである。2025年6月時点の上位10システムは、現代のスーパーコンピュータ設計における主要なアーキテクチャ哲学と技術的到達点を示している 3

  1. El Capitan(米国):ローレンス・リバモア国立研究所に設置されたこのシステムは、HPLベンチマークで EFlop/sという驚異的なスコアを記録し、世界第1位の座を維持している 2
  2. Frontier(米国):オークリッジ国立研究所に設置された世界初のエクサスケールシステムであり、現在も EFlop/sの性能で第2位に位置している 2
  3. Aurora(米国):アルゴンヌ国立研究所に設置された第3のエクサスケールシステムで、 EFlop/sの性能を持つ 2
  4. JUPITER(欧州連合/ドイツ):ユーリッヒ・スーパーコンピューティング・センターに設置された欧州で最も強力なシステムであり、 PFlop/sの性能で初登場4位にランクインした 2
  5. Eagle(米国):Microsoft Azureクラウド上に構築されたこのシステムは第5位に位置し、商用クラウドプロバイダーがHPCの最高峰に到達したことを象徴している 2
  6. HPC6(欧州連合/イタリア):イタリアのエネルギー企業Eni S.p.A.が運用するシステムで、Frontierと同様のアーキテクチャを持つ 3
  7. Fugaku(日本):理化学研究所計算科学研究センターに設置された、かつての世界第1位システム。現在は第7位だが、その独自のアーキテクチャは依然として高い評価を得ている 3
  8. Alps(スイス):スイス国立スーパーコンピューティング・センターに設置され、JUPITERと同様の技術を採用している 3
  9. LUMI(欧州連合/フィンランド):欧州HPC共同事業(EuroHPC JU)が所有するもう一つの主要システム 3
  10. Leonardo(欧州連合/イタリア):同じくEuroHPC JUが所有するシステムで、欧州の計算科学能力を支えている 3

これらのシステムは、単なる計算速度の競争相手ではなく、それぞれが異なる設計思想と技術的アプローチを体現するケーススタディである。以下の表1は、これらのトップ10システムについて、性能と構成の概要を示したものである。

表1:トップ10スーパーコンピュータ – 2025年6月TOP500リスト

順位システム名設置場所/国製造元総コア数Rmax (PFlop/s)Rpeak (PFlop/s)消費電力 (kW)
1El CapitanLLNL / 米国HPE11,039,6161,742.002,746.3829,581
2FrontierORNL / 米国HPE9,066,1761,353.002,055.7224,607
3AuroraANL / 米国HPE9,264,1281,012.001,980.0138,698
4JUPITEREuroHPC/FZJ / ドイツAtos4,801,344793.40930.0013,088
5EagleMicrosoft / 米国Microsoft2,073,600561.20846.84
6HPC6Eni S.p.A. / イタリアHPE3,143,520477.90606.978,461
7Fugaku理研 / 日本富士通7,630,848442.01537.2129,899
8AlpsCSCS / スイスHPE2,121,600434.90574.847,124
9LUMIEuroHPC/CSC / フィンランドHPE2,752,704379.70531.517,107
10LeonardoEuroHPC/CINECA / イタリアAtos1,824,768241.20306.317,494

出典: 3

1.3 地政学的およびベンダーの優位性

TOP500リストの全体的な分布は、HPC分野における地政学的な競争と産業界の動向を浮き彫りにする。国別に見ると、米国が175システムで首位を走り、次いで欧州連合(137システム)、中国(47システム)となっている 3。これは、米国がHPCへの継続的な大規模投資を通じて、その優位性を維持していることを示している。

ベンダーの観点からは、Hewlett Packard Enterprise(HPE)の存在感が際立っている。HPEは、El Capitan、Frontier、Auroraというトップ3システムすべてを構築しただけでなく、AlpsやLUMIといった他のトップ10システムも手掛けており、最高性能クラスのHPC市場で圧倒的なシェアを誇る 2

この状況は、単なる偶然の結果ではない。米国エネルギー省が2016年から2024年にかけて主導した「エクサスケール・コンピューティング・プロジェクト(ECP)」は、国内にエクサスケール・エコシステムを構築するための意図的な国家戦略であった 5。このプロジェクトは、HPEという単一のインテグレーターの下で、AMDとIntelというプロセッサベンダー間に競争を促すという巧みな戦略を採用した。その結果、AMDのAPUベース(El Capitan)、AMDのCPU+GPUベース(Frontier)、そしてIntelのCPU+GPUベース(Aurora)という3つの異なるアーキテクチャが、HPE Cray EXという共通のプラットフォーム上に実現された。このアプローチは、開発リスクを分散させ、堅牢なサプライチェーンを構築し、国家的な技術的優位性を確立することに成功した。この強力なエコシステムの出現は、EuroHPC JUのような他の国家連合が、自らの戦略を再考し、対抗策を講じる必要性を生じさせている。

同時に、MicrosoftのEagleシステムが第5位にランクインしたことは、HPCのパラダイムシフトを示唆している 3。歴史的に、HPCの最高峰は国立研究所や研究機関の独占領域であった。しかし、商用クラウドプロバイダーがトップ5に入るスーパーコンピュータを運用するという事実は、いくつかの重要な変化を示している。第一に、人工知能(AI)モデルのトレーニングの規模が、リーダーシップクラスのシステムを構築することが経済的に正当化されるレベルに達したこと。第二に、HPCの民主化の可能性である。Frontierへのアクセスは限られているかもしれないが、Eagleのようなシステム上のリソースは、理論的には商用サービスとして利用可能になる可能性がある 6。第三に、「スーパーコンピュータ」の定義そのものが問い直されていることである。その定義は、目的(科学研究)によって決まるのか、それとも能力によって決まるのか。Eagleのランキングは、その商業的な基盤に関わらず、能力が主要な評価基準になったことを示唆しており、これは民間部門におけるHPC技術の採用を加速させる可能性が高い。

第2章:アーキテクチャの深層分析:競合する設計思想

現代のスーパーコンピュータは、単一の設計思想に収斂するのではなく、多様なアーキテクチャが競合する豊かな生態系を形成している。本章では、世界の主要なスーパーコンピュータをケーススタディとして取り上げ、それぞれの設計哲学を深く掘り下げる。プロセッサレベルの革新からシステム全体のインターコネクトに至るまで、各コンポーネントを詳細に分析し、その選択が性能に与える影響を明らかにする。

2.1 APUが先導する最前線:El Capitanの統合アーキテクチャ

El Capitanは、単なる性能向上ではなく、アーキテクチャの根本的な進化を象徴している。ローレンス・リバモア国立研究所(LLNL)に設置されたこのHPE Cray EX255aベースのシステムは、米国の核備蓄の安全性と信頼性を保証する「核備蓄管理計画」を支援するという国家安全保障上の重要な使命を担っている 7

その心臓部にあるのは、AMD Instinct™ MI300A Accelerated Processing Unit(APU)である 9。これは、24個のZen 4 CPUコア、CDNA 3ベースのGPU、そして128GBの広帯域メモリ(HBM3)を単一のパッケージに統合した革新的なプロセッサである 7。El Capitanは11,136個の計算ノードを持ち、各ノードにはこのMI300A APUが4基搭載されている 7。これにより、ノードあたり96個のCPUコアと4基のGPU、合計512GBのメモリが利用可能となる 10

APUの最大の利点は、CPUとGPUがメモリ空間を共有することにある。これにより、従来は性能のボトルネックとなっていたCPUメモリとGPUメモリ間のデータ転送が最小限に抑えられる 7。この密結合な設計は、データ移動が計算そのものよりもコストがかかる現代のコンピューティングにおいて、極めて重要な意味を持つ。

システム全体は、HPE Slingshot-11インターコネクトによって結合されている。各ノードは4つの200 GbEインターフェースを備え、合計100 GB/sの注入帯域幅を持つ 11。システム全体のトポロジには、どの2ノード間も最大3ホップで通信できるように設計された「ドラゴンフライ」ネットワークが採用されており、大規模システム全体で低遅延を維持している 7

2.2 異種混合の前駆者:FrontierのディスクリートCPU+GPU設計

世界で初めて公式にエクサスケールを達成したFrontierは、El Capitanとは異なるアプローチを採用している。オークリッジ国立研究所(ORNL)に設置されたこのHPE Cray EX235aベースのシステムは、より伝統的な「ディスクリート」な異種混合(ヘテロジニアス)構成を洗練させたものである 12

9,402個の各計算ノードは、1基のカスタム64コア第3世代AMD EPYC “Trento” CPUと、4基のAMD Instinct MI250X GPUで構成されている 12。APUのように単一パッケージに統合されているわけではないが、これらのコンポーネントはAMD Infinity Fabricによって密接に接続されている。このコヒーレントインターコネクトにより、CPUはGPUのメモリに、GPUはCPUのメモリに直接アクセスでき、プログラミングモデルを大幅に簡素化している 12

メモリ階層は、CPU用に512GBのDDR4メモリ、そして各GPUに128GBのHBM2eメモリ(ノードあたり合計512GB)という構成になっている 12。この構成は、大量のデータを扱うアプリケーションにはDDR4を、計算中のデータには高速なHBMを、というように役割を分担させることを可能にする。

システムインターコネクトには、El Capitanと同様にHPE Slingshot-11とドラゴンフライトポロジが採用されており、これはHPEがエクサスケールシステム向けに標準化したプラットフォーム設計の有効性を示している 12

2.3 オールIntelのエクサスケールシステム:Auroraの垂直統合アプローチ

アルゴンヌ国立研究所(ANL)のAuroraは、IntelとHPEの協力によって生まれた、米国第3のエクサスケールシステムである 16。このシステムは、プロセッサからソフトウェアスタックまで、Intelの技術で垂直統合されている点が特徴的である。

10,624個の各計算ブレードには、2基のIntel® Xeon® CPU Maxシリーズプロセッサと、6基のIntel® Data Center GPU Maxシリーズアクセラレータ(開発コード名 “Ponte Vecchio”)が搭載されている 18

Auroraのプロセッサとメモリの設計は特にユニークである。Xeon Max CPUは、512GBのDDR5メモリに加えて、パッケージ上に64GBのHBM2eメモリを搭載している。このHBMは、高速なキャッシュとして、あるいは独立したメモリ領域として機能させることができ、アプリケーションに応じて柔軟なメモリ利用が可能となる 18。一方、GPUはそれぞれ128GBのHBMを搭載しており、ノード全体で非常に複雑かつ多層的なメモリ階層を形成している 18

ノード内のインターコネクトは、GPU間が高速なXe Link、CPU-GPU間がPCIe Gen5で接続されている 18。そして、システムレベルでは、AuroraもまたHPE Slingshot-11インターコネクトとドラゴンフライトポロジを採用している 18

さらに、Auroraはストレージシステムにおいても革新的である。Distributed Asynchronous Object Store(DAOS)と呼ばれる新しいI/Oシステムは、エクサスケールのワークロードに対応するために設計された。230 PBの容量と31 TB/sという極めて高い帯域幅を提供し、データ集約的な科学計算のボトルネックを解消する 18

2.4 欧州のモジュラー型挑戦者:JUPITERのGrace Hopperプラットフォーム

ドイツのユーリッヒ・スーパーコンピューティング・センターに設置されたJUPITERは、欧州初のエクサスケールシステムであり、米国のシステムとは異なる設計哲学を体現している。Eviden社のBullSequana XH3000アーキテクチャを基盤とするこのシステムは、モジュラー設計が特徴である 21

JUPITERは、異なるワークロードに対応するために、2つの主要なモジュールで構成される。大規模並列計算向けのGPUアクセラレーテッド区画である「ブースターモジュール」と、汎用計算向けの「クラスターモジュール」である。クラスターモジュールには、SiPearl Rhea1というArmベースのCPUが採用される予定である 21

ブースターモジュールを駆動するのは、約24,000基のNVIDIA GH200 Grace Hopperスーパーチップである 22。各スーパーチップは、72コアのArm Neoverse V2 “Grace” CPUと強力な “Hopper” H100 GPUを、高速なNVLink-C2Cインターコネクトで単一モジュール上に統合したものである 2。これは、AMDのMI300Aに対するNVIDIAの回答であり、CPUとGPUの緊密な統合と高いエネルギー効率を追求している。

インターコネクトには、米国のエクサスケールシステムが採用するSlingshotとは異なり、NVIDIAのQuad-Rail NDR200 InfiniBandネットワークが採用されている 2。これにより、HPCのネットワークファブリック市場において、SlingshotとInfiniBandという2つの主要なエコシステムが競合する構図が明確になっている。

2.5 同種混合の先駆者:Fugakuの永続的な遺産

理化学研究所計算科学研究センターに設置されたFugakuは、2020年から2022年にかけてTOP500の頂点に君臨し、混合精度AIベンチマークで初めてエクサフロップスの壁を破ったシステムである 25。そのアーキテクチャは、現代のトップシステムの中で異彩を放っている。

Fugakuの最大の特徴は、GPUのような専用アクセラレータを使用しない「同種混合(ホモジニアス)」アーキテクチャであることだ。158,976個の全ノードが、それぞれ1基の富士通製A64FXプロセッサで構成されている 25

このカスタムプロセッサA64FXは、Armv8.2-Aアーキテクチャをベースとし、スーパーコンピュータ向けのScalable Vector Extension(SVE)を実装している 26。また、HPC用CPUとしてはいち早く、パッケージ上にHBM2メモリ(ノードあたり32 GiB)を統合し、システム全体で163 PB/sという広大なメモリ帯域幅を実現した 26

インターコネクトには、極限的なスケーラビリティと低遅延を目指してカスタム設計された「Tofu Interconnect D」という6次元メッシュ/トーラスネットワークが採用されている 26。ストレージは、高速なノードローカル層(LLIO)、大規模な並列Lustreファイルシステム(FEFS)、そしてクラウドストレージとの連携からなる3階層システムで構成されている 25

これら5つのシステムのアーキテクチャを比較すると、現代のHPC設計における2つの根源的な課題への取り組みが見えてくる。

第一に、「オンパッケージ」メモリ革命である。これら5つの全く異なるアーキテクチャに共通する糸は、広帯域メモリ(HBM)をプロセッサパッケージ上に直接配置するという動きである。これは、より低速なオフチップのDIMM(DDRなど)への依存から脱却する根本的な転換を意味する。「メモリの壁」、すなわちプロセッサがメインメモリからデータを取得するよりも速く計算してしまうという問題は、長らくHPCの重大なボトルネックであった。FugakuはCPUのみの設計でオンパッケージHBMの大規模利用を開拓した 26。FrontierはHBM搭載GPUとDDRベースCPUを組み合わせた 14。Auroraはさらに進んで、CPUとGPUの両方にHBMを搭載した 18。そしてEl Capitan(MI300A)とJUPITER(GH200)は、このトレンドの最終形、すなわち密結合されたCPUとGPUコンポーネント間で直接共有されるHBMの統合メモリプールを実現した 7。このアーキテクチャの収斂は、データ移動のボトルネックを克服することが、現代のHPCアーキテクトが解決しようとしている最も重要な課題であることを示している。

第二に、インターコネクトの二強体制とトポロジの重要性である。プロセッサが注目されがちだが、これらの巨大システムの性能は、本質的にネットワークファブリックによって支えられている。データは、HPEのSlingshotとNVIDIAのInfiniBandという二大勢力の存在を明確に示している。米国のトップ3システムはすべてSlingshot-11に依存しており 7、HPE Cray EXプラットフォームにとって深く統合されたソリューションであることを示唆している。繰り返し言及される「ドラゴンフライ」トポロジは、巨大なスケールでも低く予測可能な遅延を維持するために特別に設計されている 7。一方、JUPITERをはじめとするNVIDIAベースのシステムは、NVIDIA独自のInfiniBandファブリックを使用している 3。これにより、HPE/Slingshot陣営とNVIDIA/InfiniBand陣営という2つの競合するエコシステムが形成されている。これは、アプリケーション開発者が、これらの異なるネットワークファブリックの特性に合わせて最適化を行う必要があることを意味し、最高性能を達成するための複雑さを一層増している。

以下の表2は、これら主要システムのアーキテクチャを詳細に比較したものである。

表2:主要スーパーコンピュータのアーキテクチャ比較(2025年6月)

項目El CapitanFrontierAuroraJUPITER (Booster)Fugaku
プラットフォームHPE Cray EX255aHPE Cray EX235aHPE Cray EXBullSequana XH3000Custom
CPUモデルAMD 4th Gen EPYC (APU内)AMD 3rd Gen EPYC “Trento”Intel Xeon Max 9470Arm Neoverse V2 “Grace”Fujitsu A64FX
CPUコア/ノード96 (24 x 4 APU)64104 (52 x 2 CPU)7248
アクセラレータAMD Instinct MI300AAMD Instinct MI250XIntel Data Center GPU MaxNVIDIA Hopper H100なし
アクセラレータ/ノード4 (APUとして統合)461 (Superchipとして統合)0
メモリ/ノード512 GB HBM3 (共有)512 GB DDR4 + 512 GB HBM2e1024 GB DDR5 + 128 GB HBM2e (CPU) + 768 GB HBM (GPU)480 GB LPDDR5X + 96 GB HBM332 GB HBM2
ノード内接続AMD Infinity FabricAMD Infinity FabricXe Link (GPU-GPU), PCIe (CPU-GPU)NVLink-C2C
システム接続HPE Slingshot-11HPE Slingshot-11HPE Slingshot-11NVIDIA NDR200 InfiniBandTofu Interconnect D
接続トポロジDragonflyDragonflyDragonfly6D Mesh/Torus
ストレージシステム“Rabbit” NVMeOrion (Lustre)DAOSFlash Storage3階層 (LLIO, FEFS, Cloud)

出典: 7

第3章:多次元的な性能分析

スーパーコンピュータの能力を単一の指標、すなわちHPLベンチマークのスコアだけで評価することは、その多面的な能力を見誤る危険性をはらむ。本章では、HPLを超えた複数のベンチマーク(HPCG、Graph500、Green500、HPL-MxP)を用いて、主要システムの性能を多角的に分析する。これにより、各システムのアーキテクチャ設計が、異なる種類のワークロードに対してどのように異なる強みと弱みとして現れるかを明らかにする。

3.1 Linpackを超えて:メモリおよびデータ集約型ワークロードの性能

科学技術計算の多くは、純粋な浮動小数点演算性能よりも、メモリ帯域幅やデータ移動能力によって性能が律速される。HPCGおよびGraph500ベンチマークは、こうした現実世界のアプリケーションに近い性能を評価するための重要な指標である。

HPCGベンチマークは、共役勾配法という反復法ソルバーの性能を測定するもので、メモリ帯域幅とネットワーク遅延に敏感な特性を持つ 29。2025年6月のリストでは、El Capitanが PFlop/sというスコアで首位に立った 29。これは、MI300A APUの統合メモリがもたらす広帯域メモリ性能の証左である。長らくこのベンチマークの王者であったFugakuは、 PFlop/sで第2位につけており、そのメモリ中心のCPUオンリー設計がいかに強力であるかを依然として示している 29。これに対し、Frontierは PFlop/sで第3位、Auroraは PFlop/sで第4位となっている 29

Graph500ベンチマークは、大規模なグラフ構造を幅優先探索(BFS)する性能を測定するもので、不規則なメモリアクセスパターンが支配的なデータ集約型問題の処理能力を評価する 33。この分野では、Fugakuが GTEPS(Giga-Traversed Edges Per Second)という圧倒的なスコアで11期連続の首位を独走している 34。この結果は、Fugakuの広帯域メモリと低遅延のTofuインターコネクトDが、この種のワークロードに対して最適化された設計であることを明確に示している。他のエクサスケールシステムも高い性能を示しており、Auroraが第4位( GTEPS)、Frontierが第6位( GTEPS)にランクインしているが、Fugakuの専門性には及ばない 36

Fugakuが示すこの独特な性能プロファイル(HPLでは中位、HPCG/Graph500では最上位)は、新しいヘテロジニアスシステムを評価するための貴重なリトマス試験紙となっている。Fugakuのアーキテクチャは、データ移動によって律速される現実の科学問題に優れるようにアプリケーション開発者と共同で設計された 37。その結果としてのHPCGとGraph500での高い順位は、この設計思想の直接的な成果である 29。GPU主導のHPL性能を重視して設計された新しいエクサスケールシステムは、これらのデータ集約型問題も効率的に解決できることを証明しなければならない。その意味で、El CapitanがHPCGで首位を獲得したことは、極めて重要な出来事である 31。これは、そのAPUアーキテクチャが、Fugakuのバランスの取れた性能プロファイルを再現しつつ、HPL性能では桁違いの向上を達成したことを示唆しており、APU設計思想が「両方の世界の長所」を兼ね備えたアプローチであることを裏付けている。

3.2 エネルギー効率という至上命題:Green500からの洞察

エクサスケールシステムの運用における最大の課題の一つは、その膨大な消費電力である。Green500リストは、TOP500システムを消費電力1ワットあたりの計算性能(GFlop/s)で再ランク付けし、エネルギー効率を評価する 38

2025年6月のリストで際立っているのは、NVIDIA GH200 Grace Hopperスーパーチップを搭載したシステムの優位性である。JUPITERの開発システムであるJEDIが、 GFlop/sという記録的な効率で第1位を獲得した 40ROMEO-2025(第2位)、Isambard-AI(第4位)など、リストの上位はGrace Hopperベースのシステムで占められており、低消費電力のArm CPUと強力なGPUの組み合わせが、卓越したエネルギー効率をもたらすことを明確に示している 38

一方、巨大なエクサスケールシステムも、その規模に見合わぬ高い効率を達成している。JUPITERは第21位( GFlop/s)、El Capitanは第25位( GFlop/s)、Frontierは第31位( GFlop/s)にランクインしている 41。これらのシステムが30 MW近い電力を消費することを考えると 4、このレベルの効率達成は、運用コストと環境負荷を管理する上で不可欠な技術的成果である。

3.3 HPCとAIの融合:混合精度計算能力

現代のスーパーコンピュータは、伝統的な科学技術計算だけでなく、AIのワークロード、特にディープラーニングモデルのトレーニングにも使用される。HPL-MxP(旧HPL-AI)ベンチマークは、AIで一般的に使用される混合精度演算(16ビットや32ビット浮動小数点数)を用いた性能を測定する 31

このベンチマークでは、各システムは標準のHPL(64ビット)を遥かに超える性能を発揮する。El Capitanは EFlop/sで首位に立ち、Auroraが EFlop/sで第2位、Frontierが EFlop/sで第3位と続く 31

これらの結果は、各システムのHPLスコアの5倍から10倍に達しており、現代のGPU/APUに搭載されているテンソルコアやマトリックスコアといったAI専用ハードウェアが、その設計の中核的な要素であることを示している。これらのマシンは、HPCとAIの両方のワークロードに対応する「デュアルユース」の強力なプラットフォームとして明確に設計されているのである。

このAIによる「性能乗数」は、これらのシステムの経済的・科学的価値提案を根本的に変えている。6億ドルもの費用がかかるEl Capitanのようなシステム 7 の価値は、伝統的な64ビット科学計算で約 EFlop/sの性能を発揮することが基本となる。しかし、AIワークロードに対してその10倍近い性能( EFlop/s)を提供できるという事実は、その有用性と投資対効果を劇的に高める 31。これは、同じマシンが、本来の国家安全保障の任務を遂行すると同時に、次世代の大規模言語モデルや「科学のためのAI」モデルを、これまで想像もできなかったスケールでトレーニングするために使用できることを意味する。このデュアルユース能力は、今や主要な設計ドライバーとなり、GPUのハードウェア設計に影響を与え、これらのシステムの莫大な価格を正当化している。

以下の表3は、主要システムの性能を複数のベンチマークにわたってまとめたものである。この表は、「最高の」システムは文脈に依存し、そのアーキテクチャ設計と密接に結びついているという、本報告書の中心的なテーマを明確に示している。

表3:主要システムの多次元ベンチマーク性能ランキング

システムTOP500 (HPL)HPCGGraph500 (BFS)Green500HPL-MxP
順位順位 (スコア)順位 (スコア)順位 (スコア)順位 (スコア)
El Capitan11 (17.41 PFlop/s)N/A25 (58.9 GFlop/s)1 (16.7 EFlop/s)
Frontier23 (14.05 PFlop/s)6 (29,655 GTEPS)31 (55.0 GFlop/s)3 (11.4 EFlop/s)
Aurora34 (5.61 PFlop/s)4 (69,373 GTEPS)N/A2 (11.6 EFlop/s)
JUPITER4N/AN/A21 (60.6 GFlop/s)N/A
Fugaku72 (16.00 PFlop/s)1 (204,068 GTEPS)N/A6 (N/A)

注: N/Aはデータが利用不可であることを示す。

出典: 3

第4章:主要な応用分野と将来の展望

スーパーコンピュータは、その驚異的な計算能力を具体的な科学的・戦略的目標の達成に役立てるために構築される。本章では、これまでに分析してきたアーキテクチャと性能が、現実世界の課題解決にどのように貢献しているかを概説する。さらに、現在のエクサスケール世代を超えて、Zettascale(ゼタスケール)や量子コンピューティングとの融合といった、HPCの未来の軌跡を探る。

4.1 画期的な科学と国家安全保障の実現

エクサスケールコンピューティングのインパクトは、多岐にわたる分野で既に現れている。

  • 国家安全保障:El Capitanの最重要任務は、物理的な核実験に代わる高忠実度3Dシミュレーションを通じて、米国の核備蓄の安全性、セキュリティ、信頼性を確保することである 7
  • エネルギーと材料科学:Frontierは、核融合エネルギーの研究、新材料の設計、先進的な燃焼エンジンの開発などを可能にしている 12。Auroraは、次世代バッテリー材料の探索や原子力エネルギー研究に活用されている 47
  • 気候・地球科学:JUPITERの主要な目標の一つは、キロメートルスケールの解像度で気候・気象モデルを実行し、熱波や豪雨といった極端現象の予測精度を向上させることである 24。Fugakuは、地震や津波などの災害シミュレーションと被害予測に利用されている 37
  • 生命科学・医療:すべてのシステムが、生物医学研究に深く関わっている。FugakuとAuroraは、大規模な創薬スクリーニングや分子動力学シミュレーションに用いられている 47。Frontierは、アルツハイマー病などの疾患の遺伝的要因を解明するために使用されている 13
  • 基礎科学:Auroraは、宇宙論の研究やダークエネルギーの謎の解明に貢献し 47、Frontierは超新星爆発のような天体物理現象をシミュレートしている 54

これらの応用事例は、スーパーコンピュータが単なる計算ツールではなく、設計段階から特定のミッションを念頭に置いて開発される「共同設計(Co-design)」の産物であることを示している。El CapitanはNNSAのシミュレーションコードのために構築され 8、Fugakuの設計は災害対策や創薬を含む9つの重点課題によって推進された 37。米国のECPも、ハードウェアの構築と同様に、アプリケーションとソフトウェアの開発に重点を置いていた 5。これは、過去のHPCの世代から学んだ重要な教訓、すなわち、科学コードが効率的に実行できなければ、真空中で最速のマシンを構築しても無意味である、ということを反映している。

4.2 Zettascale(ゼタスケール)への道

エクサスケールの次なるフロンティアは、Zettascale( FLOPS)およびYottascale( FLOPS)コンピューティングである。このレベルへの到達は、単なる漸進的な改善ではなく、エネルギー効率とコストにおける根本的なブレークスルーを必要とする 55。世界中の主要な研究機関は、すでにポスト・エクサスケール時代に向けた取り組みを開始している。

  • 理化学研究所(日本):「FugakuNEXT」プロジェクトはすでに設計段階にあり、2029年から2030年頃の展開を目指している。Fugakuの1桁上の性能向上を目標とし、新しい「MONAKA-X」CPUとNVIDIA GPUを搭載したヘテロジニアスシステムとなり、HPCとAIの両方のために明示的に設計される 56
  • EuroHPC JU(EU):欧州のロードマップは、より強力なマシンを構築するだけでなく、すべてのHPCセンターを超高速ネットワークで結ぶ「ハイパーコネクテッド」エコシステムの構築(EuroHyPerConプロジェクト)を目指している 57。また、将来のヘテロジニアスアーキテクチャにアプリケーションを対応させるためのソフトウェア開発(DEEP-SEAプロジェクト)にも資金を提供している 58

4.3 次のパラダイム:ハイブリッド量子-HPCシステム

エクサスケールコンピュータでさえ解決不可能な問題に取り組むため、量子プロセッシングユニット(QPU)を古典的なスーパーコンピュータと統合するという新しい概念が現実のものとなりつつある。

  • 先駆的プロジェクト
  • 理化学研究所/ソフトバンク(日本):「JHPC-quantum」プロジェクトは、量子コンピュータをFugakuと接続し、トヨタなどのパートナーと共に材料科学、創薬、最適化問題におけるハイブリッドアプリケーションを開発・評価している 59
  • HPCQS(EU):このEuroHPC JUのプロジェクトは、100量子ビットを超える2つの量子シミュレータを、ドイツとフランスのTier-0スーパーコンピューティングセンターに直接統合し、ユーザーがアクセス可能な連合型のハイブリッドインフラを構築している 60
  • NVIDIA CUDA-Q:ハイブリッドな古典-量子アルゴリズムのための統一されたプログラミングモデルを提供するCUDA-Qのようなソフトウェアプラットフォームの開発は、この新しいパラダイムを実現するための重要な技術である 61

これらのポスト・エクサスケールおよび量子ハイブリッドへの取り組みは、HPCの未来が単一の「世界一」のマシンに焦点を当てるのではなく、連合型で相互接続されたハイブリッドなエコシステムへと移行していることを明確に示している。EuroHPC JUの「ハイパーコネクティビティ」ロードマップは、異なる国のマシンをシームレスに利用可能にすることを目指している 57。理研のFugakuNEXTのビジョンには、量子コンピュータとの深い統合が含まれている 56。HPCQSプロジェクトは、QPUを物理的に古典的なHPCデータセンター内に設置している 60。これは、単一の科学的ワークフローが、データの前処理にローカルクラスタを使い、大規模シミュレーションをリモートのエクサスケールマシンに送り、特定のサブ問題(例えば量子化学計算)をQPUにディスパッチする、といった未来を示唆している。今後の課題は、単により速いコンピュータを構築することだけでなく、この複雑で、異種混合で、地理的に分散した計算エコシステムを管理するためのソフトウェアとネットワークインフラを構築することにある。

第5章:統合と結論

本報告書では、2025年6月時点における現代スーパーコンピュータの構成と性能について、多角的な分析を行ってきた。エクサスケール時代の到来は、単なる計算速度の向上に留まらず、コンピュータアーキテクチャ、性能評価、そして科学的応用における質的な転換を促している。本章では、これまでの分析を統合し、主要なトレンドを要約し、ハイパフォーマンスコンピューティングの未来について結論を述べる。

主要なアーキテクチャトレンドの要約

現代の最高性能クラスのスーパーコンピュータは、いくつかの明確なアーキテクチャトレンドを共有している。

  • ヘテロジニアス設計の支配:Fugakuを除き、トップクラスのシステムはすべて、汎用CPUと専用アクセラレータ(主にGPU)を組み合わせたヘテロジニアス設計を採用している。これは、浮動小数点演算の大部分を、電力効率の高い並列プロセッサにオフロードするという設計思想が主流になったことを示している。
  • オンパッケージHBMの普遍化:「メモリの壁」を克服するための決定的な解決策として、広帯域メモリ(HBM)をプロセッサパッケージ上に直接統合するアプローチが、CPU、GPUを問わず、ほぼすべての主要アーキテクチャで採用されている。
  • 統合CPU-GPUモジュールの出現:El CapitanのMI300A APUやJUPITERのGH200スーパーチップに代表されるように、CPUとGPUを単一のモジュール上に緊密に統合し、共有メモリ空間を提供する設計が、ヘテロジニアス設計の次なる進化形として登場した。
  • 高性能インターコネクトの重要性:数万ノードを結ぶシステム全体の性能は、ネットワークファブリックによって決まる。HPEのSlingshotとNVIDIAのInfiniBandが二大勢力として市場を支配し、ドラゴンフライのようなスケーラブルなトポロジが、大規模システムにおける低遅延通信を実現する鍵となっている。

「性能」の定義の進化

エクサスケール時代は、スーパーコンピュータの「性能」が単一の指標では測れないことを明確にした。

  • HPLベンチマークが示す純粋な計算能力(Rmax)は依然として重要であるが、それだけではシステムの全体像を捉えられない。
  • メモリ帯域幅とデータ移動能力を測るHPCGやGraph500、エネルギー効率を測るGreen500、そしてAIワークロード性能を測るHPL-MxPといった複数のベンチマークを組み合わせることで、より現実的で多面的な性能評価が可能になる。
  • FugakuがHPLでは7位でありながらGraph500では1位であるという事実は、ワークロードに応じて最適なアーキテクチャが異なることを象徴している。

HPC、AI、そして量子の融合

本報告書が明らかにした最も重要な長期的トレンドは、コンピューティングパラダイムの融合である。

  • 伝統的なシミュレーション(HPC)と機械学習(AI)の融合は、すでに科学的発見のプロセスを再構築している。現代のスーパーコンピュータは、物理モデルのシミュレーションと、その結果からパターンを学習するAIモデルのトレーニングを、同一のプラットフォーム上で実行できるように設計されている。
  • さらにその先には、量子コンピューティングとのハイブリッド化という、次の大きなパラダイムシフトが控えている。理化学研究所やEuroHPC JUにおける先駆的なプロジェクトが示すように、古典的なスーパーコンピュータが量子コンピュータを制御し、その計算結果を大規模なシミュレーションに組み込むという未来が現実のものとなりつつある。

最終的な展望

エクサスケール時代は、計算科学の歴史における終着点ではなく、重要な通過点である。アーキテクチャの多様性、現実世界のアプリケーション性能への注力、そしてハイブリッドシステムにおける先駆的な取り組みはすべて、来るべきZettascale(ゼタスケール)時代と、量子加速されたコンピューティングエコシステムへの礎を築いている。これらの技術革新が、今後数十年にわたって人類が直面するであろう科学的・社会的課題の解決に貢献することは間違いない。

引用文献

  1. DOE Explains…Exascale Computing – Department of Energy https://www.energy.gov/science/doe-explainsexascale-computing
  2. TOP500: Home – https://top500.org/
  3. TOP500 – Wikipedia https://en.wikipedia.org/wiki/TOP500
  4. TOP500 List – June 2025 | TOP500 https://top500.org/lists/top500/list/2025/06/
  5. Exascale Computing Project: Home Page https://www.exascaleproject.org/
  6. Azure high-performance computing (HPC) – Microsoft Azure https://azure.microsoft.com/en-us/solutions/high-performance-computing
  7. El Capitan (supercomputer) – Wikipedia https://en.wikipedia.org/wiki/El_Capitan_(supercomputer)
  8. Introducing El Capitan | Science & Technology Review – College of Engineering | Oregon State University https://web.engr.oregonstate.edu/~mjb/cs575/ElCapitan.pdf
  9. AMD’s Fastest Supercomputer Ever: El Capitan – Microchip USA https://www.microchipusa.com/articles/amd/amds-fastest-supercomputer-ever-el-capitan
  10. El Capitan | HPC @ LLNL https://hpc.llnl.gov/hardware/compute-platforms/el-capitan
  11. Using El Capitan Systems: Hardware Overview | HPC @ LLNL https://hpc.llnl.gov/documentation/user-guides/using-el-capitan-systems/hardware-overview
  12. Frontier (supercomputer) – Wikipedia https://en.wikipedia.org/wiki/Frontier_(supercomputer)
  13. Frontier – Oak Ridge Leadership Computing Facility https://www.olcf.ornl.gov/olcf-resources/compute-systems/frontier/
  14. Report on the Oak Ridge National Laboratory’s Frontier System – Innovative Computing Laboratory – University of Tennessee, Knoxville https://icl.utk.edu/files/publications/2022/icl-utk-1570-2022.pdf
  15. Frontier – Oak Ridge Leadership Computing Facility https://www.olcf.ornl.gov/frontier/
  16. Aurora (supercomputer) – Wikipedia https://en.wikipedia.org/wiki/Aurora_(supercomputer)
  17. Aurora Exascale Supercomputer – Argonne National Laboratory https://www.anl.gov/aurora
  18. Aurora | Argonne Leadership Computing Facility https://www.alcf.anl.gov/aurora
  19. Aurora Supercomputer Blade Installation Complete – Intel Newsroom https://newsroom.intel.com/artificial-intelligence/aurora-supercomputer-blade-installation-complete
  20. Aurora: Architecting Argonne’s First Exascale Supercomputer for Accelerated Scientific Discovery – arXiv https://arxiv.org/html/2509.08207v1
  21. Our Supercomputers – EuroHPC JU https://www.eurohpc-ju.europa.eu/supercomputers/our-supercomputers_en
  22. Europe’s First Exascale Supercomputer JUPITER Officially Inaugurated – WarmWorld https://www.warmworld.de/news/jupiter_inauguration/
  23. Application-Driven Exascale: The JUPITER Benchmark Suite – arXiv https://arxiv.org/pdf/2408.17211
  24. JUPITER – The New Dimension of Computing – Forschungszentrum Jülich https://www.fz-juelich.de/en/jupiter
  25. Fugaku (supercomputer) – Wikipedia https://en.wikipedia.org/wiki/Fugaku_(supercomputer)
  26. About Fugaku | RIKEN Center for Computational Science RIKEN … https://www.r-ccs.riken.jp/en/fugaku/about/
  27. Specifications – Supercomputer Fugaku : Fujitsu Global https://www.fujitsu.com/global/about/innovation/fugaku/specifications/
  28. Europe’s First Exascale Supercomputer, JUPITER, Now Live | NVIDIA Blog https://blogs.nvidia.com/blog/jupiter-exascale-supercomputer-live/
  29. HPCG – June 2025 – TOP500 https://top500.org/lists/hpcg/2025/06/
  30. HPCG Benchmark https://hpcg-benchmark.org/
  31. El Capitan Retains Top Spot in 65th TOP500 List as Exascale Era Expands https://top500.org/news/el-capitan-retains-top-spot-65th-top500-list-exascale-era-expands/
  32. El Capitan reigns supreme across three major supercomputing benchmarks https://www.llnl.gov/article/53006/el-capitan-reigns-supreme-across-three-major-supercomputing-benchmarks
  33. Sandia upgrades supercomputer benchmarks – EE Times https://www.eetimes.com/sandia-upgrades-supercomputer-benchmarks/
  34. Supercomputer Fugaku retains first place worldwide in Graph500 rankings : Fujitsu Global https://www.fujitsu.com/global/about/resources/news/press-releases/2025/0610-01.html
  35. Supercomputer Fugaku Retains 1st Place Worldwide in Graph500 Rankings – HPCwire https://www.hpcwire.com/off-the-wire/supercomputer-fugaku-retains-1st-place-worldwide-in-graph500-rankings/
  36. Graph 500 | large-scale benchmarks https://graph500.org/
  37. To exascale and beyond | RIKEN https://www.riken.jp/en/news_pubs/research_news/rr/2019spring/
  38. Green500 – Wikipedia https://en.wikipedia.org/wiki/Green500
  39. Looking Back to Look Forward: 15 Years of the Green500 – IEEE Computer Society https://www.computer.org/csdl/magazine/co/2025/01/10834281/23lk50desJa
  40. November 2024 – Green500 – TOP500 https://top500.org/lists/green500/2024/11/
  41. Green500 List – June 2025 – TOP500 https://top500.org/lists/green500/list/2025/06/
  42. June 2025 | TOP500 https://top500.org/lists/green500/2025/06/
  43. TOP500: JUPITER Joins the List at Number Four, but Top Three Hold Their Position https://www.hpcwire.com/2025/06/10/top500-jupiter-joins-the-list-at-number-four-but-top-three-hold-their-position/
  44. TOP500: El Capitan Stays on Top, US Holds Top 3 Supercomputers, Europe Expands in Leadership HPC https://insidehpc.com/2025/06/top500-el-capitan-stays-on-top-us-holds-top-3-supercomputers-europe-expands-in-leadership-hpc/
  45. El Capitan: The World’s Fastest Supercomputer Is Revolutionizing National Security and Science – YouTube https://www.youtube.com/watch?v=Q8wtuk3XPWM
  46. Building El Capitan: How LLNL’s Exascale Supercomputer Came to Be – YouTube https://www.youtube.com/watch?v=MPRjIlgVwlg
  47. Argonne releases Aurora exascale supercomputer to researchers, enabling accelerated science https://www.anl.gov/article/argonne-releases-aurora-exascale-supercomputer-to-researchers-enabling-accelerated-science
  48. Aurora supercomputer ushers in new era of AI-driven discovery for the US https://www.innovationnewsnetwork.com/aurora-supercomputer-ushers-in-new-era-of-ai-driven-discovery-for-the-us/59879/
  49. Europe enters the exascale supercomputing league with ‘JUPITER’ – EC Europa https://ec.europa.eu/commission/presscorner/detail/en/ip_25_2029
  50. Reaching JUPITER: ECMWF celebrates the first European exascale supercomputer https://www.ecmwf.int/en/about/media-centre/news/2025/reaching-jupiter-ecmwf-celebrates-first-european-exascale
  51. Program for Promoting Research on the Supercomputer Fugaku https://www.r-ccs.riken.jp/en/fugaku/org-relations/promoting-research/
  52. Precision spatiotemporal analysis of large-scale compound–protein interactions through molecular dynamics simulation – PMC – PubMed Central https://pmc.ncbi.nlm.nih.gov/articles/PMC11949864/
  53. Discovery Simulations on ALCF’s Aurora Supercomputer – YouTube https://www.youtube.com/watch?v=b1RTWLheUDo
  54. Frontier Supercomputer Surges to 1.35 Exaflops, To Tackle the “Biggest Science Problems on the Planet” – SciTechDaily https://scitechdaily.com/frontier-supercomputer-surges-to-1-35-exaflops-to-tackle-the-biggest-science-problems-on-the-planet/
  55. YOTA: Building a roadmap for Yottascale computing by 2040 | by Ersun Warncke | Medium https://medium.com/@ersun.warncke/yota-building-a-roadmap-for-yottascale-computing-by-2040-de5ee49ed7e1
  56. Projecting RIKEN CCS’s Future State Across HPC, AI, and Quantum – HPCwire https://www.hpcwire.com/2025/09/16/projecting-riken-ccss-future-state-across-hpc-ai-and-quantum/
  57. New Project to Define EuroHPC Hyperconnectivity Roadmap – HLRS https://www.hlrs.de/news/detail/new-project-to-define-eurohpc-hyperconnectivity-roadmap
  58. DEEP-SEA – EuroHPC JU – European Union https://www.eurohpc-ju.europa.eu/research-innovation/our-projects/deep-sea_en
  59. RIKEN, SoftBank Select 21 Test Users for Quantum–Supercomputer Link Project https://thequantuminsider.com/2025/10/14/riken-softbank-select-21-test-users-for-quantum-supercomputer-link-project/
  60. HPCQS: High Performance Computer – Quantum Simulator hybrid https://www.hpcqs.eu/
  61. Hybrid Classical-Quantum Supercomputing: A demonstration of a multi-user, multi-QPU and multi-GPU environment – arXiv https://arxiv.org/html/2508.16297v2