Exascale-Supercomputer JUPITER setzt Maßstäbe für Energieeffizienz
Europäischer Supercomputer JEDI kommt auf den ersten Platz in der Green500-Liste der energieeffizientesten Supercomputer.
Bei der Messung für die Green500-Liste der energieeffizientesten Supercomputer erzielte das JEDI-System eine Rechenleistung von 4,5 Billiarden Rechenoperationen pro Sekunde oder 4,5 Petaflops bei einem Stromverbrauch von im Schnitt 66 Kilowatt. Bei einem optimierten Lauf konnte die Leistungsaufnahme auf 52 Kilowatt reduziert werden.
GPUs statt CPUs
Der im April installierte erste Baustein, das „JUPITER Exascale Development Instrument“ oder kurz JEDI, schafft 72 Milliarden Rechenoperationen pro Sekunde pro Watt. Der vorherige Spitzenreiter kam im Vergleich dazu auf rund 65 Milliarden. Entscheidend für die herausragende Effizienz von JEDI ist der Einsatz von Grafikprozessoren, GPUs, und die Tatsache, dass es gelungen ist, wissenschaftliche Anwendungen für die Berechnung auf Grafikprozessoren zu optimieren. Praktisch alle führenden Systeme der Green500 setzen heute massiv auf GPUs, die Berechnungen bauartbedingt wesentlich energiesparsamer ausführen können als herkömmliche Hauptprozessoren, CPUs.
Hocheffiziente Warmwasserkühlung
Das Entwicklungssystem JEDI gehört zu den ersten Systemen weltweit, die die neueste Beschleuniger-Generation von NVIDIA einsetzen: den NVIDIA GH200 Grace Hopper Superchip, der einen NVIDIA Hopper-Grafikprozessor (GPU) und NVIDIA Grace-Hauptprozessor (CPU) auf einem Chip vereint. Die hocheffiziente Warmwasserkühlung von Eviden, die deutlich weniger Energie benötigt als eine klassische Luftkühlung, leistet ebenfalls einen Beitrag und erlaubt es darüber hinaus die entstehende Wärme im Nachgang weiter zu nutzen.
JUPITER soll als erster Supercomputer in Europa die Marke von einem Exaflops durchbrechen, was einer Trillion – einer „1“ mit 18 Nullen – Rechenoperationen pro Sekunde entspricht. Das finale System wird im zweiten Halbjahr 2024 schrittweise installiert und wissenschaftlichen Anwendern zunächst im Rahmen des Early Access Program zugänglich gemacht, bevor es Anfang 2025 in den allgemeinen Nutzerbetrieb übergeht.
Training von großen KI-Modellen
Die enorme Rechenleistung von JUPITER soll dazu beitragen, die Grenzen wissenschaftlicher Simulationen zu erweitern und große KI-Modelle zu trainieren. Das modular aufgebaute Exascalesystem basiert auf der dynamischen modularen Systemarchitektur (dMSA), die ParTec und das Jülich Supercomputing Centre gemeinsam entwickelt haben. Das derzeit installierte Booster-Modul von JUPITER wird aus 125 BullSequana XH300 Racks und über rund rund 24.000 NVIDIA GH200 Superchips verfügen, die über ein Quantum-2 InfiniBand-Netzwerk miteinander verbunden sind. Bei Berechnungen mit 8 bit, wie sie für das Training von KI-Modellen üblich sind, soll die Rechenleistung auf deutlich mehr als 70 Exaflops steigen. Stand heute wäre JUPITER damit der weltweit schnellste Rechner für KI.
Der Energiebedarf von JUPITER wird nach Schätzungen im Mittel etwa 11 Megawatt betragen. Weitere Maßnahmen sollen dazu beitragen, die Energie noch nachhaltiger zu nutzen. So ist das modulare Rechenzentrum, in dem JUPITER untergebracht wird, darauf ausgelegt, die beim Kühlen anfallende Wärme auszukoppeln und zum Heizen der Gebäude auf dem Campus des Forschungszentrum Jülich zu nutzen.