Der Petaflop-Computer – ein Schwabe
Der schnellste Rechner der Welt kommt zu weiten Teilen aus dem Entwicklungsstandort Böblingen. Die Schwaben waren federführend bei der Entwicklung des Cell-Prozessors. Von ihnen stammen auch die ersten Blades mit PowerPC-Prozessoren. Eine Besichtigung.
Nachdem viel Entwicklungsarbeit aus Schwaben im Cell-Prozessor steckt, war es naheliegend, dass das Böblinger Team auch die Entwicklung der Cell-Blades voranbringt. Diese liegen dem Supercomputer Roadrunner zu Grunde. Er hat vor wenigen Wochen im Los Alamos National Laboratory in New Mexico erstmals eine Billiarde Rechenoperationen in der Sekunde geschafft.
Bei den Cell-Blades kam zuerst der Prototyp QS20, dann das Einstiegsprodukt QS21 und schließlich das Blade QS22, das mit bis zu 32 GB Speicher und einer hohen Rechenleistung insbesondere die Anwendungsfälle abdeckt, wo Speicher und Gleitkomma-Rechenleistung in doppelter Genauigkeit gefragt sind.
Die reine Rechenleistung von in Spielekonsolen eingesetzten Prozessoren übersteigt mittlerweile die von Server- und Desktop-Prozessoren. Für IBM, das sowohl für die Entwicklung des Xbox360- und des Playstation-3-Prozessors – des Cell/B.E. – verantwortet, lag es nahe, dass diese Rechenleistung auch in anderen Anwendungsgebieten zum Einsatz kommt.
Für das Supercomputing bietet sich insbesondere die Weiterentwicklung des Cell/B.E.-Prozessors an: Mit einer um den Faktor 5 gesteigerten Gleitkomma-Rechenleistung wird er im IBM BladeServer QS22 eingesetzt, die auch die Computer-Komponente im RoadRunner Cluster des Los Alamos National Laboratory darstellt, dem derzeit leistungsfähigsten Höchstleistungsrechner. Dieser Prozessor stellt mit seinen 9 Rechenkernen eine Abkehr von klassischen Einzelprozessoren dar. IBM setzt seit einigen Jahren bei Servern Multicore-Prozessoren ein und hat diese Erfahrungen auch in das Design dieses neuartigen Prozessors einfließen lassen.
Das Petaflop/s-System Roadrunner ist im Grunde genommen lediglich eine spezielle Konfiguration aus Cell-Blades. Neben dem Cell kommen in dem hybriden System auch Opteron-Blades vor, die als Host für Cell-Blades fungieren. Andere Konfigurationen seien durch den modularen Aufbau in Form von Blades ebenfalls denkbar, heißt es von IBM. Das System benutzt ausschließlich Standardoptionen zur Kopplung der QS22 Blades über ein Infiniband-Netzwerk und bietet sich daher für den Einsatz in unterschiedlichsten Anwendungsfällen an.
Die hohe Rechenleistung baut auf nur ca. 250 Millionen Transistoren auf, wohingegen andere Prozessoren mittlerweile in die Milliarde-Transistoren-Größenordnung vorgestoßen sind. Auf einen einfachen Nenner gebracht, braucht ein System mit mehr Schaltelementen auch mehr Energie.
Die Liste der energieeffizientesten Systeme stellen reine QS22 Cluster dar, mit denen sich ein großer Aufgabenbereich abdecken lässt, seien es 1, 2, 64, 6480 oder jede andere Zahl gekoppelter QS22 Blades. Mit einem solchen Cluster ist es IBM laut eigenen Angaben gelungen, im Entwicklungszentrum Böblingen 488 Megaflops pro Watt zu erreichen das ist immerhin 35 Prozent mehr als das bisher führende System in der Green-500-Liste.
Supercomputing ist damit nicht nur skalierbar, sondern rückt damit auch in neue Anwendungsbereiche in der Medizinelektronik, der Konstruktion, der Simulation oder im Bereich Multimedia vor.