Heute wurde Deutschlands schnellster Supercomputer Juwels am Jülicher Supercomputing Centre von Bundesministerin für Bildung und Forschung, Anja Karliczek, dem Ministerpräsidenten von Nordrhein-Westfalen, Armin Laschet* und dem Leiter des JSC Prof. Thomas Lippert offiziell eingeweiht. Juwels steht dabei für "Jülich Wizard for European Leadership Science".

Schon im Juni konnte eine noch nicht voll ausgebaute Vorstufe des Juwels mit 2385 Skylake-Knoten (Xeon Platinum 8168) im Atos/Bull Sequana 1000 die Führungsposition in Deutschland übernehmen. Mit den von 114.480 Rechenkernen erzielten 6,2 PFlops im Linpack-Benchmark erreichte er Platz 23 in der Top500-Liste der Supercomputer.

Zur heutigen Einweihung zeigte sich Juwels nun noch etwas kraftvoller: 2511 Knoten mit jeweils zwei Xeon Platinum 8168, davon 240 mit doppelter Speicherkapazität von 240 GByte pro Knoten. Hinzu kommen jetzt vor allem aber noch die 48 „Acceleration Nodes“, die jeweils mit Xeon Gold 6148 und vier Nvidia Tesla-V100-GPUs bestückt sind. Damit liegt die theoretische Spitzenleistung um 21 Prozent über der im Juni eingereichten.

Bulls Sequana X1000 arbeitet dabei mit einer hocheffizienten Heißwasser-Kühlung mit Eingangstemperaturen von bis zu 40°C. Der PUE-Wert liegt bei entsprechender Weiterverwendung des heißen Wassers nahe 1,0 . Dabei werden alle Sequana-Komponenten. also auch die Infiniband-EDR-Switches, mit Heißwasser gekühlt (Bull Direct Liquid Cooling (DLC) Technology).

Das Atos/Bull X1000 Blade (Bild: Atos)

Jülich hat auch schon die nächste Ausbauphase angekündigt. Wie beim bisherigen Rechner Jureca auch soll ein Booster die Performance erheblich steigern. Allerdings ist die bisherige Booster-Linie zusammen mit Intels Xeon-Phi gestorben. Vermutlich wird Jülich daher für den nächsten Booster auf die Nachfolge-Generation von Nvidia Tesla-Volta (Ampere oder wie auch immer) setzen.

An der Spitze, aber nur sehr kurz

Beim aktuellen Juwels jedoch reicht der gegenüber dem Vorgängersystem JuQueen nur sehr mäßige Performancezuwachs wohl nur wenige Tage aus, um sich im Glanze des offiziellen Spitzenreiters in Deutschland zu sonnen. Markus Söder wird es sich nicht nehmen lassen, noch kurz vor den Wahlen zum bayrischen Landtag am 14. Oktober (möglicherweise schon nächste Woche) den SuperMUC-NG am Leibniz-Rechenzentrum einzuweihen – auch, wenn der dann noch nicht voll ausgebaut ist. Trotzdem dürfte der mit Lenovo ThinkSystem SD650 DWC ebenfalls mit energiesparender Heißwasserkühlung arbeitende SuperMUC-NG in der Performance schon sehr weit voraus liegen. Im für die nächste Top500-Liste im November angestrebten Vollausbau soll er mit 6336 dünnen Knoten (Platinum 8168, 24C, 2,7 GHz) und 144 dicken Knoten (Platinum 8160, 24C, 2,1 GHz) und damit mit über 310.000 Skylake-Rechenkernen theoretisch 26,7 PFlops erzielen, also mehr als das Doppelte von Juwels.

Mit dem heißwassergekühlten SD650 DWC im SuperMUC-NG setzt Lenovo den von IBM eingeschlagenen Weg fort (Bild: Lenovo)

Mit der für Skylake/OmniPath-Rechner üblichen Effizienz kommt dann seine Linpack-Leistung auf 20,4 PFlops. Wenn also Lenovo bis November den Vollausbau und einen gültigen Linpack-Lauf schafft, käme der SuperMUC NG auf Platz 5 der derzeitigen Top-500-Liste, läge damit noch vor Europas aktuellem Spitzenreiter, dem schweizerischen Piz Daint mit 19,6 PFlops. 96 Millionen Euro beträgt das Budget für den SuperMUC-NG, an dem auch der Bund einen großen Anteil trägt. So wird dann wohl neben Söder auch Bundesministerin Karliczek (CDU) zur Einweihung erscheinen.

Und der Dritte im Bunde

Auch Baden-Württemberg will sich nicht lumpen lassen und bis 2024 insgesamt 240 Millionen Euro in Supercomputer investieren, schließlich steht der Dritte der ganz Großen, das HLRS in Stuttgart. Hier ackert derzeit das Cray-XC40-System Hazel Hen mit betagtem Haswell-Prozessor, also noch ohne AVX-512 (Xeon E5-2680v3). Mit 5,6 PFlops liegt es auf Platz 27 in der aktuellen Top500-Liste. Bis 2019 soll das Nachfolgesystem Hawk aufgebaut werden, das etwa die fünffache Performance bieten soll und so möglicherweise den SuperMUC-NG noch vom Sockel stößt.

Und auch hier kommen vermutlich Intel-Skylake-Prozessoren zum Einsatz. Eigentlich war ja vereinbart worden, dass die drei Mitglieder des Gauss Centre unterschiedliche Architekturen anbieten, damit die Wissenschaftler ihre Software auf eben solchen unterschiedlichen Architekturen ausprobieren können. Zumindest für die CPUs steht dann zur Auswahl Skylake, Skylake und ... Skylake. So sorgt letztlich aktuell nur das Centro Nacional de Supercomputación in Barcelona dafür, dass im Rahmen der europäischen Partnerschaft PRACE auch IBM Power9 im Zusammenspiel mit Nvidia Volta mit ordentlich Rechenpower zur Verfügung steht. Immerhin könnte sich bei den Beschleunigern und Boostern mehr Vielfalt zeigen. Der Leiter des HLRS etwa, Prof. Michael Resch, ist ja als Freund von Fortran und Vektor-Processing bekannt – vielleicht gibt es ja hier eine Chance für NECs Vektorprozessoren Aurora Tsubasa auf PCI-Karten.

* Eigentlich ist die vom JSC veröffentlichte Reihenfolge nicht protokollgemäß. Zwar steht in der Protokollreihenfolge ein Bundesminister vor dem Ministerpräsidenten eines Landes, das gilt aber nicht bei Veranstaltungen im eigenen Lande. Aber bei einer Bundesministerin gilt wohl die alte Höflichkeit ... (as)