Spätestens seit vor einem Monat die Vertragsänderung für den geplanten Aurora-Supercomputer an den Argonne Laboratories bekannt wurde, war klar: Intels Xeon Phi Knights Hill wird es nicht mehr geben. Aber Intel wird nicht nur diesen Prozessor canceln, sondern mit ihm die ganze Xeon-Phi-Linie, also auch den schon in Arbeit befindlichen Nachfolger Knights Peak. Erste Alarmglocken läuteten schon im vergangenen Jahr, als der Xeon-Phi-Chefarchitekt Avinash Sodani Intel in Richtung Cavium verließ.

In dem Aurora-Report war von einem Wechsel auf eine andere Architektur die Rede, mit der man 2021 mehr als ein Exaflops erzielen will und seitdem rätselt man, wie die wohl aussehen könnte. Hinter verschlossenen Türen hat Intel auf der Konferenz SC17 ein paar Eckdaten dazu verraten. Diese blieben im großen Convention Center von Denver aber nicht lange geheim.

Wie schon bekannt, wird Intel 2018 den Skylake-SP-Nachfolger Cascade Lake im verbesserten 14-nm++-Prozess als Xeon Scalable Performance (SP) herausbringen. 2019/20 sollen dann die Ice Lake Scalable Xeons (ISX-SP) in 10 nm+ folgen, mit bis zu 38 Kernen, acht Speicherkanälen und mit bis zu 32 GByte High Bandwidth Memory (HBM2) on board. Man hört aber von einer nur mäßigen Bandbreite von 650 GByte/s – zum Vergleich: NECs Aurora schafft mit HBM2 1,2 TByte/s. Die normale Xeon-SP-Linie soll dann noch um eine spezielle Version ISX-H (Codename Knights Cove) mit 38 oder 44 Kernen erweitert werden, der als Nachfolger vom Xeon Phi gedacht ist.

ISX-H

Erste Prototypen von Knights Mill waren auf der SC17 zu sehen. Der Prozessor erfordert Wasserkühlung.

Der 44-Kerner soll dabei ein MCM sein, bestehend aus zwei Chips à 22 Kernen. Er soll im Linpack etwa 40 Prozent schneller sein als der normale ISX mit 24 Kernen und dürfte folglich mit rund 30 Prozent niedrigerem Takt laufen. Man hörte auch schon von den für 2021 vorgesehenen Nachfolgern Ice Age und Knights Run, die dann wohl für Aurora vorgesehen sind.

Den für Deep Learning optimierten Knights Mill will Intel weiterhin Ende dieses Jahr ohne großes Launch-Trara herausbringen. Erste Prototypen waren auf der SC17 schon zu sehen.

Den Nachfolger Knights Way (oder so ähnlich) wird es aber nicht mehr geben. Wer will auch schon für eine abgekündigte Architekturlinie Software entwickeln? Allerdings wird die AVX512-Erweiterung VNNI (Vector Neural Network Instructions) dann vom ISX-H angeboten.

Kostenfalle

Hauptgrund für den Abschied vom Xeon Phi dürften die Kosten sein. Anders als Nvidia bei Tesla kann Intel beim Xeon Phi keine Synergie mit Grafikchips ausnutzen und kommt auf keine größeren Stückzahlen. Bei Nvidia sorgen Millionen Gamer dafür, dass sich das GPU-Design amortisiert.

Auf Intels HPC-Devcon berichtete NERSC über die Erfahrungen mit dem KNL-Supercomputer Cori. Ohne Handoptimierung schaft der Xeon Phi nur 70 Prozent vom Haswell-Knoten.

Hinzu kommen bei Intel offenbar Probleme mit dem 10-nm-Prozess, sodass die Ausbeute bei großen Chips gering ist, was die Kosten weiter in die Höhe treibt.

Auch die Unzufriedenheit der Phi-User könnte eine Rolle gespielt haben. Die Implementierung von AVX512 ist nämlich nur teilweise zum Xeon kompatibel und der Code ist wegen anderer Präfixe auch nicht binärkompatibel.

Zudem erfordert der Xeon Phi Knights Landing (KNL) aufwendige Optimierung, weil er sonst nach dem Erfahrungsbericht von NERSC mit dem KNL-Supercomputer Cori im Schnitt nur 70 Prozent eines Haswell-Knotens erreicht. Optimiert man für beide, so kann er den Haswell zwar überholen, aber auch gerade mal um 10 Prozent. (as)