Sondertests

Pascal basiert auf Maxwell, Anpassungen finden sich im Detail. Dem Standard-Parcours sind deren Auswirkungen nur schwer zu entnehmen, die nachfolgenden Sondertests beleuchten sie hingegen im Detail.

Pascal profitiert tatsächlich von Async Compute

Nvidias Maxwell-GPU konnte anders als aktuelle Radeon-Grafikkarten nicht signifikant von der Low-Level-API DirectX 12 profitieren. Ein Grund dafür ist in Nvidias sehr gutem DirectX-11-Treiber zu suchen, der oft schon die DirectX-12-Performance (oder bessere im GPU-Limit) mit der alten API bringt. Der andere liegt im Feature Async-Compute, durch das Nvidia in den bisher verfügbaren Tests höchstens langsamer und nicht schneller wurde. Mit Pascal soll sich das ändern.

Um dem Versprechen nachzugehen, muss zunächst das von Microsoft entwickelte nBodyGravity-Sample aus dem DX12-SDK herhalten, was jedoch in einer von AMD veränderten Version genutzt wird, die eine höhere GPU-Last erzeugt als das Original-Sample. Vergleiche haben gezeigt, dass dieses mit dem höheren Grafik-Workload tatsächlich GPUs besser auslastet, wobei dies jedoch nicht zugunsten eines GPU-Entwicklers geht.

Und in der Tat zeigt das modifizierte DirectX-12-Sample ein bessere Async Compute auf Pascal als noch auf Maxwell. Während die letzte GeForce-Generation unabhängig von der Anzahl der genutzten Partikel nur langsamer wird, kann die GP104-GPU auf der GeForce GTX 1080 tatsächlich leicht zulegen.

Pascal ist die erste Nvidia-Grafikkarte, die von Async Compute profitiert

So liefert die neue Grafikkarte bei 8.192 Partikel eine um 2,5 Prozent bessere Leistung, bei 16.384 Partikel bleibt davon noch ein Prozent übrig. Auch bei 65.536 Partikel zeigt sich kein Leistungsverlust. Zwar kann AMDs GCN-GPU massiv mehr von Async Compute profitieren, jedoch hat AMD auch anders als Nvidia Schwierigkeiten, die vielen ALUs auszulasten – und unter anderem genau dort ist Async Compute hilfreich. Alleine deswegen schneidet AMD automatisch besser als Nvidia ab. Nvidias Problem war bis jetzt immer nur, dass die Maxwell-Grafikkarten mit dem Feature langsamer als ohne werden.

Ashes of the Singularity ist derzeit leider das einzige DirectX-12-Spiel, bei dem sich Async Compute gezielt an- oder abschalten lässt. Dennoch reicht dieses aus, um der GeForce GTX 1080 ein gutes Zeugnis auszustellen. So kann die Pascal-Grafikkarte in 2.560 × 1.440 immerhin um drei Prozent mit Async Compute zulegen, während die GeForce GTX 980 Ti genau jene drei Prozent langsamer wird. Und in den anderen Szenarien ändert sich nicht viel an dem Bild. Die GeForce GTX 1080 wird zu keiner Zeit langsamer durch Async Compute.

« Voriges Ashes of the Singularity – Async Compute Ashes of the Singularity – Async Compute Ashes of the Singularity – Async Compute Nächstes » Ashes of the Singularity – Async Compute Einheit: Bilder pro Sekunde (FPS) 2.560 × 1.440, Extreme-Preset – kompletter Benchmark: GeForce GTX 1080 @ DX12 + Async 65,6 GeForce GTX 1080 @ DX12 63,8 GeForce GTX 1080 @ DX11 62,1 Radeon R9 Fury X @ DX12 + Async 57,8 Radeon R9 Fury X @ DX12 52,9 GeForce GTX 980 Ti @ DX11 46,9 GeForce GTX 980 Ti @ DX12 46,7 Radeon R9 Fury X @ DX11 46,6 GeForce GTX 980 Ti @ DX12 + Async 45,4

Ashes of the Singularity – Async Compute Einheit: Bilder pro Sekunde (FPS) 3.840 × 2.160, Extreme-Preset – kompletter Benchmark: GeForce GTX 1080 @ DX11 51,4 GeForce GTX 1080 @ DX12 50,2 GeForce GTX 1080 @ DX12 + Async 50,1 Radeon R9 Fury X @ DX12 + Async 46,3 Radeon R9 Fury X @ DX12 42,2 Radeon R9 Fury X @ DX11 39,3 GeForce GTX 980 Ti @ DX11 36,9 GeForce GTX 980 Ti @ DX12 34,6 GeForce GTX 980 Ti @ DX12 + Async 34,1

Ashes of the Singularity – Async Compute Einheit: Bilder pro Sekunde (FPS) 1.920 × 1.080, Crazy-Preset – kompletter Benchmark: GeForce GTX 1080 @ DX12 + Async 60,3 GeForce GTX 1080 @ DX12 59,9 GeForce GTX 1080 @ DX11 59,1 Radeon R9 Fury X @ DX12 + Async 53,0 Radeon R9 Fury X @ DX12 51,0 Radeon R9 Fury X @ DX11 45,5 GeForce GTX 980 Ti @ DX11 44,6 GeForce GTX 980 Ti @ DX12 42,6 GeForce GTX 980 Ti @ DX12 + Async 41,6



Damit macht das DirectX-12-Feature auf der GP104- und auch allen kommenden Pascal-GPU einen Schritt nach vorne. Dieses mag zwar noch nicht so effektiv wie AMDs äußerst gelungene Integration sein, bringt nun jedoch auch auf GeForce-Karten das ein oder andere Prozent an Leistung anstatt es zu vernichten.

Die große Stärke Tessellation weiter ausgebaut?

Tessellation war schon immer eine Stärke der Nvidia-Grafikkarten. Der SubD11-Test aus dem Microsoft-SDK zeigt auch in diesem Fall schnell, ob es Änderungen bei der Performance gegeben hat – denn es lässt sich jeder der 64 Tessellation-Faktoren separat einstellen. Und in der Tat gibt es eine interessante Entdeckung.

Beim Blick auf die Ergebnisse gilt es zu bedenken, dass die GeForce GTX 980 Ti über 22 Polymorph-Engines und damit 22 Tessellation-Einheiten verfügt, die GeForce GTX 1080 jedoch nur über deren 20. Allerdings taktet in dem Test die neue Pascal-Grafikkarte knapp 60 Prozent höher. Eine bis zu 50 Prozent höhere Leistung könnte man also erwarten, ganz ankommen tut sie nicht.

Interessant ist: Umso niedriger die Tessellation-Faktoren sind, desto besser kann sich die GeForce GTX 1080 von der GeForce GTX 980 Ti in dieser Disziplin absetzen. Knapp 45 Prozent mehr Leistung – und damit fast ein optimales Ergebnis, zeigt sich dann. Ab dem Tessellation-Faktor 26 zeigt sich dann jedoch ein Einbruch.

Zwischen den Faktoren 26 und 36 ist Pascal plötzlich nur noch gleich schnell bis zehn Prozent zügiger und nimmt erst danach wieder Fahrt auf. Bei hohen Faktoren ist der GP104 plötzlich wieder 20 bis 25 Prozent voraus. Warum die GeForce GTX 1080 bei den mittleren Faktoren so stark einbricht und dann wieder anzieht, ist derzeit unklar. AMDs Grafikkarten werden trotzdem noch deutlich geschlagen.

Auf der nächsten Seite: Der GDDR5X könnte noch schneller sein