... Leitthema zur Einführung von Direct X 11 vor gut neun Jahren. Mittlerweile ist Tessellation in jeder großen Engine obligatorisch, doch wie schlägt sich eine Radeon RX 5700 (XT) bei einer derartigen Standardfunktion? Der Einbruch durch Tessellation (bzw. zusätzliche Dreiecke generell) ist übrigens auflösungsabhängig: Je höher die Bildschirmauflösung, desto mehr Pixel gilt es zu berechnen. In geringen Auflösungen wie Full HD schlägt Tessellation daher heftiger ins Kontor, während Ultra HD die wahren Kosten maskiert. Wie die Geschichte ausgeht, erfahren Sie im bunten Extrakasten auf der folgenden Seite.
Daraus ergibt sich eine Brutto-Transferrate von 448 GByte/s. In einer perfekten Welt würden diese linear durchschlagen, in der Praxis ist dies trotz diverser Effizienzkniffe jedoch kaum zu erreichen. Turing-Grafikkarten punkteten in den vergangenen Analysen dieser Art mit einem guten Verhältnis aus Brutto und Netto. So erreichen die getesteten Founders-Editionen der RTX 2070(S)/2080 alle gut 364 GByte/s, was einer Effizienz von 77 Prozent entspricht. Eine Radeon RX Vega 56 erzielt rund 74 Prozent Effizienz (ca. 325 von 410 GByte/s), eine Radeon RX 590 nur 61 Prozent (ca. 184 von 256 GByte/s). Sowohl die Radeon RX 5700 als auch die RX 5700 XT, beide mit dem gleichen Speichersubsystem ausgestattet, schleusen satte 388 GByte/s durch – das mit Abstand beste Ergebnis. Unter dem Strich steht eine Effizienz von über 84 Prozent. Selbstverständlich ist das nur ein einziger Test und keineswegs allgemeingültig, zeigt jedoch die Verbesserungen innerhalb der RDNA-Architektur.
…und pro Takt
Vergleiche mit fluktuierenden, unterschiedlichen Taktraten geben erste Anhaltspunkte, Benchmarks mit angeglichenen Frequenzen offenbaren die ganze Wahrheit. Bisher war dies zwischen Radeon und Geforce nicht direkt möglich, doch mit Navi ändert sich das. Neben dem Speichersubsystem ist nun auch die Anzahl der Rechenwerke auf gleichem Taktniveau direkt vergleichbar. Um der Pro-MHz-Leistung auf den Grund zu gehen, vergleichen wir jeweils zwei Modelle miteinander. Die Geforce RTX 2070 Super tritt gegen die Radeon RX 5700 XT an; beide rechnen mit 2.560 FP32-ALUs. Eine Stufe darunter rangieren die originale RTX 2070 und die RX 5700 mit je 2.304 ALUs. Die beiden letztgenannten Modelle testen wir mit reduzierter Taktrate, um auch Rückschlüsse auf die Taktskalierung respektive Abhängigkeit vom stets gleichen Speicherdurchsatz ziehen zu können. In beiden Tests mischt jeweils ein älteres Vergleichsobjekt mit: die Pascal-Geforce GTX 1080 mit 2.560 ALUs und die Polaris-Radeon RX 590 mit 2.304 ALUs. In beiden Fällen erreichen wir durch Übertaktung zwar die gleiche GPU-Rohleistung, nicht aber die hohe Speichertransferrate von Navi und Turing. Die Werte sind somit nettes Beiwerk, aber nicht einhundertprozentig vergleichbar. Vega bleibt aufgrund der grundverschiedenen Architekur komplett außen vor: Das am ehesten vergleichbare Modell RX Vega 56 rechnet mit 3.584 ALUs und nutzt High Bandwidth Memory anstelle von GDDR. Egal mit welchen Taktraten wir die Vergleiche anstellen, es wäre niemals wirklich vergleichbar. Somit landen wir bei den unten abgebildeten Daten und Ergebnissen.
Letztere sind hochinteressant, denn sie zeigen eindrücklich, dass AMD mit RDNA einen großen Satz nach vorn gemacht hat. Sie zeigen aber auch, dass es nach wie vor Hochs und Tiefs gibt, nicht jedes Spiel schmeckt jeder GPU-Architektur gleichermaßen gut. Wir haben bewusst „polarisierende“ Benchmarks mit neutralen Engines gemischt, um das ganze Ausmaß zu zeigen. Da wäre Supraland, das die weitverbreitete und stark von Nvidia unterstützte Unreal Engine 4 verwendet. Erwartungsgemäß kann Turing hier auftrumpfen, selbst der alte Pascal kann Navi hier ein Schnippchen schlagen. Das Duell AMD gegen AMD geht jedoch eindeutig zugunsten von AMD aus: Navi (RX 5700) ist pro Takt um satte 39 Prozent schneller als Polaris (RX 590). Letzterer sieht in allen Tests ziemlich alt aus, obwohl die getestete Karte mit 1.650/4.500 MHz den absoluten Bestfall für dieses Modell abbildet.
Interessant ist auch der Blick auf die AMD-Paradespiele in der aktuellen Spielelandschaft, Forza Horizon 4 und Battlefield 5. In beiden Fällen rangiert Navi im Pro-Takt-und-Einheiten-Test vor Turing. In Shadow of the Tomb Raider liegen die Architekturen in etwa auf Augenhöhe, was insofern bemerkenswert ist, als Nvidia dieses Spiel gerne im Kontext der Turing-Errungenschaften bewirbt. Damit sind nicht die optionalen Raytracing-Schatten gemeint, sondern der Instruktionsmix: Laut Nvidia gehört SotTR zur modernen Gattung Spiel, die viele Integer-Befehle unter die Gleitkomma-Operationen mischen. Turing beherbergt pro FP32- eine entsprechende INT32-Einheit und profitiert daher direkt von der Aufteilung. Navi fehlt diese Architekturfeinheit, doch offensichtlich bewältigen die neuen Dual Compute Units die anfallende Arbeit ausreichend schnell. Wie bei neuen Architekturen üblich, sind weitere Zugewinne im Laufe der Zeit mit neuen Treibern möglich.
Tessellation: Radeon und Geforce im Generationenvergleich
1x (keine) Tessellation
8x Tessellation
16x Tessellation
32x Tessellation
64x Tessellation
Die Idee hinter Tessellation ist, mit relativ geringen Polygonmengen zu arbeiten und dennoch die Qualität eines feineren Modells zu erhalten. Das wird durch die Zerlegung der vorhandenen Dreiecke erreicht, die seit Direct X 11 „auf“ der Grafikkarte vonstattengeht, aufwendige Transfers über den PCI-Express bleiben aus. Das Feature findet sich in vielen modernen Spielen, beispielsweise in Assassin’s Creed Odyssey, Battlefield 5 und Metro Exodus, wertet die Qualität aber nur punktuell auf.
Wichtig beim Einsatz von Tessellation ist der maßvolle Umgang. Wie die Grafiken oben zeigen, führen hohe Unterteilungsfaktoren zu enorm vielen winzig kleinen Polygonen. Die Bildschirmauflösung muss diese Detailflut abbilden können, sonst ist der Aufwand sprichwörtlich für die Katz’. Die Verläufe offenbaren, dass Tessellation nicht zu Navis Stärken gehört. Zwar zerlegt der Chip dank seines hohen Takts nahe 2 GHz geringe Faktoren schneller als jede andere Radeon-GPU, jenseits von 4x bricht die Leistung jedoch stärker ein als bei Vega und Polaris. Ab dem Unterteilungsfaktor 28 unterliegt die Radeon RX 5700 XT sogar ihren Vorgängern. Die gute Nachricht lautet, dass Faktoren jenseits von 16 in freier Wildbahn die Ausnahme darstellen, bis auf Techdemos und Showcases wie Crysis 2 kommt die maximale Stufe nicht zum Einsatz. Sobald sich das ändert, wird Navi bei bildfüllender Tessellation Federn lassen. Dann wäre es Zeit, den Unterteilungsfaktorbegrenzer in der Radeon-Software zu aktivieren.