Die nächste RTX 40 ist doppelt so schnell wie die RTX 30?


Dies ist heute ein Gerücht über kommende Nvidia-Karten. Diese neuen Lecks kommen von kopte7kimi Und sprechen Sie über das schematische Diagramm der Struktur der neuen Generation von Grüns. Bild eines Dateiblockdiagramms AD102 „Ada Lovelace“-GPU Es wird uns erlauben, uns auf die Leistung der kommenden RTX 40 zu stürzen.

RTX 40: Ein tolles Datenblatt (falls wahr)

Für den Anfang, die GPU Ada Lovelace AD102 Es wird bis zu 12 GPCs (Graphics Processing Clusters) beherbergen. Dies ist eine Steigerung von 70 % in GA102 (größer als der aktuelle Bereich), der nur 7 GPC enthält. Jede GPU wird aus 6 TPCs und 2 SMs bestehen, was der gleichen Konfiguration wie der aktuelle Chip entspricht. Jeder SM (Multiprocessor Stream) wird vier Unterkerne haben, was auch der GA102-GPU entspricht. Die eigentliche Änderung ist die FP32- und INT32-Kernelkonfiguration. Jedes Unterzentrum wird aus 128 FP32-Einheiten bestehen, aber die kombinierten FP32 + INT32-Einheiten werden auf 192 Einheiten ansteigen. Dies liegt daran, dass die FP32-Module nicht dasselbe Subzentrum wie die IN32-Module teilen. 128 FP32-Kerne werden von 64 INT32-Kernen getrennt.

RTX 40 Schaltplan
Ein schematisches Bild der RTX 40 GPU von Kopte7kimi

Der Cache dürfte ein weiterer Bereich sein, in dem NVIDIA bestehenden Ampere-GPUs entwachsen ist. Ada Lovelace-GPUs werden 192 KB L1-Cache pro SM haben, eine Steigerung von 50 % gegenüber Ampere. Dies beläuft sich auf insgesamt 4,5 MB L1-Cache auf der AD102-GPU der Spitzenklasse. Der L2-Cache wird auf 96 MB erhöht, eine Zahl, die regelmäßig in mehreren Leaks genannt wird. Das ist fast 16-mal mehr im Vergleich zur Ampere-GPU, die nur 6 MB L2-Cache hostet. Der Cache wird auf der GPU geteilt.

Wenn die Leaks korrekt sind, haben wir einen exponentiellen Anstieg des L2-Cache, der sich auf einen Gesamtwert erhöht 96MB mir‘ M102 . In Bezug auf ROPs hätte es in dieser Architektur doppelt so viele Module geben können, 32 von GPC Um genau zu sein, geben Sie uns eine Summe 384 OME Für einen potenziellen RTX 4090 gegenüber 112 für einen RTX 3090 … auf dem Papier ist es brutal.

Siehe auch  Computex - Intel stellt zwei neue mobile Prozessoren vor, NUC- und 5G-Integrationen
RTX 40. Vergleich
Vergleich der Eigenschaften der Grafikverarbeitungseinheit. Der AD102 wird die Spitze der RTX 40-Reihe sein

Aber welche Gewinne können wir nach dieser Orgie technischer Daten wirklich erwarten?

Natürlich ist es noch zu früh, um eine genaue Vorstellung zu bekommen, aber wenn sich diese bestätigen, zeigt das technische Datenblatt einen großen Unterschied im Vergleich zum Ampere. Zusammenfassen:

  • X2 GPC (im Vergleich zu Verstärkern)
  • 50 % mehr Kerne (im Vergleich zu Verstärkern)
  • 50 % mehr L1-Cache (im Vergleich zu Verstärkern)
  • 16-mal so viel L2-Cache (im Vergleich zu Verstärkern)
  • X2 ROP (im Vergleich zu Verstärkern)
  • Motor der 4. Generation und 3 Kerne RT

Aber was können wir in Bezug auf die tatsächliche Leistung erwarten?

Es ist sehr schwierig, weil uns ein Schlüsselelement fehlt: die Betriebsfrequenz.

Wenn wir ein wenig darüber spekulieren, können wir uns eine Stärke im FP32 vorstellen 90 TFLOPS, mehr als das Doppelte des aktuellen GA102. Aber mit TFLOPS können wir auch Überraschungen erleben. Wenn sie eine Vorstellung von der rohen Leistung geben, werden sie niemals eine Voreinschätzung der Ergebnisse im „alltäglichen“ Gebrauch zulassen. Durchgesickerte Anzeigen von x2 bis x2.2 im Vergleich zum RTX 30 … Es wird offensichtlich Gewinne geben, und sie scheinen groß zu sein. Aber um als nächstes eine Entscheidung zu treffen, müssen wir noch etwas warten.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.