Ta detta med en liten nypa salt då 5000-serien inte är ute än, baserat på senaste 5000-siffror jag hittade
GPU | RT TFLOPS | Tensor Core TOPS | CUDA Cores | Memory |
---|
RTX 5090 | 318 | 3,352 | 21,760 | 32 GB GDDR7 |
RTX 5080 | 171 | 1,801 | 10,752 | 16 GB GDDR7 |
RTX 4090 | 191 | 1,321 | 16,384 | 24 GB GDDR6X |
RTX 4080 | 113 | 780 | 9,728 | 16 GB GDDR6X |
RTX 3090 | 69 | 320 | 10,496 | 24 GB GDDR6X |
RTX 3080 | 58 | 238 | 8,704 | 10 GB GDDR6X |
Rätt uppenbart att fokus för Blackwell är tensor-kärnorna, där är gen-over-gen ökningen rätt mycket 2x kontra motsvarande CUDA-kärnorkapacitet.
Men även RT-kärnorna har fått ett lyft. Inte lika stort som mellan Ampere till Ada Lovelace, men rätt mycket ett lyft på ca 50 % kontra motsvarande CUDA-kärnorkapacitet.
Det som kan ge ett litet extra lyft i "raster-prestanda" över vad ser i antalet CUDA-kärnor är övergången till GDDR7. De fall som är begränsade av minnesbandbredd mer än "compute" kommer se lite extra boost även med samma antal CUDA-kärnor.
Och kan egentligen ovan förvåna någon? Hypen just nu är kring AI. Givet också att Nvidia faktiskt verkar gjort rejält förbättring av DLSS med övergång från CNN till visual transformer modell kommer ju tensor-kärnorna vara viktigare framåt.
Ska man tro Nvidia här verkar det som visual transformers må vara dyrare (kräver ca 4x mer "compute"), men de är en bättre match för vad tensorkärnorna är bra på vilket verkar vara orsaken att den modellen även kan användas på tidigare modeller (fast där kommer det kosta mer FPS relativt sett p.g.a. lägre tensor-kapacitet).
Blir spännande att se testerna. Förhandsvisningarna av visual transformers pekar ju på att det är en kraftig förbättring över det som verkar vara största kritiken mot DLSS: potentiell ghosting / smearing.
Glaset halvtomt: men raster då, jag bryr mig bara om raster!!!
Glaset halvfullt: Nvidia vet att deras största styrka är programvara, de fortsätter "work smarter, not harder" och det ser lovande ut