DLSS 4

Jämte en ny generation grafikkort är det på sin plats att en nya generation DLSS gör den sällskap. Med DLSS 4 är det fullt fokus på att förbättra tidigare beståndsdelar utöver den nya funktionen Multi Frame Generation.

Screenshot 2025-01-07 052507.png

Single Frame Generation får förbättrad prestanda och lägre minneskostnad, Ray Reconstruction får högre temporal stabilitet i bilden vilket ska reducera artefakter samtidigt som Super Resolution och DLAA ska bli bättre på att hantera bild i rörelse. Den stora nyheten med DLSS 4 är dock den RTX 5000-exklusiva funktionen Multi Frame Generation.

Screenshot 2025-01-07 053246.png
Screenshot 2025-01-07 053239.png
Screenshot 2025-01-07 053231.png

Med en ny modell för bildruteinterpolering via Frame Generation uppges processen vara 40 procent snabbare med 30 procent lägre minneskostnad vilket gör det möjligt att generera upp till tre stycken bildrutor för varje renderad och uppskalad bildruta.

nvidia-dlss-4-multi-frame-generation-architecture.jpg

Det är dock en funktion som sätter stora krav på hårdvaran för att fungera tillfredsställande vilket är anledning att just Multi Frame Generation vid lansering enbart fungerar på Geforce RTX 5000-serien. Övriga förbättringar på de andra funktionerna kommer dock att fungera på tidigare modeller.

Tidigare versionen av Frame Generation nyttjade processorbaserad pacing med de varianser som uppstår ackumuleras dessa vilket kan leda till ett lägre upplevt flyt i bilden. Med Blackwell flyttas detta till hårdvaran i bildskärmskontrollen via Flip Metering som låter grafikkretsen ha större kontroll över takten i när en bildruta visas. Kortfattat leder detta till ett bättre flyt i bilden när Frame Generation används.

Screenshot 2025-01-07 053019.png

Med DLSS 4 går Nvidia över till transformator-baserad modell efter att historiskt ha använt Convolutional Neural Network (CNN) eller faltningsnätverk. Enligt Nvidia har de tidigare CNN-baserade modellerna fungerat genom att beräkna vad bildrutan skall fyllas med genom att titta på små lokala områden och förändringar i de specifika områdena över flera bildutor.

Den nya transformatorbaserade modellen skall vara bättre på att förstå varje pixels relativa vikt i förhållande till hela bildrutan samt över flera bildutor. Detta uppges vara en av nycklarna till förbättringarna i bildkvalitet.

Bildkvalitet med DLSS 4

Börjar vi med en snabb jämförelse mellan den nya Transformer-modellen och den tidigare CNN-modellen går det att notera flertalet skillnader som blir påtagliga i rörelse. I exemplet ovan blir det framförallt påtagligt i precisionen i karaktärens hår. Notera även skillnaden i textur på läppstiftet samt runt nyckelbenen.

Misty-dlss4.png

DLSS 4 Transformer model

Misty-dlss3.png

DLSS 3 CNN Model

Misty-FSR3.jpg

FSR 3

Misty-DLSS-3-4-FSR-Split.png

Vid stillbild blir det än mer påtagligt att en del av "oljemålningseffekten" försvinner från huden och den blir betydligt mycker mer stabil.

Misty-klader-dlss4.png

DLSS 4 Transformer model

Misty-klader-dlss3.png

DLSS 3 CNN Model

Tittar vi på detaljer i kläderna är det en stor skillnad i skärpa på detaljerna längs ärmarna på tröjan. Materialet ser betydligt mer realistiskt ut och mer av texturen framgår.

Vänder vi blicken mot Hogwarts Legacy framgår det väldigt tydligt när den nyare DLSS-varianten används. Tittar vi på reflektionen i golvet är det en stor skillnad i temporal stabilitet och artefakterna är nästan helt bortblåsta.

Prestandatester med uppskalning

När vi mäter prestandan med bildruteinterpolering via Frame Generation finns det fler aspekter att ha i åtanke än enbart FPS.

Uppskalning och interpolering via DLSS har en kostnad i beräkningstid vilket innebär ökade latenser för dig som användare. För att minimera känslas av "sirapskontroller" är det därför inte rekommenderat att använda interpolering om bildfrekvensen du interpolerar från är för låg. Om du från början uppnår minst 60 FPS brukar Frame Generation generellt sett fungera bra utan någon större försämring i upplevelse.

components-end-to-end-system-latency.png

Via Nvidias Frameview går det att mäta PC Latency som är den metod vi valt för att kvantifiera latenserna.

I Cyberpunk mäter vi en slinga på 55 sekunder i området Kabuki i spelet. Grafikinställningarna är uppskruvade till Ray Tracing Overdrive. Vi testar Geforce RTX 5090 och 5080 dels med Multi Frame Gen ×4 samt den vanliga Frame Gen funktionen i DLSS. Därtill är det testat med enbart uppskalning via Super Resolution samt ett worst case-scenario utan uppskalning men med Multi Frame Gen aktiverat.

Prestandatest i 3 840 × 2 160 pixlar

Börjar vi med att kika på hur RTX 5080 presterar i detta väldigt krävande scenario utan Frame Gen aktiverat är bildfrekvensen strax under 60 FPS vilket jag får anse som brukbar trots att den absolut skulle kunna få vara högre. Slår vi på "vanlig" Frame Gen ovanpå detta blir bildfrekvensen betydligt trevligare och landar strax norr om 100 FPS. Här ökar latensen med ungefär 25 procent vilket är acceptabelt i den här typen av spel i min egen mening. När Multi Frame Gen aktiveras ökar bildfrkevensen ytterligare till 183 FPS. I utbyte mot en ökning i bildfrekvens med 200 procent kostar det oss en ökning i latens med 40 procent. Ökningen i latens märks en aning men jag skulle vilja påstå att den till stor del mitigeras av ökningen i FPS.

Slutsatsen är dock att vi i 4K med Path tracing börjar närma oss gränsen för vad skulle benämna som ett optimalt scenario för RTX 5080 även med Frame Gen aktiverat. För att få en bättre bildfrekvens att interpolera nya bildrutor från behöver vi därför antingen sänka våra grafikinställningar eller vår upplösning. Eftersom jag inte vill tumma på ray tracing-ögongodiset väljer jag därför att kliva ned till 1440p och DLSS Quality.

Prestandatest i 2 560 × 1 440 pixlar

I 1440p får vi det betydligt trevligare vad kommer till både uppmätt och upplevd latens. 34 procent ökning i latens kostar ett uppsving med 215 procent i bildfrekvens. Detta är återigen en avvägning som är högst subjektiv men i kombinatikon med tillexempel en 240 Hz 1440p-skärm är detta en avvägning som i min egen mening är klart värd det. Multi Frame Gen är en väldigt komplicerad funktion att bedöma. När den gör sitt jobb och förutsättningarna är rätt är den i min mening en transformativ funktion.

Däremot kan den under fel förutsättningar bli ett sänke alternativt tvinga dig till väldigt många kompromisser. Spelar du med handkontroll i soffan är kanske inte ökningen i latens kännbar på samma sätt som när du spelar med mus och tangentbord. Den är inget magiskt trollspö men med lite eftertanke i hur du använder den och en medvetenhet kring bristerna kan den vara ett väldigt kraftfullt verktyg.