Möt generation Vega

När AMD lanserade generationen Polaris som låg till grund för Radeon RX 400- och 500-serierna baserades dessa på grafikarkitekturen Graphics Core Next (GCN) 4.0. Eftersom Vega är företagets nästa generations skapelse är det därför lätt att anta att namnet blir GCN 5.0, men så är inte fallet.

Namnet på arkitekturen är än så länge Vega kort och gott, även om detta av allt att döma inte är skrivet i sten och kan komma att ändras. De nya grafikkorten baseras på den första iterationen av Vega och kretsen kallas Vega 10. Kretsarna tillverkas på en 14-nanometers FinFET-process och innehåller 12,5 miljarder transistorer.

Vega_enhancements.jpg
HBM2.jpg
Vega_numbers.jpg
Vega10.jpg
Vega_Zen_SRAM.jpg

Enligt AMD har Vega 10 utvecklats för att kunna gå i väldigt höga klockfrekvenser. De färska modellerna i familjen Radeon RX Vega har basfrekvenser som håller sig strax över 1 200 MHz med turbohastigheter strax norr om 1 500 MHz. Vega 10 är designad för att nå hastigheter om 1 700 MHz, vilket är högt jämfört med AMD:s föregående generation men strax under Nvidias Pascal.

Den mest omtalade egenskapen hos Vega-generationen inför lanseringen har varit dess bruk av andra generationens HBM-minne. Det HBM2-minne som grafikkorten utrustas med ansluts över en minnesbuss på 2 048 bitar och en minneshastighet som varierar mellan 800 och 945 MHz. Detta ger en total bandbredd på maximalt 484 GB/s, vilket faktiskt är något lägre än de 512 GB/s som föregångaren Radeon R9 Fury X mäktar med.

HBM2-minnet kan dock hantera felkorrigering i form av ECC-stöd. Enligt AMD ska implementationen av HBM2 i Vega dessutom erbjuda dubbelt så hög bandbredd per kontaktstift jämfört med första generationens HBM-minne, och åtta gånger så hög densitet per minnes-stapel. Jämfört med GDDR5 ska HBM2-minnet vara 3,5 gånger mer energieffektivt och upptar 25 procent av motsvarande kretsyta.

Att minnet är utrustat med ECC-stöd skvallrar om en allmän strategisk satsning inom AMD, nämligen att tekniken ska delas mellan produktkategorier och produktsegment. Detta illustreras främst av att kretsarna i Vega-arkitekturen vävs samman och synkroniseras av tekniken Infinity Fabric som även används i företagets Ryzen-processorer.

Ingenjörerna inom AMD:s Radeon-grupp har även tagit hjälp av det arbete som processordivisionen gjort med Zen-arkitekturen, vilket har lett till att de totala 45 MB SRAM-minne som Vega-arkitekturen är utrustad med i olika cache-nivåer har skräddarsytts så att det upptar mindre kretsutrymme, drar mindre ström och har lägre latens i kommunikationen.

Fokus på bildsynkronisering

Centralt i AMD:s presentation av Vega-familjen är även förbättringarna runt bildsynkronisering via Freesync 2. Dessa består dels i nya kapaciteter i Vega, och dels nya funktioner i mjukvaran. Sett till hårdvarufunktionerna introduceras stöd för bland annat Multi-Stream Transport (MST) och Displayport High Bit Rate 3 (HBR3).

Display_Engine.jpg
Vega_features_Wolf2.jpg
Enhancedsync_latens.jpg

MST är en del av Displayport-standarden som gör det möjligt att ansluta till ett flertal externa skärmar via en enda Displayport-kabel. Detta ger Vega-baserade grafikkort möjligheten att ansluta till fler skärmar över en port. HBR3 är en teknik som introducerades med Displayport 1.3 och ökar den maximala bandbredden över en Displayport-anslutning.

Med stöd för MST och HBR3 får Vega-korten bättre stöd för höga upplösningar, snabb bilduppdatering och tekniker som HDR med anslutna skärmar. I praktiken innebär det bland annat att Vega-korten stöder tre samtidigt anslutna 5K-skärmar med 60 Hz bildfrekvens över en kabel, jämfört med Polaris som stöder en ensam 5K-skärm i samma läge.

Om HDR-stöd ska aktiveras klarar Vega anslutning av tre 4K-skärmar med 60 Hz bildfrekvens och HDR-stöd med 64-bitars pixelformat. Över HDMI 2.0b stöds anslutning av 4K-skärmar i 60 Hz och 12-bitars stöd för HDR, detta med videokodning enligt formatet 4:2:0. Både Displayport och HDMI-anslutningar stöder HDCP 2.2 och Freesync.

Utöver Vega-arkitekturens förbättrade stöd för bildsynkronisering via Freesync 2 syns även förbättringar för användare som inte äger Freesync-utrustade skärmar. Detta i form av en teknik vid namn Enhanced Sync som introducerades som en del av Radeon-mjukvaran Relive i slutet av 2016.

Freesync_1440p.jpg
Freesync_4K.jpg
RTD.jpg

Enhanced Sync används för att minska latensen i bilduppdateringen och kan ses som en mer dynamisk version av V-Sync. Enhanced Sync fungerar på så sätt att bildsynkroniseringen är olåst så länge som bilduppdateringen håller sig över skärmens högsta uppdateringstakt, och nästa bild visas alltid så fort den är redo. Detta liknar till stor del en klassisk trippelbuffer-lösning och minskar latensen jämfört med när en traditionell lösning för V-Sync är aktiverad.

Om bilduppdateringen sjunker under skärmens normaluppdatering aktiveras en dynamisk lösning för V-Sync där funktionen stängs av om bilduppdateringen sjunker för lågt. I dessa lägen uppstår risken för tearing, där de renderade bildrutorna inte matchar upp med skärmens uppdateringsfrekvens. Detta minskar också latensen som inträffar när bildrutor ska repeteras i V-Sync. Enhanced Sync är ett svar på Nvidias lösning Fast Sync som erbjuder samma funktion i Pascal-arkitekturen.

AMD:s egna uppgifter för Enhanced Sync anger att spel som DOTA 2 kan få upp till 68 procent lägre latens i bilduppdateringen jämfört med när traditionell V-Sync är aktiverad. Andra spel som Doom och Overwatch uppges kunna nå 45 respektive 44 procent lägre latens. Jämfört med att stänga av V-Sync helt uppges Enhanced Sync tillföra marginellt högre latens.

Till sist några ord om parallellkopplade grafikkort. Under presentationen av Radeon RX Vega-familjen nämndes inte tekniken Crossfire en enda gång, och i samtal med SweClockers har AMD:s representanter bekräftat att tekniken inte är ett fokus för industrin framöver. Anledningen anges vara att den inte utnyttjas effektivt av utvecklare.

Vega och grafikkort från konkurrenten Nvidia hanterar fortfarande parallella grafikkort, men stödet överlåts åt funktionen Multi-GPU i grafikramverk som DirectX 12, Vulkan, Metal, med flera. Förbättringar med flera grafikkort behöver alltså ske i dessa utvecklargränssnitt, inte hos företagen bakom grafikkorten.

Energisnålare drift

Ett problem med senaste generationernas Radeon-arkitekturer är att de varit förhållandevis energitörstiga i förhållande till hur mycket prestanda de erbjuder. Nvidia lyckades skapa ett försprång med avseende på energieffektivtet med Maxwell, ett försprång som bara ökade med uppföljaren Pascal.

Med Vega lyfter AMD fram att en hel del arbete gjorts för att råda bot på detta. Ett steg i denna process har varit att bygga in en ny kontrollkrets för energihantering. Denna är direkt ansluten till Infinity Fabric som sköter kommunikationen mellan kretsarna och grafikminnet och kan anpassa hastigheterna för att spara energi.

Energi_mikrokontroller.jpg
Energi_profiler.jpg
Energi_prestanda_watt.jpg
Energi_chillpill.jpg

Utöver detta har kretsarna ett sekundärt läge för grafikkretsens klockhastighet som är ett statiskt läge för låg energidrift. Denna paras med ett ultralågt frekvensläge för HBM2-minnet vilket tillsammans ska innebära att Vega-kretsar drar betydligt mindre energi under mindre krävande situationer eller i situationer där arbetsuppgiften kan avlastas effektivt av dedikerade hårdvaruenheter.

De arkitektoniska förbättringarna arbetar i tandem med mjukvaran, där den sedan tidigare tillgängliga mjukvarufunktionen Radeon Chill uppges vara upp till 76 procent mer energieffektiv än när funktionen är avstängd. AMD jämför dock inte dessa besparingar med vad konkurrenten Nvidias Pascal-baserade kort mäktar med.

Användaren kan själv välja vilket förhållande mellan prestanda och energieffektivitet som är önskvärt via Radeon Relive-mjukvaran, mer specifikt i Wattman-sektionen. Här finns tre lägen för kortens två VBIOS-lägen, det primära och sekundära. Det primära energisparläget uppges dra 75 procent av normallägets energikonsumtion medan prestandaläget uppges dra 115 procent.

I det sekundära läget uppges energisparläget dra 68 procent av normalläget som i sig drar 90 procent av normalläget i det primära energiläget, och prestandaläget drar 105 procent av det primära lägets normalläge. Som referens uppges det sekundära läget kunna erbjuda 38 procent bättre energieffektivitet i Tom Clancy's Ghost Recon Wildlands.