Hawaii: Nya Graphics Core Next

Grafikprocessorn Hawaii står till grund för det nya flaggskeppet Radeon R9 290X och baseras likt andra grafikkort i Radeon 200-serien på arkitekturen Graphics Core Next (GCN), dock med vissa mindre förändringar. En av dessa är fullt stöd för DirectX 11.2 och Tiled Resources.

GCN_R9_290X_1.jpg
GCN_R9_290X_2.jpg
GCN_R9_290X_3.jpg
GCN_R9_290X_4.jpg
GCN_R9_290X_5.jpg
GCN_R9_290X_6.jpg
GCN_R9_290X_9.jpg

Den övergripande strukturen för beräkningsenheterna består och innehåller fyra texturenheter samt 64 streamprocessorer. Med 44 beräkningsenheter i Hawaii resulterar det i inget mindre än 2 816 streamprocessorer och 176 texturenheter. Den största skillnaden är att Hawaii dubblerar antalet rasterenheter (ROP) och geometrienheter till 64 respektive fyra stycken, vilket fördubblar prestandan vid tesselering samt fillrate (pixlar per sekund).

GCN_R9_290X_7.jpg

Till detta hör en 512-bitars minnesbuss, som trots dess bredd ska vara 20 procent mindre än 384-bitars minnesbussen i grafikprocessorn Tahiti. Det är en del i att AMD optimerat kretsen för att ta upp mindre yta. Antalet transistorer uppgår till hela 6,2 miljarder på 438 mm2, vilket kan jämföras mot 4,3 miljarder respektive 353 mm2 för Tahiti.

Förutom att AMD skruvat upp antalet tillgängliga resurser ska Hawaii även ha högre prestanda per watt. Detta genom en rad optimeringar, men framförallt att geometrienheterna kan utföra fler uträkningar utan att behöva flytta data mellan grafikprocessorn och GDDR5-minnet.

GCN_R9_290X_8.jpg

Sammantaget rör det sig fortfarande om arkitekturen Graphics Core Next med optimeringar för högre energieffektivitet och fler resurser, som framförallt ska gynna höga upplösningar. AMD ser en framtid bortom 2 560 x 1 600 pixlar och hävdar att priskrig inom 4K-skärmarnas värld är i antågande redan nästa år. Här ska den breda minnesbussen och möjligheten att skyffla det dubbla antalet pixlar komma väl till pass.

Powertune och dynamisk klockfrekvens

Med grafikkretsen Hawaii vinkar AMD adjö till fasta klockfrekvenser. Företaget menar att mycket potentiell prestanda går till spillo med tidigare grafikkort och väljer därför att gå över till dynamiska klockfrekvenser. I teorin möjliggör det AMD att pressa ur så mycket prestanda som möjligt inom en given strömbudget.

Powertune_1.jpg
Powertune_2.jpg
Powertune_3.jpg
Powertune_4.jpg
Powertune_5.jpg
Powertune_6.jpg
Powertune_7.jpg
Powertune_8.jpg
Powertune_9.jpg
Powertune_10.jpg
Powertune_11.jpg
Powertune_12.jpg
Powertune_13.jpg
Powertune_14.jpg
Powertune_15.jpg

Medan flera rykten talar för att Radeon R9 290X har en basfrekvens på 800 MHz hävdar AMD att en sådan inte existerar, utan specificerar endast klockfrekvensen "upp till 1 000 MHz". Grafikkretsen reglerar klockfrekvensen till ett så högt värde som möjligt, under förutsättning att det inte överstiger antingen det förutbestämda värdet för strömförbrukning eller den maximala temperaturen, som i fallet Radeon R9 290X är specificerat till 95 grader.

I och med att det saknas en fast klockfrekvens hävdar AMD att traditionell överklockning inte längre är logiskt, istället justeras klockfrekvensen i antalet procent. En överklockning på 10 procent motsvarar således en klockfrekvens på "upp till 1 100 MHz" vid drift.

Viktigt att påpeka är att även de andra parametrarna behöver justeras för att överklockning ska göra någon skillnad i praktiken. Medan temperaturvärdet som standard är inställt på maximala 95 grader går den maximala strömförbrukningen eller Power Limit att justera uppåt. Eftersom klockfrekvensen begränsas när grafikkretsen slår i sitt termiska tak, kan ett även ett högre varvtal på fläkten hjälpa för att öka prestandan ytterligare vid överklockning.

XDMA – Crossfire utan kablar

Sedan urminnes tider har Crossfire och Nvidias motsvarighet SLI använt kablar för att få flera grafikkort att kommunicera med varandra. Undantaget har varit vissa grafikkort i det lägre segmentet, som klarat av att kommunicera via PCI Express.

GCN_R9_290X_10.jpg
GCN_R9_290X_11.jpg

Med Hawaii och även Bonaire, som används i Radeon R7 260X och HD 7790, övergår AMD till en helt ny teknik kallad Crossfire Direct Memory Access (XDMA), som tar bort Crossfire-kabeln ur ekvationen. Medan den generella uppfattning är att bandbredden i PCI Express inte räcker till för kommunikation mellan flera högpresterande grafikkort, säger AMD att så inte är fallet:

XDMA has been confirmed to deliver full performance down to configurations of Gen2 x8 with 4 GPUs in a system. As such, PCIe bandwidth should not be a limiting factor in any relevant situations.

Enligt företagets interna tester levererar fyra grafikkort full prestanda även när varje är begränsat till PCI Express 2.0 x8. AMD hävdar att den nya lösningen rentutav ska leverera högre bandbredd än med kablar mellan grafikkorten, med direkt resultat att skalningen i Crossfire ska bli bättre.

amd_r9_290x-3.jpg

En annan fördel är att AMD tacklat problemet med ojämna renderingstider genom funktionen Frame Pacing. Det kommer dock med restriktionen att det inte fungerar i upplösningar över 2 560 x 1 600 pixlar, men med Crossfire-tekniken XDMA finns ingen sådan begränsning och fungerar således i 4K-upplösning.

Samtidigt berättar AMD att Frame Pacing i höga upplösningar även kommer fungera med grafikkort som Radeon R9 270X och R9 280X i samband med en framtida uppdatering av drivrutinerna. XDMA medför därför ingen direkt fördel i dagsläget, men ska däremot vara mer framtidssäkert.