Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Det stormar kring den mystiska minneshanteringen i storsäljaren Geforce GTX 970. Nu tar Nvidia bladet från munnen och förklarar hur det hela hänger ihop.

Den som surfat SweClockers i helgen har förmodligen inte missat alla inflammerade diskussioner om Geforce GTX 970. Det populära grafikkortet innehåller en nedskalad variant av kretsen GM204, som av en hitintills oklar anledning delar upp det 4 GB stora videominnet i två segment om 3,5 och 0,5 GB. Vad kontroversen handlar om är att den mindre biten dras med betydligt lägre bandbredd än normalt.

unnamed.jpg

Nvidia korrigerar* specifikationerna för Geforce GTX 970

GTX 980

GTX 970 (äldre)

GTX 970 (nytt)

Teknik

28 nm

28 nm

28 nm

GPU

GM204

GM204

GM204

Transistorer

5,2 md

5,2 md

5,2 md

Kretsarea 398 mm2

398 mm2

398 mm2

398 mm2

Arkitektur

Maxwell

Maxwell

Maxwell

CUDA-kärnor

2 048 st.

1 664 st.

1 664 st.

Texturenheter

128 st.

128 st.

128 st.

Rasterenheter

64 st.

64 st.

56 st.

Basfrekvens

1 126 MHz

1 050 MHz

1 050 MHz

Turbofrekvens

1 216 MHz

1 178 MHz

1 178 MHz

L2-cacheminne

2 MB

2 MB

1,75 MB

Minnesbuss

256-bit

256-bit

256-bit

Minnesmängd

4 GB GDDR5

4 GB GDDR5

4 GB GDDR5

Minnesfrekvens

7 000 MHz

7 000 MHz

7 000 MHz

Minnesbandbredd

224 GB/s

224 GB/s

224 GB/s (?)

Strömförsörjning

6+6-pin

6+6-pin

6+6-pin

TDP

165 W

148 W

148 W

Efter det första officiella uttalandet ger Nvidia en mer djuplodad förklaring till fenomenet. Tvärtemot många teorier är beteendet inte direkt relaterat till att Geforce GTX 970 saknar tre så kallade SMM-kluster jämfört med storebror GTX 980. Grafikkretsen är nämligen uppdelad i två sektioner, där kommunikationen hanteras av vad Nvidia kallar för en crossbar eller tvärbalk.

I diagrammets övre del syns CUDA-kärnor i SMM-kluster, samtidigt som videominneshantering och L2-cacheminne huserar på den andra sidan tvärbalken. Enligt Nvidia ger det bland annat flexibilitet för att hantera delvis defekta kretsar, där olika delar kan inaktiveras oberoende av varandra utan att kommunikationen påverkas.

Nedbantad GM204 påverkar minnesbandbredden

Nytt för generation Maxwell är att inte bara beräkningskluster kan inaktiveras vid behov utan även delar av logiken för minneshanteringen, något som för Kepler krävde att hela sektionen skrotades. I praktiken innebär det att Geforce GTX 970 saknar en uppsättning L2-cache samt tillhörande anslutning mot tvärbalken jämfört med storebror GTX 980.

två olika sektioner minne

I korthet är resultatet att en ensam port med tillhörande logik blir ansvarig för att hantera två minneskanaler, något som i princip kan halvera prestandan. Nvidias lösning på problemet är att segmentera videominnet i två sektioner, där 3,5 GB alltid är tillgängligt medan återstående 0,5 GB endast används vid behov.

Den 3,5 GB stora sektionen av videominnet får tillgång till 7 minneskanaler, vilket i stora drag ger 7/8-delar av bandbredden i jämförelse med Geforce GTX 980. Det sista segmentet får dock endast tillgång till 1/8-del av den maximala bandbredden.

Hanteringen av segmenten, eller rättare sagt optimeringen, sköts i Nvidias drivrutin och i operativsystemet. Mjukvaran försöker aktivt och så långt det är möjligt använda den snabbare 3,5 GB stora sektionen. När mer utrymme behövs för en ensam operation utnyttjas de sista 0,5 GB, vilket fortfarande är snabbare än att exempelvis arbeta mot primärminnet.

Nvidia hävdar att effekten av det hela i de flesta fall är en minimal prestandaförlust i jämförelse med om allt videominnet alltid arbetat vid full hastighet. Grafikkortsmakaren lovar dock att undersöka alla problem som inrapporterats av oroliga användare och eventuellt göra ytterligare optimeringar av minneshanteringen i drivrutinerna.

* För att återspegla minneshanteringen i Geforce GTX 970 uppdaterar Nvidia även grafikkortets specifikationer, där antalet rasterenheter nu uppgår till 56 stycken medan L2-cachen minskar till 1,75 MB.

Kommentarer till artikeln

675 debattinlägg

Skicka en rättelse
23

Test: AOC Agon AG352UCG – ultrabred spelskärm med 100 Hz VA-panel och G-Sync

AOC:s senaste gamingskärm Agon AG352UCG passerar testlabbet, med en upplösning på 3 440 × 1 440 pixlar, Nvidia G-sync och 100 Hz uppdateringsfrekvens. Läs mer

22

Nvidia kontrar Radeon RX 550 med "GP108" och Geforce GT 1030

Det blåser upp till storm i instegssegmentet när Nvidia söker att kontra AMD Radeon RX 550 med Geforce GT 1030, som samtidigt ska ha lägre strömförbrukning. Läs mer

11

Razer tillkännager den trådlösa spelmusen Lancehead

Amerikanska Razer siktar på tronen för bästa trådlösa spelmus och med den senaste skapelsen Lancehead, som dessutom får en trådad syskonmodell. Läs mer

14

Cooler Master döms för patentintrång – får betala 5,3 miljoner kronor till Asetek

Efter lite mindre än två år är rättstvisten mellan Asetek och Cooler Master avslutad, där Cooler Master döms att betala böter i miljonklassen för patentintrång. Läs mer

11

Intel LGA 2066 för Skylake-X har samma kylarmontering som sockel LGA 2011-3

Det vankas ny sockel till Intels Skylake-X med upp till tolv kärnor och Kaby Lake-X. Den som planerar uppgradera slipper dock köpa ny kylare, det bekräftar Noctua. Läs mer

21

Nintendo tillkännager New 2DS XL

I ett något oväntat drag tillkännager Nintendo spelkonsolen New 2DS XL, en kraftfullare uppdaterad version av fyra år gamla 2DS med ny design. Läs mer

56

Acer avtäcker Predator X27 med 4K UHD i 144 Hz, Nvidia G-Sync och HDR

Taiwanesiska Acer går "all-in" med skärmen Predator X27, som utöver 4K-upplösning och 144 Hz fylls till brädden med andra funktioner som Nvidia G-Sync och HDR. Läs mer

56

Teknikdemo visar Project Scorpios potential i 4K UHD och 1080p

Nya bilder visar hur Microsofts kommande konsol ska förbättra den grafiska upplevelsen i både 4K- och 1080p, med bland annat större texturer och supersampling-teknik. Läs mer

5

Fulkultur om Marvel i film och TV-serier

Fulkultur återvänder till att prata om Marvel och deras superhjältar, men denna gång flyttas fokus från serietidningar till vita duken. Läs mer

19

Kom på din egen shoppingfest och vinn bärbar speldator från CDON

CDON drar åter igång sin shoppingfest Green Friday, där de utlovar erbjudanden i nivå med Black Friday. För att fira tävlar återförsäljaren ut en bärbar speldator värd 15 490 kronor. Läs mer

21

Nintendo sålde 2,7 miljoner Switch-enheter under första månaden

Spelkonsoltillverkaren Nintendo presenterar sin första kvartalsrapport för år 2017, av vilken det framgår att företaget sålt totalt 2,74 miljoner Switch-enheter under mars månad. Läs mer

45

Call of Duty: WWII avtäckt

Trenden trogen tillkännager Activision den senaste delen i spelserien Call of Duty, vilken blir den första på många år som utspelar sig under andra världskriget. Läs mer