Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Det stormar kring den mystiska minneshanteringen i storsäljaren Geforce GTX 970. Nu tar Nvidia bladet från munnen och förklarar hur det hela hänger ihop.

Den som surfat SweClockers i helgen har förmodligen inte missat alla inflammerade diskussioner om Geforce GTX 970. Det populära grafikkortet innehåller en nedskalad variant av kretsen GM204, som av en hitintills oklar anledning delar upp det 4 GB stora videominnet i två segment om 3,5 och 0,5 GB. Vad kontroversen handlar om är att den mindre biten dras med betydligt lägre bandbredd än normalt.

unnamed.jpg

Nvidia korrigerar* specifikationerna för Geforce GTX 970

GTX 980

GTX 970 (äldre)

GTX 970 (nytt)

Teknik

28 nm

28 nm

28 nm

GPU

GM204

GM204

GM204

Transistorer

5,2 md

5,2 md

5,2 md

Kretsarea 398 mm2

398 mm2

398 mm2

398 mm2

Arkitektur

Maxwell

Maxwell

Maxwell

CUDA-kärnor

2 048 st.

1 664 st.

1 664 st.

Texturenheter

128 st.

128 st.

128 st.

Rasterenheter

64 st.

64 st.

56 st.

Basfrekvens

1 126 MHz

1 050 MHz

1 050 MHz

Turbofrekvens

1 216 MHz

1 178 MHz

1 178 MHz

L2-cacheminne

2 MB

2 MB

1,75 MB

Minnesbuss

256-bit

256-bit

256-bit

Minnesmängd

4 GB GDDR5

4 GB GDDR5

4 GB GDDR5

Minnesfrekvens

7 000 MHz

7 000 MHz

7 000 MHz

Minnesbandbredd

224 GB/s

224 GB/s

224 GB/s (?)

Strömförsörjning

6+6-pin

6+6-pin

6+6-pin

TDP

165 W

148 W

148 W

Efter det första officiella uttalandet ger Nvidia en mer djuplodad förklaring till fenomenet. Tvärtemot många teorier är beteendet inte direkt relaterat till att Geforce GTX 970 saknar tre så kallade SMM-kluster jämfört med storebror GTX 980. Grafikkretsen är nämligen uppdelad i två sektioner, där kommunikationen hanteras av vad Nvidia kallar för en crossbar eller tvärbalk.

I diagrammets övre del syns CUDA-kärnor i SMM-kluster, samtidigt som videominneshantering och L2-cacheminne huserar på den andra sidan tvärbalken. Enligt Nvidia ger det bland annat flexibilitet för att hantera delvis defekta kretsar, där olika delar kan inaktiveras oberoende av varandra utan att kommunikationen påverkas.

Nedbantad GM204 påverkar minnesbandbredden

Nytt för generation Maxwell är att inte bara beräkningskluster kan inaktiveras vid behov utan även delar av logiken för minneshanteringen, något som för Kepler krävde att hela sektionen skrotades. I praktiken innebär det att Geforce GTX 970 saknar en uppsättning L2-cache samt tillhörande anslutning mot tvärbalken jämfört med storebror GTX 980.

två olika sektioner minne

I korthet är resultatet att en ensam port med tillhörande logik blir ansvarig för att hantera två minneskanaler, något som i princip kan halvera prestandan. Nvidias lösning på problemet är att segmentera videominnet i två sektioner, där 3,5 GB alltid är tillgängligt medan återstående 0,5 GB endast används vid behov.

Den 3,5 GB stora sektionen av videominnet får tillgång till 7 minneskanaler, vilket i stora drag ger 7/8-delar av bandbredden i jämförelse med Geforce GTX 980. Det sista segmentet får dock endast tillgång till 1/8-del av den maximala bandbredden.

Hanteringen av segmenten, eller rättare sagt optimeringen, sköts i Nvidias drivrutin och i operativsystemet. Mjukvaran försöker aktivt och så långt det är möjligt använda den snabbare 3,5 GB stora sektionen. När mer utrymme behövs för en ensam operation utnyttjas de sista 0,5 GB, vilket fortfarande är snabbare än att exempelvis arbeta mot primärminnet.

Nvidia hävdar att effekten av det hela i de flesta fall är en minimal prestandaförlust i jämförelse med om allt videominnet alltid arbetat vid full hastighet. Grafikkortsmakaren lovar dock att undersöka alla problem som inrapporterats av oroliga användare och eventuellt göra ytterligare optimeringar av minneshanteringen i drivrutinerna.

* För att återspegla minneshanteringen i Geforce GTX 970 uppdaterar Nvidia även grafikkortets specifikationer, där antalet rasterenheter nu uppgår till 56 stycken medan L2-cachen minskar till 1,75 MB.

Kommentarer till artikeln

675 debattinlägg

Skicka en rättelse
12

François Piednoël lämnar Intel

Under nästan 20 år har François Piednoël tagit fram några av Intels viktigaste processorarkitekturer, men nu väljer han att lämna företaget. Läs mer

30

Specifikationer för en trio processorer ur Intel Coffee Lake hittar ut på webben

Inför Intels stundande lansering av Coffee Lake läcker nu vad som tros vara specifikationer för tre sex-kärniga modeller ur serien ut på webben. Läs mer

21

Intel lanserar AI-stickan Movidius Neural Compute Stick

Intel har lanserat ytterligare en datorsticka, men denna gång med fokus på artificiell intelligens utan behov av uppkoppling eller strömkrävande hårdvara. Läs mer

19

Galleri: Egentillverkat tangentbord från medlemmen Felion1337

Medlemmen Felion1337 bygger ett eget tangentbord från botten upp med modifierade Cherry MX Silent-brytare, i jakten på ett tyst mekaniskt tangentbord i minimalistisk formfaktor. Läs mer

40

Blizzard upphör med stöd för Windows XP och Windows Vista

Trots att Microsoft själva officiellt avslutat stödet för både Windows XP och Vista har Blizzard behållit stöd för operativsystemen i ett flertal spel, nu bekräftar Blizzard att det är slut med det. Läs mer

83

Varumärkesansökan av Nintendo pekar på ett Nintendo 64 Classic Edition

En användare på forumet Neogaf har upptäckt en varumärkesansökan på vad som verkar vara den klassiska spelkontrollen för Nintendo 64, vilket kan antyda att en revision av konsolen är på gång. Läs mer

6

Arctics trio av vattenkylare får stöd för AMD Ryzen Threadripper

Lanseringsdatumet för AMD:s mångkärniga processorer i Threadripper-serien närmar sig och samtidigt dyker fler uppgifter om kylare upp. Läs mer

30

Moderkort i Mini ITX-format från Gigabyte för sockel AM4 når svenska butiker

Några månader efter lanseringen av AMD Ryzen är det fortfarande glest i lagren när det kommer till ITX-moderkort för AMD:s nya sockel AM4. Nu blir det ändring på det när Gigabyte äntrar scenen. Läs mer

42

Microsoft bekräftar avslutat stöd för Intels Clover Trail-familj

Kort efter att inkompatibilitet mellan äldre Intel-processorer och senaste uppdateringen för Windows 10 uppdagats, bekräftar Microsoft att den är permanent. Läs mer

24

EagleTree Capital i förhandlingar om att köpa Corsair Components

Anonyma källor till Reuters gör gällande att investeringsbolaget EagleTree Capital befinner sig i förhandlingar om att köpa amerikanska Corsair Components. Läs mer

34

Microsoft introducerar kortare nedtid vid uppdateringar med Fall Creators Update

Med lanseringen av uppdateringen Fall Creators Update väntas kortare nedtid vid uppdateringar eftersom bolaget stuvar om uppdateringsprocessen. Läs mer

32

Testpilot: Komplett Gamer Xtreme a70

För den kräsne gamern som bara vill starta upp datorn och börja lira står numera även AMD på menyn hos Komplett. Testpiloten Simon Alling granskar prestandapaketet Gamer Xtreme a70. Läs mer