Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Det stormar kring den mystiska minneshanteringen i storsäljaren Geforce GTX 970. Nu tar Nvidia bladet från munnen och förklarar hur det hela hänger ihop.

Den som surfat SweClockers i helgen har förmodligen inte missat alla inflammerade diskussioner om Geforce GTX 970. Det populära grafikkortet innehåller en nedskalad variant av kretsen GM204, som av en hitintills oklar anledning delar upp det 4 GB stora videominnet i två segment om 3,5 och 0,5 GB. Vad kontroversen handlar om är att den mindre biten dras med betydligt lägre bandbredd än normalt.

unnamed.jpg

Nvidia korrigerar* specifikationerna för Geforce GTX 970

GTX 980

GTX 970 (äldre)

GTX 970 (nytt)

Teknik

28 nm

28 nm

28 nm

GPU

GM204

GM204

GM204

Transistorer

5,2 md

5,2 md

5,2 md

Kretsarea 398 mm2

398 mm2

398 mm2

398 mm2

Arkitektur

Maxwell

Maxwell

Maxwell

CUDA-kärnor

2 048 st.

1 664 st.

1 664 st.

Texturenheter

128 st.

128 st.

128 st.

Rasterenheter

64 st.

64 st.

56 st.

Basfrekvens

1 126 MHz

1 050 MHz

1 050 MHz

Turbofrekvens

1 216 MHz

1 178 MHz

1 178 MHz

L2-cacheminne

2 MB

2 MB

1,75 MB

Minnesbuss

256-bit

256-bit

256-bit

Minnesmängd

4 GB GDDR5

4 GB GDDR5

4 GB GDDR5

Minnesfrekvens

7 000 MHz

7 000 MHz

7 000 MHz

Minnesbandbredd

224 GB/s

224 GB/s

224 GB/s (?)

Strömförsörjning

6+6-pin

6+6-pin

6+6-pin

TDP

165 W

148 W

148 W

Efter det första officiella uttalandet ger Nvidia en mer djuplodad förklaring till fenomenet. Tvärtemot många teorier är beteendet inte direkt relaterat till att Geforce GTX 970 saknar tre så kallade SMM-kluster jämfört med storebror GTX 980. Grafikkretsen är nämligen uppdelad i två sektioner, där kommunikationen hanteras av vad Nvidia kallar för en crossbar eller tvärbalk.

I diagrammets övre del syns CUDA-kärnor i SMM-kluster, samtidigt som videominneshantering och L2-cacheminne huserar på den andra sidan tvärbalken. Enligt Nvidia ger det bland annat flexibilitet för att hantera delvis defekta kretsar, där olika delar kan inaktiveras oberoende av varandra utan att kommunikationen påverkas.

Nedbantad GM204 påverkar minnesbandbredden

Nytt för generation Maxwell är att inte bara beräkningskluster kan inaktiveras vid behov utan även delar av logiken för minneshanteringen, något som för Kepler krävde att hela sektionen skrotades. I praktiken innebär det att Geforce GTX 970 saknar en uppsättning L2-cache samt tillhörande anslutning mot tvärbalken jämfört med storebror GTX 980.

två olika sektioner minne

I korthet är resultatet att en ensam port med tillhörande logik blir ansvarig för att hantera två minneskanaler, något som i princip kan halvera prestandan. Nvidias lösning på problemet är att segmentera videominnet i två sektioner, där 3,5 GB alltid är tillgängligt medan återstående 0,5 GB endast används vid behov.

Den 3,5 GB stora sektionen av videominnet får tillgång till 7 minneskanaler, vilket i stora drag ger 7/8-delar av bandbredden i jämförelse med Geforce GTX 980. Det sista segmentet får dock endast tillgång till 1/8-del av den maximala bandbredden.

Hanteringen av segmenten, eller rättare sagt optimeringen, sköts i Nvidias drivrutin och i operativsystemet. Mjukvaran försöker aktivt och så långt det är möjligt använda den snabbare 3,5 GB stora sektionen. När mer utrymme behövs för en ensam operation utnyttjas de sista 0,5 GB, vilket fortfarande är snabbare än att exempelvis arbeta mot primärminnet.

Nvidia hävdar att effekten av det hela i de flesta fall är en minimal prestandaförlust i jämförelse med om allt videominnet alltid arbetat vid full hastighet. Grafikkortsmakaren lovar dock att undersöka alla problem som inrapporterats av oroliga användare och eventuellt göra ytterligare optimeringar av minneshanteringen i drivrutinerna.

* För att återspegla minneshanteringen i Geforce GTX 970 uppdaterar Nvidia även grafikkortets specifikationer, där antalet rasterenheter nu uppgår till 56 stycken medan L2-cachen minskar till 1,75 MB.

Kommentarer till artikeln

675 debattinlägg

Skicka en rättelse
2

SweClockers följer med bakom kulisserna på Dreamhacks Counter Strike-turnering

Dreamhack är inte bara en LAN-fest utan också centrum för ett flertal tävlingar i e-sport. SweClockers tar tillfället i akt och kikar in bakom kulisserna på CS:GO-tävlingen. Läs mer

6

5G-standarden spikas av 3GPP – sista pusselbiten innan kommersialisering

Efter 34 månaders mangling har industrin enats om specifikationen för 5G. Det innebär att det är fritt fram för tillverkare att färdigställa och slutligen kommersialisera 5G-produkter. Läs mer

I samarbete med Mionix
2

Wrestling och krossade skrivbord när medlem vinner kringutrustning från Mionix

Svenska Mionix sommartävling är nu avgjord och en lycklig SweClockers medlem går därmed vinnande ur striden med en helt ny uppsättning påkostade gamingtillbehör. Läs mer

3

FZ pratar Rage 2 och svensk spelutveckling med Avalanche Studios Magnus Nedfors

Svenska Avalance Studios är utvecklarna bakom kommande Rage 2. Carl Johansson-Sundelius på FZ har pratat med spelets regissör Magnus Nedfors. Läs mer

62

Teknikstund: Bästa TV:n för sport

Fotbolls-VM är igång och med det ökar försäljningen av stora TV-apparater. Thomas Ytterberg går igenom fenomenet TV för sport och slår hål på de vanligaste myterna. Läs mer

7

AMD:s instegsmodeller Ryzen 5 2500X och 3 2300X får specifikationer

Inför lanseringen av instegsmodellerna Ryzen 5 2500X och 3 2300X får duon specifikationer, som talar för ett prestandalyft norr om 10 procent gentemot dagens 5 1500X och 3 1300X. Läs mer

4

Svåra frågor om spelen på E3-mässan i förra veckans quiz

Som avslutning på den traditionsenliga spelveckan på E3 bjöd SweClockers på frågesport om mässan, och endast 26 deltagare lyckades få alla rätt. Läs mer

52

World of Warcraft Classic baseras på Patch 1.12: Drums of War

Månader av spekulationer når vägs ände när Blizzard beslutar sig för att World of Warcraft Classic ska baseras på Patch 1.12, som anses leverera den med kompletta klassiska upplevelsen. Läs mer

25

Microsoft vill se högre bildfrekvenser med nästa generations Xbox

Från att tidigare ha tonat ned betydelsen av högre bildfrekvenser i spel kovänder Xbox-chefen Phil Spencer och uttrycker det som en hög prioritet för nästa generation. Läs mer

5

Intervju – Pete Hines om Fallout 76 och framtiden

Bland godbitarna från E3 finns en intervju med Bethesdas Pete Hines – mannen som drar i trådarna runt när, var och hur företaget kommunicerar om kommande spel. Läs mer

33

Microsoft: "Vi respekterade inte PC-spelare"

I intervju under E3 2018 frågas Xbox-chefen Phil Spencer ut om framtiden för integrationen mellan Xbox och PC, och passar då på att erkänna tidigare bristande uppmärksamhet för PC-spelare. Läs mer