Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Det stormar kring den mystiska minneshanteringen i storsäljaren Geforce GTX 970. Nu tar Nvidia bladet från munnen och förklarar hur det hela hänger ihop.

Den som surfat SweClockers i helgen har förmodligen inte missat alla inflammerade diskussioner om Geforce GTX 970. Det populära grafikkortet innehåller en nedskalad variant av kretsen GM204, som av en hitintills oklar anledning delar upp det 4 GB stora videominnet i två segment om 3,5 och 0,5 GB. Vad kontroversen handlar om är att den mindre biten dras med betydligt lägre bandbredd än normalt.

unnamed.jpg

Nvidia korrigerar* specifikationerna för Geforce GTX 970

GTX 980

GTX 970 (äldre)

GTX 970 (nytt)

Teknik

28 nm

28 nm

28 nm

GPU

GM204

GM204

GM204

Transistorer

5,2 md

5,2 md

5,2 md

Kretsarea 398 mm2

398 mm2

398 mm2

398 mm2

Arkitektur

Maxwell

Maxwell

Maxwell

CUDA-kärnor

2 048 st.

1 664 st.

1 664 st.

Texturenheter

128 st.

128 st.

128 st.

Rasterenheter

64 st.

64 st.

56 st.

Basfrekvens

1 126 MHz

1 050 MHz

1 050 MHz

Turbofrekvens

1 216 MHz

1 178 MHz

1 178 MHz

L2-cacheminne

2 MB

2 MB

1,75 MB

Minnesbuss

256-bit

256-bit

256-bit

Minnesmängd

4 GB GDDR5

4 GB GDDR5

4 GB GDDR5

Minnesfrekvens

7 000 MHz

7 000 MHz

7 000 MHz

Minnesbandbredd

224 GB/s

224 GB/s

224 GB/s (?)

Strömförsörjning

6+6-pin

6+6-pin

6+6-pin

TDP

165 W

148 W

148 W

Efter det första officiella uttalandet ger Nvidia en mer djuplodad förklaring till fenomenet. Tvärtemot många teorier är beteendet inte direkt relaterat till att Geforce GTX 970 saknar tre så kallade SMM-kluster jämfört med storebror GTX 980. Grafikkretsen är nämligen uppdelad i två sektioner, där kommunikationen hanteras av vad Nvidia kallar för en crossbar eller tvärbalk.

I diagrammets övre del syns CUDA-kärnor i SMM-kluster, samtidigt som videominneshantering och L2-cacheminne huserar på den andra sidan tvärbalken. Enligt Nvidia ger det bland annat flexibilitet för att hantera delvis defekta kretsar, där olika delar kan inaktiveras oberoende av varandra utan att kommunikationen påverkas.

Nedbantad GM204 påverkar minnesbandbredden

Nytt för generation Maxwell är att inte bara beräkningskluster kan inaktiveras vid behov utan även delar av logiken för minneshanteringen, något som för Kepler krävde att hela sektionen skrotades. I praktiken innebär det att Geforce GTX 970 saknar en uppsättning L2-cache samt tillhörande anslutning mot tvärbalken jämfört med storebror GTX 980.

två olika sektioner minne

I korthet är resultatet att en ensam port med tillhörande logik blir ansvarig för att hantera två minneskanaler, något som i princip kan halvera prestandan. Nvidias lösning på problemet är att segmentera videominnet i två sektioner, där 3,5 GB alltid är tillgängligt medan återstående 0,5 GB endast används vid behov.

Den 3,5 GB stora sektionen av videominnet får tillgång till 7 minneskanaler, vilket i stora drag ger 7/8-delar av bandbredden i jämförelse med Geforce GTX 980. Det sista segmentet får dock endast tillgång till 1/8-del av den maximala bandbredden.

Hanteringen av segmenten, eller rättare sagt optimeringen, sköts i Nvidias drivrutin och i operativsystemet. Mjukvaran försöker aktivt och så långt det är möjligt använda den snabbare 3,5 GB stora sektionen. När mer utrymme behövs för en ensam operation utnyttjas de sista 0,5 GB, vilket fortfarande är snabbare än att exempelvis arbeta mot primärminnet.

Nvidia hävdar att effekten av det hela i de flesta fall är en minimal prestandaförlust i jämförelse med om allt videominnet alltid arbetat vid full hastighet. Grafikkortsmakaren lovar dock att undersöka alla problem som inrapporterats av oroliga användare och eventuellt göra ytterligare optimeringar av minneshanteringen i drivrutinerna.

* För att återspegla minneshanteringen i Geforce GTX 970 uppdaterar Nvidia även grafikkortets specifikationer, där antalet rasterenheter nu uppgår till 56 stycken medan L2-cachen minskar till 1,75 MB.

Kommentarer till artikeln

675 debattinlägg

Skicka en rättelse
12

Föråldrad hårdvara ångar på i musikfest

Att all teknik inte åldras väl är allmänt känt, men ett klipp på Youtube visar att det fortfarande finns hopp för gamla komponenter. Mekaniska delar tuffar ofta taktfast på, oavsett ålder. Läs mer

57

Nintendo tillkännager SNES Classic Edition med 21 förinstallerade spel

Efter krympta NES Classic Edition tillkännager Nintendo SNES Classic Edition, som släpps i slutet av september med 21 förinstallerade spel. Ett av dessa är aldrig tidigare lanserade Star Fox 2. Läs mer

27

Gamestop-chefer bekräftar SNES Classic

Uppgifter om att Nintendo arbetar på en ny krympt klassiker stärks när två Gamestop-chefer meddelar att speljätten bakom stängda dörrar börjat tala om spelkonsolen. Läs mer

15

Google upphör med automatisk avläsning av e-post för Gmail

Efter flera års automatisk avläsning av användares e-post på Gmail tillkännager nu Google i ett blogginlägg att bolaget kommer upphöra med detta inom kort. Läs mer

7

Star Wars: Battlefront II Alpha till PC, Xbox One och Playstation 4

Ett nu borttaget inlägg på det officiella Battlefront-forumet avslöjar att de andra delen i titeln får ett Alpha-test. Läs mer

43

Intels Skylake- och Kaby Lake-processorer har Hyperthreading-relaterat fel

Snart två år efter lansering uppdagas ett fel i Intels Skylake-processorer, men även efterträdaren Kaby Lake, där Hyperthreading kan ge upphov till oförutsägbart systembeteende. Läs mer

108

MSI: "AMD Radeon RX Vega drar förbaskat mycket ström"

Mycket pekar mot att AMD:s flaggskepp Radeon RX Vega blir en energikrävande historia, något som stärks av såväl en marknadschef från MSI som nylanserade Radeon Vega Frontier Edition. Läs mer

5

Fler bilder från Casemod Championship 2017 på Dreamhack Summer 2017

En av de stora hårdvaruhändelserna under Dreamhack Summer 2017 var Casemod Championship, där såväl den svenska eliten som nya stjärnskott gjorde upp. Nu bjuder Geeks Gaming på en bildkavalkad från mästerskapen! Läs mer

15

Valve berättar mer om sina nya handkontroller för SteamVR

Nya handkontroller för SteamVR har nu börjat skickas ut till spelutvecklare. Dessa kallas för Knuckles och möjliggör mer naturliga rörelser i spel tack vare tryckkänsliga ytor. Läs mer

17

Imagination Technologies lägger upp sin verksamhet för försäljning

Efter att Apple bestämt sig för att övergå till egen tillverkning av grafikprocessorer för Iphone och Ipad säljer nu Imagination sin verksamhet, där ett flertal intressenter redan lagt bud på denna. Läs mer

4

Fulkultur om tidsresande mördarrobotar

Denna veckas avsnitt av Fulkultur bjuder på en djupdykning i de två första Terminator-filmerna, där James Cameron målar upp en dystopisk framtid med självmedveten artificiell intelligens. Läs mer

0

Alla teknik- och frågepaneler med SweClockers från Dreamhack Summer 2017

Årets upplaga av datorfestivalen Dreamhack Summer må ha tagit slut i början av veckan men lämnar dock efter sig en diger skara hårdvarurelaterade paneler som livesändes från scenen. Läs mer