Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Det stormar kring den mystiska minneshanteringen i storsäljaren Geforce GTX 970. Nu tar Nvidia bladet från munnen och förklarar hur det hela hänger ihop.

Den som surfat SweClockers i helgen har förmodligen inte missat alla inflammerade diskussioner om Geforce GTX 970. Det populära grafikkortet innehåller en nedskalad variant av kretsen GM204, som av en hitintills oklar anledning delar upp det 4 GB stora videominnet i två segment om 3,5 och 0,5 GB. Vad kontroversen handlar om är att den mindre biten dras med betydligt lägre bandbredd än normalt.

unnamed.jpg

Nvidia korrigerar* specifikationerna för Geforce GTX 970

GTX 980

GTX 970 (äldre)

GTX 970 (nytt)

Teknik

28 nm

28 nm

28 nm

GPU

GM204

GM204

GM204

Transistorer

5,2 md

5,2 md

5,2 md

Kretsarea 398 mm2

398 mm2

398 mm2

398 mm2

Arkitektur

Maxwell

Maxwell

Maxwell

CUDA-kärnor

2 048 st.

1 664 st.

1 664 st.

Texturenheter

128 st.

128 st.

128 st.

Rasterenheter

64 st.

64 st.

56 st.

Basfrekvens

1 126 MHz

1 050 MHz

1 050 MHz

Turbofrekvens

1 216 MHz

1 178 MHz

1 178 MHz

L2-cacheminne

2 MB

2 MB

1,75 MB

Minnesbuss

256-bit

256-bit

256-bit

Minnesmängd

4 GB GDDR5

4 GB GDDR5

4 GB GDDR5

Minnesfrekvens

7 000 MHz

7 000 MHz

7 000 MHz

Minnesbandbredd

224 GB/s

224 GB/s

224 GB/s (?)

Strömförsörjning

6+6-pin

6+6-pin

6+6-pin

TDP

165 W

148 W

148 W

Efter det första officiella uttalandet ger Nvidia en mer djuplodad förklaring till fenomenet. Tvärtemot många teorier är beteendet inte direkt relaterat till att Geforce GTX 970 saknar tre så kallade SMM-kluster jämfört med storebror GTX 980. Grafikkretsen är nämligen uppdelad i två sektioner, där kommunikationen hanteras av vad Nvidia kallar för en crossbar eller tvärbalk.

I diagrammets övre del syns CUDA-kärnor i SMM-kluster, samtidigt som videominneshantering och L2-cacheminne huserar på den andra sidan tvärbalken. Enligt Nvidia ger det bland annat flexibilitet för att hantera delvis defekta kretsar, där olika delar kan inaktiveras oberoende av varandra utan att kommunikationen påverkas.

Nedbantad GM204 påverkar minnesbandbredden

Nytt för generation Maxwell är att inte bara beräkningskluster kan inaktiveras vid behov utan även delar av logiken för minneshanteringen, något som för Kepler krävde att hela sektionen skrotades. I praktiken innebär det att Geforce GTX 970 saknar en uppsättning L2-cache samt tillhörande anslutning mot tvärbalken jämfört med storebror GTX 980.

två olika sektioner minne

I korthet är resultatet att en ensam port med tillhörande logik blir ansvarig för att hantera två minneskanaler, något som i princip kan halvera prestandan. Nvidias lösning på problemet är att segmentera videominnet i två sektioner, där 3,5 GB alltid är tillgängligt medan återstående 0,5 GB endast används vid behov.

Den 3,5 GB stora sektionen av videominnet får tillgång till 7 minneskanaler, vilket i stora drag ger 7/8-delar av bandbredden i jämförelse med Geforce GTX 980. Det sista segmentet får dock endast tillgång till 1/8-del av den maximala bandbredden.

Hanteringen av segmenten, eller rättare sagt optimeringen, sköts i Nvidias drivrutin och i operativsystemet. Mjukvaran försöker aktivt och så långt det är möjligt använda den snabbare 3,5 GB stora sektionen. När mer utrymme behövs för en ensam operation utnyttjas de sista 0,5 GB, vilket fortfarande är snabbare än att exempelvis arbeta mot primärminnet.

Nvidia hävdar att effekten av det hela i de flesta fall är en minimal prestandaförlust i jämförelse med om allt videominnet alltid arbetat vid full hastighet. Grafikkortsmakaren lovar dock att undersöka alla problem som inrapporterats av oroliga användare och eventuellt göra ytterligare optimeringar av minneshanteringen i drivrutinerna.

* För att återspegla minneshanteringen i Geforce GTX 970 uppdaterar Nvidia även grafikkortets specifikationer, där antalet rasterenheter nu uppgår till 56 stycken medan L2-cachen minskar till 1,75 MB.

Kommentarer till artikeln

675 debattinlägg

Skicka en rättelse
2

Orsaken till problemen med Samsung Galaxy Note 7 upptäckt

Samsung har ännu inte gett någon officiell förklaring till varför Galaxy Note 7 exploderar, men enligt två ingenjörer som plockat isär telefonen beror det på fel i enhetens utformning. Läs mer

19

Testpilot: MSI Z170A Gaming M7

MSI satsar på mängder av finesser och lätta överklockningsfunktioner med sitt moderkort Z170A Gaming M7. Testpiloten David Rönnlund sätter tänderna i modellen och ser vad den går för. Läs mer

26

Nvidia förbereder Geforce GTX 1060 3 GB med grafikkretsen GP104

Defekta grafikkretsar som inte håller måttet för Geforce GTX 1080 och GTX 1070 ska användas till 3 GB-varianten av GTX 1060. Det här framgår av en ny ID-slinga i Nvidias senaste drivrutiner. Läs mer

30

Seagate lanserar portabla hårddiskar under varumärket Maxtor

Efter att för ett antal år sedan lagt ned varumärket Maxtor återupplivas det nu av Seagate. Maxtor tar över Seagates budgetsegment av portabla hårddiskar efter Samsung. Läs mer

Spelpaket med Omen by HP samt mus och hörlurar

  • igår 12:00

Geeks Julkalender fortsätter, och när femte luckan öppnas avslöjas ett förmånligt erbjudande från HP innehållande en bärbar speldator, mus och hörlurar. Läs mer

21

HTML5 blir standard i Google Chrome

Google är ett av många företag som börjat överge Flash för att övergå till HTML5 och nu blir den sistnämnda standard i företagets webbläsare Chrome. Läs mer

14

AVOID av "timpelay"

På finalen av Cooler Master Casemod Championship på Dreamhack Winter 2016 kom det farliga bygget Avoid på en hedervärd fjärdeplats. Spana in bygget i SweClockers galleri! Läs mer

27

Direkt från Kappa Bar med Geeks Gaming

Spelsällskapet Geeks Gaming intar Kappa Bar för häng och god mat. Givetvis direktsänds hela kvällen, och gänget uppdaterar löpande med bilder. Läs mer

42

Test: Corsair Crystal 570X RGB

Corsair storsatsar på konceptet härdat glas och flerfärgsbelysning med sitt nya chassi Crystal 570X RGB. Modellen tar idag plats i SweClockers testlabb för en rejäl videogenomgång. Läs mer

56

SSD-priser väntas fortsätta stiga på grund av minnesbrist

På grund av komponentbrist och ökad efterfrågan väntas priserna på SSD-enheter öka, vissa med så mycket som 20 procent. Bristen tros hålla i sig ända till slutet av nästa år. Läs mer

73

Amazon lanserar Snowmobile – tjänst för att flytta stora mängder data via långtradare

Amazons nya tjänst gör det möjligt för företag att flytta upp till 100 PB data åt gången till deras molntjänster, vilket görs genom att den fraktas i 14 meter långa långtradare. Läs mer

10

Gött häng med Geeks Gaming på Kappa Bar

Det vankas stream i annorlunda tappning med Geeks Gaming. På lördag besöker gänget e-sportbaren Kappa Bar i Göteborg, och givetvis blir det en helkväll med direktsändning på Twitch. Läs mer