Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Det stormar kring den mystiska minneshanteringen i storsäljaren Geforce GTX 970. Nu tar Nvidia bladet från munnen och förklarar hur det hela hänger ihop.

Den som surfat SweClockers i helgen har förmodligen inte missat alla inflammerade diskussioner om Geforce GTX 970. Det populära grafikkortet innehåller en nedskalad variant av kretsen GM204, som av en hitintills oklar anledning delar upp det 4 GB stora videominnet i två segment om 3,5 och 0,5 GB. Vad kontroversen handlar om är att den mindre biten dras med betydligt lägre bandbredd än normalt.

unnamed.jpg

Nvidia korrigerar* specifikationerna för Geforce GTX 970

GTX 980

GTX 970 (äldre)

GTX 970 (nytt)

Teknik

28 nm

28 nm

28 nm

GPU

GM204

GM204

GM204

Transistorer

5,2 md

5,2 md

5,2 md

Kretsarea 398 mm2

398 mm2

398 mm2

398 mm2

Arkitektur

Maxwell

Maxwell

Maxwell

CUDA-kärnor

2 048 st.

1 664 st.

1 664 st.

Texturenheter

128 st.

128 st.

128 st.

Rasterenheter

64 st.

64 st.

56 st.

Basfrekvens

1 126 MHz

1 050 MHz

1 050 MHz

Turbofrekvens

1 216 MHz

1 178 MHz

1 178 MHz

L2-cacheminne

2 MB

2 MB

1,75 MB

Minnesbuss

256-bit

256-bit

256-bit

Minnesmängd

4 GB GDDR5

4 GB GDDR5

4 GB GDDR5

Minnesfrekvens

7 000 MHz

7 000 MHz

7 000 MHz

Minnesbandbredd

224 GB/s

224 GB/s

224 GB/s (?)

Strömförsörjning

6+6-pin

6+6-pin

6+6-pin

TDP

165 W

148 W

148 W

Efter det första officiella uttalandet ger Nvidia en mer djuplodad förklaring till fenomenet. Tvärtemot många teorier är beteendet inte direkt relaterat till att Geforce GTX 970 saknar tre så kallade SMM-kluster jämfört med storebror GTX 980. Grafikkretsen är nämligen uppdelad i två sektioner, där kommunikationen hanteras av vad Nvidia kallar för en crossbar eller tvärbalk.

I diagrammets övre del syns CUDA-kärnor i SMM-kluster, samtidigt som videominneshantering och L2-cacheminne huserar på den andra sidan tvärbalken. Enligt Nvidia ger det bland annat flexibilitet för att hantera delvis defekta kretsar, där olika delar kan inaktiveras oberoende av varandra utan att kommunikationen påverkas.

Nedbantad GM204 påverkar minnesbandbredden

Nytt för generation Maxwell är att inte bara beräkningskluster kan inaktiveras vid behov utan även delar av logiken för minneshanteringen, något som för Kepler krävde att hela sektionen skrotades. I praktiken innebär det att Geforce GTX 970 saknar en uppsättning L2-cache samt tillhörande anslutning mot tvärbalken jämfört med storebror GTX 980.

två olika sektioner minne

I korthet är resultatet att en ensam port med tillhörande logik blir ansvarig för att hantera två minneskanaler, något som i princip kan halvera prestandan. Nvidias lösning på problemet är att segmentera videominnet i två sektioner, där 3,5 GB alltid är tillgängligt medan återstående 0,5 GB endast används vid behov.

Den 3,5 GB stora sektionen av videominnet får tillgång till 7 minneskanaler, vilket i stora drag ger 7/8-delar av bandbredden i jämförelse med Geforce GTX 980. Det sista segmentet får dock endast tillgång till 1/8-del av den maximala bandbredden.

Hanteringen av segmenten, eller rättare sagt optimeringen, sköts i Nvidias drivrutin och i operativsystemet. Mjukvaran försöker aktivt och så långt det är möjligt använda den snabbare 3,5 GB stora sektionen. När mer utrymme behövs för en ensam operation utnyttjas de sista 0,5 GB, vilket fortfarande är snabbare än att exempelvis arbeta mot primärminnet.

Nvidia hävdar att effekten av det hela i de flesta fall är en minimal prestandaförlust i jämförelse med om allt videominnet alltid arbetat vid full hastighet. Grafikkortsmakaren lovar dock att undersöka alla problem som inrapporterats av oroliga användare och eventuellt göra ytterligare optimeringar av minneshanteringen i drivrutinerna.

* För att återspegla minneshanteringen i Geforce GTX 970 uppdaterar Nvidia även grafikkortets specifikationer, där antalet rasterenheter nu uppgår till 56 stycken medan L2-cachen minskar till 1,75 MB.

Kommentarer till artikeln

675 debattinlägg

Skicka en rättelse
16

SweClockers Meet & Geek till Skellefteå och tankar inför år 2019

När SweClockers för tredje gången på fyra månader begår medlemsträff bär det av till Skellefteå. Vi är redan i full gång med att planera för år 2019 och vill nu ha in önskemål från er! Läs mer

30

Webbläsarnas spårningsblockering uppges sakna funktion

Funktionen Do Not Track är tänkt att hindra webbplatser från att spåra användare, men enligt ny information är det ytterst ovanligt att detta faktiskt efterföljs. Läs mer

92

Netflix: "EU:s innehållskvot kommer endast få negativa konsekvenser"

I sin senaste kvartalsrapport kritiserar Netflix EU:s innehållskvot för strömningstjänster, och menar att en sådan lösning är fel väg att gå för att främja filmskapande i regionen. Läs mer

86

Bahnhof släpper 10 Gbit-router för hemanvändare

Bahnhof blir nu en av de första att erbjuda en router för privatpersoner som bestyckas med en 10 Gigabit Ethernet, och därmed klarar av att leverera hastigheter upp till 10 000 Mbit/s. Läs mer

35

Nvidia kan förbereda Geforce RTX 2070 Ti

Efter släppen av Geforce RTX 2080 Ti, RTX 2080 och RTX 2070 framgår att Nvidia kan komma att kila in en modell mellan de senare, något som skulle göra det trångt i prestanda- och prisstegen. Läs mer

8

Be Quiet lanserar Dark Rock Pro 4 för AMD Ryzen Threadripper

Be Quiet släpper en ny version av Dark Rock Pro, som erbjuder kylförmåga upp till 250 W och en ljudnivå på endast 24 decibel vid full belastning. Läs mer

131

Test: MSI Geforce RTX 2070 Armor – Turing för under 6 000 kronor

Arkitekturen Turings duett Geforce RTX 2080 Ti och RTX 2080 får sällskap av ett mer rimligt prissatt alternativ. Det har blivit dags att titta närmare på Geforce RTX 2070! Läs mer

242

Telia tvingas blockera fildelningssajter

Efter filmindustrins stämning mot Telia dömer Patent- och marknadsdomstolen Sveriges största leverantör av bredband att blockera The Pirate Bay, Dreamfilm, Nyafilmer och Fmovies. Läs mer

33

Crucial lanserar PCI Express-baserade SSD-enheter till pressat pris

Crucial utökar sitt utbud av SSD-enheter med den nya P1-serien, vilken till skillnad från tidigare modeller använder gränssnittet PCI Express för anslutning. Läs mer

37

Fulkultur är tillbaka med dubbelavsnitt om Sagan om Ringen och Tolkiens värld

Fyra månaders väntan är över och Fulkultur är äntligen tillbaka. Denna gång handlar det om J.R.R Tolkiens värld och Sagan om Ringen, som avhandlas i två nya avsnitt. Läs mer

35

Intel Core i9-9900K, Core i7-9700K och Core i5-9600K får stöd för 128 GB DDR4

Intel bekräftar att kommande Coffee Lake Refresh får stöd för upp till 128 GB primärminne, tack vare nya minnen med en kapacitet på upp till 32 GB per minnesmodul. Läs mer

71

Winamp återuppstår 2019

Sex år efter nedläggningen återuppstår Winamp under år 2019, med en modernisering av mediaspelaren för PC/Windows och Mac OS samt en ny applikation för smarta telefoner. Läs mer