Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Nvidia förklarar det segmenterade videominnet i Geforce GTX 970

Det stormar kring den mystiska minneshanteringen i storsäljaren Geforce GTX 970. Nu tar Nvidia bladet från munnen och förklarar hur det hela hänger ihop.

Den som surfat SweClockers i helgen har förmodligen inte missat alla inflammerade diskussioner om Geforce GTX 970. Det populära grafikkortet innehåller en nedskalad variant av kretsen GM204, som av en hitintills oklar anledning delar upp det 4 GB stora videominnet i två segment om 3,5 och 0,5 GB. Vad kontroversen handlar om är att den mindre biten dras med betydligt lägre bandbredd än normalt.

unnamed.jpg

Nvidia korrigerar* specifikationerna för Geforce GTX 970

GTX 980

GTX 970 (äldre)

GTX 970 (nytt)

Teknik

28 nm

28 nm

28 nm

GPU

GM204

GM204

GM204

Transistorer

5,2 md

5,2 md

5,2 md

Kretsarea 398 mm2

398 mm2

398 mm2

398 mm2

Arkitektur

Maxwell

Maxwell

Maxwell

CUDA-kärnor

2 048 st.

1 664 st.

1 664 st.

Texturenheter

128 st.

128 st.

128 st.

Rasterenheter

64 st.

64 st.

56 st.

Basfrekvens

1 126 MHz

1 050 MHz

1 050 MHz

Turbofrekvens

1 216 MHz

1 178 MHz

1 178 MHz

L2-cacheminne

2 MB

2 MB

1,75 MB

Minnesbuss

256-bit

256-bit

256-bit

Minnesmängd

4 GB GDDR5

4 GB GDDR5

4 GB GDDR5

Minnesfrekvens

7 000 MHz

7 000 MHz

7 000 MHz

Minnesbandbredd

224 GB/s

224 GB/s

224 GB/s (?)

Strömförsörjning

6+6-pin

6+6-pin

6+6-pin

TDP

165 W

148 W

148 W

Efter det första officiella uttalandet ger Nvidia en mer djuplodad förklaring till fenomenet. Tvärtemot många teorier är beteendet inte direkt relaterat till att Geforce GTX 970 saknar tre så kallade SMM-kluster jämfört med storebror GTX 980. Grafikkretsen är nämligen uppdelad i två sektioner, där kommunikationen hanteras av vad Nvidia kallar för en crossbar eller tvärbalk.

I diagrammets övre del syns CUDA-kärnor i SMM-kluster, samtidigt som videominneshantering och L2-cacheminne huserar på den andra sidan tvärbalken. Enligt Nvidia ger det bland annat flexibilitet för att hantera delvis defekta kretsar, där olika delar kan inaktiveras oberoende av varandra utan att kommunikationen påverkas.

Nedbantad GM204 påverkar minnesbandbredden

Nytt för generation Maxwell är att inte bara beräkningskluster kan inaktiveras vid behov utan även delar av logiken för minneshanteringen, något som för Kepler krävde att hela sektionen skrotades. I praktiken innebär det att Geforce GTX 970 saknar en uppsättning L2-cache samt tillhörande anslutning mot tvärbalken jämfört med storebror GTX 980.

två olika sektioner minne

I korthet är resultatet att en ensam port med tillhörande logik blir ansvarig för att hantera två minneskanaler, något som i princip kan halvera prestandan. Nvidias lösning på problemet är att segmentera videominnet i två sektioner, där 3,5 GB alltid är tillgängligt medan återstående 0,5 GB endast används vid behov.

Den 3,5 GB stora sektionen av videominnet får tillgång till 7 minneskanaler, vilket i stora drag ger 7/8-delar av bandbredden i jämförelse med Geforce GTX 980. Det sista segmentet får dock endast tillgång till 1/8-del av den maximala bandbredden.

Hanteringen av segmenten, eller rättare sagt optimeringen, sköts i Nvidias drivrutin och i operativsystemet. Mjukvaran försöker aktivt och så långt det är möjligt använda den snabbare 3,5 GB stora sektionen. När mer utrymme behövs för en ensam operation utnyttjas de sista 0,5 GB, vilket fortfarande är snabbare än att exempelvis arbeta mot primärminnet.

Nvidia hävdar att effekten av det hela i de flesta fall är en minimal prestandaförlust i jämförelse med om allt videominnet alltid arbetat vid full hastighet. Grafikkortsmakaren lovar dock att undersöka alla problem som inrapporterats av oroliga användare och eventuellt göra ytterligare optimeringar av minneshanteringen i drivrutinerna.

* För att återspegla minneshanteringen i Geforce GTX 970 uppdaterar Nvidia även grafikkortets specifikationer, där antalet rasterenheter nu uppgår till 56 stycken medan L2-cachen minskar till 1,75 MB.

Kommentarer till artikeln

675 debattinlägg

Skicka en rättelse
61

Vad får dig att återvända till en "streamer"?

I forumet undrar Geeks Gaming-profilen "Lan" vad som får dig att följa en streamer. Är det nyhetsvärdet, personligheten, att någon är sjukt duktig i ett spel du gillar, produktionen eller något helt annat? Läs mer

14

AMD Radeon RX Vega utan officiellt stöd för fler än två grafikkort i Multi-GPU

Mer än ett år efter att Nvidia frångick stöd för fler än två grafikkort med SLI följer AMD efter med Radeon RX Vega-familjen, där officiellt stöd för fler än två grafikkort uteblir. Läs mer

43

Atari tillkännager detaljer om Ataribox

I ett nyhetsbrev meddelar Atari att spelkonsolen Ataribox börjar närma sig en färdig produkt, där nu närmare hårdvaruspecifikationer och förväntad prislapp avslöjas av företaget. Läs mer

63

AMD Zen 2 till processorfamiljen "Matisse" – lanseras år 2019

Processormakaren AMD har två uppföljare till första generationens Ryzen planerade till år 2019. År 2018 släpps kodnamn Pinnacle Ridge, som efterträds av Matisse med arkitekturen Zen 2. Läs mer

35

Green Man Gaming och Intel inleder samarbete om digital marknadsplats för spel

Den digitala spelåterförsäljaren Green Man Gaming inleder ett partnerskap tillsammans med Intel, där företagets plattform ska stå till grund för halvledarjättens nya handelsportal för partners. Läs mer

44

Microsoft och Facebook installerar rekordsnabb undervattenskabel i Atlanten

För att tillgodose framtidens bandbreddsbehov har Microsoft och Facebook slutfört installationen av en undervattenskabel mellan Europa och Nordamerika med rekordhög kapacitet. Läs mer

39

MSI-moderkort med styrkretsen Z370 för Intel Coffee Lake listas på Prisjakt

Rapporterna och läckorna inför Intels lansering av Coffee Lake avlöser varandra. Nu listas åtta moderkort från MSI med styrkretsen Z370, bland annat toppmodellen Z370 Godlike Gaming. Läs mer

100

Apple TV 4K saknar stöd för Youtube i 4K UHD-upplösning

Utbudet av högupplöst media växer och blir mer lättillgängligt. Apple TV 4K är en mediaspelare gjord för 4K UHD-upplösning, men stöd saknas för uppspelning av film från Youtube i 4K. Läs mer

57

Intel säljstartar Core i9-7980XE, i9-7960X, i9-7940 med 18, 16 respektive 14 kärnor

Utrullningen av Skylake-X avrundas av de sanna toppmodellerna med 14, 16 och 18 kärnor, som släpps idag. Priset för flaggskeppet Core i9-7980XE är omkring 20 000 kronor. Läs mer

100

Intel avtäcker Coffee Lake med 6 och 4 kärnor för lansering den 5 oktober

Med knappt två veckor till lansering tillkännager Intel officiellt Coffee Lake för stationära datorer, där sex modeller i ett brett prisspann släpps i början av oktober. Läs mer

20

MSI Radeon RX Vega 64 Air Boost hittar ut på webben

Komponenttillverkaren MSI är mest känd för sin Gaming-serie inom grafikkort, men för AMD:s senaste Radeon RX Vega-familj blir referensliknande Air Boost först ut från bolaget. Läs mer

205

Ge ditt bästa tips på spel för att fördriva tiden

Det diskuteras i forumet kring spel som passar som kortare tidsfördriv och inte kräver flera timmar åt gången. Gå med i diskussionen och dela med dig av ditt bästa tips. Läs mer