Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Under GPU Technology Conference tillkännager Nvidias Jen-Hsun Huang grafikkretsen GP100, som kommer med inget mindre än 15,3 miljarder transistorer tillverkade på 16 nanometer.

Under Nvidias årliga GPU Technology Conference intar bolagets Jen-Hsun Huang scen för att presentera de stora nyheterna. I år blir det också plattformen där Nvidia kastar ljus på den kommande arkitekturen Pascal, där först ut att äntra rampljuset är Tesla P100 med grafikkretsen GP100.

Nvidia-GP100-block.png

Blockdiagram för Nvidia "Pascal" GP100.

Nvidia-Tesla-P100.jpg

Specifikationer: Nvidia Tesla P100

Tesla K40

Tesla M40

Tesla P100

Teknik

28nm TSMC

28nm TSMC

16nm TSMC

Krets

GK110

GM200

GP100

Kretsyta

551 mm2

601 mm2

610 mm2

Transistorer

7,1 miljarder

8 miljarder

15,3 miljarder

Arkitektur

Kepler

Maxwell

Pascal

SM-kluster

15 st.

24 st.

56 st.

CUDA-kärnor

2 880 st.

3 072 st.

3 584 st.

Texturenheter

240 st.

192 st.

224 st.

Klockfrekvens

745 MHz

948 MHz

1 328 MHz

GPU Boost

875 MHz

1 114 MHz

1 480 MHz

Beräkningskraft (SP, FP32)

5 040 GFLOPS

6 844 GFLOPS

10 608 GFLOPS

Beräkningskraft (DP, FP64)

1 680 GFLOPS

214 GFLOPS

5 304 GFLOPS

Minnesbuss

384-bit

384-bit

4 096-bit

Minnestyp

GDDR5

GDDR5

HBM2

Minnesmängd

Upp till 12 GB

Upp till 24 GB

16 GB

Minnesfrekvens

6 000 MHz

6 000 MHz

~1 400 MHz

Minnesbandbredd

288 GB/s

288 GB/s

720 GB/s

TDP

235 W

250 W

300 W

Beräkningskortet Tesla P100 är först ut med arkitekturen Pascal, som tack vare en 16-nanometersteknik från TSMC huserar inget mindre än 15,3 miljarder transistorer. Detta att jämföra mot 8 miljarder för Maxwell-baserade GM200, och storleken på själva kretsen är något större på 610 mm2.

Till det massiva antalet transistorer hör också gott om beräkningskraft, där kortet vid singelprecision (FP32) anges till 10,6 TFLOPS och dubbelprecision (FP64) till 5,3 TFLOPS. Det förstnämnda är en ökning med 54 procent jämfört mot GM200, och skulle kunna ses som en indikation om vad som är att vänta av uppföljaren till det konsumentorienterade grafikkortet Geforce Titan X.

Nvidia-GP100-SM-block.png

Ett Stream Multiprocessor-kluster med 64 CUDA-kärnor.

För vidare specifikationer har GP100 hela 60 Stream Multiprocessor-kluster, varje med 64 CUDA-kärnor och 4 texturenheter. Detta ger totalt 3 840 CUDA-kärnor och 240 texturenheter. För Tesla P100 är dock fyra kluster inaktiverade, vilket sänker antalet till 3 584 respektive 224 stycken.

Grafikkretsen flankeras dessutom av fyra minneskapslar av typen HBM2 med en samlad kapacitet på 16 GB. Bandbredden anges till rekordhöga 720 GB/s, som dock är lägre än de 1 TB/s som möjliggörs av minnestekniken. Det är dock troligt att Nvidia skruvat ned klockfrekvenserna på för att pressa strömförbrukningen, och att andra grafikkort med GP100 bestyckas med snabbare HBM2.

Leveranserna av Nvidia Tesla P100 inleds inom kort. När grafikkretsen GP100 kan tänkas hitta ut i grafikkort för konsumenter framgår inte.

Kommentarer till artikeln

114 debattinlägg

Skicka en rättelse
5

Fler bilder från Casemod Championship 2017 på Dreamhack Summer 2017

En av de stora hårdvaruhändelserna under Dreamhack Summer 2017 var Casemod Championship, där såväl den svenska eliten som nya stjärnskott gjorde upp. Nu bjuder Geeks Gaming på en bildkavalkad från mästerskapen! Läs mer

11

Valve berättar mer om sina nya handkontroller för SteamVR

Nya handkontroller för SteamVR har nu börjat skickas ut till spelutvecklare. Dessa kallas för Knuckles och möjliggör mer naturliga rörelser i spel tack vare tryckkänsliga ytor. Läs mer

15

Imagination Technologies lägger upp sin verksamhet för försäljning

Efter att Apple bestämt sig för att övergå till egen tillverkning av grafikprocessorer för Iphone och Ipad säljer nu Imagination sin verksamhet, där ett flertal intressenter redan lagt bud på denna. Läs mer

3

Fulkultur om tidsresande mördarrobotar

Denna veckas avsnitt av Fulkultur bjuder på en djupdykning i de två första Terminator-filmerna, där James Cameron målar upp en dystopisk framtid med självmedveten artificiell intelligens. Läs mer

0

Alla teknik- och frågepaneler med SweClockers från Dreamhack Summer 2017

Årets upplaga av datorfestivalen Dreamhack Summer må ha tagit slut i början av veckan men lämnar dock efter sig en diger skara hårdvarurelaterade paneler som livesändes från scenen. Läs mer

23

Zenimax vill säljstoppa Oculus Rift

Ett antal månader efter domen mot Oculus fortsätter nu rättstvisten mellan dem och Zenimax. Detta då Zenimax vill blockera all försäljning av Oculus VR-headset Rift. Läs mer

52

AMD förbereder B2-stepping för AMD Ryzen "Summit Ridge"

Inom kort sjösätter AMD en ny våg av Ryzen-processorer, där smärre buggfixar och vad som tros bli förbättrad minneskompatibilitet står i centrum Läs mer

15

Fler bilder från Dreamhack Summer 2017

Under Dreamhack Summer 2017 fick SweClockers redaktion uppbackning av de glada spelnördarna i Geeks Gaming, som med kamerorna i högsta hugg bevakade världens största LAN-festival. Läs mer

12

Testpilot: Cryorig H7 Quad Lumi

Testpiloten David Kvist testar Cryorig H7 Quad Lumi, vilken utlovar extremt god kompatibilitet och god kylförmåga med ett litet avtryck och RGB-belysning. Läs mer

7

Toshiba har hittat en köpare för sin minnesverksamhet

Toshiba har nu hittat en köpare för sin minnesverksamhet, där det vinnande budet för denna uppges hamna på minst 157 miljarder kronor. Läs mer

22

Microsoft svarar på Kasperskys anmälan om konkurrensbrott

Efter att Kaspersky lämnat in en anmälan om konkurrensbrott mot Microsoft till EU svarar nu företaget och erkänner att de avaktiverat annan mjukvara, men att det gjorts av kompatibilitetsskäl. Läs mer

29

Samsung Galaxy Note 8 lanseras i augusti

Trots debaclet kring Galaxy Note 7 arbetar Samsung på en ny modell i Galaxy Note-serien, vilken utrustas med 6,2-tumsskärm och väntas lanseras i augusti i år. Läs mer