Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Under GPU Technology Conference tillkännager Nvidias Jen-Hsun Huang grafikkretsen GP100, som kommer med inget mindre än 15,3 miljarder transistorer tillverkade på 16 nanometer.

Under Nvidias årliga GPU Technology Conference intar bolagets Jen-Hsun Huang scen för att presentera de stora nyheterna. I år blir det också plattformen där Nvidia kastar ljus på den kommande arkitekturen Pascal, där först ut att äntra rampljuset är Tesla P100 med grafikkretsen GP100.

Nvidia-GP100-block.png

Blockdiagram för Nvidia "Pascal" GP100.

Nvidia-Tesla-P100.jpg

Specifikationer: Nvidia Tesla P100

Tesla K40

Tesla M40

Tesla P100

Teknik

28nm TSMC

28nm TSMC

16nm TSMC

Krets

GK110

GM200

GP100

Kretsyta

551 mm2

601 mm2

610 mm2

Transistorer

7,1 miljarder

8 miljarder

15,3 miljarder

Arkitektur

Kepler

Maxwell

Pascal

SM-kluster

15 st.

24 st.

56 st.

CUDA-kärnor

2 880 st.

3 072 st.

3 584 st.

Texturenheter

240 st.

192 st.

224 st.

Klockfrekvens

745 MHz

948 MHz

1 328 MHz

GPU Boost

875 MHz

1 114 MHz

1 480 MHz

Beräkningskraft (SP, FP32)

5 040 GFLOPS

6 844 GFLOPS

10 608 GFLOPS

Beräkningskraft (DP, FP64)

1 680 GFLOPS

214 GFLOPS

5 304 GFLOPS

Minnesbuss

384-bit

384-bit

4 096-bit

Minnestyp

GDDR5

GDDR5

HBM2

Minnesmängd

Upp till 12 GB

Upp till 24 GB

16 GB

Minnesfrekvens

6 000 MHz

6 000 MHz

~1 400 MHz

Minnesbandbredd

288 GB/s

288 GB/s

720 GB/s

TDP

235 W

250 W

300 W

Beräkningskortet Tesla P100 är först ut med arkitekturen Pascal, som tack vare en 16-nanometersteknik från TSMC huserar inget mindre än 15,3 miljarder transistorer. Detta att jämföra mot 8 miljarder för Maxwell-baserade GM200, och storleken på själva kretsen är något större på 610 mm2.

Till det massiva antalet transistorer hör också gott om beräkningskraft, där kortet vid singelprecision (FP32) anges till 10,6 TFLOPS och dubbelprecision (FP64) till 5,3 TFLOPS. Det förstnämnda är en ökning med 54 procent jämfört mot GM200, och skulle kunna ses som en indikation om vad som är att vänta av uppföljaren till det konsumentorienterade grafikkortet Geforce Titan X.

Nvidia-GP100-SM-block.png

Ett Stream Multiprocessor-kluster med 64 CUDA-kärnor.

För vidare specifikationer har GP100 hela 60 Stream Multiprocessor-kluster, varje med 64 CUDA-kärnor och 4 texturenheter. Detta ger totalt 3 840 CUDA-kärnor och 240 texturenheter. För Tesla P100 är dock fyra kluster inaktiverade, vilket sänker antalet till 3 584 respektive 224 stycken.

Grafikkretsen flankeras dessutom av fyra minneskapslar av typen HBM2 med en samlad kapacitet på 16 GB. Bandbredden anges till rekordhöga 720 GB/s, som dock är lägre än de 1 TB/s som möjliggörs av minnestekniken. Det är dock troligt att Nvidia skruvat ned klockfrekvenserna på för att pressa strömförbrukningen, och att andra grafikkort med GP100 bestyckas med snabbare HBM2.

Leveranserna av Nvidia Tesla P100 inleds inom kort. När grafikkretsen GP100 kan tänkas hitta ut i grafikkort för konsumenter framgår inte.

Kommentarer till artikeln

114 debattinlägg

Skicka en rättelse
6

Intel Core i7-2600K och AMD FX-8150 mot 2018 års processorer

För sju år sedan lanserades Intel arkitekturer Sandy Bridge och AMD Bulldozer. Hur står de sig idag och räcker verkligen Intels Core i7-2600K för spel idag med ett modernt grafikkort? Läs mer

3

Fredagspanelen 157: Kärnornas krig och de nya upphovsrättslagarna från EU

Den regniga midsommarhelgen är ett perfekt tillfälle att sitta inne och glo på senaste Fredagspanelen, denna gång om kommande monsterprocessorer och omdiskuterade EU-lagar. Läs mer

1

Produkterna du missade på Computex 2018

På stora hårdvarumässor blir det alltid ett antal nyheter som inte får någon direkt uppmärksamhet. Här är fyra videoreportage som merparten av SweClockers läsare missade. Läs mer

102

Minnestillverkare väntas dömas till höga böter för kartellbildning

Samsung, SK Hynix och Micron uppges med stor sannolikhet dömas till höga böter i Kina, då de bedrivit otillåten kartellverksamhet för att hålla uppe priserna på minnesmarknaden. Läs mer

71

Intels VD Brian Krzanich tvingas lämna sin post

Intel meddelar att VD:n Brian Krzanich avgår med omedelbar verkan, då han haft ett förhållande med en anställd på företaget. Läs mer

9

Mutant Year Zero: Road to Eden får ny trailer – släpps under 2018

Mutant Year Zero: Road to Eden visas i en ny trailer, vilken ger mer info om tre av huvudkaraktärerna samt bekräftar att lanseringen sker under 2018. Läs mer

26

Den nya upphovsrättslagen inom EU – det här händer nu

Den nya upphovsrättslagen Artikel 13 röstades nyligen igenom av Europaparlamentets juridiska utskott. Ännu har dock beslutet en bit kvar att gå innan det blir lag inom EU. Läs mer

87

Nvidias nästa generation Geforce försenas till följd av överskottslager av Pascal

Efter ett knappt år av bristvara på grafikkort har efterfrågan sjunkit rejält, vilket istället lett till stora överskott som tvingat Nvidia ta tillbaka 300 000 grafikkretsar. Läs mer

38

Steam drar igång sin årliga sommarrea idag

Uppgifter talar för att Steams årliga sommarrea påbörjas idag, och nedsatta priser på tusentals speltitlar är att vänta. Läs mer

389

Hur mycket har du lagt på Steam genom åren?

Genom ett nytt verktyg gör Valve det möjligt att kolla upp hur mycket pengar som gått åt på Steam genom åren. Jacob ligger på blygsamma $997,04. Hur mycket mer eller mindre ligger du på? Läs mer

49

Asus ROG Swift PG27UQ: Stora kompromisser vid 144 Hz i 4K-upplösning

I praktiken är det 4K i 120 Hz som gäller för Asus PG27UQ. SweClockers går igenom den komplexa situationen med bandbredd, subsampling och mitt i allt ett fel som gör bilden för mörk. Läs mer

76

SweClockers guide till datorlådor

Går du i uppgraderingstankar efter alla chassinyheter som presenterades på Computex? Missa då inte SweClockers guide till datorlådor, där allt från formfaktorer till funktioner gås igenom. Läs mer