Under Nvidias årliga GPU Technology Conference intar bolagets Jen-Hsun Huang scen för att presentera de stora nyheterna. I år blir det också plattformen där Nvidia kastar ljus på den kommande arkitekturen Pascal, där först ut att äntra rampljuset är Tesla P100 med grafikkretsen GP100.
Specifikationer: Nvidia Tesla P100
Tesla K40 | Tesla M40 | Tesla P100 | |
---|---|---|---|
Teknik | 28nm TSMC | 28nm TSMC | 16nm TSMC |
Krets | GK110 | GM200 | GP100 |
Kretsyta | 551 mm2 | 601 mm2 | 610 mm2 |
Transistorer | 7,1 miljarder | 8 miljarder | 15,3 miljarder |
Arkitektur | Kepler | Maxwell | Pascal |
SM-kluster | 15 st. | 24 st. | 56 st. |
CUDA-kärnor | 2 880 st. | 3 072 st. | 3 584 st. |
Texturenheter | 240 st. | 192 st. | 224 st. |
Klockfrekvens | 745 MHz | 948 MHz | 1 328 MHz |
GPU Boost | 875 MHz | 1 114 MHz | 1 480 MHz |
Beräkningskraft (SP, FP32) | 5 040 GFLOPS | 6 844 GFLOPS | 10 608 GFLOPS |
Beräkningskraft (DP, FP64) | 1 680 GFLOPS | 214 GFLOPS | 5 304 GFLOPS |
Minnesbuss | 384-bit | 384-bit | 4 096-bit |
Minnestyp | GDDR5 | GDDR5 | HBM2 |
Minnesmängd | Upp till 12 GB | Upp till 24 GB | 16 GB |
Minnesfrekvens | 6 000 MHz | 6 000 MHz | ~1 400 MHz |
Minnesbandbredd | 288 GB/s | 288 GB/s | 720 GB/s |
TDP | 235 W | 250 W | 300 W |
Beräkningskortet Tesla P100 är först ut med arkitekturen Pascal, som tack vare en 16-nanometersteknik från TSMC huserar inget mindre än 15,3 miljarder transistorer. Detta att jämföra mot 8 miljarder för Maxwell-baserade GM200, och storleken på själva kretsen är något större på 610 mm2.
Till det massiva antalet transistorer hör också gott om beräkningskraft, där kortet vid singelprecision (FP32) anges till 10,6 TFLOPS och dubbelprecision (FP64) till 5,3 TFLOPS. Det förstnämnda är en ökning med 54 procent jämfört mot GM200, och skulle kunna ses som en indikation om vad som är att vänta av uppföljaren till det konsumentorienterade grafikkortet Geforce Titan X.
För vidare specifikationer har GP100 hela 60 Stream Multiprocessor-kluster, varje med 64 CUDA-kärnor och 4 texturenheter. Detta ger totalt 3 840 CUDA-kärnor och 240 texturenheter. För Tesla P100 är dock fyra kluster inaktiverade, vilket sänker antalet till 3 584 respektive 224 stycken.
Grafikkretsen flankeras dessutom av fyra minneskapslar av typen HBM2 med en samlad kapacitet på 16 GB. Bandbredden anges till rekordhöga 720 GB/s, som dock är lägre än de 1 TB/s som möjliggörs av minnestekniken. Det är dock troligt att Nvidia skruvat ned klockfrekvenserna på för att pressa strömförbrukningen, och att andra grafikkort med GP100 bestyckas med snabbare HBM2.
Leveranserna av Nvidia Tesla P100 inleds inom kort. När grafikkretsen GP100 kan tänkas hitta ut i grafikkort för konsumenter framgår inte.