Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Under GPU Technology Conference tillkännager Nvidias Jen-Hsun Huang grafikkretsen GP100, som kommer med inget mindre än 15,3 miljarder transistorer tillverkade på 16 nanometer.

Under Nvidias årliga GPU Technology Conference intar bolagets Jen-Hsun Huang scen för att presentera de stora nyheterna. I år blir det också plattformen där Nvidia kastar ljus på den kommande arkitekturen Pascal, där först ut att äntra rampljuset är Tesla P100 med grafikkretsen GP100.

Nvidia-GP100-block.png

Blockdiagram för Nvidia "Pascal" GP100.

Nvidia-Tesla-P100.jpg

Specifikationer: Nvidia Tesla P100

Tesla K40

Tesla M40

Tesla P100

Teknik

28nm TSMC

28nm TSMC

16nm TSMC

Krets

GK110

GM200

GP100

Kretsyta

551 mm2

601 mm2

610 mm2

Transistorer

7,1 miljarder

8 miljarder

15,3 miljarder

Arkitektur

Kepler

Maxwell

Pascal

SM-kluster

15 st.

24 st.

56 st.

CUDA-kärnor

2 880 st.

3 072 st.

3 584 st.

Texturenheter

240 st.

192 st.

224 st.

Klockfrekvens

745 MHz

948 MHz

1 328 MHz

GPU Boost

875 MHz

1 114 MHz

1 480 MHz

Beräkningskraft (SP, FP32)

5 040 GFLOPS

6 844 GFLOPS

10 608 GFLOPS

Beräkningskraft (DP, FP64)

1 680 GFLOPS

214 GFLOPS

5 304 GFLOPS

Minnesbuss

384-bit

384-bit

4 096-bit

Minnestyp

GDDR5

GDDR5

HBM2

Minnesmängd

Upp till 12 GB

Upp till 24 GB

16 GB

Minnesfrekvens

6 000 MHz

6 000 MHz

~1 400 MHz

Minnesbandbredd

288 GB/s

288 GB/s

720 GB/s

TDP

235 W

250 W

300 W

Beräkningskortet Tesla P100 är först ut med arkitekturen Pascal, som tack vare en 16-nanometersteknik från TSMC huserar inget mindre än 15,3 miljarder transistorer. Detta att jämföra mot 8 miljarder för Maxwell-baserade GM200, och storleken på själva kretsen är något större på 610 mm2.

Till det massiva antalet transistorer hör också gott om beräkningskraft, där kortet vid singelprecision (FP32) anges till 10,6 TFLOPS och dubbelprecision (FP64) till 5,3 TFLOPS. Det förstnämnda är en ökning med 54 procent jämfört mot GM200, och skulle kunna ses som en indikation om vad som är att vänta av uppföljaren till det konsumentorienterade grafikkortet Geforce Titan X.

Nvidia-GP100-SM-block.png

Ett Stream Multiprocessor-kluster med 64 CUDA-kärnor.

För vidare specifikationer har GP100 hela 60 Stream Multiprocessor-kluster, varje med 64 CUDA-kärnor och 4 texturenheter. Detta ger totalt 3 840 CUDA-kärnor och 240 texturenheter. För Tesla P100 är dock fyra kluster inaktiverade, vilket sänker antalet till 3 584 respektive 224 stycken.

Grafikkretsen flankeras dessutom av fyra minneskapslar av typen HBM2 med en samlad kapacitet på 16 GB. Bandbredden anges till rekordhöga 720 GB/s, som dock är lägre än de 1 TB/s som möjliggörs av minnestekniken. Det är dock troligt att Nvidia skruvat ned klockfrekvenserna på för att pressa strömförbrukningen, och att andra grafikkort med GP100 bestyckas med snabbare HBM2.

Leveranserna av Nvidia Tesla P100 inleds inom kort. När grafikkretsen GP100 kan tänkas hitta ut i grafikkort för konsumenter framgår inte.

Kommentarer till artikeln

114 debattinlägg

Skicka en rättelse
11

Testpilot: Tesoro Excalibur Spectrum SE

En ny typ av optiska brytare får SweClockers tangentbordskonnässör Niklas Huhtala att skutta av glädje. Det är dags för recensionen av Tesoro Excalibur Spectrum SE. Läs mer

20

Fredagspanelen 127: Intel Kaby Lake, AMD Ryzen och Nintendo Switch

I första Fredagspanelen för året orerar Jonas och Jacob om Intels nylanserade processorfamilj Kaby Lake, AMD:s stundande lansering av Ryzen och Nintendos skeva prissättning av Switch. Läs mer

169

Titanfall-utvecklare: "Switch får lika dåligt tredjepartsstöd som Wii U"

På grund av klen hårdvara kommer Nintendo Switch gå samma öde till mötes som Wii U när det kommer till tredjepartsutvecklade spel, menar TItanfall-utvecklaren Mohammad Alavi. Läs mer

33

Windows 10 Creators Update gör det lättare att välja mellan olika energilägen

Till följd av efterfrågan från partnertillverkare kommer bärbara Windows 10-datorer få ett lätt åtkomligt reglage för olika energiprofiler med Creators Update. Läs mer

48

AOC avtäcker ultrabred 35-tumsskärm med 100 Hz

Det senaste tillskottet i AOC:s Agon-serie blir AG352UCG, en ultrabred spelskärm med 100 Hz bilduppdateringsfrekvens och Nvidia G-Sync. Läs mer

84

Nintendo Switch utan strömningstjänster vid lansering

Strömningstjänster som Netflix kommer inte stödjas av Nintendo Switch vid lansering. Detta då Nintendo i första hand vill se till att Switch blir en så bra spelkonsol som möjligt. Läs mer

99

LG och Sony slår spiken i kistan för 3D TV

Efter några år av pyspunka upphör de sista stora TV-tillverkarna med 3D i sina senaste modeller, för att istället lägga fokus på 4K UHD, HDR och smarta funktioner. Läs mer

9

Fulkultur om tecknade serier

Folkbildning utanför finkulturens salonger fortsätter när Fulkultur sänder nytt avsnitt, som idag handlar om tecknade serier. Läs mer

42

Test: Razer Deathadder Elite

Senast att äntra testlabbet är Razers uppdaterade Deathadder Elite, där utseendet känns igen från tidigare. Istället står en uppdaterad sensor och exklusiva brytare för nyheterna. Läs mer

30

LG G6 lanseras inför Mobile World Congress

Dagen innan Mobile World Congress i Barcelona håller LG evenemang för nya flaggskeppet G6, som bland annat får en 5,7-tumsskärm med bildförhållandet 18:9. Läs mer

45

Microsoft Surface Book lanseras i Sverige

Den bärbara hybriddatorn Surface Book från Microsoft uppdaterades under förra året med en ny modell med kraftfullare prestanda och lanseras under våren för första gången i Sverige. Läs mer

103

AMD hoppas bryta Intels dominans på servermarknaden med Zen

Med arkitekturen Zen hoppas AMD slå hål på Intels järngrepp om servermarknaden, detta genom att erbjuda upp till 32 kärnor till ett lägre pris. Läs mer