Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Under GPU Technology Conference tillkännager Nvidias Jen-Hsun Huang grafikkretsen GP100, som kommer med inget mindre än 15,3 miljarder transistorer tillverkade på 16 nanometer.

Under Nvidias årliga GPU Technology Conference intar bolagets Jen-Hsun Huang scen för att presentera de stora nyheterna. I år blir det också plattformen där Nvidia kastar ljus på den kommande arkitekturen Pascal, där först ut att äntra rampljuset är Tesla P100 med grafikkretsen GP100.

Nvidia-GP100-block.png

Blockdiagram för Nvidia "Pascal" GP100.

Nvidia-Tesla-P100.jpg

Specifikationer: Nvidia Tesla P100

Tesla K40

Tesla M40

Tesla P100

Teknik

28nm TSMC

28nm TSMC

16nm TSMC

Krets

GK110

GM200

GP100

Kretsyta

551 mm2

601 mm2

610 mm2

Transistorer

7,1 miljarder

8 miljarder

15,3 miljarder

Arkitektur

Kepler

Maxwell

Pascal

SM-kluster

15 st.

24 st.

56 st.

CUDA-kärnor

2 880 st.

3 072 st.

3 584 st.

Texturenheter

240 st.

192 st.

224 st.

Klockfrekvens

745 MHz

948 MHz

1 328 MHz

GPU Boost

875 MHz

1 114 MHz

1 480 MHz

Beräkningskraft (SP, FP32)

5 040 GFLOPS

6 844 GFLOPS

10 608 GFLOPS

Beräkningskraft (DP, FP64)

1 680 GFLOPS

214 GFLOPS

5 304 GFLOPS

Minnesbuss

384-bit

384-bit

4 096-bit

Minnestyp

GDDR5

GDDR5

HBM2

Minnesmängd

Upp till 12 GB

Upp till 24 GB

16 GB

Minnesfrekvens

6 000 MHz

6 000 MHz

~1 400 MHz

Minnesbandbredd

288 GB/s

288 GB/s

720 GB/s

TDP

235 W

250 W

300 W

Beräkningskortet Tesla P100 är först ut med arkitekturen Pascal, som tack vare en 16-nanometersteknik från TSMC huserar inget mindre än 15,3 miljarder transistorer. Detta att jämföra mot 8 miljarder för Maxwell-baserade GM200, och storleken på själva kretsen är något större på 610 mm2.

Till det massiva antalet transistorer hör också gott om beräkningskraft, där kortet vid singelprecision (FP32) anges till 10,6 TFLOPS och dubbelprecision (FP64) till 5,3 TFLOPS. Det förstnämnda är en ökning med 54 procent jämfört mot GM200, och skulle kunna ses som en indikation om vad som är att vänta av uppföljaren till det konsumentorienterade grafikkortet Geforce Titan X.

Nvidia-GP100-SM-block.png

Ett Stream Multiprocessor-kluster med 64 CUDA-kärnor.

För vidare specifikationer har GP100 hela 60 Stream Multiprocessor-kluster, varje med 64 CUDA-kärnor och 4 texturenheter. Detta ger totalt 3 840 CUDA-kärnor och 240 texturenheter. För Tesla P100 är dock fyra kluster inaktiverade, vilket sänker antalet till 3 584 respektive 224 stycken.

Grafikkretsen flankeras dessutom av fyra minneskapslar av typen HBM2 med en samlad kapacitet på 16 GB. Bandbredden anges till rekordhöga 720 GB/s, som dock är lägre än de 1 TB/s som möjliggörs av minnestekniken. Det är dock troligt att Nvidia skruvat ned klockfrekvenserna på för att pressa strömförbrukningen, och att andra grafikkort med GP100 bestyckas med snabbare HBM2.

Leveranserna av Nvidia Tesla P100 inleds inom kort. När grafikkretsen GP100 kan tänkas hitta ut i grafikkort för konsumenter framgår inte.

Kommentarer till artikeln

114 debattinlägg

Skicka en rättelse
11

Atari tillkännager detaljer om Ataribox

I ett nyhetsbrev meddelar Atari att spelkonsolen Ataribox börjar närma sig en färdig produkt, där nu närmare hårdvaruspecifikationer och förväntad prislapp avslöjas av företaget. Läs mer

20

AMD Zen 2 till processorfamiljen "Matisse" – lanseras år 2019

Processormakaren AMD har två uppföljare till första generationens Ryzen planerade till år 2019. År 2018 släpps kodnamn Pinnacle Ridge, som efterträds av Matisse med arkitekturen Zen 2. Läs mer

29

Green Man Gaming och Intel inleder samarbete om digital marknadsplats för spel

Den digitala spelåterförsäljaren Green Man Gaming inleder ett partnerskap tillsammans med Intel, där företagets plattform ska stå till grund för halvledarjättens nya handelsportal för partners. Läs mer

35

Microsoft och Facebook installerar rekordsnabb undervattenskabel i Atlanten

För att tillgodose framtidens bandbreddsbehov har Microsoft och Facebook slutfört installationen av en undervattenskabel mellan Europa och Nordamerika med rekordhög kapacitet. Läs mer

37

MSI-moderkort med styrkretsen Z370 för Intel Coffee Lake listas på Prisjakt

Rapporterna och läckorna inför Intels lansering av Coffee Lake avlöser varandra. Nu listas åtta moderkort från MSI med styrkretsen Z370, bland annat toppmodellen Z370 Godlike Gaming. Läs mer

91

Apple TV 4K saknar stöd för Youtube i 4K UHD-upplösning

Utbudet av högupplöst media växer och blir mer lättillgängligt. Apple TV 4K är en mediaspelare gjord för 4K UHD-upplösning, men stöd saknas för uppspelning av film från Youtube i 4K. Läs mer

56

Intel säljstartar Core i9-7980XE, i9-7960X, i9-7940 med 18, 16 respektive 14 kärnor

Utrullningen av Skylake-X avrundas av de sanna toppmodellerna med 14, 16 och 18 kärnor, som släpps idag. Priset för flaggskeppet Core i9-7980XE är omkring 20 000 kronor. Läs mer

95

Intel avtäcker Coffee Lake med 6 och 4 kärnor för lansering den 5 oktober

Med knappt två veckor till lansering tillkännager Intel officiellt Coffee Lake för stationära datorer, där sex modeller i ett brett prisspann släpps i början av oktober. Läs mer

20

MSI Radeon RX Vega 64 Air Boost hittar ut på webben

Komponenttillverkaren MSI är mest känd för sin Gaming-serie inom grafikkort, men för AMD:s senaste Radeon RX Vega-familj blir referensliknande Air Boost först ut från bolaget. Läs mer

201

Ge ditt bästa tips på spel för att fördriva tiden

Det diskuteras i forumet kring spel som passar som kortare tidsfördriv och inte kräver flera timmar åt gången. Gå med i diskussionen och dela med dig av ditt bästa tips. Läs mer

24

Guide till nätverk: Öka räckvidden

Kenneth "Yoshman" Jonsson är tillbaka med en ny del i sin nätverksguide, där olika handgrepp för att utvidga räckvidden hos hemmanätverkets Wifi studeras. Läs mer

71

Quiz: Allt om lagringsmedia

Det har blivit dags för ny quiz på SweClockers, där ämnet denna gång är olika typer av lagringsmedia genom tiderna. Läs mer