Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Under GPU Technology Conference tillkännager Nvidias Jen-Hsun Huang grafikkretsen GP100, som kommer med inget mindre än 15,3 miljarder transistorer tillverkade på 16 nanometer.

Under Nvidias årliga GPU Technology Conference intar bolagets Jen-Hsun Huang scen för att presentera de stora nyheterna. I år blir det också plattformen där Nvidia kastar ljus på den kommande arkitekturen Pascal, där först ut att äntra rampljuset är Tesla P100 med grafikkretsen GP100.

Nvidia-GP100-block.png

Blockdiagram för Nvidia "Pascal" GP100.

Nvidia-Tesla-P100.jpg

Specifikationer: Nvidia Tesla P100

Tesla K40

Tesla M40

Tesla P100

Teknik

28nm TSMC

28nm TSMC

16nm TSMC

Krets

GK110

GM200

GP100

Kretsyta

551 mm2

601 mm2

610 mm2

Transistorer

7,1 miljarder

8 miljarder

15,3 miljarder

Arkitektur

Kepler

Maxwell

Pascal

SM-kluster

15 st.

24 st.

56 st.

CUDA-kärnor

2 880 st.

3 072 st.

3 584 st.

Texturenheter

240 st.

192 st.

224 st.

Klockfrekvens

745 MHz

948 MHz

1 328 MHz

GPU Boost

875 MHz

1 114 MHz

1 480 MHz

Beräkningskraft (SP, FP32)

5 040 GFLOPS

6 844 GFLOPS

10 608 GFLOPS

Beräkningskraft (DP, FP64)

1 680 GFLOPS

214 GFLOPS

5 304 GFLOPS

Minnesbuss

384-bit

384-bit

4 096-bit

Minnestyp

GDDR5

GDDR5

HBM2

Minnesmängd

Upp till 12 GB

Upp till 24 GB

16 GB

Minnesfrekvens

6 000 MHz

6 000 MHz

~1 400 MHz

Minnesbandbredd

288 GB/s

288 GB/s

720 GB/s

TDP

235 W

250 W

300 W

Beräkningskortet Tesla P100 är först ut med arkitekturen Pascal, som tack vare en 16-nanometersteknik från TSMC huserar inget mindre än 15,3 miljarder transistorer. Detta att jämföra mot 8 miljarder för Maxwell-baserade GM200, och storleken på själva kretsen är något större på 610 mm2.

Till det massiva antalet transistorer hör också gott om beräkningskraft, där kortet vid singelprecision (FP32) anges till 10,6 TFLOPS och dubbelprecision (FP64) till 5,3 TFLOPS. Det förstnämnda är en ökning med 54 procent jämfört mot GM200, och skulle kunna ses som en indikation om vad som är att vänta av uppföljaren till det konsumentorienterade grafikkortet Geforce Titan X.

Nvidia-GP100-SM-block.png

Ett Stream Multiprocessor-kluster med 64 CUDA-kärnor.

För vidare specifikationer har GP100 hela 60 Stream Multiprocessor-kluster, varje med 64 CUDA-kärnor och 4 texturenheter. Detta ger totalt 3 840 CUDA-kärnor och 240 texturenheter. För Tesla P100 är dock fyra kluster inaktiverade, vilket sänker antalet till 3 584 respektive 224 stycken.

Grafikkretsen flankeras dessutom av fyra minneskapslar av typen HBM2 med en samlad kapacitet på 16 GB. Bandbredden anges till rekordhöga 720 GB/s, som dock är lägre än de 1 TB/s som möjliggörs av minnestekniken. Det är dock troligt att Nvidia skruvat ned klockfrekvenserna på för att pressa strömförbrukningen, och att andra grafikkort med GP100 bestyckas med snabbare HBM2.

Leveranserna av Nvidia Tesla P100 inleds inom kort. När grafikkretsen GP100 kan tänkas hitta ut i grafikkort för konsumenter framgår inte.

Kommentarer till artikeln

114 debattinlägg

Skicka en rättelse
25

Marknaden för spelhårdvara omsatte 266 miljarder kronor under 2016

Marknaden för spelinriktad hårdvara fortsätter växa och slog under förra året försäljningsrekord, där nästan hälften utgjordes av entusiastinriktade produkter i de övre prisklasserna. Läs mer

11

Samsung lanserar inte Galaxy S8 på Mobile World Congress 2017

Efter att Samsungs senaste flaggskepp Galaxy Note 7 bokstavligen brann upp bryter bolaget sin tradition och lanserar Galaxy S8 senare än väntat. Läs mer

18

Halo Wars 2 får systemkrav

Till skillnad från del ett släpps Halo Wars samtidigt för Xbox-plattformen och PC/Windows, där utvecklarna nu går ut med systemkrav för strategispelet. Läs mer

28

Steam uppdateras med möjlighet att flytta spel mellan hårddiskar

En ny uppdatering till speltjänsten Steam gör det nu lättare att flytta spel mellan hårddiskar och SSD-enheter, detta med en ny funktion som finns inbyggd direkt i mjukvaran. Läs mer

50

Apple stämmer Qualcomm för uteblivna betalningar och dyra patent

En ny rättstvist inleds mellan Apple och Qualcomm, där Apple stämmer processortillverkaren på motsvarande 8,8 miljarder kronor för bland annat överprisade patent. Läs mer

69

Samsung avslöjar varför Galaxy Note 7 började brinna

Efter flera månaders felsökning av Galaxy Note 7 berättar Samsung varför telefonerna började brinna, där resultatet visar att det i båda fallen handlade om felande batterier. Läs mer

20

Ubisoft släpper systemkrav för For Honor

Med endast veckor kvar till lansering går Ubisoft ut med systemkrav för For Honor, där utgivaren anger alltifrån åldrande till mer moderna doningar för att driva spelet. Läs mer

16

Testpilot: Tesoro Excalibur Spectrum SE

En ny typ av optiska brytare får SweClockers tangentbordskonnässör Niklas Huhtala att skutta av glädje. Det är dags för recensionen av Tesoro Excalibur Spectrum SE. Läs mer

21

Fredagspanelen 127: Intel Kaby Lake, AMD Ryzen och Nintendo Switch

I första Fredagspanelen för året orerar Jonas och Jacob om Intels nylanserade processorfamilj Kaby Lake, AMD:s stundande lansering av Ryzen och Nintendos skeva prissättning av Switch. Läs mer

177

Titanfall-utvecklare: "Switch får lika dåligt tredjepartsstöd som Wii U"

På grund av klen hårdvara kommer Nintendo Switch gå samma öde till mötes som Wii U när det kommer till tredjepartsutvecklade spel, menar TItanfall-utvecklaren Mohammad Alavi. Läs mer

33

Windows 10 Creators Update gör det lättare att välja mellan olika energilägen

Till följd av efterfrågan från partnertillverkare kommer bärbara Windows 10-datorer få ett lätt åtkomligt reglage för olika energiprofiler med Creators Update. Läs mer

48

AOC avtäcker ultrabred 35-tumsskärm med 100 Hz

Det senaste tillskottet i AOC:s Agon-serie blir AG352UCG, en ultrabred spelskärm med 100 Hz bilduppdateringsfrekvens och Nvidia G-Sync. Läs mer