Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Under GPU Technology Conference tillkännager Nvidias Jen-Hsun Huang grafikkretsen GP100, som kommer med inget mindre än 15,3 miljarder transistorer tillverkade på 16 nanometer.

Under Nvidias årliga GPU Technology Conference intar bolagets Jen-Hsun Huang scen för att presentera de stora nyheterna. I år blir det också plattformen där Nvidia kastar ljus på den kommande arkitekturen Pascal, där först ut att äntra rampljuset är Tesla P100 med grafikkretsen GP100.

Nvidia-GP100-block.png

Blockdiagram för Nvidia "Pascal" GP100.

Nvidia-Tesla-P100.jpg

Specifikationer: Nvidia Tesla P100

Tesla K40

Tesla M40

Tesla P100

Teknik

28nm TSMC

28nm TSMC

16nm TSMC

Krets

GK110

GM200

GP100

Kretsyta

551 mm2

601 mm2

610 mm2

Transistorer

7,1 miljarder

8 miljarder

15,3 miljarder

Arkitektur

Kepler

Maxwell

Pascal

SM-kluster

15 st.

24 st.

56 st.

CUDA-kärnor

2 880 st.

3 072 st.

3 584 st.

Texturenheter

240 st.

192 st.

224 st.

Klockfrekvens

745 MHz

948 MHz

1 328 MHz

GPU Boost

875 MHz

1 114 MHz

1 480 MHz

Beräkningskraft (SP, FP32)

5 040 GFLOPS

6 844 GFLOPS

10 608 GFLOPS

Beräkningskraft (DP, FP64)

1 680 GFLOPS

214 GFLOPS

5 304 GFLOPS

Minnesbuss

384-bit

384-bit

4 096-bit

Minnestyp

GDDR5

GDDR5

HBM2

Minnesmängd

Upp till 12 GB

Upp till 24 GB

16 GB

Minnesfrekvens

6 000 MHz

6 000 MHz

~1 400 MHz

Minnesbandbredd

288 GB/s

288 GB/s

720 GB/s

TDP

235 W

250 W

300 W

Beräkningskortet Tesla P100 är först ut med arkitekturen Pascal, som tack vare en 16-nanometersteknik från TSMC huserar inget mindre än 15,3 miljarder transistorer. Detta att jämföra mot 8 miljarder för Maxwell-baserade GM200, och storleken på själva kretsen är något större på 610 mm2.

Till det massiva antalet transistorer hör också gott om beräkningskraft, där kortet vid singelprecision (FP32) anges till 10,6 TFLOPS och dubbelprecision (FP64) till 5,3 TFLOPS. Det förstnämnda är en ökning med 54 procent jämfört mot GM200, och skulle kunna ses som en indikation om vad som är att vänta av uppföljaren till det konsumentorienterade grafikkortet Geforce Titan X.

Nvidia-GP100-SM-block.png

Ett Stream Multiprocessor-kluster med 64 CUDA-kärnor.

För vidare specifikationer har GP100 hela 60 Stream Multiprocessor-kluster, varje med 64 CUDA-kärnor och 4 texturenheter. Detta ger totalt 3 840 CUDA-kärnor och 240 texturenheter. För Tesla P100 är dock fyra kluster inaktiverade, vilket sänker antalet till 3 584 respektive 224 stycken.

Grafikkretsen flankeras dessutom av fyra minneskapslar av typen HBM2 med en samlad kapacitet på 16 GB. Bandbredden anges till rekordhöga 720 GB/s, som dock är lägre än de 1 TB/s som möjliggörs av minnestekniken. Det är dock troligt att Nvidia skruvat ned klockfrekvenserna på för att pressa strömförbrukningen, och att andra grafikkort med GP100 bestyckas med snabbare HBM2.

Leveranserna av Nvidia Tesla P100 inleds inom kort. När grafikkretsen GP100 kan tänkas hitta ut i grafikkort för konsumenter framgår inte.

Kommentarer till artikeln

114 debattinlägg

Skicka en rättelse
80

Samsung avtäcker Galaxy S8 och S8+

Samsungs Unpacked-evenemang blir arena för lanseringen av de nya flaggskeppstelefonerna Galaxy S8 och S8+, där båda modellerna har nästintill kantlösa bildskärmar. Läs mer

27

Testpilot: Vertagear Triigger 350 Special Edition

Med en sportigt röd metalliclack och Formel 1-inspirerade paddlar sladdar gamingstolen Vertagear Triigger 350SE in hos testpiloten Joakim "vargeEEEEn" Pekkari för recension. Läs mer

62

Windows 10 Creators Update släpps 11 april

Microsoft har nu bekräftat att årets första stora uppdatering till Windows 10 släpps i april. Bland nyheterna återfinns bland annat en ny version av Paint och spelläget Game Mode. Läs mer

34

FSP lanserar nätaggregatsserien Dagger i formfaktorn SFX

Taiwanesiska FSP ansluter sig till skaran tillverkare att framställa högpresterande nätaggregat för den mindre formfaktorn SFX, där den nya serien Dagger kommer i både 500 och 600 W. Läs mer

14

Razer uppdaterar Blade Pro med Kaby Lake och THX-certifiering

Den bärbara speldatorn Razer Blade Pro lanseras i en ny version, där en av de stora nyheterna är THX-certifiering av ljud och bild. Läs mer

51

Biostar lanserar X370GTN – Mini ITX-moderkort för AMD Ryzen

Efter att ha saknats vid lansering börjar moderkort enligt formfaktorn Mini ITX dyka upp för AMD Ryzen. Först ut blir Biostar med X370GTN som baseras kring styrkretsen X370. Läs mer

19

Planescape: Torment får nyutgåva med uppdaterad grafik

Det klassiska rollspelet Planescape: Torment får en remaster-utgåva senare i år, med stöd för modern hårdvara och 4K-upplösning. Läs mer

51

Test: Benq Zowie XL2540 – Gamingskärm med äkta 240 Hz

Benq tar sikte på e-sporten med Zowie XL2540, en gamingskärm med traditionella 1 920 × 1 080 pixlars upplösning och en TN-panel med genuin 240 Hz-kapacitet. Läs mer

64

Elon Musk startar Neuralink – ska utveckla hjärnimplantat för att interagera med datorer

Det senaste projektet från entreprenören Elon Musk heter Neuralink och ska utveckla teknik för att koppla ihop hjärnan med datorer genom implantat. Läs mer

73

Intel lanserar Optane för konsumenter i form av M.2-baserad cachelagring

De första konsumentprodukterna med Intels minnesteknik 3D Xpoint ser nu dagens ljus i form av två M.2-enheter med låg kapacitet ämnade för cachelagring ihop med mekaniska hårddiskar. Läs mer

72

Microsoft stäms av användare för Windows 10-uppgradering

Ett flertal användare hävdar att uppgraderingen till operativsystemet Windows 10 skadat deras datorer och raderat sparade filer, något som de nu stämmer Microsoft för. Läs mer

15

TSMC inleder massproduktion av Apples systemkrets A11 i april

Inför höstens lansering av nästa generations Iphone förbereder TSMC storskalig produktion av Apples kommande systemkrets A11, där tillverkningen denna gång sker i 10 nanometer. Läs mer