Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Under GPU Technology Conference tillkännager Nvidias Jen-Hsun Huang grafikkretsen GP100, som kommer med inget mindre än 15,3 miljarder transistorer tillverkade på 16 nanometer.

Under Nvidias årliga GPU Technology Conference intar bolagets Jen-Hsun Huang scen för att presentera de stora nyheterna. I år blir det också plattformen där Nvidia kastar ljus på den kommande arkitekturen Pascal, där först ut att äntra rampljuset är Tesla P100 med grafikkretsen GP100.

Nvidia-GP100-block.png

Blockdiagram för Nvidia "Pascal" GP100.

Nvidia-Tesla-P100.jpg

Specifikationer: Nvidia Tesla P100

Tesla K40

Tesla M40

Tesla P100

Teknik

28nm TSMC

28nm TSMC

16nm TSMC

Krets

GK110

GM200

GP100

Kretsyta

551 mm2

601 mm2

610 mm2

Transistorer

7,1 miljarder

8 miljarder

15,3 miljarder

Arkitektur

Kepler

Maxwell

Pascal

SM-kluster

15 st.

24 st.

56 st.

CUDA-kärnor

2 880 st.

3 072 st.

3 584 st.

Texturenheter

240 st.

192 st.

224 st.

Klockfrekvens

745 MHz

948 MHz

1 328 MHz

GPU Boost

875 MHz

1 114 MHz

1 480 MHz

Beräkningskraft (SP, FP32)

5 040 GFLOPS

6 844 GFLOPS

10 608 GFLOPS

Beräkningskraft (DP, FP64)

1 680 GFLOPS

214 GFLOPS

5 304 GFLOPS

Minnesbuss

384-bit

384-bit

4 096-bit

Minnestyp

GDDR5

GDDR5

HBM2

Minnesmängd

Upp till 12 GB

Upp till 24 GB

16 GB

Minnesfrekvens

6 000 MHz

6 000 MHz

~1 400 MHz

Minnesbandbredd

288 GB/s

288 GB/s

720 GB/s

TDP

235 W

250 W

300 W

Beräkningskortet Tesla P100 är först ut med arkitekturen Pascal, som tack vare en 16-nanometersteknik från TSMC huserar inget mindre än 15,3 miljarder transistorer. Detta att jämföra mot 8 miljarder för Maxwell-baserade GM200, och storleken på själva kretsen är något större på 610 mm2.

Till det massiva antalet transistorer hör också gott om beräkningskraft, där kortet vid singelprecision (FP32) anges till 10,6 TFLOPS och dubbelprecision (FP64) till 5,3 TFLOPS. Det förstnämnda är en ökning med 54 procent jämfört mot GM200, och skulle kunna ses som en indikation om vad som är att vänta av uppföljaren till det konsumentorienterade grafikkortet Geforce Titan X.

Nvidia-GP100-SM-block.png

Ett Stream Multiprocessor-kluster med 64 CUDA-kärnor.

För vidare specifikationer har GP100 hela 60 Stream Multiprocessor-kluster, varje med 64 CUDA-kärnor och 4 texturenheter. Detta ger totalt 3 840 CUDA-kärnor och 240 texturenheter. För Tesla P100 är dock fyra kluster inaktiverade, vilket sänker antalet till 3 584 respektive 224 stycken.

Grafikkretsen flankeras dessutom av fyra minneskapslar av typen HBM2 med en samlad kapacitet på 16 GB. Bandbredden anges till rekordhöga 720 GB/s, som dock är lägre än de 1 TB/s som möjliggörs av minnestekniken. Det är dock troligt att Nvidia skruvat ned klockfrekvenserna på för att pressa strömförbrukningen, och att andra grafikkort med GP100 bestyckas med snabbare HBM2.

Leveranserna av Nvidia Tesla P100 inleds inom kort. När grafikkretsen GP100 kan tänkas hitta ut i grafikkort för konsumenter framgår inte.

Kommentarer till artikeln

114 debattinlägg

Skicka en rättelse
3

Live: Nintendo-kväll med Geeks Gaming

Häng med när Geeks Gaming spelar både nytt och gammalt från Nintendo. Galleriet kommer uppdateras löpande från kvällens gång. Läs mer

Blixtsnabb SSD-lagring bakom lucka tio

  • igår 12:00

Det är dags för den tionde luckan i Geeks Julkalender, och här erbjuder Inet ett förmånligt pris på en rymlig SSD. Läs mer

12

Fredagspanelen 126: Oculus Touch, AMD Crimson ReLive och Fitbit förvärvar Pebble

Jonas och Kenneth rasar över uteblivna smarta klockor, snackar nya drivrutiner och blir påtvingade ett grandiost julpynt i veckans avsnitt av fredagspanelen. Läs mer

24

Julstämning med Bluetooth-styrd ljusstake

Till julen hör ljusstakar och slingor i alla tänkbara tappningar. Medlemmen Sennaho skruvar upp konceptet genom att introducera styrning via Bluetooth. Läs mer

39

The Division får DirectX 12-stöd nästa vecka

I och med nästa uppdatering av svenska Massives The Division introduceras stöd för grafikgränssnittet DirectX 12, vilket ska medföra bättre prestanda i högre upplösningar. Läs mer

16

Google, Oculus och HTC med flera går samman för att bilda VR-förening

För att främja utveckling och innovation inom virtuell verklighet går flera stora aktörer samman och bildar Global Virtual Reality Association, ett samarbete som ska forma framtiden för VR. Läs mer

25

Bitfenix avtäcker Shogun – chassi med dubbla paneler av härdat glas

Dubbla paneler av härdat glas, gedigen konstruktion och plats för en uppsjö av hårddiskar. Dessa är några av paradnumren för Bitfenix senaste flaggskeppschassi Shogun. Läs mer

31

SweClockers logotyp pyntad för jul!

Nio stilfulla jullogotyper gick till final och efter att medlemmarna fått säga sitt är det ett bidrag som med bred marginal kammat hem segern, och får sprida julstämning på SweClockers. Läs mer

12

Spelare bygger fungerande Atari 2600-emulator i Minecraft

Youtube-användaren SethBling visar i ett nytt videoklipp på de stora möjligheterna i Minecraft, med en Atari 2600-emulator skapad direkt i spelet. Läs mer

10

Testpilot: Cooler Master Mastermouse Pro L

Cooler Masters modulära mus Mastermouse Pro L passar både vänster- och högerhänta samt olika greppstilar. Testpiloten Niklas Huhtala sätter tänderna i modellen och ser vad den går för. Läs mer

65

Microsoft samarbetar med Qualcomm för att ta Windows 10 till ARM-processorer

I ett något oväntat drag meddelar nu Microsoft att Windows 10 i framtiden kommer kunna köras på ARM-processorer, med stöd för samtliga Windows-applikationer och spel. Läs mer

65

AMD introducerar Radeon Software Crimson ReLive

Ett år efter introduktionen av mjukvarusviten Radeon Software Crimson har det blivit dags för nästa inkarnation, där en av de stora nyheterna är en hårdvaruaccelererad inspelningsfunktion. Läs mer