Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Nvidia tillkännager Tesla P100 – Pascal med 15,3 miljarder transistorer och HBM2

Under GPU Technology Conference tillkännager Nvidias Jen-Hsun Huang grafikkretsen GP100, som kommer med inget mindre än 15,3 miljarder transistorer tillverkade på 16 nanometer.

Under Nvidias årliga GPU Technology Conference intar bolagets Jen-Hsun Huang scen för att presentera de stora nyheterna. I år blir det också plattformen där Nvidia kastar ljus på den kommande arkitekturen Pascal, där först ut att äntra rampljuset är Tesla P100 med grafikkretsen GP100.

Nvidia-GP100-block.png

Blockdiagram för Nvidia "Pascal" GP100.

Nvidia-Tesla-P100.jpg

Specifikationer: Nvidia Tesla P100

Tesla K40

Tesla M40

Tesla P100

Teknik

28nm TSMC

28nm TSMC

16nm TSMC

Krets

GK110

GM200

GP100

Kretsyta

551 mm2

601 mm2

610 mm2

Transistorer

7,1 miljarder

8 miljarder

15,3 miljarder

Arkitektur

Kepler

Maxwell

Pascal

SM-kluster

15 st.

24 st.

56 st.

CUDA-kärnor

2 880 st.

3 072 st.

3 584 st.

Texturenheter

240 st.

192 st.

224 st.

Klockfrekvens

745 MHz

948 MHz

1 328 MHz

GPU Boost

875 MHz

1 114 MHz

1 480 MHz

Beräkningskraft (SP, FP32)

5 040 GFLOPS

6 844 GFLOPS

10 608 GFLOPS

Beräkningskraft (DP, FP64)

1 680 GFLOPS

214 GFLOPS

5 304 GFLOPS

Minnesbuss

384-bit

384-bit

4 096-bit

Minnestyp

GDDR5

GDDR5

HBM2

Minnesmängd

Upp till 12 GB

Upp till 24 GB

16 GB

Minnesfrekvens

6 000 MHz

6 000 MHz

~1 400 MHz

Minnesbandbredd

288 GB/s

288 GB/s

720 GB/s

TDP

235 W

250 W

300 W

Beräkningskortet Tesla P100 är först ut med arkitekturen Pascal, som tack vare en 16-nanometersteknik från TSMC huserar inget mindre än 15,3 miljarder transistorer. Detta att jämföra mot 8 miljarder för Maxwell-baserade GM200, och storleken på själva kretsen är något större på 610 mm2.

Till det massiva antalet transistorer hör också gott om beräkningskraft, där kortet vid singelprecision (FP32) anges till 10,6 TFLOPS och dubbelprecision (FP64) till 5,3 TFLOPS. Det förstnämnda är en ökning med 54 procent jämfört mot GM200, och skulle kunna ses som en indikation om vad som är att vänta av uppföljaren till det konsumentorienterade grafikkortet Geforce Titan X.

Nvidia-GP100-SM-block.png

Ett Stream Multiprocessor-kluster med 64 CUDA-kärnor.

För vidare specifikationer har GP100 hela 60 Stream Multiprocessor-kluster, varje med 64 CUDA-kärnor och 4 texturenheter. Detta ger totalt 3 840 CUDA-kärnor och 240 texturenheter. För Tesla P100 är dock fyra kluster inaktiverade, vilket sänker antalet till 3 584 respektive 224 stycken.

Grafikkretsen flankeras dessutom av fyra minneskapslar av typen HBM2 med en samlad kapacitet på 16 GB. Bandbredden anges till rekordhöga 720 GB/s, som dock är lägre än de 1 TB/s som möjliggörs av minnestekniken. Det är dock troligt att Nvidia skruvat ned klockfrekvenserna på för att pressa strömförbrukningen, och att andra grafikkort med GP100 bestyckas med snabbare HBM2.

Leveranserna av Nvidia Tesla P100 inleds inom kort. När grafikkretsen GP100 kan tänkas hitta ut i grafikkort för konsumenter framgår inte.

Kommentarer till artikeln

114 debattinlägg

Skicka en rättelse
10

SweClockers Meet & Geek till Skellefteå och tankar inför år 2019

När SweClockers för tredje gången på fyra månader begår medlemsträff bär det av till Skellefteå. Vi är redan i full gång med att planera för år 2019 och vill nu ha in önskemål från er! Läs mer

29

Webbläsarnas spårningsblockering uppges sakna funktion

Funktionen Do Not Track är tänkt att hindra webbplatser från att spåra användare, men enligt ny information är det ytterst ovanligt att detta faktiskt efterföljs. Läs mer

87

Netflix: "EU:s innehållskvot kommer endast få negativa konsekvenser"

I sin senaste kvartalsrapport kritiserar Netflix EU:s innehållskvot för strömningstjänster, och menar att en sådan lösning är fel väg att gå för att främja filmskapande i regionen. Läs mer

85

Bahnhof släpper 10 Gbit-router för hemanvändare

Bahnhof blir nu en av de första att erbjuda en router för privatpersoner som bestyckas med en 10 Gigabit Ethernet, och därmed klarar av att leverera hastigheter upp till 10 000 Mbit/s. Läs mer

33

Nvidia kan förbereda Geforce RTX 2070 Ti

Efter släppen av Geforce RTX 2080 Ti, RTX 2080 och RTX 2070 framgår att Nvidia kan komma att kila in en modell mellan de senare, något som skulle göra det trångt i prestanda- och prisstegen. Läs mer

8

Be Quiet lanserar Dark Rock Pro 4 för AMD Ryzen Threadripper

Be Quiet släpper en ny version av Dark Rock Pro, som erbjuder kylförmåga upp till 250 W och en ljudnivå på endast 24 decibel vid full belastning. Läs mer

131

Test: MSI Geforce RTX 2070 Armor – Turing för under 6 000 kronor

Arkitekturen Turings duett Geforce RTX 2080 Ti och RTX 2080 får sällskap av ett mer rimligt prissatt alternativ. Det har blivit dags att titta närmare på Geforce RTX 2070! Läs mer

235

Telia tvingas blockera fildelningssajter

Efter filmindustrins stämning mot Telia dömer Patent- och marknadsdomstolen Sveriges största leverantör av bredband att blockera The Pirate Bay, Dreamfilm, Nyafilmer och Fmovies. Läs mer

32

Crucial lanserar PCI Express-baserade SSD-enheter till pressat pris

Crucial utökar sitt utbud av SSD-enheter med den nya P1-serien, vilken till skillnad från tidigare modeller använder gränssnittet PCI Express för anslutning. Läs mer

36

Fulkultur är tillbaka med dubbelavsnitt om Sagan om Ringen och Tolkiens värld

Fyra månaders väntan är över och Fulkultur är äntligen tillbaka. Denna gång handlar det om J.R.R Tolkiens värld och Sagan om Ringen, som avhandlas i två nya avsnitt. Läs mer

35

Intel Core i9-9900K, Core i7-9700K och Core i5-9600K får stöd för 128 GB DDR4

Intel bekräftar att kommande Coffee Lake Refresh får stöd för upp till 128 GB primärminne, tack vare nya minnen med en kapacitet på upp till 32 GB per minnesmodul. Läs mer

70

Winamp återuppstår 2019

Sex år efter nedläggningen återuppstår Winamp under år 2019, med en modernisering av mediaspelaren för PC/Windows och Mac OS samt en ny applikation för smarta telefoner. Läs mer