Nvidia tillkännager Tesla V100 – Volta med 21 miljarder transistorer på 12 nanometer

Nvidia tillkännager Tesla V100 – Volta med 21 miljarder transistorer på 12 nanometer

På scenen under GPU Technology Conference tillkännager Nvidias Jen-Hsun Huang arkitekturen Volta, som gör entré i världen mest avancerade och största krets genom tiderna.

Traditionen trogen håller Nvidia i sin årliga GPU Technology Conference och under en session intar alltid bolagets grundare och VD Jen-Hsun Huang scenen. Under fjolåret presterades arkitekturen Pascal med beräkningskortet Tesla P100 och för 2017 års upplaga är det dags för nästa steg – Volta.

Nvidia-GV100.png

Blockdiagram för Nvidia "Volta" GV100

Skärmbild (285).png

Specifikationer: Nvidia Tesla V100

Tesla V100

Tesla P100

Tesla M40

Tesla K40

Teknik

12nm TSMC

16nm TSMC

28nm TSMC

28nm TSMC

Krets

GV100

GP100

GM200

GK110

Kretsyta

815 mm2

610 mm2

601 mm2

551 mm2

Transistorer

21,1 miljarder

15,3 miljarder

8 miljarder

7,1 miljarder

Arkitektur

Volta

Pascal

Maxwell

Kepler

SM-kluster

80 st.

56 st.

24 st.

15 st.

CUDA-kärnor

5 120 st.

3 584 st.

3 072 st.

2 880 st.

Texturenheter

320 st.

224 st.

192 st.

240 st.

Klockfrekvens

1 370 MHz

1 328 MHz

948 MHz

745 MHz

GPU Boost

1 455 MHz

1 480 MHz

1 114 MHz

875 MHz

Beräkningskraft (SP, FP32)

14 899 GFLOPS

10 608 GFLOPS

6 844 GFLOPS

5 040 GFLOPS

Beräkningskraft (DP, FP64)

7 450 GLOPS

5 304 GFLOPS

214 GFLOPS

1 680 GFLOPS

Minnesbuss

4 096-bit

4 096-bit

384-bit

384-bit

Minnestyp

HBM2

HBM2

GDDR5

GDDR5

Minnesmängd

16 GB

16 GB

Upp till 24 GB

Upp till 12 GB

Minnesfrekvens

~1 750 MHz

1 430 MHz

6 000 MHz

6 000 MHz

Minnesbandbredd

900 GB/s

732 GB/s

288 GB/s

288 GB/s

TDP

300 W

300 W

250 W

235 W

Det nya beräkningskortet heter Tesla V100 och debuterar arkitekturen Volta. Grafikkretsen GV100 bygger på TSMC:s 12-nanometersteknik, som baseras på fjolårets 16 nanometer men med optimeringar för energieffektivitet, prestanda och transistortäthet. Det här möjliggör för Nvidia att skapa den mest avancerade och största kretsen någonsin.

► Läs alla artiklar om #Nvidia Volta

Grafikkretsen huserar inget mindre än 21 miljarder transistorer, vilket kan jämföras med 15,3 miljarder transistorer för tidigare rekordhållare GP100. Detta med en kretsyta på massiva 815 mm2, avsevärt större än enstaka kretsar som historiskt mätt som mest närmare 700 mm2.

NVIDIA-Volta-GV100-Tensor.png

Ett Stream Multiprocessor-kluster med 64 CUDA-kärnor och 8 Tensor-kärnor.

Skärmbild (292).png
Skärmbild (294).png
Skärmbild (296).png
Skärmbild (299).png
Skärmbild (300).png

Antalet CUDA-kärnor för Tesla V100 är 5 120 stycken och beräkningskraften anges till 15 TFLOPS vid singelprecision (FP32) och 7,5 TFLOPS vid dubbelprecision (FP64). Vid sidan om detta hör en ny typ av Tensor-kärnor som kan utföra beräkningar särskilt ämnade maskininlärning och med dessa är den teoretiska beräkningskraften hela 120 TFLOPS.

Den massiva grafikkretsen omgärdas av fyra HBM2-kapslar på 4 GB vardera med en klockfrekvens på 875 MHz (1 750 MHz effektivt), vilket ger totalt 16 GB minne och en teoretiskt bandbredd om 900 GB/s. I anslutningsväg har Tesla V100 stöd för andra generationens NVLink med en bandbredd på 300 GB/s – nästan tio gånger högre än 32 GB/s för PCI Express 3.0 x16.

Skärmbild (302).png
Skärmbild (305).png
Skärmbild (307).png

Leveranserna av Nvidia Tesla V100 inleds under årets tredje kvartal. När den nya grafikkretsen släpps för konsumenter framgår inte, men med Pascal i åtanke är det troligt att Nvidia skapar en mindre och mer energieffektiv krets vid namn GV102 utan beräkningsorienterade finesser.

Kommentarer till artikeln

73 debattinlägg

Skicka en rättelse
2

Marknaden för spelskärmar över 100 Hz mer än dubblerades år 2018

Spelorienterade skärmar fortsätter att bli allt mer populära och segmentet mer än dubblerades förra året. Från ingenstans seglar MSI upp som femte största leverantör av spelskärmar. Läs mer

159

Het diskussion om kontantlöst samhälle och uttagsavgift från bankomater

De allra flesta är uppväxta med att kontanter är ett självklart betalmedel, men nu pekar alltmer mot att sedlar och mynt vara på väg bort. Är det rätt av Bankomat att införa en avgift för uttag? Läs mer

I samarbete med Asus
14

Tävla och vinn Asus flaggskepp Zenfone 6 med massivt batteri

För att fira lanseringen av Zenfone 6 och lång batteritid arrangerar Asus en tävling för SweClockers medlemmar, som får chansen att vinna den nya flaggskeppsluren. Läs mer

20 ÅR
10

Throwback Thursday – populära Mini ITX-chassit Bitfenix Prodigy fyller sju år

För sju år sedan lanserades det populära Mini ITX-chassit Bitfenix Prodigy – en modell som bjöd på imponerande expansionmöjligheter för storleken och satte standarden för sin tid. Läs mer

72

Huawei: "Förstår att våra partner är pressade av politiskt motiverade beslut"

I ett skriftligt uttalande skriver Huawei att de förstår sina samarbetspartner som brutit med bolaget till följd av "politiskt motiverade beslut". Läs mer

12

Funcom presenterar Seed of Evil – expansion till Mutant Year Zero

Fjolårets svenskutvecklade Mutant Year Zero får den nya expansionen Seed of Evil. Det nya innehållet innefattar utöver ny handling även en ny karaktär. Läs mer

61

MSI: "Moderkort med AMD:s styrkrets X570 behöver fläkt"

Efter att MSI-moderkort med styrkretsen X570 letat sig ut på webben har det dykt upp frågor om varför dessa har fläktkylning. Nu uttalar sig MSI om att den krävs för att kyla kretsen. Läs mer

29

SweClockers har röstat – här är formkurvan för Fallout-spelen

Postapokalyps, supermutanter och evigt 50-tal – tre pelare i spelserien Fallout. Men, vilken titel är egentligen bäst? Här är SweClockers-gemenskapens dom. Läs mer

9

Qualcomm fälls för konkurrensbrott – tvingas ändra affärsmodell

Efter en längre strid med amerikanskt rättsväsende döms Qualcomm för konkurrenshämmande verksamhet, och ska enligt domen fundamentalt stöpa om affärsmodellen. Läs mer

0

AMD släpper grafikdrivrutin med stöd för Total War: Three Kingdoms

Lagom till dagens lansering av den strategibetonade slagfältssimulatorn Total War: Three Kingdoms släpper AMD en ny drivrutin med prestandamässiga optimeringar för titeln. Läs mer

42

GOG samlar spelbutiker på en plats i nya klienten Galaxy 2.0

Spelbutiken GOG vill förena spelares spelkataloger då version två av klienten GOG Galaxy ska låta användare importera spelbibliotek från andra spelbutiker. Läs mer

89

Huawei förlorar ARM-licens – omöjliggör utveckling av systemkretsar

ARM Holdings uppges beordra sina anställda att inte arbeta med Huawei. Det innebär att Huawei kan förlora den kritiska instruktionsuppsättningen i företagets ARM-processorer. Läs mer