Asus lanserar arbetsstation med Nvidia GB300 Blackwell Ultra

Permalänk
Melding Plague

Asus lanserar arbetsstation med Nvidia GB300 Blackwell Ultra

ExpertCenter Pro ET900N G3 har ännu inget pris men lär inte bli billig.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Klarar den av Crysis?

Permalänk
Redaktion
Redaktör
Skrivet av ThomasLidstrom:

Klarar den av Crysis?

Köp en och testa!

Permalänk
Medlem

Känns rimligt, nästan mer ram än min systemsdisk

Permalänk
Datavetare

Vore spännande att få en mer konsumentinriktad version av DGX-plattformen. Inte minst då den är helt byggd för att köras på Linux.

Systemet i artikeln kommer med NVIDIAs "DGX OS", som i praktiken är Ubuntu med alla drivers + lite andra CUDA-relaterade program förinstallerade.

Vad det gäller priset på denna, TechPowerUp gissar på >= 30 000 USD, vilket nog är fullt rimligt.

DGX Sparks är "budgetvarianten" med 128 GB RAM, men även den kommer ligga på 3 000 - 4 000 USD.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Vore spännande att få en mer konsumentinriktad version av DGX-plattformen. Inte minst då den är helt byggd för att köras på Linux.

Systemet i artikeln kommer med NVIDIAs "DGX OS", som i praktiken är Ubuntu med alla drivers + lite andra CUDA-relaterade program förinstallerade.

Vad det gäller priset på denna, TechPowerUp gissar på >= 30 000 USD, vilket nog är fullt rimligt.

DGX Sparks är "budgetvarianten" med 128 GB RAM, men även den kommer ligga på 3 000 - 4 000 USD.

Asus har ju sin Ascent GX10som ligger runt 1000$ under DGX, tyvärr lär de nog inte gå ner så mycket förbi det. Men kanske går att hitta begagnade enheter om något år.

Permalänk
Hedersmedlem

20 PFLOFS på skrivbordet är helt galet. Jag sitter med 0.03 i mitt 3080 (dock i FP16, men som jag förstår det ger FP8 och FP4 samma prestanda på Ampere?)...

Visa signatur

Asus ROG STRIX B550-F / Ryzen 5800X3D / 48 GB 3200 MHz CL14 / Asus TUF 3080 OC / WD SN850 1 TB, Kingston NV1 2 TB + NAS / Corsair RM650x V3 / Acer XB271HU (1440p165) / LG C1 55"
NAS: 6700K/16GB/Debian+ZFS | Backup (offsite): 9600K/16GB/Debian+ZFS

Permalänk
Medlem

Priset blir intressant att veta, men även strömförbrukningen, behovet av AC sommartid.

Visa signatur

Citera mig - annars kan svar utebli i trådar jag inte själv skapat.

Permalänk
Medlem
Skrivet av Thomas:

20 PFLOFS på skrivbordet är helt galet. Jag sitter med 0.03 i mitt 3080 (dock i FP16, men som jag förstår det ger FP8 och FP4 samma prestanda på Ampere?)...

Enligt
TechPowerUp > GPU Database > GeForce RTX 3080 Specs
Så har RTX 3080

Theoretical Performance
Pixel Rate 164.2 GPixel/s
Texture Rate 465.1 GTexel/s
FP16 (half) 29.77 TFLOPS (1:1)
FP32 (float) 29.77 TFLOPS
FP64 (double) 465.1 GFLOPS (1:64)

Verkar ha lika många TFLOPS i FP32 som i FP16.

Permalänk
Hedersmedlem
Skrivet av GuessWho:

Enligt
TechPowerUp > GPU Database > GeForce RTX 3080 Specs
Så har RTX 3080

Theoretical Performance
Pixel Rate 164.2 GPixel/s
Texture Rate 465.1 GTexel/s
FP16 (half) 29.77 TFLOPS (1:1)
FP32 (float) 29.77 TFLOPS
FP64 (double) 465.1 GFLOPS (1:64)

Verkar ha lika många TFLOPS i FP32 som i FP16.

Jo, det var den jag kollade på också.

Visa signatur

Asus ROG STRIX B550-F / Ryzen 5800X3D / 48 GB 3200 MHz CL14 / Asus TUF 3080 OC / WD SN850 1 TB, Kingston NV1 2 TB + NAS / Corsair RM650x V3 / Acer XB271HU (1440p165) / LG C1 55"
NAS: 6700K/16GB/Debian+ZFS | Backup (offsite): 9600K/16GB/Debian+ZFS

Permalänk
Medlem

20 petaflops refererar nog till tensorcore ops för fp4, medan tech powerup nog inte tar hänsyn till tensorcores. Ska man jämföra äpplen med äpplen (i detta fall tc fp16) så är det nog 20/4 = 5 vs 0.03*8=0.24. Fortfarande sjukt stor skillnad dock

Sen räknar nog båda fallen med en funktion som kallas structured sparsity, och är bara användbar i nichade fall. För att ta bort den ska båda siffrorna halveras..

Och tensor cores är bara en specifik enhet som beräknar matrismultiplikation i reducerad precision. Så för mer generella applikationer i fp32 kan man dela flops ovan med 16 igen.

Dvs fp4 sparse tensor core: 20 PFlops
Fp32 general compute: 20PFlops / (4*2*8*2) = 156 TFlops (gissar jag på)