Nvidia avtäcker liten superdator för 38 000 kronor

Permalänk
Melding Plague

Nvidia avtäcker liten superdator för 38 000 kronor

DGX Spark riktar sig till professionella användare – eller dig med djupa fickor.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Vilket OS? Linux?

Nostalgi för övrigt. Fick mina hjärnceller att gräva fram SPARC (Scalable Processor ARChitecture).

https://en.m.wikipedia.org/wiki/SPARC

Visa signatur

Ryzen 7 7800X3D | ASUS TUF Gaming B650-Plus WIFI | Kingston 32GB (2x16GB) DDR5 6GT/s CL30 FURY Beast | Kingston Fury Renegade M.2 NVMe SSD Gen 4 2TB | MSI RTX 4060 8GB | Fractal Design Define S | MSI MPG A850G 850W | Thermalright Phantom Spirit 120 SE | Windows 11 Pro | AOC 27" AGON AG276QZD2 OLED QHD 240 Hz

Permalänk
Medlem

Bara jag som blev förvånad över att den inte kostar mer? Klart inte en billig grej, men man få tänka att en maxad imac pro landar på runt 5500 dollar.

Permalänk
Medlem

Hur snabb är den jämfört med 4090 eller 5090?

Visa signatur

“The dollar is our currency, but it's your problem.” -John Connally, President Nixon's Treasury Secretary to a group of European finance minsters
"Keep the Russians out, the Americans in, and the Germans down" -NATO Secretary General, Lord Ismay

Permalänk
Medlem
Skrivet av Joppis:

Vilket OS? Linux?

Nostalgi för övrigt. Fick mina hjärnceller att gräva fram SPARC (Scalable Processor ARChitecture).

https://en.m.wikipedia.org/wiki/SPARC

Nvidia DGX OS som bygger på Ubuntu.

Permalänk
Medlem

Detta var då tyvärr en besvikelse. Satt och såg keynoten igår.

Sett fram emot en Mac Studio-konkurrent minnesbandbreddsmässigt.
Men detta är ju bara halva minnesbandbredden av en M4 Max-cpu och ~1/4 av en Ultra.
Även om den säkerligen har bra mycket snabbare GPU så kommer minnesbandbredden sätta begränsningarna i tokens per sekund.
Så mitt hopp om datorinköp blev plötsligt mycket komplicerat. Siktat på en M4 Ultra som inte släpptes, eller nu denna som har lägre prestanda än förhoppningarna. Så får väl köpa mig en M4 Max som ersättare till M1 Max och acceptera att det blir inga stora modeller att köra lokalt...

Men om man vill arbeta i Nvidias ekosystem runt DGX och vllm etc. är detta säkerligen en intressant pryl för prosumers eller kontorsarbete. Men är nog bättre att skaffa ett RTX Pro 6000 som insteg i jobbsammanhang iaf.

@Joppis Sannolikt nvidia dgx os, alltså ubuntu med nvidia-repon för deras grejer.

Men det är kul med nya *nix-workstations. Även om detta är en lite mindre pryl.
Mer kommer från Nvidia framgent med DGX Station: https://wccftech.com/nvidia-enters-ai-pc-realm-dgx-spark-dgx-... men prislappen på den lär vara precis som 90talets SGI osv.

Edit:
Också väldigt roligt att det rullas ut seriösa ARM-maskiner nu också. x86 har äntligen fått bra konkurrens igen. "Nvidia 72-core Grace CPU Performance close to AMD 96-core Threadripper 7995WX" - https://www.guru3d.com/story/nvidia-72core-grace-cpu-performa...

Permalänk
Medlem

Det är ju faktiskt billigare än min nuvarande dator.

Visa signatur

Desktop: AMD Ryzen 7 7800X3D | ASUS ROG B650E-F | Deepcool LT720 | Gainward Phantom RTX 4090 | 64 GB G.Skill Trident Z5 Neo RGB DDR5-6000 | WD Black SN850X | Lian Li Lancool 216 | Corsair RM1000x SHIFT | LG Oled LX3 (Flex) 42" | Roccat Kone Pro Air | Logitech G915 TKL Brown | Windows 11 Pro

Permalänk
Medlem

Kan det vara ett MSRP pris?? igen..

Men dyr är den väl andå inte? *sneglar mot Apple*

Skrivet av Joppis:

Vilket OS? Linux?

Nostalgi för övrigt. Fick mina hjärnceller att gräva fram SPARC (Scalable Processor ARChitecture).

https://en.m.wikipedia.org/wiki/SPARC

DXG OS is just Ubuntu with optimized Linux kernel, which supports GPU Direct Storage (GDS) and access to all NVIDIA GPU driver branches and CUDA toolkit versions.

Visa signatur

42? Seven and a half million years and all you can come up with is 42?!
► FD Define R2 | Win11Pro | R7-5800X | PA 120SE | ROG STRIX B550-F GAMING | CMN32GX4M2Z4600C18 | 1080 Ti | AX750 | Asus VG27WQ | HP Z27n |► Realme GT Master |

Permalänk
Medlem
Skrivet av xfade:

Men dyr är den väl andå inte? *sneglar mot Apple*

Nej, det låter som rätt så rimlig prissätning, givet att det är ett pris som faktiskt kommer gälla i verkligheten.

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem

Kostar som ett endaste 5090 då. Känns mycket mer värt.

Visa signatur

AMDAMDAMD

Permalänk
Medlem
Skrivet av Sidde:

Också väldigt roligt att det rullas ut seriösa ARM-maskiner nu också. x86 har äntligen fått bra konkurrens igen. "Nvidia 72-core Grace CPU Performance close to AMD 96-core Threadripper 7995WX" - https://www.guru3d.com/story/nvidia-72core-grace-cpu-performa...

Det var som... nVidia har inte legat på latsidan!
Först seriös AI-assisterad rendering för gaming, och nu en gedign ARM-prolle.

Starkt jobbat nVidia.

Visa signatur

|[●▪▪●]| #Monster Battle Station(tm)#: Ryzen 3700X >-< GB-X570-AE >-< 32GB RAM >-< RTX 4070S >-< Crucial 2TB SSD |[●▪▪●]|

Permalänk
Medlem

STORT villhöver på denna

Permalänk
Medlem

Blir nog lagom att köra 72B modeller i tja acceptabel hastighet, tyvärr är minneshastigheten riktigt långsam. Frågan är nu dock om Framework Desktop är ett bättre val än denna eller ej, vist minneshastigheten är ett snäpp lägre samt AMD men betydligt bättre CPU för att inte nämna 10k billigare.

Visa signatur

Speldator: Ryzen 7800X3D, 64GB DDR5, RTX 5090
Server: i7-8700k, 32GB DDR4, RTX2080
Steam deck, Rog Ally + de fiesta konsoler.

Permalänk
Medlem

Man kan bygga ihop en bättre dator 🖥 med valfria komponenter...

Jag känner mig inte så sugen 🤤 på denna datorn...

Visa signatur

Att jaga Krokodil 🐊 med en känd profil gör att internetfakturan blir betald med Stil. 🏖

En dammsugare som Suger och inte är Sugen betyder bara att det är ett dåligt märke utan drag i - Ett felaktigt köp...😃

Hon vet säkert mäst vad som kan va' bäst, o hon talar som en läsarpräst. 😊 Absolutely Vodka. 😊 Chili 🌶 Mobil = Nyskapande på GHz... ✅

Permalänk
Medlem
Skrivet av Radovic:

Man kan bygga ihop en bättre dator 🖥 med valfria komponenter...

Jag känner mig inte så sugen 🤤 på denna datorn...

Själva grejen här är väl just att detta är en till variant på "dator med duglig GPU som har tillgång till mycket minne", eller om man så vill, något som fungerar som arbetsstation som kan jonglera större AI-modeller.
(Ja, jag har sett att det är lite si och så med minnesbandbredden, men känns som att det tydligt är detta segment den siktar på att vara något slags instegsmodell för oavsett)

Om du ska bygga en "bättre dator" så måste den väl då också ha en någorlunda kapabel GPU som har tillgång till närmare 128GB minne för att inte vara sämre i det sammanhanget, och detta då i något slags liknande prisklass.
Det är ju inte så att det inte finns några alternativ alls (och alternativen kanske är bättre!), men "valfria komponenter" känns som att det börjar tänja väldigt på det hela; blir inte så mycket valfria komponenter att välja bland vad jag sett, utan känns som att det i dagsläget snarare blir några stycken mer eller mindre nedlåsta alternativ.

Om man inte ska köpa ett grafikkort som i sig spränger budgeten för hela systemet så är det precis som här någon variant med integrerad grafik, och då t.ex. Mac Studio, system baserade på AMD Ryzen AI Max, som figurerar i sådana diskussioner. Och där är det inte så mycket "valfritt", eller ja, det börjar bli "fritt från val" snarare, om något.

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Medlem
Skrivet av evil penguin:

Själva grejen här är väl just att detta är en till variant på "dator med duglig GPU som har tillgång till mycket minne", eller om man så vill, något som fungerar som arbetsstation som kan jonglera större AI-modeller.
(Ja, jag har sett att det är lite si och så med minnesbandbredden, men känns som att det tydligt är detta segment den siktar på att vara något slags instegsmodell för oavsett)

Om du ska bygga en "bättre dator" så måste den väl då också ha en någorlunda kapabel GPU som har tillgång till närmare 128GB minne för att inte vara sämre i det sammanhanget, och detta då i något slags liknande prisklass.
Det är ju inte så att det inte finns några alternativ alls (och alternativen kanske är bättre!), men "valfria komponenter" känns som att det börjar tänja väldigt på det hela; blir inte så mycket valfria komponenter att välja bland vad jag sett, utan känns som att det i dagsläget snarare blir några stycken mer eller mindre nedlåsta alternativ.

Om man inte ska köpa ett grafikkort som i sig spränger budgeten för hela systemet så är det precis som här någon variant med integrerad grafik, och då t.ex. Mac Studio, system baserade på AMD Ryzen AI Max, som figurerar i sådana diskussioner. Och där är det inte så mycket "valfritt", eller ja, det börjar bli "fritt från val" snarare, om något.

Yep, detta är verkligen inget man bara bygger ihop, närmsta vore väl isåfall något vaserat på threadrippers eller ampere men ändå inte samma sak. Inte riktigt mot gamers oavsett.

Är spännande, nyfiken om om de kommer släppa något som konkurrera mer i klass med Strix halo för mer generellt bruk.

Men är mer taggad påbatt flera/större/snabbare RISC-V processorer med RVV ska börja dyka upp, börjar bli trött på walled gardens.

Visa signatur

Gamingrigg: MEG x570 ACE, 5950X, Ripjaws V 32GB 4000MT/S CL16, 6800XT Red Devil LE, HX1200i.
Laptop: XPS 9570 x GTX 1050 x 8300h + 16GB Vengeance 2666Mhz + Intel AX200
Valheim server: i7-8559 + Iris Plus 655 + 32GB + 256GB
Printers? Yes. Ender 5, Creality LD-002R, Velleman VM8600, Velleman K8200

Permalänk
Medlem

En hel dator för samma pris som ett 5090… jag vet vilken jag skulle välja

Permalänk
Medlem

Trodde först att det va en ny xbox series X, när jag såg bilden

Visa signatur

Chassi Fractal design R6 USB C, Skärm LG UltraGear 38GN950 38" Moderkort ASUS ROG STRIX X570-E GAMING CPU 5800X3D RAM G.Skill 4x8 DDR4 3600MHz CL16 Ripjaws SSD 1 Samsung 970 EVO Plus 250GB SSD 2 CRUCIAL MX500 2TB. SSD 3 WD SN770 2TB,SSD 4 SAMSUNG 970EVO 512GB, GPU Gigabyte Geforce RTX 3080 10GB AORUS XTREME NON LHR. Nätagg Corsair RM1000x.

Permalänk
Medlem

Är den snabbare än en PDP 11 som minidator?

Permalänk
Skrivet av iknight:

Bara jag som blev förvånad över att den inte kostar mer? Klart inte en billig grej, men man få tänka att en maxad imac pro landar på runt 5500 dollar.

En imac pro alltså. Ca 4 år sedan den gick att beställa. Du kanske tänker på Mac studio? Eller Mac mini?

Permalänk
Medlem
Skrivet av medbor:

En hel dator för samma pris som ett 5090… jag vet vilken jag skulle välja

Precis min tanke också 🙂

Permalänk

Så det är ett 5070 med 128GB (LPDDR5X?) minne i princip. Folk säger att det är prisvärt men jag håller inte med. 13800kr är vad GPU + minne kostar vilket gör processorn rätt dyr.

Anledningen till det höga priset är nog pga avsaknaden av konkurrens för system med unified memory. Hoppas Intel/AMD/Qualcomm också hoppar på tåget.

Visa signatur
Permalänk
Medlem
Skrivet av klein:

Är den snabbare än en PDP 11 som minidator?

Ja.

(Men nej, det är ju förstås inte en minidator i traditionell mening)

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Datavetare
Skrivet av IKEA Billy Bokhylla:

Så det är ett 5070 med 128GB (LPDDR5X?) minne i princip. Folk säger att det är prisvärt men jag håller inte med. 13800kr är vad GPU + minne kostar vilket gör processorn rätt dyr.

Anledningen till det höga priset är nog pga avsaknaden av konkurrens för system med unified memory. Hoppas Intel/AMD/Qualcomm också hoppar på tåget.

Nu finns inte officiella specifikationer för FP32 hos DGX Spark, men om vi antar (då det är högst sannolikt) att det är samma FP4 vs FP32 ratio hos DGX Spark som andra konsument-blackwell verkar man hamna rätt mycket exakt på ett 5070.

För ett 5070 med 128 GB VRAM är det knappast dyrt, för de som har nytta av så mycket RAM.

AMD har rätt nyligen släppt deras "Strix Halo" som får anses vara en väldigt nära konkurrent till denna då båda har samma bandbredd mot RAM, samma maximala RAM-kapacitet och FP32-kapaciteten är rätt nära (om antagandet ovan stämmer har DGX Spark ett visst övertag, men handlar mer om 10-30 % mot Radeon 8060S, inga heltalsfaktorer).

Mot Apple är det lite svårare att göra en direkt jämförelse. Prismässigt, GPU-kapacitetmässigt och VRAM-bandbreddsmässigt är M4 Pro väldigt lika, fast den har en maximal RAM-kapacitet på 64 GB.

M4 Max är dyrare, men har också en snabbare GPU och dubbla bandbredden mot RAM.

CPU-mässigt lär inte Nvidia nå Apple, men de kommer med 100 % säkerhet klå "Strix Halo" givet att telefoner med Cortex X925 där man bara klockar dessa till 3,5-3,7 GHz, är snabbare än toppmodellen av "Strix Halo" i single-thread (typ 10-15 % snabbare).

Arm har pratat om att de kommer passera 4,0 GHz under 2025, om man antar att DGX Spark klockar 4,0 GHz borde den bli 20-25 % snabbare per kärna jämfört med Strix Halo (M4 är 30-35 % snabbare än Strix Halo per kärna).

Det som är den absoluta killer-app:en för DGX Spark är Nvidias CUDA-ramverk. Det ÄR guldstandarden för GPGPU och lär tyvärr också förbli det under överskådlig tid. Är man OK med MacOS (Linux är dock standardvalet för detta område) skulle jag hävda att Apple är i nuläget klar tvåa sett till programvara för GPGPU, men går inte att komma ifrån att man är efter CUDA.

Så finns faktiskt en del konkurrens här. Tre spelare är ju 50 % fler än antalet CPU-spelare på CPU-marknaden för stationära PC... Ryktet säger att Qualcomm har någon form av stationär på gång och finns också rykten att Intel ska göra något likt "Strix Halo" ic slutet av detta år eller 2026.

Tror detta är framtiden för high-end PC, dock kanske inte helt optimalt specifikt för gaming-PCs...

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

38 tusen för en snusdosa, kylningen måste vara ett stort problem med denna lilla lådan om man inte bara kör den i korta intervaller med lång vila emellan?

Permalänk
Skrivet av Yoshman:

Nu finns inte officiella specifikationer för FP32 hos DGX Spark, men om vi antar (då det är högst sannolikt) att det är samma FP4 vs FP32 ratio hos DGX Spark som andra konsument-blackwell verkar man hamna rätt mycket exakt på ett 5070.

För ett 5070 med 128 GB VRAM är det knappast dyrt, för de som har nytta av så mycket RAM.

AMD har rätt nyligen släppt deras "Strix Halo" som får anses vara en väldigt nära konkurrent till denna då båda har samma bandbredd mot RAM, samma maximala RAM-kapacitet och FP32-kapaciteten är rätt nära (om antagandet ovan stämmer har DGX Spark ett visst övertag, men handlar mer om 10-30 % mot Radeon 8060S, inga heltalsfaktorer).

Mot Apple är det lite svårare att göra en direkt jämförelse. Prismässigt, GPU-kapacitetmässigt och VRAM-bandbreddsmässigt är M4 Pro väldigt lika, fast den har en maximal RAM-kapacitet på 64 GB.

M4 Max är dyrare, men har också en snabbare GPU och dubbla bandbredden mot RAM.

CPU-mässigt lär inte Nvidia nå Apple, men de kommer med 100 % säkerhet klå "Strix Halo" givet att telefoner med Cortex X925 där man bara klockar dessa till 3,5-3,7 GHz, är snabbare än toppmodellen av "Strix Halo" i single-thread (typ 10-15 % snabbare).

Arm har pratat om att de kommer passera 4,0 GHz under 2025, om man antar att DGX Spark klockar 4,0 GHz borde den bli 20-25 % snabbare per kärna jämfört med Strix Halo (M4 är 30-35 % snabbare än Strix Halo per kärna).

Det som är den absoluta killer-app:en för DGX Spark är Nvidias CUDA-ramverk. Det ÄR guldstandarden för GPGPU och lär tyvärr också förbli det under överskådlig tid. Är man OK med MacOS (Linux är dock standardvalet för detta område) skulle jag hävda att Apple är i nuläget klar tvåa sett till programvara för GPGPU, men går inte att komma ifrån att man är efter CUDA.

Så finns faktiskt en del konkurrens här. Tre spelare är ju 50 % fler än antalet CPU-spelare på CPU-marknaden för stationära PC... Ryktet säger att Qualcomm har någon form av stationär på gång och finns också rykten att Intel ska göra något likt "Strix Halo" ic slutet av detta år eller 2026.

Tror detta är framtiden för high-end PC, dock kanske inte helt optimalt specifikt för gaming-PCs...

Dold text

Ja det är ju bristen på alternativ som skruvar upp priset - inte tillverkningskostnaden. Nvidia har garanterat en enorm marginal på denna lilla dator.
Angående CUDA så hoppas jag att EU kommer tvinga Nvidia öppna upp sitt ekosystem. Det är verkligen inte sunt att ett enda företag kan styra hela GPGPU-marknaden på detta sätt.

Visa signatur
Permalänk
Medlem

Försökte reservera/beställa en för skoj skull (läser en kurs i AI), men tyvärr gick det bara att skeppa till adress i USA.

Visa signatur

macOS: Mac mini [M4 Pro 14-core/24GB/1TB/10GbE], MacBook Air 13" [M1/16GB/256GB], MacBook Pro 16" [M2/32GB/512GB]
Windows: Microsoft Surface Pro 11 [Snapdragon X Elite/16GB/1TB/OLED], Microsoft Surface Laptop 7 13" [Snapdragon X Plus/16GB/512GB], HP Omnibook X 14" [Snapdragon X Elite/16GB/1TB]
iOS: iPad Mini [128GB/LTE], iPad Pro 12,9" [M1/512GB/LTE], iPhone SE3 [128GB], Apple Watch Series 10 46mm [LTE]
HT: LG 77" OLED C2 [OLED77C25LB], Intel NUC [Core i5/8GB/256GB]

Permalänk
Medlem
Skrivet av martinot:

Försökte reservera/beställa en för skoj skull (läser en kurs i AI), men tyvärr gick det bara att skeppa till adress i USA.

Jag noterade något liknande, inte för att jag är övertygad om att jag tänker köpa en.

Min slutsats blev dock snrast att man verkar landa här istället om man ska försöka beställa, och för EU finns ingen preorder, bara "notify me": https://www.nvidia.com/en-eu/products/workstations/dgx-spark/

Visa signatur

Desktop spel m.m.: Ryzen 9800X3D || MSI X870 Tomahawk Wifi || MSI Ventus 3x 5080 || Gskill FlareX 6000 64GB || Kingston KC3000 2TB || Samsung 970 EVO Plus 2TB || Samsung 960 Pro 1TB || Fractal Torrent || Asus PG42UQ 4K OLED
Arbetsstation: Ryzen 7945HX || Minisforum BD790i || Asus Proart 4070 Ti Super || Kingston Fury Impact 5600 65 GB || WD SN850 2TB || Samsung 990 Pro 2TB || Fractal Ridge
Proxmox server: Ryzen 5900X || Asrock Rack X570D4I-2T || Kingston 64GB ECC || WD Red SN700 1TB || Blandning av WD Red / Seagate Ironwolf för lagring || Fractal Node 304

Permalänk
Datavetare
Skrivet av IKEA Billy Bokhylla:

Ja det är ju bristen på alternativ som skruvar upp priset - inte tillverkningskostnaden. Nvidia har garanterat en enorm marginal på denna lilla dator.
Angående CUDA så hoppas jag att EU kommer tvinga Nvidia öppna upp sitt ekosystem. Det är verkligen inte sunt att ett enda företag kan styra hela GPGPU-marknaden på detta sätt.

I någon ideal-värld kan det kännas vettigt att tvinga Nvidia att öppna CUDA. Men har faktiskt rätt svårt att se att det egentligen finns något hårt juridisk hinder för andra att göra egna ramverk som använder CUDA-APUet.

Faktum är att AMDs HIP i rätt mycket är samma API som CUDA.

Problemen att göra det AMD gör med HIP är flera. Och går att exemplifiera det rätt väl med AMDs Mantle som blev Vulkan.

Mantle var helt designat för CGN, det var inte alls optimalt att använda på någon annan GPU-mikroarkitektur. Majoriteten av jobbet Khronos gjorde när AMD donerade Mantle till dess att Vulkan 1.0 släpptes var att "fixa" de delar som inte var vettiga utanför GCN. I detta specifika fall handlade det mest om förändringar riktade mot mobil-GPUer, men fanns även sådant som inte var optimalt för Nvidia och Intel GPUer också.

Tror vi ser en del av detta med HIP också. För att med OpenCL och GCN tenderade AMDs GPUer överprestera ställd mot Nvidia GPUer med på pappret liknande kapacitet. Ställer man CUDA mot HIP är det rätt kraftig fördel Nvidia när på pappret likvärdiga GPuer jämförs. Ett målande exempel är GPGPU-rendering i Blender där 7900XTX presterar något sämre än Apple M4 Max (där Apple använder Metal Compute som är specialdesignad för deras GPUer, i spel presterar denna GPU i nivå med 4070) och är långt efter RTX4080, en GPU som 7900XTX presterar rätt jämt med i spel.

Ett stort värde med CUDA är att det idag finns enormt mycket avancerade bibliotek skrivna ovanpå ramverket. Bibliotek som alla är optimerade för att det är Nvidias GPUer man kör med när man använder CUDA. Mikroarkitekturen i GPUer skiljer sig mer än för CPUer, så tyvärr är det förväntade utfallet att andra GPU-mikroarkitekturer skulle underprestera om de använde CUDA.

Det vi får hoppas på här är att det kommer någon standard som blir tillräckligt populär så Nvidia inte längre kan ignorera den. OpenCL var inte bra designad, någon Khronos är medvetna om och de skapade för länge sedan SyCL (som är riktigt bra).

Problemet med SyCL är att Nvidia knappast lär stödja det innan de måste (men finns stöd för Nvidia GPUer, skrivet av Intel). Det större problemet är att AMD, den näst största dGPU tillverkaren, också helt ignorerar SyCL (finns stöd gjord av Heidelberg University's Computing Center).

Intel använder SyCL i deras OneAPI, Arm och Qualcomm har också stöd för SyCL för deras respektive GPUer men alla dessa är i nuläget allt för små spelar på GPGPU-marknaden för att själva driva på SyCLs popularitet. Apple skapade ju OpenCL, så det hade man ett intresse i, men de har helt övergett det och kör nu all in på deras variant av CUDA, Metal Compute.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av IKEA Billy Bokhylla:

Angående CUDA så hoppas jag att EU kommer tvinga Nvidia öppna upp sitt ekosystem. Det är verkligen inte sunt att ett enda företag kan styra hela GPGPU-marknaden på detta sätt.

Inte säkert det är bra även om det just nu är dyrt. nVidia måste tänka på att om de blir för dyra eller låser ute andra så kommer andra skapa egna lösningar och det är många som är på gång.
Volvo har tydligen valt att köra på AMD och det tolkar jag som att de vet att AMD har hårdvara på gång.

Amazon, Microsoft, Tesla, Google, Intel, Cerebras, Graphcore är exempel på företag som jobbar på hårdvara (vad jag fick fram i en sökning).

Med det sagt så tror jag AI behöver slipa på flexibiliteten istället för att träna fram alla dessa gigantiska modeller som drar så mycket hårdvara. Nya modeller skryter om hur mycket bättre de är men så stor skillnad är det inte trots mycket mer energi för att räkna fram dem. Fler märker att det går långsammare och då försvinner hypen.

Det som finns nu är tillräckligt bra. Om nytt är 5% bättre men kostar 10 gånger mer går inte affären ihop