Nvidia djupdyker i "Grace" och "Hopper" under nästa vecka

Permalänk
Melding Plague

Nvidia djupdyker i "Grace" och "Hopper" under nästa vecka

Hårdvarutillställningen Hot Chips går av stapeln på måndag nästa vecka, och Nvidia lovar att berätta mer om bolagets första serverprocessor och färska grafikarkitektur.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Intressant, framförallt CPU-delen, frågan är om Nvidia har liknande planer som Qualcomm: att satsa på en CPU för ARM Windows och konsument PC? Känns lite som en nödvändighet för Microsoft med partners, med tanke på hur bra Apple M1 och M2 har visat sig vara.

Intel och AMD lär ju göra allt för att bromsa, men med Nvidia känns det som om dom skulle gilla en sån utveckling stort.

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Permalänk
Datavetare
Skrivet av the squonk:

Intressant, framförallt CPU-delen, frågan är om Nvidia har liknande planer som Qualcomm: att satsa på en CPU för ARM Windows och konsument PC? Känns lite som en nödvändighet för Microsoft med partners, med tanke på hur bra Apple M1 och M2 har visat sig vara.

Intel och AMD lär ju göra allt för att bromsa, men med Nvidia känns det som om dom skulle gilla en sån utveckling stort.

Just Grace lär inte vara speciellt spännande för konsumenter. Nvidia säger ju själva ”Neoverse based” och de resultat som hittat ut pekar på att det handlar om Neoverse N2 (måste vara N2 eller V1 givet att det är ARMv9).

ARM Neoverse N2 är server-varianten av Cortex A710 medan Neoverse V1 i är en variant av Cortex X2. (A710 och X2 är sin tur väldigt nära A78 resp. X1, fast med ARMv9 stöd).

Är lite märklig konfiguration för Grace, vilket ger en vink om att den är inte i första hand en traditionell server CPU utan det är en produkt specifikt framtaget för att orkestrera massor med GPUer (tydligen ska ett Grace-kort kunna kontrollera upp till 256 GPUer).

De prestandaindikationer som nämnts har uteslutande kommit från SPECInt_2017_rate, d.v.s. ”all-core” prestanda för heltal. Nvidias design har 72 kärnor per CPU och ett ”grace superchip” består av två sådana CPUer. Prestanda är inte dåligt, ligger i nivå med dagens snabbaste x86 baserade server CPUer (fast som vanligt när det gäller ARM64, med betydligt bättre perf/W).

Så inte dåligt, men denna krets ska släppas våren 2023 och kommer då gå upp mot nästa generation Intel/AMD, nästa generation Ampere Computing (hoppas verkligen Ampere Computing också är på Hot Chip, de ska lansera en ny design 2H 2022 vilket blir deras första ”egna” design, nuvarande är baserade på Neoverse N1).

Nu vet vi inte frekvensen hos Nvidias CPU, men om den inte är väldigt låg finns ju redan Amazons Graviton 3 ute på marknaden. Graviton 3 är Neoverse V1 baserad är räknat per ”vCPU” (sättet AWS säljer CPU-kraft) i genomsnitt snabbare än dagens Intel/AMD CPUer enligt Phoronix tester. Det trots att Graviton 3 är väldigt lågt klockad, endast 2,6 GHz, detta för att man satt effektbudget på hela CPUn (64-kärnor) till 100 W (mot 270-280 W hos Intels/AMDs modeller som är med i testet).

Coola med Grace är att dess I/O-kapacitet, PCIe5 är fortfarande rykande färskt ändå toppar Nvidia bandbredden med en faktor x7. Vad man gjort är mer jämförbart med PCIe5+CXL, inte enbart PCIe5.

Valet av RAM är lite udda, man kör med LPDDR5X och begränsar kapaciteten till 512 GB per CPU (så 1 TB RAM för ett ”Grace superchip”). Bandbredden mot RAM är 500 GB/s per CPU, bra men inte fantastiskt ställt mot dagens Intel/AMD som ligger på ca 200 GB/s per CPU (de lär ligga i nivå med Nvidia vid nästa generation när man går till DDR5).

Även här skiljer sig Nvidias design från ”vanliga” server CPUer. 500 GB RAM per CPU kan låta mycket för desktop-användaren, men dagens server CPUer är redan kapabla till 2-4 TB RAM per socket och det lär öka till nästa generation.

Fördelen med LPDDR5X är väsentligt mycket högre perf/W jämfört med ”vanligt” DDR5. Nvidia trycker ju på att ett ”Grace superchip” drar max 500 W totalt. Intels/AMDs CPUer drar ju mer enbart räknat i ”package power”. Nästa x86-generation lär bryta 300 W vallen per CPU och Grace har två CPUer i den 500 W siffran, sen tillkommer allt utanför CPUn vilket inte är försumbart i en server CPU!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer