Skrivet av the squonk:
Intressant, framförallt CPU-delen, frågan är om Nvidia har liknande planer som Qualcomm: att satsa på en CPU för ARM Windows och konsument PC? Känns lite som en nödvändighet för Microsoft med partners, med tanke på hur bra Apple M1 och M2 har visat sig vara.
Intel och AMD lär ju göra allt för att bromsa, men med Nvidia känns det som om dom skulle gilla en sån utveckling stort.
Just Grace lär inte vara speciellt spännande för konsumenter. Nvidia säger ju själva ”Neoverse based” och de resultat som hittat ut pekar på att det handlar om Neoverse N2 (måste vara N2 eller V1 givet att det är ARMv9).
ARM Neoverse N2 är server-varianten av Cortex A710 medan Neoverse V1 i är en variant av Cortex X2. (A710 och X2 är sin tur väldigt nära A78 resp. X1, fast med ARMv9 stöd).
Är lite märklig konfiguration för Grace, vilket ger en vink om att den är inte i första hand en traditionell server CPU utan det är en produkt specifikt framtaget för att orkestrera massor med GPUer (tydligen ska ett Grace-kort kunna kontrollera upp till 256 GPUer).
De prestandaindikationer som nämnts har uteslutande kommit från SPECInt_2017_rate, d.v.s. ”all-core” prestanda för heltal. Nvidias design har 72 kärnor per CPU och ett ”grace superchip” består av två sådana CPUer. Prestanda är inte dåligt, ligger i nivå med dagens snabbaste x86 baserade server CPUer (fast som vanligt när det gäller ARM64, med betydligt bättre perf/W).
Så inte dåligt, men denna krets ska släppas våren 2023 och kommer då gå upp mot nästa generation Intel/AMD, nästa generation Ampere Computing (hoppas verkligen Ampere Computing också är på Hot Chip, de ska lansera en ny design 2H 2022 vilket blir deras första ”egna” design, nuvarande är baserade på Neoverse N1).
Nu vet vi inte frekvensen hos Nvidias CPU, men om den inte är väldigt låg finns ju redan Amazons Graviton 3 ute på marknaden. Graviton 3 är Neoverse V1 baserad är räknat per ”vCPU” (sättet AWS säljer CPU-kraft) i genomsnitt snabbare än dagens Intel/AMD CPUer enligt Phoronix tester. Det trots att Graviton 3 är väldigt lågt klockad, endast 2,6 GHz, detta för att man satt effektbudget på hela CPUn (64-kärnor) till 100 W (mot 270-280 W hos Intels/AMDs modeller som är med i testet).
Coola med Grace är att dess I/O-kapacitet, PCIe5 är fortfarande rykande färskt ändå toppar Nvidia bandbredden med en faktor x7. Vad man gjort är mer jämförbart med PCIe5+CXL, inte enbart PCIe5.
Valet av RAM är lite udda, man kör med LPDDR5X och begränsar kapaciteten till 512 GB per CPU (så 1 TB RAM för ett ”Grace superchip”). Bandbredden mot RAM är 500 GB/s per CPU, bra men inte fantastiskt ställt mot dagens Intel/AMD som ligger på ca 200 GB/s per CPU (de lär ligga i nivå med Nvidia vid nästa generation när man går till DDR5).
Även här skiljer sig Nvidias design från ”vanliga” server CPUer. 500 GB RAM per CPU kan låta mycket för desktop-användaren, men dagens server CPUer är redan kapabla till 2-4 TB RAM per socket och det lär öka till nästa generation.
Fördelen med LPDDR5X är väsentligt mycket högre perf/W jämfört med ”vanligt” DDR5. Nvidia trycker ju på att ett ”Grace superchip” drar max 500 W totalt. Intels/AMDs CPUer drar ju mer enbart räknat i ”package power”. Nästa x86-generation lär bryta 300 W vallen per CPU och Grace har två CPUer i den 500 W siffran, sen tillkommer allt utanför CPUn vilket inte är försumbart i en server CPU!