Det som brukar nämnas är att x86 sedan väldigt länge delar upp x86 instruktioner i mindre och mer "RISC-lika" instruktioner internt. Det är i.o.f.s. helt sant, men om det vore det enda relevanta skulle PowerPC, MIPS etc rimligen klarat sig bättre mot x86 än de gjorde.
Det som är nytt med ARM64 och RISC-V är att man identifierade en rejäl flaskhals i att "riktigt gå på bredden" när högre frekvens inte var en framkomlig väg och man började allt mer jaga högre "IPC" (mängd instruktioner som kan köras per cykel).
Alla CPUer innan ARM64/RISC-V ändrar frekvent på "flaggor" som indikerar lite olika saker kring resultatet hos en instruktion. Problemet här är att ändra dessa flaggor är i praktiken som att programmera multitrådade program med globalt data (alla som gjort multitrådad programmering borde direkt inse hur dåligt detta är).
Så även om x86 delar upp instruktionerna i mindre och enklare instruktioner intern (vilket för övrigt även de mest högpresterande ARM64 CPUer också gör, för finns flera fördelar med detta, främst att det ger bättre perf/W) så kan man inte komma runt fundamentala designbeslut som flaggor och andra saker kring hur läsning/skrivning mot minne fungerar (även här finns fundamentala skillnader mellan ARM64/RISC-V och x86 där de förra har en mer effektiv modell både ur prestanda och prestanda/W aspekten).
Om två lika kompetenta team bygger en ARM64/RISC-V CPU och en x86_64 CPU kommer den senare ta fler transistorer, dra mer ström och/eller vara långsammare. Exakt hur stor skillnaden är är svårt att säga, men inget tvivel att en sådan skillnad finns och den är icke-försumbar.
Gracemont visar en av flera aspekter av avvägningar som måste göras. Avvägningen i Gracemont är att man inte går efter absolut högsta ST prestanda, för det är exponentiellt svårare att extrahera ut mer prestanda! IPC-mässigt får man ut Skylake/Zen2 nivå ur något som tar ~1/4 av Goldmonts kretsyta (som ligger ~35-40 % högre i IPC).
Men det finns fler aspekter. Man kan jämföra Gracemont med Arms Cortex X2 som används i Samsungs Exynos 2200. Dessa har rätt snarlik ST-prestanda, Gracemont drar mer effekt men de är ändå inom rimligt avstånd (d.v.s. är inte mer än kanske 2-3 heltalsfaktorer som skiljer på den punkten).
Gracemont klockar till ca 4,0 GHz medan Cortex X2 klockar till strax över 3,0 GHz. Så den senare har ~30 % högre IPC (och där är nog en realistisk nivå på vad ARM64 kan ge över x86_64, fördelarna från en bättre ISA ligger nog runt den här nivån om man spenderar ungefär samma antal transistorer).
Lite svårt att hitta information om densitet hos Samsungs 4 nm process, men såg någon gissning om att den ligger på ~140 MTr/mm² medan Intel 7 ligger på ~100 MTr/mm².
Tar man den informationen och mäter lite i dessa två bilder så verkar Gracemont matcha Cortex X2 rätt väl i kretsyta (kompenserat för skillnad i densitet).
Gracemont verkar vara ~2,3 mm² på Intel 7 medan Cortex X2 är ~2,0 mm² på Samsung 4nm (Gracemont har 2 MB L2$ per 4 kärnor, så motsvarande 0,5 MB / kärna medan Cortex X2 i detta fall har 1 MB L2$, cache tar relativt mycket utrymme).
Klicka för mer information
Visa mer
Det Intel gjort så bra för x86 och som en av barriärerna för att gå till någon annan ISA är att Intel har massor med folk som jobbar med att optimera programvara för x86. Utan det arbetet skulle t.ex. AVX vara rätt poänglöst, det används för att Intel sett till att det används. Arm har av flera anledningar aldrig utökat NEON till att vara mer som SSE4. (Nu har man i.o.f.s. lärt sig från GPU-sidan, så börjar komma vettig sätt att använda SIMD utan att behöva knacka Assembler!).
Så beroende på om man vill se x86 leva vidare eller om man vill se det ersättas så fort som möjligt ska man hålla ett öga på vad Intel nu börjar dra ned på. Om man börja dra ned på programutvecklingen så har man nog börjat plugga ur respiratorn för x86!
Det beror på hur fet GPU man stoppar i
En jämförelse man kanske kan göra är att titta på PS5/XSX. Dessa har en Zen2 baserad CPU klockad till ~3,5 GHz. En sådan skulle få ~1000 poäng i GB5 ST.
Det är väsentligt lägre än "stora" CPU-känorna i Iphone 13 och även något läge än de "stora" kärnorna i Samsung Exynos 2200 och Qualcomm Snapdragon 8 gen 1/2.
Vi kanske också får en lite bättre idé om något år. På årets Apple WWDC presenterades 3:e generationer av deras Metal, en av huvudnyheterna var att man gjort förändringar som gör det lättare för spelutvecklare att stödja MacOS via Metal 3 (gissningsvis har man gjort saker som minskar gapet mellan DX12/Vulkan och Metal i form av hur de bäst används).