Var hittar du bärbara x86 som kan mäta sig med M1? Detta (1745/7698) är resultatet från min M1 (har både M1 MBA och M1 MacMini, CPU-mässigt presterar de rätt lika).
Bästa man i praktiken hittar från AMD och Intel just nu är 4800U samt 1165G7. Ställd mot dessa har M1 40-50 % bättre enkeltrådprestanda mot 4800U och ca 10 % bättre prestanda mot 1165G7. I multicore prestanda har M1 ca 40-50 % bättre prestanda mot 1165G7 och ungefär samma som 4800U.
Då ska man komma ihåg att både 1165G7 och 4800U har en peak-effekt på ~50 W medan peakeffekten för M1 är ~20 W. Att M1 klarar sig så bra trots att den är mer jämförbar med 4C/8T än 8C/8T beror väldigt mycket på att peak-effekten per kärna ligger på 3-4 W, den kan hålla samma frekvens vare sig en kärna jobbar eller om alla kärnor jobbar.
De senaste CPU-modellerna från både AMD och Intel passerar 15 W även när en enda kärna jobbar. För att Zen3/*Coves ska matcha M1 i prestanda per kärna måste de förra klockas till >5 GHz.
SC8280 kommer tyvärr inte matcha IPC hos Firestorm kärnorna i M1, men vi kan räkna med att det kommer sitta ett par Cortex X1 kärnor i den kretsen (sitter en Cortex X1 i SD888) och dessa har någonstans 30-40 % bättre (beror lite på vad man gör) bättre prestanda per MHz jämfört med Zen3/Willow Cove. Då maxfrekvensen för X1 verkar ligga ~3,3 GHz borde man nå hyfsat nära i enkeltrådprestanda samtidigt som man kommer, likt M1, kan hålla samma frekvenser när alla kärnor jobbar.
Till viss del har detta väldigt mycket att göra med x86_64. Visst kan man bara dubbla allt, mycket pekar på att Intel kommer göra rätt mycket det med Alder Lake (Golden Cove) då det ryktas om 40-50 % högre IPC där jämfört med Skylake (Willow Cove har ~20 % högre IPC ställd mot Skylake).
Med 100 % säkerhet kan vi redan nu säga att inte ens Golden Cove kommer matcha M1 Firestorm i arbete mer MHz, men vi kan nog samtidigt utgå från att Intel lär fortsätta klocka sina kretsar 4,5-5,0 GHz. Så förväntar mig att Intel tar tillbaka prestandakronan sett till peak-prestanda per kärna, men de lär samtidigt knappast kunna hålla den frekvensen på 15 W ens med en enda kärna.
Så varför gör inte AMD/Intel vad Apple och nu även Arm med Cortex X1 gör? D.v.s. bygger en krets med så hög IPC att det räcker att klocka den <4 GHz för att ändå slå alla dagens x86_64 CPUer? För är uppenbart att alla kretsar, oavsett vilken ISA de använder, har långt högre prestanda/Watt runt 2-3 GHz än vad som är fallet när man passerar 4 GHz.
När det kommer till designa för brutal IPC gör ISA en väldigt stor skillnad! Att öka kapaciteten på "front-end", d.v.s. hur många instruktioner som maximalt kan avkodas per cykel, skalar tyvärr rätt exponentiellt på x86 p.g.a. saker som variabel längd på instruktioner samt extremt många och komplexa instruktioner. Samtidigt skalar det relativt linjärt för ARM64.
När man skriver multitrådade applikationer definierar ISA vilka garantier som måste ges i hur CPU-trådar "ser" minnesskrivningar gjorda från andra CPU-trådar. x86 definierade sin modell när normen var en CPU-kärna och serveras hade två max fyra kärnor, det kändes logiskt då att ta en modell som är relativt enkelt för människor att förstå. Den modellen har visat sig vara allt annat än optimal, framförallt var det inte en speciellt bra match mot den modell man senare kom fram till är den lämpligaste att använda i programspråk som C++, Java, C# m.fl.
ARM64 har en perfekt ISA match för vad programspråken behöver, så multitrådade program utanför de i klassen "embarrassingly parallel" (som nästan alltid lämpar sig bättre för att köra med GPGPU) blir effektivare på ARM64 än på x86_64 allt annat förutom ISA lika.
ARM64 är unik i att vara den första ISA som är konsekvent är lika bra eller bättre än x86_64 i allt utanför SIMD. Tidigare x86 utmanare har varit bättre på vissa saker men sämre på andra, ofta har utmanarna varit konsekvent bättre på flyttal och lite varierat på heltal. Då heltalsprestanda är långt viktigare än flyttal samtidigt som Intel kunnat dra fördel frekvensmässigt av att tidigare alltid haft den bästa tillverkningsprocessen fortsatte då x86 vara det logiska valet för den stora massan. Också där finns något unik med ARM64, den är minst lika bra för heltal samtidigt som Intel inte lägre har bästa processen.
SC8280 kommer förhoppningsvis visa att man insett vad som krävs om en x86-utmanare ska tas seriöst, likt Apple måste man gå all-in och leverera något som inte bara matchar vad AMD/Intel har utan minst matchar som base-line samtidigt som ett par viktiga egenskaper är väsentligt bättre.
M1 må bara ha 4 kärnor, det är i sig rätt irrelevant för att trycka in fler kärnor i en ny krets är i sammanhanget "trivialt". Det riktigt svåra är att skapa en design med både hög absolut prestanda (minst matcha x86-lägret, här har i princip alla misslyckas innan Apples M1) och riktigt bra perf/W (har finns flera som lyckats innan, men utan hög enkeltrådprestanda är kretsen värdelös för majoriteten på desktop).
Cortex X1 är kanske inte riktigt hemma än, den räcker mot Zen2/Skylake men faller lite kort mot Zen3/Willow Cove (dock med överlägsen perf/W). Men det är det bästa som Qualcomm kan ta till just nu. Cortex X2 lär bli ett rejält kliv upp igen (Arm har ökat IPC 20-30 % per år under rätt många år nu) och Qualcomms köp av Nuvia kan vara exakt vad som krävs för att få en verklig utmanare till Apples CPU-team!