Skrivet av Dinkefing:
Jag är väldigt tveksam att det funkar bra i praktiken på en stationär dator.
Varför skulle det inte fungera i Alder Lake S när det fungerar i M1?
Som redan nämnts i tråden: även stationära x86_64 kärnor är idag kraftigt begränsade av strömbudget då de vid sin peak-frekvens drar 40-50 W när en kärna jobbar. Med strömbudget på 100-200 W kan man hantera upp till 4 kärnor utan någon direkt påverkan på prestanda per kärna, fast vid fler än 8 kärnor börjar man få skruva ned frekvensen rätt rejält.
För mig är inte frågetecknet om idén som sådan är sund, vi vet redan att det fungerar utmärk. Tror Qualcomm och Samsung har valt helt rätt strategi i denna generations kretsar när man ha tre separata kluster
en riktigt snabb kärna som hantera det som finns i förgrunden, UI är (och lär förbli) i stort sätt enkeltrådat och är samtidigt väldigt latenskritiskt. Det hanterar man med en relativt högt klockad Cortex X1 (den utför mer per cykel än något AMD/Intel har för tillfället)
tre relativt snabba kärnor som tar hand om multitrådade applikation
fyra energieffektiva kärnor som hanterar bakgrunduppgifter samt maximerar all-core prestanda i de eventuella program som skalar riktigt bar med kärnor
Att schemalägga saker på batteridrivna enheter är mer komplext än att göra det på stationära. Till och med Windows måste ju vara kapabel att hantera den policy som Apple kör med M1: när man kör på nätström, använd alltid de stora kärnorna så länge det finns minst en som är "idle". Använd de små kärnorna bara för att öka all-core prestanda.
Där Intel primärt kan misslyckas är just med de små kärnorna. x86_64 är svårare att skala nedåt jämfört med ARM/ARM64, risken är helt enkelt att de små kärnorna inte blir små och energieffektiva nog! Vidare kan man misslyckas i att de små kärnorna är för klena, i det läget kommer de inte tillföra något relevant.
M1 är egentligen inte en v1.0, det har varit rätt många generationer innan och något vi sett är hur mycket Apple skruvat upp prestanda i de små (betydligt mer än man skruvat upp prestanda i de stora över de senaste generationerna). Arm är medvetna om att de just nu har för klena "små" kärnor, en ny generation små kärnor är huvudnumret i 2021 års mikroarkitektur (vi lär får se den i maj i år).
Storleksmässigt får man in ca fyra "Icestorm" kärnor på en "Firestorm" kärna i M1. Tyvärr tillåter inte MacOS att man styr fritt vilka kärnor ett program körs på, men tog ett program som skalar nära nog perfekt till 8 kärnor och ställde prestanda när 4 kärnor jobbar (är då enbart de "stora" kärnorna som används) mot när alla 8 kärnor används. Prestanda i detta fall ökade med 55 %. D.v.s. prestanda något över två "stora" kärnor, fast med kiselytan av en. Effektmässigt drar de fyra "små" kärnorna mindre än hälften av en "stor".
Blir Alder Lake S något liknande kommer man ha en krets med frekvenser motsvarande en 8 kärning CPU, fast med prestanda motsvarande en 12 kärning CPU som inte klockar ned sig kraftigt. D.v.s. i praktiken hamnar prestanda över en motsvarande 12 käring med enbart stora kärnor.
För mig är därför idéen i sig klockren, tror det kommer vara standard rakt över om ett par år för desktop. Frågetecknen ligger istället helt i Intels förmåga att göra Gracemont tillräckligt snabb, tillräckligt liten och tillräckligt energieffektiv för att balansen ska bli hyfsat optimal. Om det blir rätt kommer spel inte bli några problem alls, det borde bli bättre än 8C/16T då spel som klarar sig med 8T eller mindre får nytta av högre prestanda per kärna och de som kan använda >8T får nytta av att tråd 8 till 15 blir en "riktig" kärna (de små) som har högre prestanda än vad prestanda per tråd är när båda CPU-trådar används i SMT.