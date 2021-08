Från artikeln

Citat: För maximal flertrådad prestanda i Alder Lake belastas kärnorna enligt följande: En tråd per Golden Cove-kärna En tråd per Gracemont-kärna Simultaneous-Multithreading används med Golden Cove

Kul att se att Intels designavdelning läser SweC

Finns ett par varianter för Alder Lake, men där känns det som om en är bäst för en förkrossande majoritet av fallen. Det är att först använda en tråd på varje stor kärna, sedan använda de små kärnorna (som saknar SMT) och sist lasta "andra" tråden på de stora kärnorna. Gissar att vi kommer se det både på Windows och Linux.

Mer seröst: är väldigt spänd på att se hur bra/dåligt Gracemont presterar i praktiken samt hur mycket de lyckas öka perf/W (well, 40 % enligt Intel själva...).

Det andra som blir riktigt spännande att se är hur vettigt det är med 6-wide decoder i Golden Cove...

Just detta är en klar akilleshäl för x86 då designen hos x86 gör att komplexiteten ökar exponentiellt med ökad bredd på front-end. Både AMD och Intel stannade väldigt länge på 4-wide. AMD sa att de tittade på 5-wide för Zen3 men skippade det då man ansåg att en sådan ökning skulle bli kontraproduktiv.

AnandTech har med det uttalandet

"Notably last year AMD’s Mike Clarke had noted while it’s not a fundamental limitation, going for decoders larger than 4 instructions can create practical drawbacks, as the added complexity, and most importantly, added pipeline stages."

Detta är en punkt där AMD/Intel hamnat rejält efter Apple då ARM64 inte alls har samma problem med uppskalning. A14/M1 är 8-wide i front-end!