Finlirad arkitektur och fler kärnor

Att Intel brottats med nya tillverkningstekniker är ingen hemlighet och intressant är att Pat Gelsinger öppet medger att "Raptor Lake" är en konsekvens av detta. Likt hur Intel 7 (f.d. 10 nanometer) blev försenad gäller detsamma nästa tillverkningsteknik Intel 4 (f.d. 7 nanometer). Lösningen på detta blev att bolaget för två år sedan inledde utvecklingen av Raptor Lake.

Processorfamiljen påminner i mångt och mycket om "Alder Lake". I sitt fullfjädrade utförande har Raptor Lake 8 stora prestandakärnor, kallade Raptor Cove, med stöd för flertrådstekniken Simultaneous-Multithreading eller Hyperthreading på Intel-språk. Dessa används för att ge så hög prestanda som möjligt i scenarion som inte kräver massvis av trådar och här lyfts två exempel fram; 3D-design och spelande.

13th Gen Intel Core Desktop Pre-Brief Presentation_Appendix Embargoed_20220926-page-029.jpg

När det kommer till rejält trådade laster letar sig de små energieffektiva kärnorna Gracemont in i bilden, och här har antalet kärnor dubblerats från 8 till 16 stycken. Förutom att agera draglok i mångtrådade laster kan de när Windows schemaläggare gör sitt jobb användas för applikationer som körs i bakgrunden, alltifrån flikar i en webbläsare till rendering, medan prestandakärnorna kan användas för att leverera hög prestanda i det fönster som används för stunden.

Intel Architecture Day 2021_Pressdeck_Final_EMBARGO-32.jpg
Intel Architecture Day 2021_Pressdeck_Final_EMBARGO-33.jpg
Intel Architecture Day 2021_Pressdeck_Final_EMBARGO-34.jpg

Att Intel valt att börja med hybridarkitekturer likt ovan har flera rimliga förklaringar, som likt så mycket annat bottnar i transistorerna. Avancemangen i energieffektivitet håller på att bromsa in med nya tillverkningstekniker, vilket innebär att vinsterna inte blir lika stora och att mer värme måste avledas från en allt mindre ytarea.

Att skala upp arkitekturer för att ge högre prestanda vid en given klockfrekvens (IPC) blir allt svårare för både AMD och Intel, då antalet transistorer som krävs ökar exponentiellt. Att kasta fler transistorer för att öka IPC är inte givet det bästa sättet att få ut mer prestanda. Ett sätt att komma runt detta har vi sett på mobilsidan i ett decennium med ARM:s koncept Big.Little.

Arkitekturen Gracemont är en arkitektur som försöker träffa en sweet-spot mellan prestanda, energieffektivitet och area (antalet transistorer). Varje Gracemont-kärna har prestanda motsvarande Skylake på 14 nanometer och fyra av dess ryms på samma yta som en ensam Raptor Cove-kärna. I Raptor Lake återfinns som ovan nämnt 8 prestandakärnor och 16 energieffektiva, där de senare hade kunnat bytas ut mot 4 prestandakärnor. Det här är det många som hävdar att de skulle föredra, men det praktiska resultatet hade blivit lägre prestanda i flertrådade laster.

Med samma namn är det kanske ingen högoddsare att det handlar om samma arkitektur som tidigare, men Intel har ändå gjort en inte obetydande förändring. Arkitekturen Gracemont är arrangerad i kluster om 4 kärnor vilka delar ett L2-cacheminne, vars kapacitet på detta gått upp från 2 MB hos Alder Lake till 4 MB hos Raptor Lake. Ett dubblerat antal kärnor från 8 till 16 stycken betyder alltså att antalet kluster om 4 kärnor vardera också dubblerats. Resultatet av detta är en rejäl ökning i L2-cacheminne från 2 × 2 MB (4 MB) till 4 × 4 MB (16 MB).

Prestandakärnorna har inte heller genomgått några världsomvälvande förändringar, utan är namnet Raptor Cove till trots i mångt och mycket förra generationens Golden Cove. Den stora arkitektoniska nyheten här är också L2-cacheminnet, som växt från 1,25 MB till 2 MB. Det Intel lyfter fram är dess trimmade tillverkningsteknik Intel 7, som gör det möjligt att nå högre klockfrekvenser än förra generationens Golden Cove.

Med fler kärnor skruvar Intel även upp L3-cacheminnet, men här är ökningen mer av det förväntade. Hos Alder Lake allokerade Intel 3 MB L3-cacheminne per Golden Cove-kärna och Gracemont-kluster, varpå L3-cacheminnet hos toppmodellen landade på 30 MB. När två Gracemont-kluster tillkommer ökar helt sonika mängden L3-cacheminne med 6 MB till 36 MB.

När allt L2- och L3-cacheminne räknas ihop skönjas en betydande ökning jämfört med Alder Lake, där den sammanlagda mängden var 44 MB (14+30 MB). Hos Raptor Lake handlar det istället om 68 MB (32+36 MB). Den betydande ökningen gör inga underverk vid enkel- eller fåtrådade laster, utan kommer till sin rätt först när många trådar används och många kärnor behöver kommunicera och dela data med varandra.

13th Gen Intel Core Desktop Pre-Brief Presentation_Appendix Embargoed_20220926-page-030.jpg

Över till DDR5-minnet har Intel lyckats skrämma upp minneskontrollern en bra bit och stöder nu officiellt minnen med en effektiv klockfrekvens om 5 600 MHz (MT/s). Det är en ökning om knappt 17 procent över Alder Lake, som erbjöd JEDEC-standardens grundnivå 4 800 MHz. Värt att tillägga är att AMD med nyligen lanserade Ryzen 7000 "Raphael", som har ett något lägre officiellt stöd på 5 200 MHz.

13th Gen Intel Core Desktop Pre-Brief Presentation_Appendix Embargoed_20220926-page-031.jpg
13th Gen Intel Core Desktop Pre-Brief Presentation_Appendix Embargoed_20220926-page-026.jpg

Vad prestandaökningarna i Raptor Cove kommer från är även tydligt i Intels egen presentation. Vid enkeltrådade laster handlar det om enstaka procent från det större cacheminnet och DDR5-minnet, medan lejonparten tillskrivs just högre klockfrekvenser. Bilden blir mer nyanserad flertrådat, där det på alla fronter större cacheminnet hjälper de många kärnorna att kommunicera med varandra. Detta, högre klockfrekvenser och 8 extra Gracemont-kärnor ger en ökning om hela 41 procent.

För maximal flertrådad prestanda i Alder Lake belastas kärnorna enligt följande:

  1. En tråd per Golden Cove-kärna

  2. En tråd per Gracemont-kärna

  3. Simultaneous-Multithreading används med Golden Cove

Likt Alder Lake är den hemliga såsen som gifter de två arkitekturerna Intel Thread Director (ITD). Det är en hårdvarubaserad schemaläggare, som i nära samverkan med operativsystemet Windows 11 och maskininlärning ska se till att rätt kärna eller tråd används vid rätt tillfälle. Hur prioriteringen ser ut i olika situationer är en komplicerad process, men i all sin enkelhet används i första rummet de åtta Golden Cove-kärnorna och när dessa väl fyllts med arbete kommer Gracemont-kärnorna in i bilden. När alla kärnor belastats går schemaläggaren tillbaka till Golden Cove och drar nytta av dess flertrådsteknik Simultaneous-Multithreading (Hyperthreading).

13th Gen Intel Core Desktop Pre-Brief Presentation_Appendix Embargoed_20220926-page-033.jpg

Ovan gäller scenarion som använder många trådar, men i andra fall används de båda kärnorna och då främst Gracemont på ett mer elegant sätt. För den arbetsuppgift användaren håller på med för stunden, vilket oftast bestäms av det fönster som är öppet, används Golden Cove för att ge så hög enkeltrådad prestanda som möjligt. Applikationer som körs i bakgrunden sköter de svagare, men ändå potenta, Gracemont-kärnorna. Ett exempel Intel lyfter fram är att användaren kan spela ett krävande spel utan prestandaförlust, medan Gracemont-kärnorna renderar en 3D-scen eller en video i bakgrunden.

Avslutningsvis återfinns en integrerad grafikdel av arkitekturen Xe-LP och här har ännu mindre hänt. Det enda specifikationerna visar är att den maximala klockfrekvensen ökat från 1,55 till 1,65 GHz, men det kan endast anses symboliskt när grafikdelens primära syfte är att visa bild på en skärm. Med 32 beräkningsenheter finns helt enkelt inte kapaciteten där för mycket mer än.