Arkitekturen Zen 2 för bärbara datorer

Lanseringen av arkitekturen Zen 2 innebar att AMD för första gången på väldigt många år kunde mäta sig med Intel sett till antalet instruktioner per klockcykel (IPC). Det här varierar givetvis beroende på last, där AMD både vinner och förlorar strider. Det är samma arkitektur som lägger grunden för "Renoir".

Läs mer om arkitekturen Zen 2

För den som är intresserad av detaljerna finns mer om Zen 2 att läsa i testet av AMD Ryzen 3000-serien "Matisse". Ställt mot Zen och Zen+ handlar det i grova drag om att AMD justerade delar i designen som inte hanns med för att pricka tidigare lanseringsfönster.

AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-4.jpg
AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-11.jpg
AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-12.jpg
AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-13.jpg

Resultatet av förbättringarna blev i snitt 15 procent högre IPC jämfört mot Zen. Samtidigt gjorde klivet från Globalfoundries 14- och 12-nanometerstekniker ned till 7 nanometer hos TSMC inte enbart att AMD fick mindre kretsar, utan även att de kunde nå högre klockfrekvenser än tidigare.

Farväl chiplet – för den här gången

Med processorfamiljen Matisse introducerade AMD en chiplet-design i syfte att pressa kostnaderna. Detta genom att tillverka beräkningsenheterna, kärnorna, på 7 nanometer medan I/O-funktioner såsom minneskontroller fortsatt tillverkas hos Globalfoundries på 12 nanometer.

AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-2.jpg
AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-19.jpg
AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-20.jpg
AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-24.jpg

Det här gav en kostnadsmässig fördel, men är därutöver en kompromiss som ökar latenserna mellan primärminnet på moderkortet och processorkärnorna – med andra ord inte bra prestandamässigt. Att AMD ändå valde att göra detta är bland annat för att I/O-funktioner generellt är svårare (längre utvecklingstid) att krympa och inte tjänar lika mycket på nya tekniker. En monolitisk krets hade helt enkelt blivit för dyr.

För att motverka höga latenser valde AMD att dubblera mängden L3-cacheminne med Zen 2 och Matisse. Varje så kallat CCX-kluster med fyra kärnor har inget mindre än 16 MB L3-cacheminne, med resultat att en 8-kärnig processor fick 32 MB. Modellerna med 12 och 16 kärnor har hela 64 MB.

En annan nackdel med AMD:s chiplet-design är att kommunikationen mellan kärnor och en extern I/O-krets är att det även kostar i strömförbrukning. Därför har det spekulerats i att det här inte är en design AMD skulle ta med sig till Renoir, något som mycket riktigt visat sig stämma.

Det här innebär inte att AMD inte kommer använda designmetodologin för sina bärbara processorer längre fram. Tvärtom talar mycket för det, men i dagsläget är de befintliga tekniker som möjliggör detta antingen för dåliga eller för dyra och det senare motverkar själva syftet AMD vill uppnå på konsumentsidan i dagsläget.

AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-25.jpg

Trots att Renoir är en monolitisk krets med åtta kärnor och integrerad grafikdel är det ingen stor historia. Kretsytan är 156 mm² och motsvarar drygt två chiplet-kretsar med åtta kärnor Zen 2 vardera. Det är också mindre än de 210 mm² som är storleken för föregångaren Picasso och Raven Ridge.

Den mindre kretsen möjliggörs av TSMC:s 7-nanometersteknik, som erbjuder mycket högre transistortäthet än Globalfoundries 12 och 14 nanometer AMD tidigare förlitat sig på. Antalet transistorer är också mer eller mindre dubblerat till 9,8 miljarder från tidigare 4,94 miljarder.

Enormt L3-cacheminne rationaliseras bort

AMD Renoir är monolitisk med I/O på samma krets som processorkärnor och den integrerade grafikdelen. Behovet av ett enormt L3-cacheminne, som tar upp stor kretsarea, är därför inte detsamma. AMD har därför valt att skära i den här delen rejält. Ett CCX-kluster har 4 MB L3-cacheminne istället för 16 MB för Zen 2 på den stationära sidan.

AMD Ryzen Mobile Tech Day_General Session_Architecture Deep Dive-5.jpg

Det finns säkert röster som förespråkar ett större L3-cacheminne ändå, men förutom att spara AMD pengar finns andra fördelar. Färre transistorer innebär också lägre läckström när dessa inte används, vilket i sin tur bidrar till längre batteritid.