AMD Ryzen 9 3900X och 7 3700X "Matisse"

AMD Ryzen 9 3900X och 7 3700X "Matisse"

Med Zen 2 och 7 nanometer lovar AMD en produkt som kan slå Intel. Ryzen 3000-serien är här och efter över ett decenniums frånvaro hälsar vi AMD välkommen tillbaka till toppen.

Arkitekturen Zen 2

Arkitekturen Zen 2 är till skillnad från Zen ingen ny design "från grunden", något som också är extremt ovanligt att göra. Att arkitekturer lever vidare under väldigt många år och förbättras hör till vanligheten, oavsett om vi talar om processorer för konsumentbruk eller grafikkort.

Mark_Papermaster-Next_Horizon_Gaming-Architecture_06092019-8.jpg
Mark_Papermaster-Next_Horizon_Gaming-Architecture_06092019-13.jpg
Mark_Papermaster-Next_Horizon_Gaming-Architecture_06092019-7.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-2.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-3.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-4.jpg

Med tillverkningstekniken 7 nanometer räknade inte AMD med att kunna nå högre klockfrekvenser, utan trodde inledningsvis på en tillbakagång. Målet blev därför tidigt att fokusera på högre prestanda vid en given klockfrekvens, det vill säga antalet instruktioner per klockcykel (IPC).

Enligt AMD var den interna målsättningen med Zen 2 att nå 8–9 procent högre IPC. I slutändan landade de på 15 procent och enligt Mike Clark uppnåddes detta genom att "plocka all lågt hängande frukt" i Zen, eliminera uppenbara flaskhalsar i designen och att utöka befintliga funktioner.

Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-5.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-6.jpg

En bra arkitektur kräver en bra Front End, som kan mata delarna som utför de faktiska beräkningarna. Med Zen 2 introducerar AMD vad de kallar för en ny TAGE Branch Predictor, vilken bolaget menar är mycket mer precis på att förutse nästa steg än den Branch Predictor som sitter i Zen(+). Det hela förstärks av större buffertzoner (eng. Branch-Target Buffers, BTB) än tidigare och en dubblering av Micro-Op Cache.

Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-7.jpg

Sett till flyttalsberäkningar handlar det om en dubblering i teoretisk prestanda, detta tack vare att bredden på flyttalsenheten utökats från 128 till 256 bitar. Ett av huvudskälen till detta stavas AVX2, vilket är en x86-förlängning med instruktioner som Intel var först ut med att introducera.

Arkitekturen Zen(+) har redan förmågan att utföra AVX2-beräkningar, men då bredden på flyttalsenheten endast är 128 bitar tar dessa instruktioner två klockcykler (kallas ofta "double pump"). Med Zen 2 räcker det således med en klockcykel. Det här är varför AMD vågar hävda fyra gånger högre flyttalsprestanda med serverprocessorerna Epyc "Rome", som utöver den här arkitektoniska förändringen dessutom dubblerar antalet kärnor till 64 stycken.

Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-9.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-10.jpg

Till skillnad från de rykten som florerat fram till sommaren har AMD gjort en del ingrepp även på heltalsfronten. I Zen 2 tillkommer en tredje Adress Generation Unit (AGU) för snabbare adressering av minne, medan antalet Arithmetic Logic Unit (ALU) för logiska och aritmetiska operationer är fortsatt fyra. Samtidigt har AMD ökat mängden resurser på annat håll för ytterligare prestandavinster.

Dubblerat L3-cacheminne

AMD:s nya chiplet-design, som vi går igenom i ett senare avsnitt, innebär nya utmaningar. Att flytt ut minneskontroller till en separat krets ger de facto högre minneslatenser än att om den satt på samma bit kisel som processorkärnorna. Trots detta lovar AMD förbättrade minneslatenser med Zen 2.

Mark_Papermaster-Next_Horizon_Gaming-Architecture_06092019-12.jpg

För att kompensera för den nya designmetodologin har AMD dubblerat mängden L3-cacheminne mot tidigare. Varje CCX-kluster med fyra kärnor har nu hela 16 MB L3-cacheminne. Det här gör att en 6- eller 8-kärnig processor med två CCX-kluster har 32 MB L3-cacheminne och att 12- samt 16-kärniga modeller med fyra CCX-kluster landar på 64 MB. Toppmodellerna i serverfamiljen Epyc "Rome" med 64 kärnor får massiva 256 MB.

Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-10.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-11.jpg

Vidare har varje kärna precis som tidigare 512 KB L2-cacheminne och datacachen (L1-D) ligger även den fast på 32 KB. När det kommer till instruktionscachen (L1-I) har denna halverats från 64 till 32 KB, vilket kan härledes till dubbleringen av Micro-Op Cache. Enligt AMD gav den här förändringen generellt bättre prestanda med dagens moderna arbetslaster.

Större cacheminne medför i regel högre latenser, något som är fallet på L3-nivå där antalet cykler gått upp från 35 till 40 stycken jämfört med Zen+. Cache på L1-nivå (data- och instruktionscache) ligger kvar på 4 cykler och även L2-cacheminnet är oförändrat 12 cykler.

Högre klockfrekvens med 7 nanometer

Den nya arkitekturen i kombination med TSMC:s 7-nanometersteknik gör att AMD kan nå högre klockfrekvenser än tidigare. På lanseringsdagen blir den nya toppmodellen 12-kärniga Ryzen 9 3900X med en maximal turbofrekvens på 4,6 GHz. I september släpps också 16-kärniga Ryzen 9 3950X som kliver upp till 4,7 GHz.

Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-18.jpg

Det här handlar om maximala frekvensvärden som uppnås genom att låta AMD:s algoritmer sköta jobbet. Vid manuell överklockning över samtliga kärnor är lägre klockfrekvenser att vänta och kan rentutav ge sämre prestanda i många fall. AMD menar därför att traditionell överklockning över alla kärnor kan vara roligt för att köra prestandatester som Cinebench, men att de som vill ha ut högre prestanda i alla fall bör använda Precision Boost Overdrive istället.

Kommentarer till artikeln

995 debattinlägg

Skicka en rättelse
I samarbete med Arlo
23

Kom igång med övervakning av hemmet – smarta övervakningskameror

Stölder, inbrott och busiga barn. Medlemmen Yoshman går igenom grunderna inom smarta övervakningssystem och vad som är möjligt för den som vill hålla ett extra öga på hemmet. Läs mer

21

Origin Big O är vattenkylt system med kraftfull dator och spelkonsoler under skalet

Under huven för Origin Big O syns spelkonsolerna Playstation 4 Pro, Switch och Xbox One X. I samma chassi finns också en speldator utrustad med Intel Core i9-9900K och Nvidia Titan RTX. Läs mer

39

Priset för DRAM-kretsar har stigit med över 20 procent i juli 2019

Strömavbrott och geopolitiska konflikter uppges ligga bakom kraftigt ökande prisnivåer för DRAM-kretsar, som bland annat används i smarta telefoner och DDR4-minnen. Läs mer

196

Undersökning: Hjälp oss bygga SweClockers 20-årsjubileum!

Vi är igång! SweClockers 20-årsjubileum står för dörren och med fyra månader kvar behöver vi din hjälp. Vad vill du se att vi fyller eventet med? Hjälp oss bygga årets fest! Läs mer

43

Asus presenterar ROG Phone II – spelinriktad telefon med 120 Hz-skärm

Under huven för Asus kommande mobiltelefon sitter Qualcomms spelanpassade och överklockade systemkrets Snapdragon 855 Plus, som får sällskap av 12 GB primärminne och påkostad skärm. Läs mer

69

Vad tycker du ska automatiseras i ett smart hem?

Intresset för hemautomation har ökat världen över och inte minst bland SweClockers medlemmar. Vilka saker tycker du är vettiga att automatisera? Dela med dig i forumet! Läs mer

33

Nvidia Geforce RTX 2080 Super hittar ut i prestandatest för Final Fantasy XV

Den 23 juli ska Nvidias Geforce RTX Super-serie kompletteras med RTX 2080 Super. Nu skymtas modellen i ett prestandatest, där en prestandaökning på drygt 8 procent visas. Läs mer

47

Qualcomm döms att betala 2,5 miljarder kronor för konkurrensbrott i EU

Rättsapparaten i EU går varm, där miljardböter på miljardböter delas ut till företag. Senast ut är Qualcomm, som döms för att ha sålt 3G-kretsar till förlust för att slå ut konkurrenter. Läs mer

36

Google: "Stadia Pro är inte spelvärldens Netflix – mer likt Playstation Plus"

Google förtydligar vad som ingår och inte ingår i prenumerationstjänsten Stadia Pro. Det blir inget stort spelbibliotek i stil med Netflix, utan istället ges omkring ett spel ut varje månad. Läs mer

73

Använder du kylning till din M.2-enhet, eller går det bra utan?

Många nya SSD-enheter utrustas med högpresterande minneskontroller, och sätts sedan i mer eller mindre okylda M.2-platser. Hur har du löst eventuella värmeproblem som kan uppstå, eller är det inget att oroa sig över? Läs mer

93

AMD: "Ursprungspriserna på Radeon 5700-serien var en fälla för Nvidia"

I en intervju avslöjar Radeon-chefen Scott Herkelman att AMD satte påhittade priser på Radeon RX 5700-serien innan lanseringen för att lura Nvidia att sätta för höga priser. Läs mer

14

TSMC tidigarelägger produktionsstarten för 5 nanometer

Med både Intel och Samsung hack i häl accelererar nu TSMC sina planer för utrullningen av tillverkning på 5 nanometer. Massproduktion inleds redan första halvan 2020. Läs mer