AMD Ryzen 9 3900X och 7 3700X "Matisse"

AMD Ryzen 9 3900X och 7 3700X "Matisse"

Med Zen 2 och 7 nanometer lovar AMD en produkt som kan slå Intel. Ryzen 3000-serien är här och efter över ett decenniums frånvaro hälsar vi AMD välkommen tillbaka till toppen.

Arkitekturen Zen 2

Arkitekturen Zen 2 är till skillnad från Zen ingen ny design "från grunden", något som också är extremt ovanligt att göra. Att arkitekturer lever vidare under väldigt många år och förbättras hör till vanligheten, oavsett om vi talar om processorer för konsumentbruk eller grafikkort.

Mark_Papermaster-Next_Horizon_Gaming-Architecture_06092019-8.jpg
Mark_Papermaster-Next_Horizon_Gaming-Architecture_06092019-13.jpg
Mark_Papermaster-Next_Horizon_Gaming-Architecture_06092019-7.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-2.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-3.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-4.jpg

Med tillverkningstekniken 7 nanometer räknade inte AMD med att kunna nå högre klockfrekvenser, utan trodde inledningsvis på en tillbakagång. Målet blev därför tidigt att fokusera på högre prestanda vid en given klockfrekvens, det vill säga antalet instruktioner per klockcykel (IPC).

Enligt AMD var den interna målsättningen med Zen 2 att nå 8–9 procent högre IPC. I slutändan landade de på 15 procent och enligt Mike Clark uppnåddes detta genom att "plocka all lågt hängande frukt" i Zen, eliminera uppenbara flaskhalsar i designen och att utöka befintliga funktioner.

Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-5.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-6.jpg

En bra arkitektur kräver en bra Front End, som kan mata delarna som utför de faktiska beräkningarna. Med Zen 2 introducerar AMD vad de kallar för en ny TAGE Branch Predictor, vilken bolaget menar är mycket mer precis på att förutse nästa steg än den Branch Predictor som sitter i Zen(+). Det hela förstärks av större buffertzoner (eng. Branch-Target Buffers, BTB) än tidigare och en dubblering av Micro-Op Cache.

Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-7.jpg

Sett till flyttalsberäkningar handlar det om en dubblering i teoretisk prestanda, detta tack vare att bredden på flyttalsenheten utökats från 128 till 256 bitar. Ett av huvudskälen till detta stavas AVX2, vilket är en x86-förlängning med instruktioner som Intel var först ut med att introducera.

Arkitekturen Zen(+) har redan förmågan att utföra AVX2-beräkningar, men då bredden på flyttalsenheten endast är 128 bitar tar dessa instruktioner två klockcykler (kallas ofta "double pump"). Med Zen 2 räcker det således med en klockcykel. Det här är varför AMD vågar hävda fyra gånger högre flyttalsprestanda med serverprocessorerna Epyc "Rome", som utöver den här arkitektoniska förändringen dessutom dubblerar antalet kärnor till 64 stycken.

Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-9.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-10.jpg

Till skillnad från de rykten som florerat fram till sommaren har AMD gjort en del ingrepp även på heltalsfronten. I Zen 2 tillkommer en tredje Adress Generation Unit (AGU) för snabbare adressering av minne, medan antalet Arithmetic Logic Unit (ALU) för logiska och aritmetiska operationer är fortsatt fyra. Samtidigt har AMD ökat mängden resurser på annat håll för ytterligare prestandavinster.

Dubblerat L3-cacheminne

AMD:s nya chiplet-design, som vi går igenom i ett senare avsnitt, innebär nya utmaningar. Att flytt ut minneskontroller till en separat krets ger de facto högre minneslatenser än att om den satt på samma bit kisel som processorkärnorna. Trots detta lovar AMD förbättrade minneslatenser med Zen 2.

Mark_Papermaster-Next_Horizon_Gaming-Architecture_06092019-12.jpg

För att kompensera för den nya designmetodologin har AMD dubblerat mängden L3-cacheminne mot tidigare. Varje CCX-kluster med fyra kärnor har nu hela 16 MB L3-cacheminne. Det här gör att en 6- eller 8-kärnig processor med två CCX-kluster har 32 MB L3-cacheminne och att 12- samt 16-kärniga modeller med fyra CCX-kluster landar på 64 MB. Toppmodellerna i serverfamiljen Epyc "Rome" med 64 kärnor får massiva 256 MB.

Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-10.jpg
Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-11.jpg

Vidare har varje kärna precis som tidigare 512 KB L2-cacheminne och datacachen (L1-D) ligger även den fast på 32 KB. När det kommer till instruktionscachen (L1-I) har denna halverats från 64 till 32 KB, vilket kan härledes till dubbleringen av Micro-Op Cache. Enligt AMD gav den här förändringen generellt bättre prestanda med dagens moderna arbetslaster.

Större cacheminne medför i regel högre latenser, något som är fallet på L3-nivå där antalet cykler gått upp från 35 till 40 stycken jämfört med Zen+. Cache på L1-nivå (data- och instruktionscache) ligger kvar på 4 cykler och även L2-cacheminnet är oförändrat 12 cykler.

Högre klockfrekvens med 7 nanometer

Den nya arkitekturen i kombination med TSMC:s 7-nanometersteknik gör att AMD kan nå högre klockfrekvenser än tidigare. På lanseringsdagen blir den nya toppmodellen 12-kärniga Ryzen 9 3900X med en maximal turbofrekvens på 4,6 GHz. I september släpps också 16-kärniga Ryzen 9 3950X som kliver upp till 4,7 GHz.

Mike_Clark-Next_Horizon_Gaming-CPU_Architecture_06092019-18.jpg

Det här handlar om maximala frekvensvärden som uppnås genom att låta AMD:s algoritmer sköta jobbet. Vid manuell överklockning över samtliga kärnor är lägre klockfrekvenser att vänta och kan rentutav ge sämre prestanda i många fall. AMD menar därför att traditionell överklockning över alla kärnor kan vara roligt för att köra prestandatester som Cinebench, men att de som vill ha ut högre prestanda i alla fall bör använda Precision Boost Overdrive istället.

Skicka en rättelse
16

Veckans fråga: När köpte du din första dator?

Är du ny i gamet, eller automatiserade du dina kulramar runt Dackefejden? Veckans fråga blickar bakåt mot det första datorinköpet. Läs mer

25

Samsungs sensommarnyheter med Note 20 Ultra som frontfigur

Den 21 augusti lanserar Samsung uppdaterade produkter i fyra serier – vi bjöds in på förhandsvisning. Läs mer

11

AMD och Lenovo tar Zen-arkitekturen till 6 watt

Den bärbara datorn Lenovo 100e med studentfokus bjuder på tvåkärnigt Zen-kisel med värmeutveckling om ynka 6 watt. Läs mer

9

ARM-medgrundare motsätter sig Nvidia-förvärv

Hermann Hauser beskriver i en BBC-intervju ett eventuellt Nvidia-uppköp av ARM som "katastrofalt". Läs mer

12

Project Xcloud till Sverige den 15 september

Microsofts spelströmningstjänst lanseras officiellt på den svenska marknaden i mitten på september ihop med över 100 spelbara titlar. Läs mer

43

Nvidia "Ampere" ryktas lanseras den 17 september

Efterträdarna till toppmodellerna RTX 2080 Ti och 2080 blir först ut, med successiv infasning av enklare modeller. Läs mer

28

AMD når 100 miljarder USD i börsvärde

Företaget når sin högsta aktievärdering någonsin under tisdagens handel till följd av en stark kvartalsrapport och framtidsutsikt. Läs mer

39

AMD:s kommande grafikkort "Big Navi" ryktas lanseras i november

Byggs på TSMC:s förfinade 7-nanometersprocess likt Zen 3-processorerna och kan komma utrustas med hela 16 GB GDDR6-minne. Läs mer

29

Apple Imac uppdateras med Intel "Comet Lake" och SSD-lagring över hela brädet

Den 27 tum stora Imac-modellen får extra kärlek genom fräsch processor och grafik, medan Fusion Drive stryks för samtliga datorer. Läs mer

44

Antalet 5G-telefoner väntas nå 250 miljoner sålda enheter i år

Var femte telefon såld under året har kommer ha utrustats med 5G-stöd, menar Digitimes Research – men de flesta hamnar i Kina. Läs mer

35

Kommande Macbook kan komma att utrustas med ny ARM-krets

Processorn A14X Bionic kan komma att förpassas till Ipads enligt nytt rykte. Läs mer

105

Officiellt: Amazon lanseras i Sverige

Amazons vice president för EU-expansion bekräftar satsningen som inte helt oväntat utlovar låga priser och snabba leveranser. Läs mer