AMD "Naples" med 32 kärnor i prestandatest

Permalänk
Datavetare

Tittade lite mer på individuella resultat i länken för Zen. Noterade att det inte är 32 kärnor utan två stycken CPUer med 32 kärnor var, d.v.s. totalt 64-kärnor (och då 128 trådar). Resultatet när alla kärnor används känns då allt annat än imponerande även om man kompenserar för CPU-frekvens.

Kvoten mellan resultatet för en kärna och flera kärnor samt resultaten för en kärna jämfört med Intel pekar på att "turbo boost" rimligen måste vara avslaget i detta fall. Antar samtidigt att alla resultat för Intels CPUer körts med maximal turbofrekvens blir Geekbench score/GHz detta

Zen Naples (Linux): 783
E5 2683 v4 (OSX): 1155
i7-6950X (Linux): 1419

Med tanke på hur mycket som är okänt kring Zen-systemet ska man inte dra allt för stora slutsatser, men ser ju inte jättebra ut...

Det som kanske borde oroa mest är resultatet som heter "Memory Latency". Nu är det svårt att säga exakt vad detta test gör (hittar inget white paper eller liknande som beskriver alla Geekbench 4 test), men är det något som Intel krossat alla andra inom (utom möjligen Apples ARM CPUer) så är det just latens mot cache och RAM. Rent generellt är lång latens mot RAM/cache betydligt viktigare för desktop än hög bandbredd och många kärnor.

Latens mot RAM är inte heller beroende av CPU-frekvens, så förutsatt att man kör med "vanliga" minnen borde detta värde vara i närheten av vad slutprodukten ser. Latens mot cache, i alla fall L1/L2 (L3 verkar ligga på en egen klockdomän för Zen), är dock beroende av CPU-frekvens. Intels CPUer är helt överlägsna i detta, 3,19 Moperations/sec för Zen mot 9,13 Moperations/sec i E5 2683 v4 (13.9 Moperations/sec för i7-6950X).

På det stora hela: det är ett Geekbench-resultat. Vi vet fortfarande väldigt lite om hur Zen kan tänkas prestera i verkliga program.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Ice Frontier:

Svårt att dra några slutsatser annat än att AMD faktiskt har en cpu med 32 cores och 64 trådar igång som faktiskt fungerar. Och det är väl ett gott tecken?

Håller med här. Går inte att säga så mycket alls om mer än en hint om att de kanske har något vettigt på serverfronten som kan konkurrera med Intel.

Man får ju hoppas de lyckas kräma ur liknande hastigheter som Intel. Blir kanske riktigt prisvärda alternativ då.

Visa signatur

System: CPU: AMD Ryzen 9 3900X, MB: Gigabyte X570 Aorus Elite, Minne: Corsair 32GB DDR4 3200MHz, GPU: Asus GeForce RTX 2080 Super ROG Strix Gaming OC

Permalänk
Medlem
Skrivet av Yoshman:

Tittade lite mer på individuella resultat i länken för Zen. Noterade att det inte är 32 kärnor utan två stycken CPUer med 32 kärnor var, d.v.s. totalt 64-kärnor (och då 128 trådar). Resultatet när alla kärnor används känns då allt annat än imponerande även om man kompenserar för CPU-frekvens.....

njae,, Tänk på att threads ser ut som logical cores för systemet, så det skulle isåfall bli 2x 16cores (32 core med SMT) Vilket inte heller stämmer överens med uppgiften om att detta skulle röra sig om en 32core, 64 threads CPU. (Man får väl anta att redaktionen har lite mer info än linken när dom säger att det rör sig om en 32cores CPU med SMT)
Om vi antar att detta rör sig om en 32core, 64 threads CPU, då verkar det som att AMD's SMT ser ut som 2 CPU'er mot systemet.

Hur man än tolkar datan så är det något som inte stämmer, då AMD's tidigare test i Blender visade på likvärdig prestande mot Intel's dito. Man får väl helt enkelt konstatera att detta är ett tidigt test exemplar som egentligen inte säger någoting alls om den färdiga produkten.

Permalänk
Datavetare
Skrivet av Lordsqueak:

njae,, Tänk på att threads ser ut som logical cores för systemet, så det skulle isåfall bli 2x 16cores (32 core med SMT) Vilket inte heller stämmer överens med uppgiften om att detta skulle röra sig om en 32core, 64 threads CPU. (Man får väl anta att redaktionen har lite mer info än linken när dom säger att det rör sig om en 32cores CPU med SMT)
Om vi antar att detta rör sig om en 32core, 64 threads CPU, då verkar det som att AMD's SMT ser ut som 2 CPU'er mot systemet.

Hur man än tolkar datan så är det något som inte stämmer, då AMD's tidigare test i Blender visade på likvärdig prestande mot Intel's dito. Man får väl helt enkelt konstatera att detta är ett tidigt test exemplar som egentligen inte säger någoting alls om den färdiga produkten.

Notera beskrivningen i Geekbench

"AMD Eng Sample: 2S1451A4VIHE4_29/14_N @ 1.44 GHz 2 processors, 64 cores "

Systemet med två E5-2684 v4 jag jämförde med ovan som har två stycken 16-kärniga CPUer

"Intel Xeon E5-2683 v4 @ 1.63 GHz 2 processors, 32 cores, 64 threads"

Medan systemet med i7-6950X säger

"Intel Core i7-6950X @ 3.00 GHz 1 processor, 10 cores, 20 threads"

Möjligen är det så att AMD-systemet har SMT avslaget då det inte nämns något explicit om trådar. Jämför t.ex. hur desktop i5 presenteras, den har ju ingen Hyperthreading

"Intel Core i5-3450 @ 3.09 GHz 1 processor, 4 cores"

Edit: hmm, verkar som Apple ha mixtrat med frekvensen... En E5-2683 v4 ska ha en basfrekvens på 2,0 GHz, inte 1,63 GHz. Men gissar att 1,63 är rätt för då blir enkeltrådade Geekbench/GHz exakt lika för E5-2683 v4 och i7-6950X vilket det borde vara då det är samma mikroarkitektur.

Så Geekbench 4 poäng per GHz (en kärna) under förutsättning att Apple minskat max turbo lika mycket som basfrekvensen
Zen Naples (Linux): 783
E5 2683 v4 (OSX): 1417
i7-6950X (Linux): 1419

Detta resultat varken motsäger eller ger konformation kring att Blender-resultatet är korrekt. Finns enskilda test-fall även i Geekbench 4 där Zen presterar jämnt med E5 2683 v4 om man normaliserar mot klockfrekvens. Däremot finns det också andra tester där Zen hamnar långt efter Broadwell per GHz.

T.ex. klarar sig Zen rätt bra i AES-testet och HDR medan den blir slaktad i LLVM och HTML Parse testerna. Av dessa är nog HDR testet närmast Blender då det verkar vara något form av flyttalstest. Så i någon mening pekar då Geekbench resultatet i samma riktning som Blender, men det ger också en vink om att Blender kanske var en extrem "cherry pick".

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Blir kanske 4 st såna då till servern 256 trådar hade ju inte varit fel

Visa signatur

Ny dator Lexius signatur 2018 edition Ryzen 7 2700X@4.35PBO/Vega 64 Nitro+/16 GB DDR4 Patriot Viper4 2866mhz/ ASUS B450 F-Gaming/ 500GB samsung 970 evo m.2ssd / 2TB SSHD/1TB WD BLUE 7200rpm/WD Black TB/1TB SSHD (AMD StoreMi)PSU Be quiet pure power 730W / Mobo Asus B 450 F-Gaming/Hörlurar Sennhieser 58X Mobil Samsung Galaxy S20FE 5G 256GB/8GB Ram Skärm Asus TUF Gaming 144HZ IPS Async

Permalänk
Hedersmedlem
Skrivet av Lexius:

Blir kanske 4 st såna då till servern 256 trådar hade ju inte varit fel

Om de ligger på 180 W styck blir det kanske lite varmt i garderoben?

Permalänk
Medlem

Detta kan nog bli ett riktigt monster till CPU 32C/64T, två stycken sånna på ett mobo det vore grejer för hemma servern
Kan nog kosta mer änn vad det smakar dock.

Ska bli riktigt intressant att se vad denna CPU går för när den släpps officielt.

Permalänk
Datavetare

Har inte mycket till övers för Geekbench, men version 4 verkar ändå vara betydligt bättre designad än tidigare versioner samt finns ju inte så mycket annat att luta sig mot vad det gäller Zen.

Så knåpade ihop ett litet awk-script som gjorde det möjligt att importera alla resultat till Excel givet referensnumret i Geeksbench 4 databasen. Exempel, 167825 importerar alla resultat från en i7-6700K.

Med detta gick det lite enklare att få en känsla för styrkor och svagheter för Zen i Geekbench 4. Tittade bara på prestanda med en CPU-kärna.

Förutsatte att Zen ES inte hade "turbo boost" utan körde på 1,44 GHz även när bara en kärna användes och förutsatte sedan att alla andra CPU-modeller körde på maximal "turbo boost". Alla resultat delades med aktuell CPU-modells frekvens för att kunna jämföra poäng per GHz.

I jämförelse med t.ex. FX-8350 fick jag då ut detta

Dold text

T.ex. betyder då AES på 0,66 att FX-8350 presterar 66 % av Zen i detta test räknat per GHz.

Har plockat bort de tre minnestesterna ur jämförelsen då de inte kan skalas med CPU-frekvens och har ingen aning om vilken minneshastighet som används.

Några observationer

  • jämfört med FX-8350 är förbättringarna i Zen större för flyttal än heltal

  • i genomsnitt är Zen 25 % snabbare än FX-8350 per GHz

  • mot Skylake är Zen relativt sett bättre på flyttal än heltal

  • i genomsnitt är 6700K 64 % snabbare än Zen per GHz

  • i7-960 (Nehalem) presterade i genomsnitt lika med Zen per GHz (åter igen är Zen stark på flyttal men svagare på heltal)

Är bara en syntetiskt benchmark, men den innehåller flera olika delmoment så bättre än tidigare "läckta" resultat i alla fall. Genom att dela alla resultat med frekvens borde det i någon mån gå att få ett hum om "IPC", problemet är att vi ännu inte vet vilken frekvens Zen kommer lanseras med.

Tyvärr finns ännu ingen vettig information från PrimateLabs kring vad varje deltest gör, men om LLVM testet gör vad jag tror det gör är det delmomentet antagligen en av de bästa indikationerna på vad man kan förvänta sig. Kört lite analys på LLVM under Linux och till skillnad från andra tester så jobbar detta rätt mycket mot OS-kärnan (vilket normala program också tenderar göra medan rena syntetiska benchmarks i princip inte använder OS).

I LLVM testet är Zen 47 % snabbare än FX-8350 (åter igen per GHz), men även med detta är det jämt skägg med Nehalem. Skylake är 33 % snabbare per GHz än Zen i LLVM.

Ska man tro på vad Geekbench rapporterar så verkar denna ES av Zen inte ha sin L3-cache aktiverad. Testade att köra på en C2750 (Silvermont baserad 8-kärnors server, saknar L3-cache och har 1 MB L2 som delas mellan två kärnor så totalt 4 MB L2). Ser ut som i princip alla deltester fortfarande kör nästan helt ur L1/L2, så eventuell avsaknad av L3 borde inte påverka Geekbench resultatet jättemycket. Möjligt undantag är SGEMM (som jobbar med stora matriser) samt HTML5 DOM (fast där kanske det mer än Atoms begränsade branchpredictor som spökar).

Förhoppningsvis blev man inte så mycket klokare av detta test, för om det är representativt för "IPC" så är Zen inte i närheten av dagens Core-modeller för heltal. Heltalsprestanda är överlägset viktigast för "vanliga" program och även för väldigt många serverlaster.

Edit: och eftersom jag ändå gjort den, här är en liten tabell över Geekbench 4 poäng för en kärna dividerad med kretsens turbo-frekvens

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Inaktiv

Intressant att mer uppgifter har kommit fram om CPU. Kan man anta att denna cpu är uppbyggd på samma sätt som de cpuer som mer vanligt folk köper? Det skulle inte kunna vara så att de kan ha ökat/minskat flyttalsdelen, cacheminnen etc för denna?
Så att vi som kör ej några tyngre system på våra datorer kan ej säga så mycket om resultatet för oss och den processorer som vi köper?
Sedan "AMD Eng Sample: 2S1451A4VIHE4_29/14_N @ 1.44 GHz 2 processors, 64 cores " var ju intressant. Det är idag väldigt vanligt att företag köper in en värsting cpu som de delar med typ hela världen och det känns som om man sitter på en 386a och jobbar. Typ nästan alla myndigheter och större företag jobbar så i sverige.. (rätta mig om jag har fel)
*edit*
Men samtidigt 10 000kr upp eller ner i pris på en dator med 2 * 32 cores som troligtvis har SAN etc är knappt något, så AMD måste konkurrera med prestanda. Det räcker att en tekniker öppnar "motorhuven" så har 10 000kr gått bort i dens kostnader..

Permalänk
Medlem
Skrivet av Yoshman:

I jämförelse med t.ex. FX-8350 fick jag då ut detta

T.ex. betyder då AES på 0,66 att FX-8350 presterar 66 % av Zen i detta test räknat per GHz.

Snyggt!

Men, inverterar man din tabell får man förbättringarna, som i procent då blir? För AES blir det en 50 % förbättring. Hinner du göra de andra också? Det var en png-fil...

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Datavetare
Skrivet av sAAb:

Snyggt!

Men, inverterar man din tabell får man förbättringarna, som i procent då blir? För AES blir det en 50 % förbättring. Hinner du göra de andra också? Det var en png-fil...

Har gjort alla, postade en liten tabell ovan. Vill något göra egna jämförelser så är awk-skriptet här (är en riktigt awk-amatör så går säkert att göra bättre)

BEGIN { state=0; cnt=1; } / Processor / { for (c = 2; c < NF; c++) { printf "%s ", $c } printf "\n"; } /Single-Core Performance/ { state=1; line=0; ix=0; } /Multi-Core Performance/ { state=2; line=0; ix=0; } /\* Share/ { state=3; } { line++; if (line > 3) { line = 0; } if (state == 1) { if (line == 0) { test_name[ix] = $0 cnt++; } if (line == 1) { single_core[ix++] = $1 } } if (state == 2) { if (line == 1) { multi_core[ix++] = $1 } } } END { for (ix = 1; ix < cnt; ix++) { printf "%-30s, %-5d, %-6d\n", test_name[ix], single_core[ix], multi_core[ix] } }

Dold text

Exempelkörning, använder lynx -dump för att få ner websidan i text-format. Har awk-programmet i en fil som heter gb4.awk

$ lynx -dump http://browser.primatelabs.com/v4/cpu/177383 | awk -f gb4.awk Intel Core i7-4790K @ 3.99 AES , 4233 , 14495 LZMA , 4989 , 22123 JPEG , 5325 , 26369 Canny , 4935 , 21340 Lua , 5026 , 19090 Dijkstra , 5529 , 22061 SQLite , 4792 , 9771 HTML5 Parse , 4471 , 17790 HTML5 DOM , 5004 , 12722 Histogram Equalization , 4760 , 20814 PDF Rendering , 5235 , 20557 LLVM , 5880 , 12806 Camera , 5395 , 25279 SGEMM , 4730 , 16427 SFFT , 5539 , 23406 N-Body Physics , 4483 , 19640 Ray Tracing , 4392 , 20125 Rigid Body Physics , 5651 , 28900 HDR , 4922 , 22877 Gaussian Blur , 4808 , 21318 Speech Recognition , 5668 , 16708 Face Detection , 4958 , 22726 Memory Copy , 5067 , 6939 Memory Latency , 8150 , 7893 Memory Bandwidth , 4716 , 5341

Dold text

Notera att det som står efter '@' i detta läge är basfrekvensen, lämnas som en övningen till den interesserade att leta upp maximal turbofrekvens (står inte på Geekbenchs resultatsida, men väl i t.ex. Intel ARK)

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer