Permalänk
Medlem
Skrivet av sAAb:

Threadripper II, eller AMD Ryzen Threadripper 2

Från https://twitter.com/PaulyAlcorn/status/871288087048888320

https://pbs.twimg.com/media/DBdvymsWAAAr1Po.jpg

Om man inte tillhör de mer skärskådande själarna så kanske man inte bryr sig om de minst sagt märkligt jaggade fingerspetsarna; finns det inte antialiasing tillverkad av Nivea?

Undrar vad som händer om AMD gör verklighet av det?

Visa signatur

Server: Fractal design Define 7 XL | AMD Ryzen 7 5800X 8/16 | ASUS ROG CROSSHAIR VIII DARK HERO | 64GB Corsair @ 3000MHz | ASUS Radeon RX 460 2GB | Samsung 960 PRO 512 GB M.2 | 2x 2TB Samsung 850 PRO SSD | 6x Seagate Ironwolf Pro 10TB
WS: Phantex Entoo Elite | AMD Ryzen Threadripper 1950X 16/32 | ASUS Zenith extreme | 128GB G.Skill @ 2400MHz | ASUS Radeon HD7970 | 3x 2TB Samsung 960PRO M.2 | 6x Seagate Ironwolf Pro 10 TB
NEC PA301W 30" @ 2560x1600 | Linux Mint 21.3 Cinnamon

Permalänk
Medlem
Skrivet av sAAb:

Threadripper II, eller AMD Ryzen Threadripper 2

Från https://twitter.com/PaulyAlcorn/status/871288087048888320

https://pbs.twimg.com/media/DBdvymsWAAAr1Po.jpg

Om man inte tillhör de mer skärskådande själarna så kanske man inte bryr sig om de minst sagt märkligt jaggade fingerspetsarna; finns det inte antialiasing tillverkad av Nivea?

Och inte minst själva storleken på "threadripper 2" jämfört med händerna (och ":P" i tweeten).

Och till en ren generell gissning från min sida, undrar om skälet till att AMD använder extremt många pins är för att framtidssäkra funktionalitet? Typ att de inte ens använder ~hälften av alla pins

Visa signatur

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Permalänk
Medlem

Vill stå för det jag skrivit långt tidigare och Tomb Raider som verkar ha vart ett absolut dödsviktigt och obligatoriskt test för att sänka Ryzen mot Intel visade sig vara hysteriskt ineffektivt just på Ryzen. Nu är spelet patchat och ökar prestanda på Ryzen med 17%:

Fick skit kastat på mig ang detta och att man absolut inte optimerar spel för en ny CPU Vi är uppe i rätt många nu sedan Ryzen's lansering och det är ändå bara halvdana optimeringar av befintliga spel, så räkna med detta som ett absolut minimum om vad Ryzen är kapabel till.

Tomb Raider är fortfarande knappast en väloptimerad titel, likaså andra spel som just använts i alla Ryzen tester där man vet att dom inte fungerat bra på Ryzen. Intel har enormt mycket pengar. Det som är sorligt är att det är precis lika mycket politik i IT-världen där journalistik och mutor/samarbeten sätter sina spår. En stor andel verkar ha allvarliga problem med att se eller förstå det.

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Medlem
Skrivet av Enigma:

Vill stå för det jag skrivit långt tidigare och Tomb Raider som verkar ha vart ett absolut dödsviktigt och obligatoriskt test för att sänka Ryzen mot Intel visade sig vara hysteriskt ineffektivt just på Ryzen. Nu är spelet patchat och ökar prestanda på Ryzen med 17%:

https://www.pcper.com/files/review/2017-05-30/tr-1.png
https://www.pcper.com/files/review/2017-05-30/tr-2.png

Fick skit kastat på mig ang detta och att man absolut inte optimerar spel för en ny CPU Vi är uppe i rätt många nu sedan Ryzen's lansering och det är ändå bara halvdana optimeringar av befintliga spel, så räkna med detta som ett absolut minimum om vad Ryzen är kapabel till.

Tomb Raider är fortfarande knappast en väloptimerad titel, likaså andra spel som just använts i alla Ryzen tester där man vet att dom inte fungerat bra på Ryzen. Intel har enormt mycket pengar. Det som är sorligt är att det är precis lika mycket politik i IT-världen där journalistik och mutor/samarbeten sätter sina spår. En stor andel verkar ha allvarliga problem med att se eller förstå det.

Många spel är svåra att optimera för multitråd och Ryzen om de från grunden är skapade för enkeltrådat, men uppenbarligen verkar de flesta problem vara bundet till bad practice och dålig information om vad som potentiellt presterar bättre.

Men jag säger definitivt inte att optimeringarna vi redan har sett inte är något att bara fnysa åt, jag är glad att de framtida Ryzen grejerna som ska sitta i min burk inom en snar (par månader) framtid kommer prestera bra

Visa signatur

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Permalänk

Kör senaste BETA BIOS med nya AGESA...
Har äntligen 3200MHz RAM fungerades
På ett B350 moderkort, känns bra.

Visa signatur

Mitt kärnkraftverk
|Asus PRIME-B350-PLUS|PH-TC14PE_OR|Ryzen 5 1400@3890MHz|Vega 56@Vega64bios |Corsair 2x4GB 3200MHz|Corsair TX 650w Bronze|CM Storm Enforcer|AOC G2460PF / 24"144Hz FreeSync|

Permalänk
Skrivet av Ytbehandlad:

Kör senaste BETA BIOS med nya AGESA...
Har äntligen 3200MHz RAM fungerades
På ett B350 moderkort, känns bra.

Du ska vara nöjd , får inte upp mina Corsair 3000mhz lpx högre än 2666mhz med de färdiga XMP som finns trots agesa 1.0.0.6

Visa signatur

Ryzen 5800x - Corsair Vengeance LPX 16GB DDR4 @ 3200MHz - MSI MPG B550 Gaming Plus - Samsung 970 m.2 500GB + 850 EVO 620GB - ASUS STRIX GTX 1070Ti OC A8G @ 2126Mhz boost - AOC 2460PF 144hz

Permalänk
Medlem

Ett test med kompileringstider med visual studio där ryzen är med , ont om den typen av test märkligt nog
http://www.hardware.fr/articles/956-13/compilation-visual-stu...

Permalänk
Skrivet av liquisole:

Du ska vara nöjd , får inte upp mina Corsair 3000mhz lpx högre än 2666mhz med de färdiga XMP som finns trots agesa 1.0.0.6

Ska nog se om det går att klocka ännu högre, mwhehehehehe

Och orka uppdatera min signatur någon dag här.. (bara tre komponenter som är utbytta dock)

Visa signatur

Mitt kärnkraftverk
|Asus PRIME-B350-PLUS|PH-TC14PE_OR|Ryzen 5 1400@3890MHz|Vega 56@Vega64bios |Corsair 2x4GB 3200MHz|Corsair TX 650w Bronze|CM Storm Enforcer|AOC G2460PF / 24"144Hz FreeSync|

Permalänk
Medlem
Skrivet av Yoshman:

Som redan nämnts i tråden, man kan faktiskt hävda att Skylake och Zen har samma IPC, att Skylake har 15-30 % högre IPC och att Skylake har >100 % högre IPC. Alla dessa kan vara sann samtidigt, så IPC är nog ett allt för abstrakt begrepp för att på något vettig sätt används i sådana här forum.

Så hur kan det vara så? Tittar man på moderna CPU-arkitekturer, gäller faktiskt generellt inte bara för x86, så kan man dela in CPU-instruktionerna i tre huvudgrupper.

  • skalära heltal - personligen tycker jag denna är klart viktigast då en klar majoritet av alla problem man kör främst beror av detta, all "logik" i ett problem bygger på detta och oavsett vad ett program gör kommer det alltid finnas en viss andel skalära heltal. Riktigt enkla CPU-designer har inget annat än detta, men finns ingen CPU-design som bara innehåller de två följande grupperna. Program som främst använder detta inkluderar spel, kompilatorer, databaser, webläsare och OS-kärnor

  • skalära flyttal - detta är "vanliga" flyttal, det är vad man kommer använda om man använder "float/double" i språk som C, C++, Java och C#. Program som använder detta inkluderar Cinebench och Blender

  • vektoriserade flyttal/heltal - för x86 hanteras detta via SSE/AVX. Trots att SIMD i form av SSE (och egentligen MMX innan det) funnits i två decennium är det relativt nyligen man fått fram vettiga sätt att utveckla program för SIMD. Tidigare fick man skriva assembler och i praktiken användes därför bara SIMD i form av bibliotek, typiskt matrisbibliotek. Nu med högnivåspråk stöd för detta + kompilator (där man med en kodbas kan skapa SSE, AVX, AVX2, AVX512 och även NEO (SIMD för ARM) versioner) har detta börja användas i vissa serverapplikationer (vi har precis börjat använda SIMD på jobbet för serverapplikationer). Traditionella program som använder detta inkluderar vetenskapliga program som Matlab, Matematica och programspråket "R".

Zen-arkitekturens största styrka är skalära flyttal, nu när Agner Fog gjort sin analys av Zen så ser man att designen har rejält med resurser för just detta. Så ingen konstighet att man är starkast här. Om man definierar "IPC" som prestanda för skalära flyttal så är Zen helt i nivå med Broadwell och Skylake (skiljer typ bara ~5 % i IPC mellan BDW och SKL här).

Tittar man i stället på SIMD ser det helt annorlunda ut. Redan Broadwell har runt 100 % högre IPC jämfört med Zen, Skylake lägger på 30-40 % till (och Skylake-X och Skylake-Xeon kommer nästan dubbla detta över dagens konsument-Skylake p.g.a. AVX512 stöd).

Skalära heltal är lurigast att jämföra, mest för att det finns en långt större flora av program som främst beror av detta och flaskhalsen kan variera från antal ALUs, cache-bandbredd, cache-latens, minneslatens, etc. Skylake har 15-30 % högre IPC jämfört med Zen här (Skylake har i många fall över 10 % högre IPC även jämfört med Broadwell i detta fall). Spel som faktiskt är CPU-bundna ligger i det övre spannet, kompilering ligger någonstans i det lägre/mitten av spannet

Blir intressant att hur Skylake och Skylake-X kommet prestera för heltal då den senare har en annorlunda cache-design, på många sätt är SLK-X mer lik Ryzen i cache-design (båda har samma policy för hur data dupliceras i olika cache-nivåer). Spel och program där det finns "kommunikation mellan kärnor" bör gynnas av cache-designen i "vanliga" Skylake. Något som kompilering, där man kör faktiskt kör ett enkeltrådat program per CPU-tråd, är absolut best-case för den cache-design Zen och SKL-X har.

TL;DR
Fungerar inte att diskutera IPC, det är ett för abstrakt koncept och utan att tekniskt sett ljuga kan man hävda att från att Zen och Skylake har samma IPC till att Skylake har en bra bit över 100 % högre IPC. Har själv försökt vara väldigt tydlig med att jag specifikt pratar om IPC för skalära heltal då det är relevant för klart flest applikationer och specifikt spel som är populärt att diskutera här. Skulle säga att det varit med usel framgång...

Hur man mäter IPC beror, precis som du säger på hur man mäter. Dessutom beror det på som du också säger på vilka instruktioner man avser att mäta. Dessutom beror det på hur dessa blandats, vilket också nämnts i ett äldre inlägg om hur spel faktist kan komma utnyttja än fler kärnor bättre i framtiden, osv. När dessa instruktioner blandas, med olika nivåer på "logik" och datatyper och datamängder så blir det allt mer systemberoende med cache-storlekar, i/o mm som spelar roll och man kommer allt mer bort från själva processorns ipc och mäter mer kanske andra saker, men... Därför kan ett trivialt problem som en Fibonacci-serie kanske avslöja mer om en processor med en lågnivåmetod, även om de resultaten drunknar i mer systemberoende parametrar. Men, även en processor råkar ut för en mängd helt lågnivåproblem som hanteras olika och därför mäter man ju med flera olika benchmarks. Det är ju där subjektiviteten kommer in, vilket du också antyder.

Men, jag är nyfiken på de IPC-skillnader du anger med siffror. Var finns källorna för dessa?

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem
Skrivet av sAAb:

Hur man mäter IPC beror, precis som du säger på hur man mäter. Dessutom beror det på som du också säger på vilka instruktioner man avser att mäta. Dessutom beror det på hur dessa blandats, vilket också nämnts i ett äldre inlägg om hur spel faktist kan komma utnyttja än fler kärnor bättre i framtiden, osv. När dessa instruktioner blandas, med olika nivåer på "logik" och datatyper och datamängder så blir det allt mer systemberoende med cache-storlekar, i/o mm som spelar roll och man kommer allt mer bort från själva processorns ipc och mäter mer kanske andra saker, men... Därför kan ett trivialt problem som en Fibonacci-serie kanske avslöja mer om en processor med en lågnivåmetod, även om de resultaten drunknar i mer systemberoende parametrar. Men, även en processor råkar ut för en mängd helt lågnivåproblem som hanteras olika och därför mäter man ju med flera olika benchmarks. Det är ju där subjektiviteten kommer in, vilket du också antyder.

Men, jag är nyfiken på de IPC-skillnader du anger med siffror. Var finns källorna för dessa?

Om man låser en 7700K och en 1800X till samma hastighet och mäter ren skalär heltalsprestanda (enkeltrådat) har i7an ungefär 15-20% fler instruktioner per sekund, om man då sedan räknar med hastighetsskillnader (fortfarande enkeltrådat) blir skillnaden större, närmare 35%. Men om man räknar in att Ryzen har dubbelt så många kärnor att leka med minskar skillnaden, för riktigt parallela uppgifter vinner Ryzen just pga detta (vilket är varför kompileringar ser så bättre/lika ut på Ryzen).

Sedan om man kollar skalär flyttalsprestanda som är parallel över många kärnor har inte 7700K en chans.

Skickades från m.sweclockers.com

Visa signatur

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Permalänk
Medlem
Skrivet av wowsers:

Om man låser en 7700K och en 1800X till samma hastighet och mäter ren skalär heltalsprestanda (enkeltrådat) har i7an ungefär 15-20% fler instruktioner per sekund, om man då sedan räknar med hastighetsskillnader (fortfarande enkeltrådat) blir skillnaden större, närmare 35%. Men om man räknar in att Ryzen har dubbelt så många kärnor att leka med minskar skillnaden, för riktigt parallela uppgifter vinner Ryzen just pga detta (vilket är varför kompileringar ser så bättre/lika ut på Ryzen).

Sedan om man kollar skalär flyttalsprestanda som är parallel över många kärnor har inte 7700K en chans.

Skickades från m.sweclockers.com

Jo, men även "skalär heltalsprestanda" är subjektiv. Rekursiva och andra mer rakt-på-sak-algoritmer ställer till det här för jämfölser och trådars beroenden. Vilken algoritm som används bestämmer svaret, oavsett om det är flyt-, heltal eller vektoriserade matriser.

Man brukar använda någon form av medelvärde för att få en överblick, men även det svaret blir subjektivt.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem
Skrivet av wowsers:

Om man låser en 7700K och en 1800X till samma hastighet och mäter ren skalär heltalsprestanda (enkeltrådat) har i7an ungefär 15-20% fler instruktioner per sekund, om man då sedan räknar med hastighetsskillnader (fortfarande enkeltrådat) blir skillnaden större, närmare 35%. Men om man räknar in att Ryzen har dubbelt så många kärnor att leka med minskar skillnaden, för riktigt parallela uppgifter vinner Ryzen just pga detta (vilket är varför kompileringar ser så bättre/lika ut på Ryzen).

Siffran 15-20% bättre prestanda vid samma klock stämmer inte, däremot har troligen de flesta försökt att optimera för intelprocessorer. Man kan anpassa efter cachestorlek mm. Jag tror skillnaden är minimal, max 5% fördel till intel men däremot verkar amd skala något bättre till fler kärnor.

Är ganska säker på att siffrorna kommer jämnas ut sett instruktioner per sekund då de flesta kommer anpassa efter amd nu när det blir en mycket vanligare processor

Permalänk
Avstängd
Skrivet av klk:

Siffran 15-20% bättre prestanda vid samma klock stämmer inte, däremot har troligen de flesta försökt att optimera för intelprocessorer. Man kan anpassa efter cachestorlek mm. Jag tror skillnaden är minimal, max 5% fördel till intel men däremot verkar amd skala något bättre till fler kärnor.

Är ganska säker på att siffrorna kommer jämnas ut sett instruktioner per sekund då de flesta kommer anpassa efter amd nu när det blir en mycket vanligare processor

Vafan, måste jag skriva mindre if-satser och loopar nu pga Ryzens kassa heltalsprestanda?

Visa signatur
Permalänk
Medlem
Skrivet av AMD-FX:

Han här har gjort en del Games Tested on Ryzen R7 1800X and Nvidia GTX 1070
Han har gjort 10 videos än så länge Del 1 är spel typ Diablo liknande spel. ni kan söka efter flera videos på hans kanal

https://www.youtube.com/watch?v=2ZbE7cbgDV8

Vissa spel har väldigt låg framerate. Deus Ex i video 7 till exempel. Måste vara fel då jag sett klart högre när andra spelar

Videorna är mer än en månad gamla. Har hänt mycket sedan dess.

Visa signatur

DATOR i bruk: ASUS ROG STRIX B550-F Gaming, Ryzen 7 5900X. 4x16 GB Ballistix MAX RGB @ 3800 MT/s 16-17-18-34-51 (1T)/~58 ns. MSI RTX 4090 Ventus x3. Samsung 980 Pro 1 TB. EK AIO Elite 360.
#ryssjävlar

Permalänk
Medlem
Skrivet av CyberVillain:

Vafan, måste jag skriva mindre if-satser och loopar nu pga Ryzens kassa heltalsprestanda?

http://gfx.bloggar.aftonbladet-cdn.se/wp-content/blogs.dir/428/files/2015/06/Skarmavbild-2015-06-26-kl.-09.38.35.jpg

Nej, inte mindre. Färre kanske.

Eller, vänta. Gör du dem större försvinner effekten av dem nästan helt.

Få men stora. Det är det bästa.

Här en länk till ett äldre inlägg från @Yoshman. Det är långt som vanligt. Jag har en liten del här:

Citat:

Jag håller absolut med om att Ryzen matchar IPC hos Broadwell, förutsatt att flaskhalsen är skalära flyttal. T.ex. Cinebench, Blender, 3D Marks Physics pekar alla på det. Så ser inte ens att vi är oense här.

Men det är också det ENDA fallet där Ryzen matchar Broadwell i IPC. i7-4770K når ungefär 80 % av sin teoretiska kapacitet för vektoriserade flyttal, Broadwell-E når ca 90 %. Skylake når 99 % av sin teoretiska kapacitet.

Finns ingen anledning att tro att Ryzen inte når väldigt nära 100 % av sin teoretiska kapacitet här, men det betyder ändå att Skylake har 100 % bättre IPC på denna punkt och Broadwell 80-90 % högre.

Gjorde en del beräkningar för att skatta heltals IPC från SweClockers spelmätningar här, kom fram till att Haswell/Broadwell har ungefär 19 % bättre IPC (Skylake får då 45 % högre IPC).

Jämför man SPECInt_2006 resultatet mellan Ryzen och i5-4670 får man en indikation på att IPC för den senare är 58 % högre. Notera att detta är enda testet som inte alls kan använda SMT då det är enkeltrådat, så förväntat att Zen klarar sig sämre relativt Core här.

Och för att ta mitt favoritfall, kompilering , så är detta faktiskt fallet där Ryzen klarar sig klart bäst. Enligt mina beräkningar är IPC ca 33 % för Skylake (ca 17 % bättre för Haswell). Just fallet här verkar värdet på p (andel parallell del i Amdahls) ligga på 97-98 %, vilket känns rimligt då kompilering skalar extremt. Är bara länkning och den synkronisering som OSet gör för disk-I/O som är seriellt.

Notera att R7-1700 och i7-7700K får på sekunden exakt samma resultat i kompileringstestet!

Äldre innebär här från 2017-03-04 17:50.

Men, det verkar som AGESA 1.0.0.6 borde ha förbättrat en del, så beräkningarna kan vara gamla.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Avstängd
Skrivet av sAAb:

Men, det verkar som AGESA 1.0.0.6 borde ha förbättrat en del, så beräkningarna kan vara gamla.

Jag hoppas verkligen på AGESA 1.0.0.6. Jag får framedrops under 90 FPS i VR (1800x@3.9@2666) fick jag inte på min 3770k@4.5 jag tror mer på minneshantering än kass heltal/flyttals IPC helt klart

Visa signatur
Permalänk
Medlem
Skrivet av CyberVillain:

Jag hoppas verkligen på AGESA 1.0.0.6. Jag får framedrops under 90 FPS i VR (1800x@3.9@2666) fick jag inte på min 3770k@4.5 jag tror mer på minneshantering än kass heltal/flyttals IPC helt klart

Intel erbjuder alternativ, egentligen avsett för servrar, Intel Xeon Platinum:

Citat:

Intel Xeon Platinum 8176 processor which rocks 28 Cores / 56 Threads and has a clock speed of 2.1 GHz. This is complimented by a maximum single core turbo of 3.8 GHz whileas the all-core turbo extends up to 2.8 GHz. The CPU scores 37.08 cb in Cinebench R11.5. This is a score that is roughly equivalent to a 16-core processor and there is good reason for this: this version of Cinebench is only recognizing 16 cores.

In Cinebench R15 however, the lister has included a dual socket benchmarks with all cores (56 Cores / 112 Threads) correctly being detected and the configuration nets 6525 points in Cinebench R15! The all core turbo appears to be stable at 2.8 GHz. This processor can be yours for only $3222 over at Taobao should you want to buy it (Note: this is the re-seller price, not the official MSRP).

Det kommer från http://wccftech.com/intel-28-core-xeon-platinum-8176-8168-xeo...

Om en Ryzen 7 1800X klarar runt 1700 i Cinebench (https://segmentnext.com/2017/05/22/amd-threadripper-benchmark...) så bör
16C32T Ryzen Threadripper klara mer än 2500 och kanske över 3000, vilket gör att en Epyc med 32C64T bör hamna i stil med den här Xeon. Fast, man kan ju gissa att det blir nog till ett lägre pris.

Det lär nog bli dyrt att köpa en sån Epyc som privatperson, även om man har VR som morot.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Avstängd

Eller så flyttar man ut Ryzen till en ren beräkningsburk/server och köper en 7700k som desktopdator

Visa signatur
Permalänk
Medlem
Skrivet av sAAb:

Intel erbjuder alternativ, egentligen avsett för servrar, Intel Xeon Platinum:

Det kommer från http://wccftech.com/intel-28-core-xeon-platinum-8176-8168-xeo...

Om en Ryzen 7 1800X klarar runt 1700 i Cinebench (https://segmentnext.com/2017/05/22/amd-threadripper-benchmark...) så bör
16C32T Ryzen Threadripper klara mer än 2500 och kanske över 3000, vilket gör att en Epyc med 32C64T bör hamna i stil med den här Xeon. Fast, man kan ju gissa att det blir nog till ett lägre pris.

Det lär nog bli dyrt att köpa en sån Epyc som privatperson, även om man har VR som morot.

Om vi räknar med att priset av Threadripper kommer bli $1000 och att Ryzen kretsarna själva står för hela priset kommer en Epyc troligtvis ligga kring $2000, men sedan får man räkna med väldigt höga priser för moderkort också.

Visa signatur

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Permalänk
Medlem
Skrivet av wowsers:

Om vi räknar med att priset av Threadripper kommer bli $1000 och att Ryzen kretsarna själva står för hela priset kommer en Epyc troligtvis ligga kring $2000, men sedan får man räkna med väldigt höga priser för moderkort också.

Det är ju vad en Intel 6950X kostar. https://m.prisjakt.nu/product/3715205

Men även där tillkommer moderkort.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Datavetare
Skrivet av sAAb:

Hur man mäter IPC beror, precis som du säger på hur man mäter. Dessutom beror det på som du också säger på vilka instruktioner man avser att mäta. Dessutom beror det på hur dessa blandats, vilket också nämnts i ett äldre inlägg om hur spel faktist kan komma utnyttja än fler kärnor bättre i framtiden, osv. När dessa instruktioner blandas, med olika nivåer på "logik" och datatyper och datamängder så blir det allt mer systemberoende med cache-storlekar, i/o mm som spelar roll och man kommer allt mer bort från själva processorns ipc och mäter mer kanske andra saker, men... Därför kan ett trivialt problem som en Fibonacci-serie kanske avslöja mer om en processor med en lågnivåmetod, även om de resultaten drunknar i mer systemberoende parametrar. Men, även en processor råkar ut för en mängd helt lågnivåproblem som hanteras olika och därför mäter man ju med flera olika benchmarks. Det är ju där subjektiviteten kommer in, vilket du också antyder.

Men, jag är nyfiken på de IPC-skillnader du anger med siffror. Var finns källorna för dessa?

Har haft lite roligt med R igen, ville lära mig skriva lite mer avancerade funktioner som jobbar med vektoroperationer kombinerat med lite gammal hederlig imperativ programmering. Sådant blir ju alltid roligare om man har ett specifikt problem att jobba med.

Har tagit resultat från Ryzen 1600X recensionen hos hardware.fr, TechReport samt TechPowerUp.

För att vara exakt, dessa program har jag tagit med

Program ST LB Type Avast T T Int BF1 F F Int Blender F T Float CineBenchMT F F Float CineBenchST T F Float Euler3D F T Vector Fallout4 F F Int FarCryPrimal F F Int GCC F T Int GTAV F F Int Hitman F F Int JetStream T F Int Kraken T T Int MySQL F F Int Octane T F Int ProjectCars F F Int RoTR F F Int Stockfish8 F F Int VS2015 F T Int Warhammer F F Int WatchDogs2 F F Int WebXPRT T F Int Word T T Int

Dold text

Har lite meta-data om programmen, ST=single thread?, LB=less is better? samt Type=heltal, flyttal eller SIMD.

Har inte resultat för alla CPUer, är ju bilder så får tyvärr skriva manuellt. Har främst tagit med R5-1400/1500X/1600X/1800X samt i7-7700K och i5-7600K (dessa finns för ALLA test).

Skulle helst velat ha i7-6700K, har det för de flesta test men TechReport testade tyvärr inte den CPUn. Orsaken är att en jämförelse av IPC blir sämre ju mer man måste kompensera för IPC i efterhand, i7-6700K ligger närmast i frekvens av alla Skylake med HT (i5 ställer till det då SMT saknas).

Har alltså en databas (en fil som R kan läsa in som ett "table") med alla resultat, det på följande format

... MySQL i7-7700K 140265 MySQL i7-6700K 130508 MySQL i5-7600K 97209 MySQL i5-7500 88744 MySQL G4560 61658 MySQL R7-1800X 171181 MySQL R5-1600X 143366 MySQL R5-1500X 105431 MySQL R5-1400 89012 Blender i7-7700K 437.61 Blender i7-6700K 480.06 Blender i5-7600K 659.83 Blender i5-7500 731.03 Blender G4560 1490.30 Blender R7-1800X 296.09 Blender R5-1600X 385.47 Blender R5-1500X 585.56 Blender R5-1400 675.83 ...

Dold text

Har sedan en session i R där jag kan fråga t.ex.

!> cmp('R5-1500X', 'R5-1400', 'Float') ModelA ModelB Result IsoFreq 1 R5-1500X R5-1400 1.14 1.02

Här jämförs alltså R5-1500X med R5-1400. "Result" är relativa prestanda för första CPU-modellen (R5-1500X i detta fall) jämfört med den andra, detta utan frekvenskompensation. "IsoFreq" är det frekvenskompenserade värdet, i någon mening "IPC" (fast tekniskt sett är det inte IPC då man även måste kompensera för antal kärnor, data jag har men känns som det blir allt för mycket kompensering i t.ex. spel då dessa inte skalar i närheten perfekt).

Här kan man se att 8 MB -> 16 MB L3$ verkar ge ~2 % i genomsnitt, är faktiskt samma resultat för heltal också (men finns enstaka fall där det skiljer nästan 10 %).

Så om vi jämför i7-6700K mot R5-1500X, båda är hyfsat nära klockade och har lika många kärnor och trådar.

> cmp('i7-6700K', 'R5-1500X', 'Float') ModelA ModelB Result IsoFreq 1 i7-6700K R5-1500X 1.17 1.07 > cmp('i7-6700K', 'R5-1500X', 'Int') ModelA ModelB Result IsoFreq 1 i7-6700K R5-1500X 1.34 1.21 !> cmp('i7-7700K', 'R5-1500X', 'Int') ModelA ModelB Result IsoFreq 1 i7-7700K R5-1500X 1.4 1.16

Här ser man att i7-7700K också är lurig att mäta, i flera spel är det i princip noll skillnad mellan i7-7700K och i7-6700K (båda dessa är i bland helt i nivå med i5-7600K) -> resultatet är GPU-bundet och mäter egentligt inte CPU-prestanda. Dessa resultat gör att "IPC" beräkningen är underskattad.

Vidare, IPC är egentligt i sig rätt ointressant, det som spelar roll är IPC * frekvens. Framförallt är det ju så att hög frekvens och hög IPC i många fall står i motsatsförhållande.

En AMDs ingenjör sa i någon intervju jag sett att de specifikt prioriterat IPC för Zen, vissa val de gjort sätter käppar i hjulet för hur högt man kan klocka. Precis som allt annat finns här en balans, är enklare att öka prestanda med högre frekvens men högre IPC tenderar vara mer energieffektivt (upp till en gräns, ingen mening att designa en bredd som överstiger teoretisk ILP som finns i instruktionsströmmen, AMD, Intel och även Apple är alla väldigt nära denna gräns nu).

Så i korthet: är i genomsnitt ~20 % högre IPC för Skylake, det trots att t.ex. program som Avast och WebXPRT till stor del är I/O-bundna och därmed minskar skillnader mellan modellerna.

Sett till prestanda per kärna är i7-7700K ~40 % snabbare i heltal. Rätt logiskt, för att i7-7700K och R5-1600X ska prestera i det närmaste identiskt i kompilering måste ju den förra ha ~50 % högre prestanda per kärna då kompilering skalar extremt väl med kärnor.

Den största skillnaden är det i spel, i7-7700K är ofta GPU-bunden av ett GTX1080 till om med i 1280x720, så den modellen visar inte sin fulla potential! Att det är så är rätt logiskt. Spel och andra program som använder flera kärnor, men där kärnorna måste kommunicera rätt frekvent är "best-case" för cache-designen i Skylake-S.

Omvänt så är "best-case" för cache-designen i Zen (och kommande Skylake-X) fallen där alla kärnor används och jobbar med helt oberoende uppgifter, t.ex. kompilering där man kör en enkeltrådad instans av kompilatorn per kärna.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Har haft lite roligt med R igen, ville lära mig skriva lite mer avancerade funktioner som jobbar med vektoroperationer kombinerat med lite gammal hederlig imperativ programmering. Sådant blir ju alltid roligare om man har ett specifikt problem att jobba med.

Har tagit resultat från Ryzen 1600X recensionen hos hardware.fr, TechReport samt TechPowerUp.

För att vara exakt, dessa program har jag tagit med

Program ST LB Type Avast T T Int BF1 F F Int Blender F T Float CineBenchMT F F Float CineBenchST T F Float Euler3D F T Vector Fallout4 F F Int FarCryPrimal F F Int GCC F T Int GTAV F F Int Hitman F F Int JetStream T F Int Kraken T T Int MySQL F F Int Octane T F Int ProjectCars F F Int RoTR F F Int Stockfish8 F F Int VS2015 F T Int Warhammer F F Int WatchDogs2 F F Int WebXPRT T F Int Word T T Int

Dold text

Har lite meta-data om programmen, ST=single thread?, LB=less is better? samt Type=heltal, flyttal eller SIMD.

Har inte resultat för alla CPUer, är ju bilder så får tyvärr skriva manuellt. Har främst tagit med R5-1400/1500X/1600X/1800X samt i7-7700K och i5-7600K (dessa finns för ALLA test).

Skulle helst velat ha i7-6700K, har det för de flesta test men TechReport testade tyvärr inte den CPUn. Orsaken är att en jämförelse av IPC blir sämre ju mer man måste kompensera för IPC i efterhand, i7-6700K ligger närmast i frekvens av alla Skylake med HT (i5 ställer till det då SMT saknas).

Har alltså en databas (en fil som R kan läsa in som ett "table") med alla resultat, det på följande format

... MySQL i7-7700K 140265 MySQL i7-6700K 130508 MySQL i5-7600K 97209 MySQL i5-7500 88744 MySQL G4560 61658 MySQL R7-1800X 171181 MySQL R5-1600X 143366 MySQL R5-1500X 105431 MySQL R5-1400 89012 Blender i7-7700K 437.61 Blender i7-6700K 480.06 Blender i5-7600K 659.83 Blender i5-7500 731.03 Blender G4560 1490.30 Blender R7-1800X 296.09 Blender R5-1600X 385.47 Blender R5-1500X 585.56 Blender R5-1400 675.83 ...

Dold text

Har sedan en session i R där jag kan fråga t.ex.

!> cmp('R5-1500X', 'R5-1400', 'Float') ModelA ModelB Result IsoFreq 1 R5-1500X R5-1400 1.14 1.02

Här jämförs alltså R5-1500X med R5-1400. "Result" är relativa prestanda för första CPU-modellen (R5-1500X i detta fall) jämfört med den andra, detta utan frekvenskompensation. "IsoFreq" är det frekvenskompenserade värdet, i någon mening "IPC" (fast tekniskt sett är det inte IPC då man även måste kompensera för antal kärnor, data jag har men känns som det blir allt för mycket kompensering i t.ex. spel då dessa inte skalar i närheten perfekt).

Här kan man se att 8 MB -> 16 MB L3$ verkar ge ~2 % i genomsnitt, är faktiskt samma resultat för heltal också (men finns enstaka fall där det skiljer nästan 10 %).

Så om vi jämför i7-6700K mot R5-1500X, båda är hyfsat nära klockade och har lika många kärnor och trådar.

> cmp('i7-6700K', 'R5-1500X', 'Float') ModelA ModelB Result IsoFreq 1 i7-6700K R5-1500X 1.17 1.07 > cmp('i7-6700K', 'R5-1500X', 'Int') ModelA ModelB Result IsoFreq 1 i7-6700K R5-1500X 1.34 1.21 !> cmp('i7-7700K', 'R5-1500X', 'Int') ModelA ModelB Result IsoFreq 1 i7-7700K R5-1500X 1.4 1.16

Här ser man att i7-7700K också är lurig att mäta, i flera spel är det i princip noll skillnad mellan i7-7700K och i7-6700K (båda dessa är i bland helt i nivå med i5-7600K) -> resultatet är GPU-bundet och mäter egentligt inte CPU-prestanda. Dessa resultat gör att "IPC" beräkningen är underskattad.

Vidare, IPC är egentligt i sig rätt ointressant, det som spelar roll är IPC * frekvens. Framförallt är det ju så att hög frekvens och hög IPC i många fall står i motsatsförhållande.

En AMDs ingenjör sa i någon intervju jag sett att de specifikt prioriterat IPC för Zen, vissa val de gjort sätter käppar i hjulet för hur högt man kan klocka. Precis som allt annat finns här en balans, är enklare att öka prestanda med högre frekvens men högre IPC tenderar vara mer energieffektivt (upp till en gräns, ingen mening att designa en bredd som överstiger teoretisk ILP som finns i instruktionsströmmen, AMD, Intel och även Apple är alla väldigt nära denna gräns nu).

Så i korthet: är i genomsnitt ~20 % högre IPC för Skylake, det trots att t.ex. program som Avast och WebXPRT till stor del är I/O-bundna och därmed minskar skillnader mellan modellerna.

Sett till prestanda per kärna är i7-7700K ~40 % snabbare i heltal. Rätt logiskt, för att i7-7700K och R5-1600X ska prestera i det närmaste identiskt i kompilering måste ju den förra ha ~50 % högre prestanda per kärna då kompilering skalar extremt väl med kärnor.

Den största skillnaden är det i spel, i7-7700K är ofta GPU-bunden av ett GTX1080 till om med i 1280x720, så den modellen visar inte sin fulla potential! Att det är så är rätt logiskt. Spel och andra program som använder flera kärnor, men där kärnorna måste kommunicera rätt frekvent är "best-case" för cache-designen i Skylake-S.

Omvänt så är "best-case" för cache-designen i Zen (och kommande Skylake-X) fallen där alla kärnor används och jobbar med helt oberoende uppgifter, t.ex. kompilering där man kör en enkeltrådad instans av kompilatorn per kärna.

Snyggt! Tack för svaret!

Du bör kolla in kommandot "system" i R!

https://stat.ethz.ch/R-manual/R-devel/library/base/html/syste...
https://stackoverflow.com/questions/16246830/running-a-window...
https://stackoverflow.com/questions/13524355/how-to-call-an-e...
https://stackoverflow.com/questions/5745886/r-and-system-call...

Där kan man ta output rakt in i R! Om man lägger en loop runt binären kan man variera input hej vilt och simulera en massa! Hade en åttanivåers loop som körde ett antal permuterade variabelkombinationer för några år sedan. Output galore!

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Hjälpsam

@Yoshman: AMD verkar ha satsat stenhårt på energieffektivitet, orsaken är givetvis till stor del servers, men det kommer vara bra även för laptops.
Ingenting är gratis, vi får lite sämre prestanda singeltrådat.
Det är något jag kan leva med, min oklockade 1700 är löjligt effektsnål.

Vi ser lite samma sak för Polaris, undervolta och underklocka, då arbetar den branta effekt-prestanda kurvan, till din förmån.

Visa signatur

AMD Ryzen 7 5700X | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/51gntq | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/gwcxfs
HTPC | https://valid.x86.fr/gqtxws |

Permalänk
Medlem
Skrivet av Yoshman:

Har haft lite roligt med R igen, ville lära mig skriva lite mer avancerade funktioner som jobbar med vektoroperationer kombinerat med lite gammal hederlig imperativ programmering. Sådant blir ju alltid roligare om man har ett specifikt problem att jobba med.

Har tagit resultat från Ryzen 1600X recensionen hos hardware.fr, TechReport samt TechPowerUp.

För att vara exakt, dessa program har jag tagit med

Program ST LB Type Avast T T Int BF1 F F Int Blender F T Float CineBenchMT F F Float CineBenchST T F Float Euler3D F T Vector Fallout4 F F Int FarCryPrimal F F Int GCC F T Int GTAV F F Int Hitman F F Int JetStream T F Int Kraken T T Int MySQL F F Int Octane T F Int ProjectCars F F Int RoTR F F Int Stockfish8 F F Int VS2015 F T Int Warhammer F F Int WatchDogs2 F F Int WebXPRT T F Int Word T T Int

Dold text

Har lite meta-data om programmen, ST=single thread?, LB=less is better? samt Type=heltal, flyttal eller SIMD.

Har inte resultat för alla CPUer, är ju bilder så får tyvärr skriva manuellt. Har främst tagit med R5-1400/1500X/1600X/1800X samt i7-7700K och i5-7600K (dessa finns för ALLA test).

Skulle helst velat ha i7-6700K, har det för de flesta test men TechReport testade tyvärr inte den CPUn. Orsaken är att en jämförelse av IPC blir sämre ju mer man måste kompensera för IPC i efterhand, i7-6700K ligger närmast i frekvens av alla Skylake med HT (i5 ställer till det då SMT saknas).

Har alltså en databas (en fil som R kan läsa in som ett "table") med alla resultat, det på följande format

... MySQL i7-7700K 140265 MySQL i7-6700K 130508 MySQL i5-7600K 97209 MySQL i5-7500 88744 MySQL G4560 61658 MySQL R7-1800X 171181 MySQL R5-1600X 143366 MySQL R5-1500X 105431 MySQL R5-1400 89012 Blender i7-7700K 437.61 Blender i7-6700K 480.06 Blender i5-7600K 659.83 Blender i5-7500 731.03 Blender G4560 1490.30 Blender R7-1800X 296.09 Blender R5-1600X 385.47 Blender R5-1500X 585.56 Blender R5-1400 675.83 ...

Dold text

Har sedan en session i R där jag kan fråga t.ex.

!> cmp('R5-1500X', 'R5-1400', 'Float') ModelA ModelB Result IsoFreq 1 R5-1500X R5-1400 1.14 1.02

Här jämförs alltså R5-1500X med R5-1400. "Result" är relativa prestanda för första CPU-modellen (R5-1500X i detta fall) jämfört med den andra, detta utan frekvenskompensation. "IsoFreq" är det frekvenskompenserade värdet, i någon mening "IPC" (fast tekniskt sett är det inte IPC då man även måste kompensera för antal kärnor, data jag har men känns som det blir allt för mycket kompensering i t.ex. spel då dessa inte skalar i närheten perfekt).

Här kan man se att 8 MB -> 16 MB L3$ verkar ge ~2 % i genomsnitt, är faktiskt samma resultat för heltal också (men finns enstaka fall där det skiljer nästan 10 %).

Så om vi jämför i7-6700K mot R5-1500X, båda är hyfsat nära klockade och har lika många kärnor och trådar.

> cmp('i7-6700K', 'R5-1500X', 'Float') ModelA ModelB Result IsoFreq 1 i7-6700K R5-1500X 1.17 1.07 > cmp('i7-6700K', 'R5-1500X', 'Int') ModelA ModelB Result IsoFreq 1 i7-6700K R5-1500X 1.34 1.21 !> cmp('i7-7700K', 'R5-1500X', 'Int') ModelA ModelB Result IsoFreq 1 i7-7700K R5-1500X 1.4 1.16

Här ser man att i7-7700K också är lurig att mäta, i flera spel är det i princip noll skillnad mellan i7-7700K och i7-6700K (båda dessa är i bland helt i nivå med i5-7600K) -> resultatet är GPU-bundet och mäter egentligt inte CPU-prestanda. Dessa resultat gör att "IPC" beräkningen är underskattad.

Vidare, IPC är egentligt i sig rätt ointressant, det som spelar roll är IPC * frekvens. Framförallt är det ju så att hög frekvens och hög IPC i många fall står i motsatsförhållande.

En AMDs ingenjör sa i någon intervju jag sett att de specifikt prioriterat IPC för Zen, vissa val de gjort sätter käppar i hjulet för hur högt man kan klocka. Precis som allt annat finns här en balans, är enklare att öka prestanda med högre frekvens men högre IPC tenderar vara mer energieffektivt (upp till en gräns, ingen mening att designa en bredd som överstiger teoretisk ILP som finns i instruktionsströmmen, AMD, Intel och även Apple är alla väldigt nära denna gräns nu).

Så i korthet: är i genomsnitt ~20 % högre IPC för Skylake, det trots att t.ex. program som Avast och WebXPRT till stor del är I/O-bundna och därmed minskar skillnader mellan modellerna.

Sett till prestanda per kärna är i7-7700K ~40 % snabbare i heltal. Rätt logiskt, för att i7-7700K och R5-1600X ska prestera i det närmaste identiskt i kompilering måste ju den förra ha ~50 % högre prestanda per kärna då kompilering skalar extremt väl med kärnor.

Den största skillnaden är det i spel, i7-7700K är ofta GPU-bunden av ett GTX1080 till om med i 1280x720, så den modellen visar inte sin fulla potential! Att det är så är rätt logiskt. Spel och andra program som använder flera kärnor, men där kärnorna måste kommunicera rätt frekvent är "best-case" för cache-designen i Skylake-S.

Omvänt så är "best-case" för cache-designen i Zen (och kommande Skylake-X) fallen där alla kärnor används och jobbar med helt oberoende uppgifter, t.ex. kompilering där man kör en enkeltrådad instans av kompilatorn per kärna.

Hej igen,

Jag skulle inverterat alla värden där LB = "T" och sedan beräknat geometriskt medelvärde per cpu.

Det borde vara en ganska snabb och enkel operation om du redan har dem i en databas.

Vilka värden får du då?

Mycket nyfiken!

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem

Nu är AMD snabbast även på bärbart

Visa signatur

Ryzen 5800X ROG STRIX X570-f GAMING FlareX DDR43600 cl 14-14-14-34 EVGA FTW3 Ultra RTX 3090

Permalänk
Datavetare
Skrivet av Ratatosk:

@Yoshman: AMD verkar ha satsat stenhårt på energieffektivitet, orsaken är givetvis till stor del servers, men det kommer vara bra även för laptops.
Ingenting är gratis, vi får lite sämre prestanda singeltrådat.
Det är något jag kan leva med, min oklockade 1700 är löjligt effektsnål.

Vi ser lite samma sak för Polaris, undervolta och underklocka, då arbetar den branta effekt-prestanda kurvan, till din förmån.

En annan väldigt stor anledning är att det är långt svårare (==dyrare) att designa en krets med riktigt hög enkeltrådprestanda. Finns en anledning varför ingen av ARM-tillverkarna förutom Apple går stenhårt på den linjen.

Precis som jag skrev väldigt tidigt i denna tråd så finns för och nackdelar med att använda en distribuerad schemaläggare, vilket Zen gör för heltalsdelen. Fördelen med distribuerad schemaläggare är att den drar mindre ström och är enklare att designa, nackdelen är att för en viss "bredd" på CPUn kommer alltid en global schemaläggare ge högre IPC (allt annat lika).

Agner Fog har numera konstaterat en annan sak jag tidigt gissade, i genomsnitt kommer Zen se högre boost från SMT jämfört med Core. Agner konstaterar att Zen i flera lägen inte är kapabel att utnyttja sin back-end fullt ut när bara en tråd används, något Skylake kan förutsatt att det är kod med väldigt hög cache-hit-rate (specifikt brukar SSE/AVX kod se rätt låg boost från SMT hos Core medan Zen absolut ser en boost trots halva kapacitet för AVX).

Det gör "IPC" jämförelsen än mer svår att göra, skiljer ju en del beroende på om en eller två CPU-trådar används per kärna. Var därför jag listade ett rätt brett spann för heltals IPC.

Skrivet av sAAb:

Hej igen,

Jag skulle inverterat alla värden där LB = "T" och sedan beräknat geometriskt medelvärde per cpu.

Det borde vara en ganska snabb och enkel operation om du redan har dem i en databas.

Vilka värden får du då?

Mycket nyfiken!

Är ju precis det jag använder LB till, om den är "T" inverteras värdet. D.v.s. om t.ex. FPS är 70 resp 60 för A och B så blir relativ prestanda 70/60 = 1,17. Om t.ex. kompileringstiden är 40 resp 50 för A och B så blir relativ prestanda 50 / 40 = 1,25

Väldigt lite ändras med geometric mean

> cmp('i7-6700K', 'R5-1500X', 'Int') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-6700K R5-1500X 1.34 1.33 1.21 1.2 !> cmp('i7-7700K', 'R5-1500X', 'Int') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-7700K R5-1500X 1.4 1.39 1.16 1.16 >

Och angående det vissa försöker göra sig lustig med "i7-7700K är 5-10 % snabbare i 1280x720", skillnaden är lite större än så i titlar som är riktigt CPU-bundna. T.ex. Hitman

!> normTo('Hitman', 'R5-1500X') Program Model Result IsoFreq EstIPC 11 Hitman i7-7700K 1.75 1.43 1.43 9 Hitman i7-6700K 1.63 1.47 1.47 7 Hitman i5-7600K 1.23 1.14 1.14 6 Hitman i5-7500 1.15 1.15 1.15 17 Hitman R7-1800X 1.09 1.06 0.53 14 Hitman R5-1600X 1.07 1.04 0.70 13 Hitman R5-1500X 1.00 1.00 1.00 12 Hitman R5-1400 0.90 1.01 1.01 1 Hitman G4560 0.89 0.92 1.84

normTo() är en funktion som visar alla CPU-resultat normaliserade till en specifik CPU-modell, i7-7700K är 75 % snabbare här och har 43 % högre "IPC" (är inte tekniskt korrekt att kalla detta IPC, är egentligen bara frekvenskompenserat resultat).

Här ser man att ett försök att verkligen beräkna IPC blir totalt bonkers för program som inte är enkeltrådade alt. skalar perfekt med kärnor, så ignorera EstIPC (den är ett både frekvens och CPU-core kompenserat värde).

Hitman (och GTAV, Total War:Warhammer m.fl.) har faktiskt en viss skalning ända till 8 fysiska kärnor. Rent generellt ser de flesta spel idag boost mellan i5 och i7 (frekvenskompenserat), vilket indikerar att de kan utnyttja fler än fyra CPU-trådar. Dock är skalningen även i dessa titlar allt annat än linjär, typiskt 40-60 % boost när man går från 2C/4T -> 4C/8T vilket indikerar ett "p"-värde i Amdalhs på mellan 0,7-0,75.

Det betyder: om prestanda per kärna är minst 27 % högre i en 4-kärnig CPU jämfört med en 8-kärnig CPU är det omöjligt för den senare att prestera bättre. i7-7700K presterar typiskt 40-50 % bättre i CPU-bundna fall jämfört med R5-1500X (jämför med den modellen för att hålla antal CPU-trådar konstant). Nu är många spel GPU-bundna, i det läget kommer båda i det närmaste prestera identiskt.

Över de program jag så här långt tagit med ser jämförelse ut så här mot R5-1600X och R7-1800X

> cmp('i7-7700K', 'R7-1800X', 'Float') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-7700K R7-1800X 0.83 0.79 0.73 0.69 > cmp('i7-7700K', 'R7-1800X', 'Int') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-7700K R7-1800X 1.2 1.17 1.04 1 > cmp('i7-7700K', 'R5-1600X', 'Float') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-7700K R5-1600X 0.97 0.95 0.84 0.82 !> cmp('i7-7700K', 'R5-1600X', 'Int') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-7700K R5-1600X 1.26 1.24 1.07 1.06

Har lite få flyttalsprogram så här långt, men Ryzen är ruggigt stark där. Dels är flyttals IPC riktigt hög, dels skalar dessa program typiskt nära perfekt med kärnor.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

AMD pratar om 7nm redan i år se http://www.mobipicker.com/amd-confirms-7nm-tape-navi-zen-happ...

Visa signatur

Ryzen 5800X ROG STRIX X570-f GAMING FlareX DDR43600 cl 14-14-14-34 EVGA FTW3 Ultra RTX 3090

Permalänk
Medlem
Skrivet av Yoshman:

En annan väldigt stor anledning är att det är långt svårare (==dyrare) att designa en krets med riktigt hög enkeltrådprestanda. Finns en anledning varför ingen av ARM-tillverkarna förutom Apple går stenhårt på den linjen.

Precis som jag skrev väldigt tidigt i denna tråd så finns för och nackdelar med att använda en distribuerad schemaläggare, vilket Zen gör för heltalsdelen. Fördelen med distribuerad schemaläggare är att den drar mindre ström och är enklare att designa, nackdelen är att för en viss "bredd" på CPUn kommer alltid en global schemaläggare ge högre IPC (allt annat lika).

Agner Fog har numera konstaterat en annan sak jag tidigt gissade, i genomsnitt kommer Zen se högre boost från SMT jämfört med Core. Agner konstaterar att Zen i flera lägen inte är kapabel att utnyttja sin back-end fullt ut när bara en tråd används, något Skylake kan förutsatt att det är kod med väldigt hög cache-hit-rate (specifikt brukar SSE/AVX kod se rätt låg boost från SMT hos Core medan Zen absolut ser en boost trots halva kapacitet för AVX).

Det gör "IPC" jämförelsen än mer svår att göra, skiljer ju en del beroende på om en eller två CPU-trådar används per kärna. Var därför jag listade ett rätt brett spann för heltals IPC.

Är ju precis det jag använder LB till, om den är "T" inverteras värdet. D.v.s. om t.ex. FPS är 70 resp 60 för A och B så blir relativ prestanda 70/60 = 1,17. Om t.ex. kompileringstiden är 40 resp 50 för A och B så blir relativ prestanda 50 / 40 = 1,25

Väldigt lite ändras med geometric mean

> cmp('i7-6700K', 'R5-1500X', 'Int') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-6700K R5-1500X 1.34 1.33 1.21 1.2 !> cmp('i7-7700K', 'R5-1500X', 'Int') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-7700K R5-1500X 1.4 1.39 1.16 1.16 >

Och angående det vissa försöker göra sig lustig med "i7-7700K är 5-10 % snabbare i 1280x720", skillnaden är lite större än så i titlar som är riktigt CPU-bundna. T.ex. Hitman

!> normTo('Hitman', 'R5-1500X') Program Model Result IsoFreq EstIPC 11 Hitman i7-7700K 1.75 1.43 1.43 9 Hitman i7-6700K 1.63 1.47 1.47 7 Hitman i5-7600K 1.23 1.14 1.14 6 Hitman i5-7500 1.15 1.15 1.15 17 Hitman R7-1800X 1.09 1.06 0.53 14 Hitman R5-1600X 1.07 1.04 0.70 13 Hitman R5-1500X 1.00 1.00 1.00 12 Hitman R5-1400 0.90 1.01 1.01 1 Hitman G4560 0.89 0.92 1.84

normTo() är en funktion som visar alla CPU-resultat normaliserade till en specifik CPU-modell, i7-7700K är 75 % snabbare här och har 43 % högre "IPC" (är inte tekniskt korrekt att kalla detta IPC, är egentligen bara frekvenskompenserat resultat).

Här ser man att ett försök att verkligen beräkna IPC blir totalt bonkers för program som inte är enkeltrådade alt. skalar perfekt med kärnor, så ignorera EstIPC (den är ett både frekvens och CPU-core kompenserat värde).

Hitman (och GTAV, Total War:Warhammer m.fl.) har faktiskt en viss skalning ända till 8 fysiska kärnor. Rent generellt ser de flesta spel idag boost mellan i5 och i7 (frekvenskompenserat), vilket indikerar att de kan utnyttja fler än fyra CPU-trådar. Dock är skalningen även i dessa titlar allt annat än linjär, typiskt 40-60 % boost när man går från 2C/4T -> 4C/8T vilket indikerar ett "p"-värde i Amdalhs på mellan 0,7-0,75.

Det betyder: om prestanda per kärna är minst 27 % högre i en 4-kärnig CPU jämfört med en 8-kärnig CPU är det omöjligt för den senare att prestera bättre. i7-7700K presterar typiskt 40-50 % bättre i CPU-bundna fall jämfört med R5-1500X (jämför med den modellen för att hålla antal CPU-trådar konstant). Nu är många spel GPU-bundna, i det läget kommer båda i det närmaste prestera identiskt.

Över de program jag så här långt tagit med ser jämförelse ut så här mot R5-1600X och R7-1800X

> cmp('i7-7700K', 'R7-1800X', 'Float') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-7700K R7-1800X 0.83 0.79 0.73 0.69 > cmp('i7-7700K', 'R7-1800X', 'Int') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-7700K R7-1800X 1.2 1.17 1.04 1 > cmp('i7-7700K', 'R5-1600X', 'Float') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-7700K R5-1600X 0.97 0.95 0.84 0.82 !> cmp('i7-7700K', 'R5-1600X', 'Int') ModelA ModelB Result GmResult IsoFreq GmIsoFreq 1 i7-7700K R5-1600X 1.26 1.24 1.07 1.06

Har lite få flyttalsprogram så här långt, men Ryzen är ruggigt stark där. Dels är flyttals IPC riktigt hög, dels skalar dessa program typiskt nära perfekt med kärnor.

Det framgick inte att du hade inverterat i den tidigare beskrivningen.

Den skillnad som finns i de geometriska medelvärdena är mer korrekt, även om skillnaden inte alltid är stor. En bra artikel på temat är:

Smith, James E. "Characterizing computer performance with a single number." Communications of the ACM 31.10 (1988): 1202-1206.

Den finns att läsa på https://www.cs.auckland.ac.nz/courses/compsci703s1c/resources...

Artikeln visar hur och varför det "vanliga" (aritmetiska) medelvärdet inte "får" användas för att jämföra datorer när man diskuterar relativ prestanda.

Man måste alltså använda det geometriska medelvärdet.

Den borde samtliga sajter på nätet som jämför datorer och prestanda läsa.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem
Skrivet av Enigma:

Vill stå för det jag skrivit långt tidigare och Tomb Raider som verkar ha vart ett absolut dödsviktigt och obligatoriskt test för att sänka Ryzen mot Intel visade sig vara hysteriskt ineffektivt just på Ryzen. Nu är spelet patchat och ökar prestanda på Ryzen med 17%:

https://www.pcper.com/files/review/2017-05-30/tr-1.png
https://www.pcper.com/files/review/2017-05-30/tr-2.png

Fick skit kastat på mig ang detta och att man absolut inte optimerar spel för en ny CPU Vi är uppe i rätt många nu sedan Ryzen's lansering och det är ändå bara halvdana optimeringar av befintliga spel, så räkna med detta som ett absolut minimum om vad Ryzen är kapabel till.

Tomb Raider är fortfarande knappast en väloptimerad titel, likaså andra spel som just använts i alla Ryzen tester där man vet att dom inte fungerat bra på Ryzen. Intel har enormt mycket pengar. Det som är sorligt är att det är precis lika mycket politik i IT-världen där journalistik och mutor/samarbeten sätter sina spår. En stor andel verkar ha allvarliga problem med att se eller förstå det.

Testat med 2400 MHz minne också, vilket betyder att man kan lägga på ytterligare 10-15% med 3200 MHz minnen. Det betyder att 1800X i princip matchar 6900K i detta spel nu. Det måste ha varit någon specifik flaskhals i koden som påverkade Ryzen mer än Intel, som de åtgärdat.

Visa signatur

Phanteks XT Pro Silent | Phanteks PH-TC14PE | Seasonic Core GX V2 850W | Asus Prime X370 Pro | Ryzen 9 5950X | Corsair 32GB 3600 MT/s | ASRock RX 9070 XT Steel Legend 16GB | WD Blue SN550 NVMe SSD 1TB

Permalänk
Medlem
Skrivet av Pepsin:

Testat med 2400 MHz minne också, vilket betyder att man kan lägga på ytterligare 10-15% med 3200 MHz minnen. Det betyder att 1800X i princip matchar 6900K i detta spel nu. Det måste ha varit någon specifik flaskhals i koden som påverkade Ryzen mer än Intel, som de åtgärdat.

Man kan åtminstone lägga på ~5% till på att köra DDR2667 som är plattformens officiella högsta ramfrekvens. Det andra är ju överklockning och Intel processorn hade ju också tjänat på snabbare RAM utöver vad som är original så sett men visst är Ryzen snabb.

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]