AMD Ryzen 9 5950X och Ryzen 9 5900X "Vermeer"

Permalänk
Datavetare
Skrivet av tellus82:

För den som undrar om det går att se skillnad i spel mellan enkel CCD & dubbel CCD (enkel CCX mot dubbel CCX), jo det gör det men för att se det i många titlar lär man tilta inställningar för absolut maximal FPS för att det ska ge stor effekt. En del titlar visar det till trots även i mer normala inställningar. GPU begränsar mer än man tror i en del titlar även vid 1080p.

https://www.anandtech.com/show/16214/amd-zen-3-ryzen-deep-div...

Fast blir det rätt att välja ut ett specifikt fall? Kollar du i stället på t.ex. GTAV så prestera 5900X/5950X bättre än 5600X/5800X...

Om man räknat ur skillnaden över alla speltester Anandtech har blir det 2 % fördel för 5800X över 5900X i genomsnittlig FPS, är däremot 1 % fördel för 5900X över 5800X i lägst FPS. Alla resultat är för lägsta upplösningen med lägsta inställningar där skillnaderna är som störst m.a.p CPU.

Gör man ett student's t-test med hypotesen att skillnaden mellan prestanda hos 5800X och 5900X är noll kan man inte förkasta den hypotesen (är inte i närheten) baserat på data.

Kort och gott: givet data kan vi inte med någon statistisk säkerhet avgöra om den skillnad vi faktisk ser mellan 5800X och 5900X kommer från en faktiskt skillnad i prestanda eller om det bara är en effekt av varians i mätningarna och testmetoderna.

Råder absolut inga tvivel om att Zen3 är snabbare än Zen2 i spel, den skillnaden verkar ha väldigt lite att göra med minskningen i antal CCX. För om så vore fallet borde 5800X prestera bättre än 5900X. Däremot ger minskningen av CCX-antal en fördel över Zen2: mängden L3$ som är användbar per CPU-kärna är dubbelt så stor i Zen3, det lär vara en (av flera) orsaker till ökad spelprestanda.

Skrivet av JBE:

Hmmm
Jag "vill" att det skall matcha resultaten i artikeln nedan, där "Vid samma klockfrekvens i upplösningen 720p tappar nämligen Ryzen 3 3100 nämnvärd prestanda och storebror Ryzen 3 3300X uppvisar här cirka 12 procent högre bildfrekvens.".
https://www.sweclockers.com/test/29571-amd-ryzen-3-3300x-och-...

Det jag hittar i rayons dokumentation om fork-join verkar gälla asynkrona tasks?
"scope Creates a "fork-join" scope s and invokes the closure with a reference to s. This closure can then spawn asynchronous tasks into s. Those tasks may run asynchronously with respect to the closure; they may themselves spawn additional tasks into s. When the closure returns, it will block until all tasks that have been spawned into s complete."

Eller kanske den är lite för syntetisk och lite för bra på att dela upp en förutbestämd sekventiell last?
Medan tex spel har en mer pseudo-random synkron last i en bra motor där olika trådar måste vänta på varandra?
Skulle vara spännande att se samma sak i bfv, eller superposition, eller w/e. Oavsett om det är latens eller något annat okänt med tex IF som spökar så är det ju en dokumenterad effekt i 3000-serien, som kanske eller kanske inte finns i 5000-serien.

Om du löser ett problem där alla ingående moment utförs synkront, vad har du då? Urtypen för ett rent enkeltrådat fall!

Enda sättet att få en "speed-up" av att slänga flera kärnor på att lösa ett och samma problem är att vissa delar kan utföras asynkront. Skillnaden mot "embarrassingly parallel" som t.ex. Cinebench där man aldrig har ett "join" steg och därmed ingen synkroniseringspunkt, är att fork-join fall delar upp något i två delproblem som kan lösas separat, men man måste sedan slå ihop delresultaten (join).

Det krävs core-to-core kommunikation både att sprida ut jobbet, men framförallt krävs core-to-core kommunikation för att slå ihop delresultaten (join är betydligt knivigare att göra effektiv än fork).

Moderna spelmotorer fungerar på just detta sätt. De delar in de saker som ska göras i deluppgifter som kan lösas separat, dessa deluppgifter kan i sin tur dela upp sitt jobb på samma sätt. D.v.s. precis det som händer i exempelprogrammet jag postade, skillnaden i det är att spel knappast har i närheten lika mycket potentiell parallellism.

Här är ett fall som lite visar effekten av att använda en kärna per CCX faktiskt ger högre prestanda än att använda alla tre kärnor i ett CCX. Det fallet med lite högre ST-prestanda är där alla tre kärnor (körde 3C/6T) kör i samma CCX, använde CCX#0 vilket ligger på den "bra" compute-die så den klockar lite högre än den andra. Andra fallet använde CCX#0, #1 och #2 (CCX#2 ligger på den "dåliga" compute-die).

GB5 har fall där "working-set" är >16 MB. Blir i det fallet en fördel att sprida över CCX, man har tillgång till 3x 16 MB L3$ medan fallet som är låst till en CCX har 16 MB L3$ som alla 3 kärnor och 6 trådar måste dela på. GB5 MT använder flera kärnor att lösa ett större problem.

Ställer man 3800X mot 3900X, med 3900X som referens:

  • högre genomsnittlig core-to-core latens p.g.a. 4 CCX mot 2 CCX

  • högre aggregerad bandbredd mot L3$ p.g.a. 4 L3$-slices mot 2 L3$-slices

  • mer L3$ p.g.a. 4 L3$-slices mot 2 L3$-slices

  • samma mängd L3$ per CPU-kärna då varje CCX innehåller en 16 MB L3$-slice

  • högre aggregerad skrivprestanda mot RAM p.g.a. två compute-die vs en

D.v.s. finns både fördelar och nackdelar i båda fallen

Ställer vi nu 3100 mot 3300X, med 3300X som referens:

  • lägre genomsnittlig core-to-core latens p.g.a. 1 CCX mot 2 CCX

  • samma aggregerad bandbredd mot L3$ p.g.a. varje L3$-slice är halverad i 3100

  • samma mängd L3$ p.g.a. att de två L3$-slices i 3100 bara är 8 MB mot 16 MB i 3300X enda

  • dubbelt så mycket L3$ per CCX, vilket ger dubbla användbara mängden L3$ per CPU-kärna

  • samma skrivprestanda mot RAM p.g.a. då båda har en compute-die

3100 vs 3300X är alltså inte jämförbar med 3600/3600X/3700X/3800X vs 3900X/3950X (och motsvarande för 5000-serien med en vs två compute-dies). I det förra fallet har 3300X kvar fördelarna med färre CCX, men 3100 har ingen av fördelarna som 3900X/3950X har.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Hade tänkt kanske byta ut mitt 8700k ,men verkar att både 5950X och 9 5900X presterar sämre i spel 4k som jag endast spelar och vr,de är inte dåliga men avstår än så länge för behöver varenda fps för 4kmed mitt vanliga skärm och 8k vr, bara att vänta ,både AMD och Intel går rätt håll 8700k klarar sig säkert ett par år till , men blir alla fall uppgradering från mitt 1080ti inom närmaste halvår RX 6900 XT eller RTX 380 ti , super om det dyker upp eller RTX 390

Permalänk
Medlem

Mysko saker där antalet stickor påverkar en hel del.

Visa signatur

▐ AMD Ryzen 5 5600X @4,725GHz 1,285V▐ PNY GeForce RTX 3070 8GB XLR8 @2,12GHz▐
▐ MSI MPG B550 Gaming Plus▐ Corsair Vengeance LPX DDR4 32GB (2x16GB) @3800MT/s▐
▐ Transcend 128GB SSD▐ Intel SSD 660p 1TB▐ 2,5" SSD 1,5TB▐ Fractal Design Integra M 650W▐

Permalänk
Medlem
Skrivet av zeg:

Mysko saker där antalet stickor påverkar en hel del.

https://www.youtube.com/watch?v=-UkGu6A-6sQ&ab_channel=Gamers...

Se tidigare inlägg

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem
Skrivet av Yoshman:

Fast blir det rätt att välja ut ett specifikt fall? Kollar du i stället på t.ex. GTAV så prestera 5900X/5950X bättre än 5600X/5800X...

Om man räknat ur skillnaden över alla speltester Anandtech har blir det 2 % fördel för 5800X över 5900X i genomsnittlig FPS, är däremot 1 % fördel för 5900X över 5800X i lägst FPS. Alla resultat är för lägsta upplösningen med lägsta inställningar där skillnaderna är som störst m.a.p CPU.

Gör man ett student's t-test med hypotesen att skillnaden mellan prestanda hos 5800X och 5900X är noll kan man inte förkasta den hypotesen (är inte i närheten) baserat på data.

Kort och gott: givet data kan vi inte med någon statistisk säkerhet avgöra om den skillnad vi faktisk ser mellan 5800X och 5900X kommer från en faktiskt skillnad i prestanda eller om det bara är en effekt av varians i mätningarna och testmetoderna.

Råder absolut inga tvivel om att Zen3 är snabbare än Zen2 i spel, den skillnaden verkar ha väldigt lite att göra med minskningen i antal CCX. För om så vore fallet borde 5800X prestera bättre än 5900X. Däremot ger minskningen av CCX-antal en fördel över Zen2: mängden L3$ som är användbar per CPU-kärna är dubbelt så stor i Zen3, det lär vara en (av flera) orsaker till ökad spelprestanda.

Om du löser ett problem där alla ingående moment utförs synkront, vad har du då? Urtypen för ett rent enkeltrådat fall!

Enda sättet att få en "speed-up" av att slänga flera kärnor på att lösa ett och samma problem är att vissa delar kan utföras asynkront. Skillnaden mot "embarrassingly parallel" som t.ex. Cinebench där man aldrig har ett "join" steg och därmed ingen synkroniseringspunkt, är att fork-join fall delar upp något i två delproblem som kan lösas separat, men man måste sedan slå ihop delresultaten (join).

Det krävs core-to-core kommunikation både att sprida ut jobbet, men framförallt krävs core-to-core kommunikation för att slå ihop delresultaten (join är betydligt knivigare att göra effektiv än fork).

Moderna spelmotorer fungerar på just detta sätt. De delar in de saker som ska göras i deluppgifter som kan lösas separat, dessa deluppgifter kan i sin tur dela upp sitt jobb på samma sätt. D.v.s. precis det som händer i exempelprogrammet jag postade, skillnaden i det är att spel knappast har i närheten lika mycket potentiell parallellism.

Här är ett fall som lite visar effekten av att använda en kärna per CCX faktiskt ger högre prestanda än att använda alla tre kärnor i ett CCX. Det fallet med lite högre ST-prestanda är där alla tre kärnor (körde 3C/6T) kör i samma CCX, använde CCX#0 vilket ligger på den "bra" compute-die så den klockar lite högre än den andra. Andra fallet använde CCX#0, #1 och #2 (CCX#2 ligger på den "dåliga" compute-die).

GB5 har fall där "working-set" är >16 MB. Blir i det fallet en fördel att sprida över CCX, man har tillgång till 3x 16 MB L3$ medan fallet som är låst till en CCX har 16 MB L3$ som alla 3 kärnor och 6 trådar måste dela på. GB5 MT använder flera kärnor att lösa ett större problem.

Ställer man 3800X mot 3900X, med 3900X som referens:

  • högre genomsnittlig core-to-core latens p.g.a. 4 CCX mot 2 CCX

  • högre aggregerad bandbredd mot L3$ p.g.a. 4 L3$-slices mot 2 L3$-slices

  • mer L3$ p.g.a. 4 L3$-slices mot 2 L3$-slices

  • samma mängd L3$ per CPU-kärna då varje CCX innehåller en 16 MB L3$-slice

  • högre aggregerad skrivprestanda mot RAM p.g.a. två compute-die vs en

D.v.s. finns både fördelar och nackdelar i båda fallen

Ställer vi nu 3100 mot 3300X, med 3300X som referens:

  • lägre genomsnittlig core-to-core latens p.g.a. 1 CCX mot 2 CCX

  • samma aggregerad bandbredd mot L3$ p.g.a. varje L3$-slice är halverad i 3100

  • samma mängd L3$ p.g.a. att de två L3$-slices i 3100 bara är 8 MB mot 16 MB i 3300X enda

  • dubbelt så mycket L3$ per CCX, vilket ger dubbla användbara mängden L3$ per CPU-kärna

  • samma skrivprestanda mot RAM p.g.a. då båda har en compute-die

3100 vs 3300X är alltså inte jämförbar med 3600/3600X/3700X/3800X vs 3900X/3950X (och motsvarande för 5000-serien med en vs två compute-dies). I det förra fallet har 3300X kvar fördelarna med färre CCX, men 3100 har ingen av fördelarna som 3900X/3950X har.

GtaV nyttjar rätt få kärnor FYI och naturligtvis kommer det skilja mellan spel och motorer, annat vore mycket märkligt men skillnad finns rätt uppenbarligen där, annat kan du inte hävda. Sen skiljer boost frekvens rätt ordentligt mellan processorerna vid få trådar.

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem
Skrivet av Aka_The_Barf:

Så det är altså ingen större skillnad på hur man ska ställa in den helt enkelt. Test på djupet lär nog dyka upp snart.

Det är ingen större skillnad därför att IO die är exakt densamma, på sin höjd processförfiningar som i XT serien. Båda mina Zen 2 klarar 1900MHz 1:1:1 så jag blir besviken om jag inte kan skruva upp det åtminstone 100MHz.

Visa signatur

9950X3D X870E HERO 96/6400c30/2200 RTX5090 Gaming OC || 7950X B650 Gaming Plus WIFI 32/6000c30 RTX5080 TUF OC(450w) UBUNTU || 12900KF Z690 Tomahawk WIFI 64/3600c16 Gear1 RTX4080 Ventus 3X OC(400W) || 5900X(B2) B550-F 32/3800c18 RTX3080 TUF OC V2 || 5800X3D CH VIII EXT. 32/3800c18 RTX3080 Gaming OC || 3700X X570 HERO 32/3000c16 RTX3070 FTW3 Ultra || Thinkpad P16s G2 PRO7840U 32/6400

Permalänk
Datavetare
Skrivet av tellus82:

GtaV nyttjar rätt få kärnor FYI och naturligtvis kommer det skilja mellan spel och motorer, annat vore mycket märkligt men skillnad finns rätt uppenbarligen där, annat kan du inte hävda. Sen skiljer boost frekvens rätt ordentligt mellan processorerna vid få trådar.

Man kan ta ett annat exempel: RDD2. Men det är just exempel.

Det ändrar inte det faktum att om man tar med alla resultat så finns ingen prestandaskillnad som kan hänföras till CCX kvar. Det är enstaka procent och genomsnittlig resp. lägsta FPS slår åt olika håll (men båda är inom vad som kan avföras som osäkerhet i testmetod och mätmetod).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Man kan ta ett annat exempel: RDD2. Men det är just exempel.

Det ändrar inte det faktum att om man tar med alla resultat så finns ingen prestandaskillnad som kan hänföras till CCX kvar. Det är enstaka procent och genomsnittlig resp. lägsta FPS slår åt olika håll (men båda är inom vad som kan avföras som osäkerhet i testmetod och mätmetod).

Men snälla, bara för att skillnaden jämnas ut i genomsnitt betyder inte att den inte finns där i del av materialet

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Datavetare
Skrivet av Thomas:

Anandtech har ett egetutvecklat (och till synes extremt syntetiskt) test för detta.
3950X och 5950X
10600K, 10700K och 10900K

Så Ryzen leder inom CCX men ligger långt efter mellan CCX. I faktisk prestanda är ju skillnaden dock ganska minimal.

Finns ingen anledning för SweC att reproducera dessa siffror, man kommer få exakt samma resultat som AnandTech då detta är helt beroende av CPU-modell samt faktiskt frekvens man kör. RAM-hastighet och övriga komponenter är irrelevant.

Sen är dessa värden extremt svåra att applicera på något verkligt, i isolation saknar de helt relevans då de bara mäter en del av en process som innefattar massor med andra delar.

Om man sitter och pillar just på work-stealing schedulers eller utvecklar någon ny metod för core-to-core synkronisering kan det där vara värdefull information. För normalanvändaren är siffrorna i praktiken oanvändbara, man måste veta hur stor andel av core-to-core latensen av totala tiden att utföra det jobb man är intresserad av.

Finns teori runt just detta, det man mäter är del av kostnaden för "work and span". Värt att notera där är att om förbättringen i den uppmätta core-to-core latensen är mycket mindre än totala mängden arbete (work) samt även klart mindre än tiden för den kritiska delen (span) är just core-to-core latensen irrelevant.

Finns fall där core-to-core latens helt klart är relevant, men det är långt ifrån alla då alla lyckade former av att effektivt sprida saker över många kärnor bygger på att man minimerar core-to-core kommunikation. Då core-to-core tiderna ligger i intervallet 10 till ett par hundra nanosekunder blir detta bara relevant i fall som har väldigt hög grad av core-to-core kommunikation. Sådana kan i praktiken inte skala till speciellt många kärnor, men de finns helt klar!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Daniel86:

Någon som sett detta? Kansske nått även swecl borde testa?
https://www.youtube.com/watch?v=-UkGu6A-6sQ

Verkar som man får en performance bump på 5-10% om man kör med 4 ist för 2 ram stickor även med samma timings och det verkar inte vara knutet till kapacitet.

@JonasT

Min tanke om detta är att den enskilt största skillnaden på zen2 vs zen3 är just hur många load/store instruktioner som varje kärna kan exekvera per cykel (läs AnandTech deep dive). Detta borde kunna belasta ramminnesresurserna maximalt ganska ofta och det lilla teoretiska som skiljer mellan single/dual/quad-rank (parallella operationer mot ranks, inte läsa/skriva data) visar sig här för första gången som en tydlig förbättring.

Mitt tips skulle vara att helt enkelt testa noggrannt dessa fall och se till att styra timings exakt lika.

1x1 (single channel, single rank)
1x2 (single channel, dual rank, kan vara 2 stickor eller en dubbelsidig sticka)
2x1 (dual channel, single rank)
2x2 (dual channel, dual rank, gärna med 2 stickor och dubbelsidiga separat (per kanal))
2x4 (dual channel, quad rank, två dubbelsidiga stickor per kanal)

Utöver detta skulle man också vilja se om den pallar 3800MT/s för alla dessa konfigurationer

Permalänk
Medlem
Skrivet av the squonk:

Det är ingen större skillnad därför att IO die är exakt densamma, på sin höjd processförfiningar som i XT serien. Båda mina Zen 2 klarar 1900MHz 1:1:1 så jag blir besviken om jag inte kan skruva upp det åtminstone 100MHz.

Ser att det är fler som diskuterar liknande saker. Då är det bara köra vidare som med zen2. När jag får min 5900X är en annan femma.

Visa signatur

Ryzen 9800X3D @ Stock, MSI Suprim X 3080 @ game mode.
YT kanal där jag meckar bilar: https://www.youtube.com/@saab900turboT16

Permalänk
Datavetare
Skrivet av tellus82:

Men snälla, bara för att skillnaden jämnas ut i genomsnitt betyder inte att den inte finns där i del av materialet

Om man vill har svar på frågan: är det en fördel för spel att ha en CCX, 5600X/5800X, över att ha två CCX, 5900X/5950X så är det faktiskt avgörande om skillnaden jämnas ut när man lägger till flera datapunkter.

Om det finns en faktiskt skillnad i specifika titlar och den skillnaden slår åt olika håll i olika titlar betyder det bara att de har olika vikt på de olika för- resp. nackdelar som en resp. två CCX medför. För finns just det, både för- och nackdelar (utanför fallet 3100 och 3300X).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Om man vill har svar på frågan: är det en fördel för spel att ha en CCX, 5600X/5800X, över att ha två CCX, 5900X/5950X så är det faktiskt avgörande om skillnaden jämnas ut när man lägger till flera datapunkter.

Om det finns en faktiskt skillnad i specifika titlar och den skillnaden slår åt olika håll i olika titlar betyder det bara att de har olika vikt på de olika för- resp. nackdelar som en resp. två CCX medför. För finns just det, både för- och nackdelar (utanför fallet 3100 och 3300X).

Ja visst finns det för och nackdelar när man jämför processorer som är fundamentalt olika, kikar du på en 5800x vs en 5900x eller 5950x så skiljer antal kärnor, antal kärnor aktiva per ccd/ccx, cache, frekvens vid få trådar och frekvens vid all core samt allt där emellan, bandbredd vid skrivning till internminne skiljer också markant mellan en CCD och dubbel CCD. Och sist har vi skillnaden i latens på core till core inom en CCX och mellan 2 CCX/CCD.

Vore det då konstigt att man såg skillnad i olika spel vid olika inställningar? Att det sedan jämnas ut i slutändan mycket pga hur man testar och med vad ändrar fortfarande inte faktum att skillnad faktiskt finns där. Spelar skillnaden någon roll om du är mestadels GPU bunden? Nej inte direkt. Kan man fortsatt se skillnader? ja, är det något man kommer märka när man väl spelar spelen, troligen inte.

Du hävdade tidigare att skillnader inte fanns alls mellan enkel CCX mot dubbel CCX men efter jag påvisade att det gör faktiskt det så ändrar du dig till att skillnad finns inte om man kikar på genomsnitt av all data insamlad, ser du skillnad där?

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem

Verkar vara fördelaktigt att köra 4 stickor vs 2!

Visa signatur

13900KS | 32GB 6400 DDR5 | 4090 FE | Samsung G8 Oled
ASUS ROG Strix Z790-F Gaming | Fractal Torrent White | Corsair HX1200

Permalänk
Medlem
Skrivet av Oneone:

Verkar vara fördelaktigt att köra 4 stickor vs 2!

https://www.youtube.com/watch?v=-UkGu6A-6sQ

Hehe, det finns länkat och diskuterat lite tidigare i tråden

#18711263

#18711285

#18711288

#18711290

#18711294

#18711346

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Datavetare
Skrivet av tellus82:

Ja visst finns det för och nackdelar när man jämför processorer som är fundamentalt olika, kikar du på en 5800x vs en 5900x eller 5950x så skiljer antal kärnor, antal kärnor aktiva per ccd/ccx, cache, frekvens vid få trådar och frekvens vid all core samt allt där emellan, bandbredd vid skrivning till internminne skiljer också markant mellan en CCD och dubbel CCD. Och sist har vi skillnaden i latens på core till core inom en CCX och mellan 2 CCX/CCD.

Vore det då konstigt att man såg skillnad i olika spel vid olika inställningar? Att det sedan jämnas ut i slutändan mycket pga hur man testar och med vad ändrar fortfarande inte faktum att skillnad faktiskt finns där. Spelar skillnaden någon roll om du är mestadels GPU bunden? Nej inte direkt. Kan man fortsatt se skillnader? ja, är det något man kommer märka när man väl spelar spelen, troligen inte.

Du hävdade tidigare att skillnader inte fanns alls mellan enkel CCX mot dubbel CCX men efter jag påvisade att det gör faktiskt det så ändrar du dig till att skillnad finns inte om man kikar på genomsnitt av all data insamlad, ser du skillnad där?

Att det finns skillnader mellan kretsar som har X eller 2*X st CCX är väl lika självklart som att vatten i flytande fas är blött! Har listat de relevanta skillnaderna ett par gånger i denna tråd och även pekat på varför det verkligen finns en skillnad även i genomsnitt just för 3100 och 3300X.

Men det väldigt nära 100 % faktiskt vill ha svar på är frågan: finns det någon fördel med en CCX över två CCX i spel? Är den frågan jag svara på med: de data vi har pekar på att det inte finns någon relevant skillnad m.a.p just den aspekten.

Det är en fråga om spel i allmänhet, svaret är då rimligen uttryck just för hur det ser ut i allmänhet, vilket rent praktiskt inte kan approximeras bättre än att kolla hur det ser ut i genomsnitt över de titlar som faktiskt testas. Så påstår exakt samma sak nu som jag gjort hela tiden.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Att det finns skillnader mellan kretsar som har X eller 2*X st CCX är väl lika självklart som att vatten i flytande fas är blött! Har listat de relevanta skillnaderna ett par gånger i denna tråd och även pekat på varför det verkligen finns en skillnad även i genomsnitt just för 3100 och 3300X.

Men det väldigt nära 100 % faktiskt vill ha svar på är frågan: finns det någon fördel med en CCX över två CCX i spel? Är den frågan jag svara på med: de data vi har pekar på att det inte finns någon relevant skillnad m.a.p just den aspekten.

Det är en fråga om spel i allmänhet, svaret är då rimligen uttryck just för hur det ser ut i allmänhet, vilket rent praktiskt inte kan approximeras bättre än att kolla hur det ser ut i genomsnitt över de titlar som faktiskt testas. Så påstår exakt samma sak nu som jag gjort hela tiden.

Alltid lika trevligt när du försöker göra om diskussionen till en fråga om semantik när det visar sig att du kanske hade en smula fel om något, huruvida du kommer se skillnad mellan enkel CCX/CCD mot dubbel CCX/CCD i spel beror helt och hållet på vilket spel och med vilka inställningar man pratar om och med vilket grafikkort.

Finns det skillnad: JA
Kommer den märkas i snittdata där man är mestadels GPU limiterad: NEJ
Kan det märkas i snittdata där du är helt CPU limiterad: JA, men det beror på vilka spel du testar
Märks det i data där du är CPU limiterad: JA, men åter igen, beror på vad du testar.

Ska man därför som konsument som endast vill spela bry sig i dubbel vs single CCX/CCD? Det beror på vad man är ute efter, jag skulle säga köp en R5 3600 eller 5600x eller rent av en 6-8 kärnig intel processor, varken 5900x eller 5950x fyller någon direkt funktion för en "gamer" om vi ska vara lite ärliga, eller vill du hävda något annat?

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem
Skrivet av tellus82:

Hehe, det finns länkat och diskuterat lite tidigare i tråden

#18711263

#18711285

#18711288

#18711290

#18711294

#18711346

så många sidor så missat hehe

Visa signatur

13900KS | 32GB 6400 DDR5 | 4090 FE | Samsung G8 Oled
ASUS ROG Strix Z790-F Gaming | Fractal Torrent White | Corsair HX1200

Permalänk
Medlem
Skrivet av tellus82:

Alltid lika trevligt när du försöker göra om diskussionen till en fråga om semantik när det visar sig att du kanske hade en smula fel om något, huruvida du kommer se skillnad mellan enkel CCX/CCD mot dubbel CCX/CCD i spel beror helt och hållet på vilket spel och med vilka inställningar man pratar om och med vilket grafikkort.

Finns det skillnad: JA
Kommer den märkas i snittdata där man är mestadels GPU limiterad: NEJ
Kan det märkas i snittdata där du är helt CPU limiterad: JA, men det beror på vilka spel du testar
Märks det i data där du är CPU limiterad: JA, men åter igen, beror på vad du testar.

Ska man därför som konsument som endast vill spela bry sig i dubbel vs single CCX/CCD? Det beror på vad man är ute efter, jag skulle säga köp en R5 3600 eller 5600x eller rent av en 6-8 kärnig intel processor, varken 5900x eller 5950x fyller någon direkt funktion för en "gamer" om vi ska vara lite ärliga, eller vill du hävda något annat?

För en gamer är 5600X mer eller mindre självklar att välja, dom andra i serien ger inga speciella fördelar i just spel. 5600X är den nya 3300X.

Visa signatur

9950X3D X870E HERO 96/6400c30/2200 RTX5090 Gaming OC || 7950X B650 Gaming Plus WIFI 32/6000c30 RTX5080 TUF OC(450w) UBUNTU || 12900KF Z690 Tomahawk WIFI 64/3600c16 Gear1 RTX4080 Ventus 3X OC(400W) || 5900X(B2) B550-F 32/3800c18 RTX3080 TUF OC V2 || 5800X3D CH VIII EXT. 32/3800c18 RTX3080 Gaming OC || 3700X X570 HERO 32/3000c16 RTX3070 FTW3 Ultra || Thinkpad P16s G2 PRO7840U 32/6400

Permalänk
Datavetare
Skrivet av tellus82:

Alltid lika trevligt när du försöker göra om diskussionen till en fråga om semantik när det visar sig att du kanske hade en smula fel om något, huruvida du kommer se skillnad mellan enkel CCX/CCD mot dubbel CCX/CCD i spel beror helt och hållet på vilket spel och med vilka inställningar man pratar om och med vilket grafikkort.

Finns det skillnad: JA
Kommer den märkas i snittdata där man är mestadels GPU limiterad: NEJ
Kan det märkas i snittdata där du är helt CPU limiterad: JA, men det beror på vilka spel du testar
Märks det i data där du är CPU limiterad: JA, men åter igen, beror på vad du testar.

Ska man därför som konsument som endast vill spela bry sig i dubbel vs single CCX/CCD? Det beror på vad man är ute efter, jag skulle säga köp en R5 3600 eller 5600x eller rent av en 6-8 kärnig intel processor, varken 5900x eller 5950x fyller någon direkt funktion för en "gamer" om vi ska vara lite ärliga, eller vill du hävda något annat?

Tja, eller så kanske du bara antagit saker om vad jag tänkte som är felaktigt. Begriper inte vad det finns att hetsa upp sig om, så släpper det här spåret. Är ju trots allt söndag, ännu en ledig dag i Corona-isolerings tecken och under nästa vecka kan vi se fram mot årtiondes mest spännande datorrelaterad lansering!

Har lovat grabben en ny speldator, tänkte först ge honom min 3900X och köpa en 5900X. Men för just det jag vill ha datorn till gav 5900X ett rätt litet lyft, så nu blir det en 5600X åt honom för i alla rimliga upplösningar ihop med ett RTX3070 är allt annat bortkastade pengar då han inte gör något annat krävande än just spel.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Tja, eller så kanske du bara antagit saker om vad jag tänkte som är felaktigt. Begriper inte vad det finns att hetsa upp sig om, så släpper det här spåret. Är ju trots allt söndag, ännu en ledig dag i Corona-isolerings tecken och under nästa vecka kan vi se fram mot årtiondes mest spännande datorrelaterade lansering!

Ja jag kan mycket väl ha tolkat dig fel, det är absolut inte omöjligt eller så har du formulerat dig klumpigt mot vad du egentligen ville få fram, vilket av dessa som stämmer kanske beror på betraktaren i slutändan. Ja nog ska det bli spännande med kommande släpp men jag måste erkänna att vi haft rena julafton under rätt lång tid nu med allt nytt & roligt som kommit & som ska komma. Så här stor förändring samtidigt var det längesedan vi hårdvarunördar fick.

Håller med om 3070 med 5600x, egentligen skulle jag kanske invänta 5600 icke X för bäst pang för pengarna men vill man ha grejer nu så är 5600x inte ett dumt val.

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem

När kommer recensionerna av 5800x och 5600x som är mer intressant för 99.98%??

Permalänk
Medlem
Skrivet av ramlösa:

När kommer recensionerna av 5800x och 5600x som är mer intressant för 99.98%??

De har svarat angående detta redan, de ville ha ledigt under helgen så testandet sker till veckan med släpp av test när det är klart. De fick nämligen 5600 och 5800 samma dag som släppet var, alltså inte i förväg.

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem
Skrivet av Yoshman:

Fast blir det rätt att välja ut ett specifikt fall? Kollar du i stället på t.ex. GTAV så prestera 5900X/5950X bättre än 5600X/5800X...

Om man räknat ur skillnaden över alla speltester Anandtech har blir det 2 % fördel för 5800X över 5900X i genomsnittlig FPS, är däremot 1 % fördel för 5900X över 5800X i lägst FPS. Alla resultat är för lägsta upplösningen med lägsta inställningar där skillnaderna är som störst m.a.p CPU.

Gör man ett student's t-test med hypotesen att skillnaden mellan prestanda hos 5800X och 5900X är noll kan man inte förkasta den hypotesen (är inte i närheten) baserat på data.

Kort och gott: givet data kan vi inte med någon statistisk säkerhet avgöra om den skillnad vi faktisk ser mellan 5800X och 5900X kommer från en faktiskt skillnad i prestanda eller om det bara är en effekt av varians i mätningarna och testmetoderna.

Råder absolut inga tvivel om att Zen3 är snabbare än Zen2 i spel, den skillnaden verkar ha väldigt lite att göra med minskningen i antal CCX. För om så vore fallet borde 5800X prestera bättre än 5900X. Däremot ger minskningen av CCX-antal en fördel över Zen2: mängden L3$ som är användbar per CPU-kärna är dubbelt så stor i Zen3, det lär vara en (av flera) orsaker till ökad spelprestanda.

Om du löser ett problem där alla ingående moment utförs synkront, vad har du då? Urtypen för ett rent enkeltrådat fall!

Enda sättet att få en "speed-up" av att slänga flera kärnor på att lösa ett och samma problem är att vissa delar kan utföras asynkront. Skillnaden mot "embarrassingly parallel" som t.ex. Cinebench där man aldrig har ett "join" steg och därmed ingen synkroniseringspunkt, är att fork-join fall delar upp något i två delproblem som kan lösas separat, men man måste sedan slå ihop delresultaten (join).

Det krävs core-to-core kommunikation både att sprida ut jobbet, men framförallt krävs core-to-core kommunikation för att slå ihop delresultaten (join är betydligt knivigare att göra effektiv än fork).

Moderna spelmotorer fungerar på just detta sätt. De delar in de saker som ska göras i deluppgifter som kan lösas separat, dessa deluppgifter kan i sin tur dela upp sitt jobb på samma sätt. D.v.s. precis det som händer i exempelprogrammet jag postade, skillnaden i det är att spel knappast har i närheten lika mycket potentiell parallellism.

Här är ett fall som lite visar effekten av att använda en kärna per CCX faktiskt ger högre prestanda än att använda alla tre kärnor i ett CCX. Det fallet med lite högre ST-prestanda är där alla tre kärnor (körde 3C/6T) kör i samma CCX, använde CCX#0 vilket ligger på den "bra" compute-die så den klockar lite högre än den andra. Andra fallet använde CCX#0, #1 och #2 (CCX#2 ligger på den "dåliga" compute-die).

GB5 har fall där "working-set" är >16 MB. Blir i det fallet en fördel att sprida över CCX, man har tillgång till 3x 16 MB L3$ medan fallet som är låst till en CCX har 16 MB L3$ som alla 3 kärnor och 6 trådar måste dela på. GB5 MT använder flera kärnor att lösa ett större problem.

Ställer man 3800X mot 3900X, med 3900X som referens:

  • högre genomsnittlig core-to-core latens p.g.a. 4 CCX mot 2 CCX

  • högre aggregerad bandbredd mot L3$ p.g.a. 4 L3$-slices mot 2 L3$-slices

  • mer L3$ p.g.a. 4 L3$-slices mot 2 L3$-slices

  • samma mängd L3$ per CPU-kärna då varje CCX innehåller en 16 MB L3$-slice

  • högre aggregerad skrivprestanda mot RAM p.g.a. två compute-die vs en

D.v.s. finns både fördelar och nackdelar i båda fallen

Ställer vi nu 3100 mot 3300X, med 3300X som referens:

  • lägre genomsnittlig core-to-core latens p.g.a. 1 CCX mot 2 CCX

  • samma aggregerad bandbredd mot L3$ p.g.a. varje L3$-slice är halverad i 3100

  • samma mängd L3$ p.g.a. att de två L3$-slices i 3100 bara är 8 MB mot 16 MB i 3300X enda

  • dubbelt så mycket L3$ per CCX, vilket ger dubbla användbara mängden L3$ per CPU-kärna

  • samma skrivprestanda mot RAM p.g.a. då båda har en compute-die

3100 vs 3300X är alltså inte jämförbar med 3600/3600X/3700X/3800X vs 3900X/3950X (och motsvarande för 5000-serien med en vs två compute-dies). I det förra fallet har 3300X kvar fördelarna med färre CCX, men 3100 har ingen av fördelarna som 3900X/3950X har.

En liten detalj, student's t-test kräver normalfördelade data, vilket vi sannolikt inte har här. Jag misstänker att chi-2-test vore mindre fel. Men, då man kanske bör se det som en tidsserie kanske det finns än bättre alternativ ändå. Sitter och väntar på bärgning och har lite svårt att fördjupa mig mer, nu... 🙂

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|

Permalänk
Medlem
Skrivet av Yoshman:

Enda sättet att få en "speed-up" av att slänga flera kärnor på att lösa ett och samma problem är att vissa delar kan utföras asynkront. Skillnaden mot "embarrassingly parallel" som t.ex. Cinebench där man aldrig har ett "join" steg och därmed ingen synkroniseringspunkt, är att fork-join fall delar upp något i två delproblem som kan lösas separat, men man måste sedan slå ihop delresultaten (join).

Jag tänker mig att spelrendering har många fler små beräkningar som skall joinas? bara draw calls tex kan ske i storleksordeningen tiotals miljoner per sekund i benchmarks? För varje core måste väl konstant synca och inte bara skicka sitt resultat till gpu, skulle bli konstiga frames.
Du har ju en liten försämring i ditt test, med en last som antagligen extremt effektivt kan delas upp?
Skulle fortfarande vilja se något spel på 5000-serien med varianter av disablade cores som benchmark för scenariot innan man kan utesluta cross-ccx-latency, då det antagligen kan skilja många storleksordringar fler joins/annat på spel vs syntetiskt?

Permalänk
Medlem
Skrivet av tellus82:

Ja visst finns det för och nackdelar när man jämför processorer som är fundamentalt olika, kikar du på en 5800x vs en 5900x eller 5950x så skiljer antal kärnor, antal kärnor aktiva per ccd/ccx, cache, frekvens vid få trådar och frekvens vid all core samt allt där emellan, bandbredd vid skrivning till internminne skiljer också markant mellan en CCD och dubbel CCD. Och sist har vi skillnaden i latens på core till core inom en CCX och mellan 2 CCX/CCD.

Vore det då konstigt att man såg skillnad i olika spel vid olika inställningar? Att det sedan jämnas ut i slutändan mycket pga hur man testar och med vad ändrar fortfarande inte faktum att skillnad faktiskt finns där. Spelar skillnaden någon roll om du är mestadels GPU bunden? Nej inte direkt. Kan man fortsatt se skillnader? ja, är det något man kommer märka när man väl spelar spelen, troligen inte.

Du hävdade tidigare att skillnader inte fanns alls mellan enkel CCX mot dubbel CCX men efter jag påvisade att det gör faktiskt det så ändrar du dig till att skillnad finns inte om man kikar på genomsnitt av all data insamlad, ser du skillnad där?

Vissa spel vinner på frekvens, vissa spel är känsliga på minne, vissa vinner på mer cache och vissa har problem med många ccx. Om du bara ska spela ett spel så kan du absolut göra ditt beslut på att det spelet går bra eller dåligt, men snittet och helheten är det som betyder något för de flesta. Bara för att en processor är bättre i ett spel betyder det inget mer än just det. Det bevisar ingen generell tes, det betyder troligen inget för andra spel med annan spelmotor eller andra applikationer. Det är för lätt att skylla allt på 1 vs 2 ccx. Hade det varit så lätt hade det synts extremt mycket på Zen2.

Om något så har väl Yoshman gång på gång pekat ut skillnaderna mellan olika de processorerna och sagt att det beror på. Spel som försöker använda alla trådar kommer straffas pga TDP och låsningar mellan ccx, andra kommer dra nytta av dubblerad cache och vinna. det är helt enkelt skillnad på olika mjukvaror. Så har det alltid varit och kommer alltid vara. Ingen processor kommer någonsin vara bäst på allt för alltid

Permalänk

Beställt en AMD 5900XT nu, ser verkligen fram emot att få den levererad. Planen är även att komplettera med ett 6900XT. SPÄNNANDE TIDER!

Visa signatur

Gigabyte X570 AORUS ELITE, AMD Ryzen 9 3900X, Trident Z Neo DDR4 3600MHz 32GB, EVGA GeForce RTX 3080 10GB XC3 ULTRA HYBRID

Permalänk
Datavetare
Skrivet av sAAb:

En liten detalj, student's t-test kräver normalfördelade data, vilket vi sannolikt inte har här. Jag misstänker att chi-2-test vore mindre fel. Men, då man kanske bör se det som en tidsserie kanske det finns än bättre alternativ ändå. Sitter och väntar på bärgning och har lite svårt att fördjupa mig mer, nu... 🙂

Tror normalfördelning är en rätt OK approximation i detta fall givet hur det ser ut om man plottar det data som finns

Klicka för mer information
Visa mer

går dock absolut inte säga med säkerhet då det är allt för få datapunkter!

Huvudpoängen är att den genomsnittliga fördelen/nackdelen i prestanda över det data som finns är 1-2 %!!!
Betänk samtidigt att det finns osäkerhetsfaktorer som t.ex. frekvensskillnad mellan olika CPU-kärnor i Ryzen kretsar på upp till 4-5 %. Borde då inte påståendet "data visar ingen statistisk relevant skillnad genomsnittlig spelprestanda mellan en och två CCX" vara rätt välbelagt?

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Rawtalent:

Beställt en AMD 5900XT nu, ser verkligen fram emot att få den levererad. Planen är även att komplettera med ett 6900XT. SPÄNNANDE TIDER!

Grattis, jag är avundsjuk!

Visa signatur

Hur många datorer är för många?

Permalänk
Medlem
Skrivet av Yoshman:

Tror normalfördelning är en rätt OK approximation i detta fall givet hur det ser ut om man plottar det data som finns

Klicka för mer information
Visa mer

går dock absolut inte säga med säkerhet då det är allt för få datapunkter!

Huvudpoängen är att den genomsnittliga fördelen/nackdelen i prestanda över det data som finns är 1-2 %!!!
Betänk samtidigt att det finns osäkerhetsfaktorer som t.ex. frekvensskillnad mellan olika CPU-kärnor i Ryzen kretsar på upp till 4-5 %. Borde då inte påståendet "data visar ingen statistisk relevant skillnad genomsnittlig spelprestanda mellan en och två CCX" vara rätt välbelagt?

Det är ju nära så det lär duga. Många tester är ju mer robusta än man vill erkänna.

Men, har du möjlighet att kolla https://en.wikipedia.org/wiki/Normality_test? Det finns gott om paket i R. Det paket du använde för t-test kände jag inte till tidigare. Såg att det dessutom är rätt nytt och skapat på KTH!

Angående statistiska skillnader och relevans så har du ju rätt, men berätta det för en gamer!

Men sedan kan man ju också beräkna standard error of the mean, som ger en tydligare beskrivning av själva medelvärdets variation på stickprovet och inte hela stickprovets variation.

Visa signatur

| Fractal Design Define R5| Asrock X399 Fatal1ty| Threadripper 1950X| Noctua NH-U14S TR4-SP3| Corsair Vengeance LPX 8x16GB 3200 C16| be quiet! Straight Power 11 Platinum 1000W| ASUS RTX 3080 10GB Strix| LG OLED 4k 42" C2| Debian Sid| KDE 5.x|