Permalänk
Medlem
Skrivet av tellus82:

Nej boost på en kärna är 4.0 med TBM3.0 men du har helt rätt i att all core inte är 3.7GHz den är 3.5GHz, inte helt lätt att få fram den informationen, normala turbo boost 2.0 för enskild kärna är 3.7GHz. MCE använder turbo boost 2.0 multipel för enskild kärna och applicerar det på boost för alla kärnor. Det är lite annorlunda på 2011-3 mot mainstreamplattformen med ett extra boost läge.
Kvarstår dock samma problem, med funktionen MCE från asus ändras turbo funktionerna från intel, igen hur många gånger kan man förklara samma saker?

Alltså med rätt frekvenser som dom ska vara för 6900k.
Basklock 3.2GHz
Turbo all core: 3.5GHz
Turbo en core: 3.7GHz
Turbo Max 3.0 (en core): 4.0GHz

Här kommer problemet med MCE
Bas 3.2GHz
Turbo all core: 3.7GHz
Turbo en core: 3.7GHz
Turbo Max 3.0 (en core): 4.0GHz

Sen finns det enligt utsago ett läge som tillför samma princip på TBM3.0 läget vilket ger en riktigt saftig OC.

Sen har vi 7700K då,
Bas:4.2GHz
all core:4.4GHz
en core:4.5GHz

Med MCE
Bas:4.2GHz
all core:4.5GHz
en core:4.5GHz

Inte den högsta ökningen direkt men fortfarande utanför intels specifikation och när folk nagelfar varenda procentuell skillnad i fps mot AMD gör 100Mhz skillnad. En annan är 6700k
Bas: 4.0GHz
all core: 4.0GHz
en core: 4.2GHz
MCE: 4.2 på alla

Källa
https://en.wikipedia.org/wiki/Kaby_Lake
https://en.wikipedia.org/wiki/Skylake_(microarchitecture)

Angående MCE och vad det gör så kan det inte förklaras mer, dom som fortfarande inte förstår kommer heller inte förstå...

Nu har jag inte direkt följt diskussionen här angående turbo boost så jag har inte särskilt koll på exakt vad som diskusterats.

Det som jag reagerade på var att 6900K påstods att köra i 3.7 GHz på alla kärnor i stock när det i själva verket var Multi-Core Enhancement (MCE) som var aktiverat, en funktion som inte finns i alla moderkort och är förmodligen inte aktiverad från start, utan att det sades i originalinlägget att man hade MCE på.

Intressant med 6900K's all core turbofrekvenser, var har du fått den infon från? Står inget om det i sidorna som du länkat in varför jag undrar vad källan är för denna infon.

Visa signatur

Siter som tar upp Frame Times/99th percentile/1% low fps i sina grafikkortstester: http://www.gamersnexus.net/, http://www.guru3d.com/, http://www.custompcreview.com/, http://arstechnica.co.uk/ http://www.pcper.com/, http://techreport.com/, http://www.tomshardware.com/,
Site som tar upp om spelen som är testade i deras grafikkortsrecensioner är sponsrade eller utvecklade i samarbetade med Nvidia/AMD: http://techgage.com/category/graphics-and-displays/

Permalänk
Medlem
Skrivet av FishTank:

Nu har jag inte direkt följt diskussionen här angående turbo boost så jag har inte särskilt koll på exakt vad som diskusterats.

Det som jag reagerade på var att 6900K påstods att köra i 3.7 GHz på alla kärnor i stock när det i själva verket var Multi-Core Enhancement (MCE) som var aktiverat, en funktion som inte finns i alla moderkort och är förmodligen inte aktiverad från start, utan att det sades i originalinlägget att man hade MCE på.

Intressant med 6900K's all core turbofrekvenser, var har du fått den infon från? Står inget om det i sidorna som du länkat in varför jag undrar vad källan är för denna infon.

Det mesta framgår relativt tydligt om du läser lite bakåt, för att få fram info på 6900k och dess turbo boost behöver du bara googla så får du rätt många svar. Intel själva är inte direkt öppna med vad som exakt gäller och av någon anledning har detta inte tagits upp speciellt noga i tester av 6900k heller. Den infon som är knepigast att få fram är all core boost men tack vare att ryzen ställdes mot 6900k i preview tidigare så finns info om 6900k på flertalet sajter i samband med detta och det går att läsa från användare av 6900k som undrar varför processorn bara boostar till 3.5 under flertrådad last. Intel själva specar på ARK allt utom "all core" boost

http://ark.intel.com/products/94196

Skickades från m.sweclockers.com

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem
Skrivet av tellus82:

Det mesta framgår relativt tydligt om du läser lite bakåt, för att få fram info på 6900k och dess turbo boost behöver du bara googla så får du rätt många svar. Intel själva är inte direkt öppna med vad som exakt gäller och av någon anledning har detta inte tagits upp speciellt noga i tester av 6900k heller. Den infon som är knepigast att få fram är all core boost men tack vare att ryzen ställdes mot 6900k i preview tidigare så finns info om 6900k på flertalet sajter i samband med detta och det går att läsa från användare av 6900k som undrar varför processorn bara boostar till 3.5 under flertrådad last. Intel själva specar på ARK allt utom "all core" boost

http://ark.intel.com/products/94196

Skickades från m.sweclockers.com

Med andra ord har du fortfarande inte länkat in en källa för 6900K's turbofrekvens när alla kärnor belastades vilket var det jag efterfrågade...

Angående källor har jag hittat detta som indikerar på att 6900K har en turbofrekvens på 3.5 GHz när alla kärnor belastas men även det är ingen slutgiltig källa, det är en indikation som bäst.

Om du har fått 3.5 GHz från någon annanstans länka gärna in det.

Visa signatur

Siter som tar upp Frame Times/99th percentile/1% low fps i sina grafikkortstester: http://www.gamersnexus.net/, http://www.guru3d.com/, http://www.custompcreview.com/, http://arstechnica.co.uk/ http://www.pcper.com/, http://techreport.com/, http://www.tomshardware.com/,
Site som tar upp om spelen som är testade i deras grafikkortsrecensioner är sponsrade eller utvecklade i samarbetade med Nvidia/AMD: http://techgage.com/category/graphics-and-displays/

Permalänk
Medlem

@AMD-FX: Där var ju en dude bakom honom.

Visa signatur

[ Corsair 3500X ] [ Corsair HX750i ] [ AMD Ryzen 9800X3D ] [ Asus 4080 Super OC ] [ Asus TUF X870-Wifi ]
[ 32GB G.Skill Trident Z5 Neo 6000Mhz DDR5 ] [ Samsung 990 Pro 2TB + 960 EVO 500GB ] [ Logitech PRO X 2 ] [ Corsair H115i ] [ Win11 ]

Permalänk
Medlem
Skrivet av ClintBeastwood:

En tråd hade varit rätt tråkig om den bara hyllade en produkt. Tänk speltrådar i jämförelse, det finns inte någon större tråd om väldigt bra och kritikerrosade spel som inte tar upp nackdelar och saker som spelet är mindre bra på och som spelet kunde göra bättre. Precis samma sak ser vi i den här tråden och det är något som gör den intressant att läsa och följa. Man kan säkert starta en tråd där endast positiva saker med Zen får diskuteras och resten hade nog enligt forumets regler kunnat rapporteras som offtopic.

Absolut och jag håller med dig i stort sett i det du säger. I grund och botten vill jag att det ska vara en ofärgad syn på saker, vara objektivt så långt det går. Dock skulle jag vilja se om det är lika analytiskt mot hållet "hårt" och riktat mot de bristande/negativa sidorna på en stor Kaby Lake/7700k-tråd som det är i denna tråd. Jag säger inte att det finns en hel del folk här som är väldigt positiv till Ryzen här. Men liksom, som att jag ska gråta några tårar över giganten Intel och ge denna mer plats än vad den redan har. Detta är för viktigt nu. Vara saklig och objektiv men låt oss vara lite försiktiga åtminstone så vi inte är för hastiga att dra i alla växlar och bara "Intel är vägen att gå, tack för försöket AMD men det är lika bra att lägga ner".

Skickades från m.sweclockers.com

Visa signatur

SpelDator: | Asus ROG Strix XG438Q 4K 120hz| AMD Ryzen 5 5600X 3.7 GHz 35MB| B450 I AORUS PRO WIFI| MSI Radeon RX 6800 16GB | Corsair Force MP510 1920GB M.2 NVMe | Samsung EVO 860 2TB | Seagate Guardian BarraCuda 2.5 5TB| Corsair 32GB (2x16GB) DDR4 3600MHz CL18 Vengeance LPX Svart| Ghost S1 MK2| Corsair SF750 750W 80+ Platinum| Logitech MX Sound| WD My Passport V2 USB 3.0 4TB| Buffalo Mediastation Ultra-Thin Portable Blu-Ray writer| Logitech Logitech G604 Lightspeed

Permalänk
Medlem

@tellus82: @yoshman

MS verkar ha bekräftat att schedulern inte riktigt tar hänsyn till Ryzens design.

https://i.redd.it/e9vdxtsb4bky.jpg

Permalänk
Medlem
Visa signatur

[4770k delid] [1080 EK] [PG348Q] [Custom loop][1.75TB SSD]

Permalänk
Hjälpsam

Jag är ju väldigt positiv till hur Ryzen blev, spelprestanda kom när nog för mig och jag klockar själv inte, effektförbrukningen är fantastiskt låg.
Men...
Något jag är mindre nöjd med är avsaknaden av meriter för en arbetsstation, virtualisering har varit ett starkt kort i AMD:s produkter för AM3, likaså ECC, jag hade även hoppats på stöd för reg-minnen.
Moderkorten tenderar vara bling bling, rgb i alla regnbågens färger och häftig design, mindre om komponentval, vart tog arvet efter mitt gamla Sabertooth vägen?

5 års garanti och byggt som en stridsvagn.

Visa signatur

AMD Ryzen 7 5700X | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/51gntq | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/gwcxfs
HTPC | https://valid.x86.fr/gqtxws |

Permalänk
Medlem

Finns det någon anledning till att vi inte ser några benchmarks som t.ex. kräver synkronisering mellan flera trådar? Man tycker ju inte att det borde vara så svårt att ta något "toy problem" och skriva ihop något. Dock kommer jag inte riktigt på något själv på rak arm heller...

Överlag är jag ganska förvånad att benchmarks ser ut som de gör. Jag har inte kollat speciellt noga nu, men t.ex. Cinebench, skulle inte det passa bättre att köra på en GPU? Eller har de gjort något med scenen de testar på som gör att det inte fungerar att lägga den på GPUn? Vidare är jag förvånad att man i många tester inte gör det tydligt att t.ex. Cinebench mest jobbar med flyttal...

Permalänk
Medlem
Skrivet av Ratatosk:

Jag är ju väldigt positiv till hur Ryzen blev, spelprestanda kom när nog för mig och jag klockar själv inte, effektförbrukningen är fantastiskt låg.

Fast just effektförbrukningen var väl något av en AMD marketing grej? Jag kommer ihåg från sweclockers recension eller om det var eftersnacket att Ryzen drar mer ström än motsvarande Intel CPUer, det är bara att AMD satt TDP på 95W, vilket alltså inte är ett mått på hur mycket ström CPUn drar, utan refererar till vad CPU-kylaren ska klara, om jag förstått det rätt.

Permalänk
Hjälpsam

Lite lustigt att Bulldozer fick kritik för sin dåliga flyttalsprestanda, nu känns det nästan som att Ryzen får kritik för sin fina flytalsprestanda.

Visa signatur

AMD Ryzen 7 5700X | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/51gntq | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/gwcxfs
HTPC | https://valid.x86.fr/gqtxws |

Permalänk
Medlem
Skrivet av FishTank:

Med andra ord har du fortfarande inte länkat in en källa för 6900K's turbofrekvens när alla kärnor belastades vilket var det jag efterfrågade...

Angående källor har jag hittat detta som indikerar på att 6900K har en turbofrekvens på 3.5 GHz när alla kärnor belastas men även det är ingen slutgiltig källa, det är en indikation som bäst.

Om du har fått 3.5 GHz från någon annanstans länka gärna in det.

Jag tyckte att jag hade lagt ner mer än tillräckligt med tid på ämnet utan att dessutom gräva upp varenda ställe som faktiskt tar upp de riktiga frekvenserna. Här har du en av dom iaf...
https://cpugrade.com/amd-ryzen-thoughts.php
Den som skrivit artikeln kanske inte ger en helt korrekt bild av ryzen men infon på 6900k är vad jag kan se korrekt. Men som jag skrev tidigare är det lite svårare på just 6900k med frekvens då det blir betydligt mer beroende på typ av belastning du ger den, nu pratar jag inte antal trådar utan vilken typ av beräkning som görs, därför kan boost vid 8 trådar ge mellan 3.4-3.5GHz i slutändan, det beror på kylning och angiven tdp gräns. 7700k är betydligt enklare då den har stabil all core frekvens, likaså max turbo frekvens. Detta påverkar dock inte MCE i fallet 6900k mer än att skillnaden blir ännu större. Utförligt nog som svar tycker du?

Skrivet av Gruarn:

@tellus82: @yoshman

MS verkar ha bekräftat att schedulern inte riktigt tar hänsyn till Ryzens design.

https://i.redd.it/e9vdxtsb4bky.jpg

Jag skulle nog inte dra allt för stora slutsatser från endast det där uttalandet men det skulle knappast vara förvånande att schedulern behöver en uppdatering för att få ryzen att prestera optimalt.

Skickades från
m.sweclockers.com

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem
Skrivet av znfi:

Fast just effektförbrukningen var väl något av en AMD marketing grej? Jag kommer ihåg från sweclockers recension eller om det var eftersnacket att Ryzen drar mer ström än motsvarande Intel CPUer, det är bara att AMD satt TDP på 95W, vilket alltså inte är ett mått på hur mycket ström CPUn drar, utan refererar till vad CPU-kylaren ska klara, om jag förstått det rätt.

Jo, fast tittade man på total effektförbrukning för samma jobb så vann ryzen

Skickades från m.sweclockers.com

Permalänk
Datavetare
Skrivet av tellus82:

I don't even... se föregående inlägg igen... Varför tror du Swec hade funktionen avslagen? För att ge AMD en orättvis fördel i en ren stock mot stock jämförelse? Allvarligt talat nu driver du väl ändå med mig?

Om man låter en processor gå ovanför sina specade frekvenser och därigenom också tillåter den gå utanför sin specade TDP så har jag oerhört svårt att se hur det inte kan kallas överklockning.

Håller med till 100 % om att kör man utanför specifikation så är det överklockning. Däremot drog du det för långt med TDP-exemplet, hela poängen med XFR är ju just att CPUn kommer gå utanför sin specificerade TDP om det är möjligt (R7 1800X drar ju 125 W under maxlast enligt SweClockers mätningar). Intel gör också detta, fast bara på sina laptop CPUer.

Det man kan fråga sig är: exakt vad är "gå utanför specifikation". Skulle säga att funktioner likt de som de flesta moderkort med Z97/Z170/Z270/X99 där man kör alla kärnor på sin Turbo 2.0 frekvens är helt att jämföra med "fabriksöverklockning" på grafikkort. Det är en gråzon då det är utanför specifikation från kretstillverkaren, men å andra sidan är det inom vad tillverkaren av moderkortet faktiskt garanterar. D.v.s. om jag köper ett moderkort från ASUS där funktionen är påslagen från start (väldigt vanligt) så har jag nu en garanti att det kommer fungera, fungerar det inte är det fel på produkten och jag ska ersättas med en ny.

Till och med mitt relativt enkla mini-ITX Z97 moderkort har ju funktion att köra alla kärnor på max turbo, fast här var funktionen inte påslagen som förval. I praktiken kommer det fungera i 100% av fallen förutsatt att man har kylare nog då detta kan få CPUn att behöva en kylare med högre kapacitet än TDP.

SweClockers är faktiskt helt konsekvent här, de kör GPU i den frekvens AMD/Nvidia specificerar och man kör CPUer utan dessa prestandahöjande moderkortsfunktioner. Däremot kan man fråga sig om det var rätt av SweClockers att även köra utan Turbo Boost 3.0 (TomsHardware körde med TB3 på och då presterar 6850K, 6900K och 6950X identiskt i Cinebench ST, vilket inte är fallet för SweC). Då jag inte har mycket till övers för E-serien var det inget jag orkade påpeka.

Skrivet av Gruarn:

@tellus82: @yoshman

MS verkar ha bekräftat att schedulern inte riktigt tar hänsyn till Ryzens design.

https://i.redd.it/e9vdxtsb4bky.jpg

Och exakt vad är problemet då?

Är det detta? I så fall verkar det problemet vara relaterat till moderkort/mikrokod i CPU, inte Windows då vissa faktiskt får rätt resultat från Coreinfo. Det är inte heller ett problem för SMT då detta inte är något OSet reder ut från cache-topologin utan från en specifik CPU-tråd-till-kärnor topologi som kommer från en annan källa (är den fel går det inte att aktivera alla CPU-trådar).

De problem jag läst faktiskt finns härrör till problem med frekvensskalning och C-states (lägga en kärna i vila). Här finns saker som påverkar prestanda negativt för Ryzen, alla dessa problem går dock att komma ducka för tillfället genom att köra "performance" profilen i Windows. Detta var något som bl.a. Toms Hardware tagit upp i sitt Ryzen-test, man kör normalt alltid med "balanced" profilen. För Ryzen har man testat både "balanced" och "performance", den senare presterar något bättre i spel.

För när det kommer till Unigine Heaven Benchmark så uppvisar den helt förväntat beteende givet hur Windows idag hanterar SMT, har fortfarande inte förstått vad @tellus82 anser problemet vara. Detta program använder inte cache-topologin till låsa program trådar till specifika CPU-trådar (vilket var det enda jag pekade på innan det hela spårade ur).

Programmet är multitrådat, en tråd är klart hårdare lastad än övriga och Windows verkar av någon anledning ha en förkärlek att lägga den på CPU-tråd #0 oavsett om det är en Ryzen eller en Core. Det finns jobb nog att fullt ut lasta ungefär två kärnor, fast det på betydligt fler trådar än två. Windows försöker hålla dessa trådar på en av det två CPU-trådarna i varje kärna när det finns mer CPU-kraft än nödvändigt (vilket är en fullt rimlig policy för SMT, Linux gör på samma sätt).

Om man specifikt låser ner Unigine Heaven Benchmark till en CPU-kärna och två trådar används båda trådarna till 100 %, i det läget blir CPU-delen flaskhals i mitt system. Detta skulle vara intressant att se även på Ryzen, om det inte blir på detta sett finns det ett problem.

Om man specifikt låser ner Unigine Heaven Benchmark till två CPU-kärna och fyra trådar används två CPU-trådar till nära 100 % (en per fysisk kärna) och två används mindre men är ändå lastade. I detta läge är GPU åter igen flaskhals i mitt system, vilket visar att det programmet är inte speciellt CPU-krävande. Åter igen, skulle vilja se motsvarande köras på Ryzen för det är beteendet som är förväntat.

Skrivet av Ratatosk:

Lite lustigt att Bulldozer fick kritik för sin dåliga flyttalsprestanda, nu känns det nästan som att Ryzen får kritik för sin fina flytalsprestanda.

Fast det var väl ändå aldrig kritiken mot Bulldozer? Kritiken var väl ändå att den presterade dåligt rakt över i saker som inte jobbade med alla trådar, vissa försökte förklara detta med en delad flyttalsdelen men den förklaringen höll inte riktigt vatten då problemet även gällde program som jobbar med heltal.

Edit: går man ner för "memory lane" och tittar på hur FX-8350 presterade i t.ex. Cinebench tror jag få klagade på flyttalsprestanda när de faktiskt såg resultaten. Precis ovanför i7-2600K. Det var mer att när folk fick höra om att FPUn delades trodde man att de fått en insikt ingen annan fått: problemet måste ju vara att två trådar delar FPU!

Dold text
Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

@Yoshman: Intressanta inlägg! Du har säkert kollat in videon där någon pratar om att Ryzens architektur med två kluster kontra hur cachen är uppbyggd och hur Windows/enskilda applikationer hanterar trådar sätter käppar i hjulen för Ryzen i vissa spel bland annat. Vederbörande trodde att det här kunde komma att patchas i Windows för vissa av problem. För att förtydliga: Misstänker du att det inte är möjligt att lösa eventuella problem på det sättet?

Permalänk
Medlem
Skrivet av Yoshman:

Håller med till 100 % om att kör man utanför specifikation så är det överklockning. Däremot drog du det för långt med TDP-exemplet, hela poängen med XFR är ju just att CPUn kommer gå utanför sin specificerade TDP om det är möjligt (R7 1800X drar ju 125 W under maxlast enligt SweClockers mätningar). Intel gör också detta, fast bara på sina laptop CPUer.

Det man kan fråga sig är: exakt vad är "gå utanför specifikation". Skulle säga att funktioner likt de som de flesta moderkort med Z97/Z170/Z270/X99 där man kör alla kärnor på sin Turbo 2.0 frekvens är helt att jämföra med "fabriksöverklockning" på grafikkort. Det är en gråzon då det är utanför specifikation från kretstillverkaren, men å andra sidan är det inom vad tillverkaren av moderkortet faktiskt garanterar. D.v.s. om jag köper ett moderkort från ASUS där funktionen är påslagen från start (väldigt vanligt) så har jag nu en garanti att det kommer fungera, fungerar det inte är det fel på produkten och jag ska ersättas med en ny.

Till och med mitt relativt enkla mini-ITX Z97 moderkort har ju funktion att köra alla kärnor på max turbo, fast här var funktionen inte påslagen som förval. I praktiken kommer det fungera i 100% av fallen förutsatt att man har kylare nog då detta kan få CPUn att behöva en kylare med högre kapacitet än TDP.

SweClockers är faktiskt helt konsekvent här, de kör GPU i den frekvens AMD/Nvidia specificerar och man kör CPUer utan dessa prestandahöjande moderkortsfunktioner. Däremot kan man fråga sig om det var rätt av SweClockers att även köra utan Turbo Boost 3.0 (TomsHardware körde med TB3 på och då presterar 6850K, 6900K och 6950X identiskt i Cinebench ST, vilket inte är fallet för SweC). Då jag inte har mycket till övers för E-serien var det inget jag orkade påpeka.

Och exakt vad är problemet då?

Är det detta? I så fall verkar det problemet vara relaterat till moderkort/mikrokod i CPU, inte Windows då vissa faktiskt får rätt resultat från Coreinfo. Det är inte heller ett problem för SMT då detta inte är något OSet reder ut från cache-topologin utan från en specifik CPU-tråd-till-kärnor topologi som kommer från en annan källa (är den fel går det inte att aktivera alla CPU-trådar).

De problem jag läst faktiskt finns härrör till problem med frekvensskalning och C-states (lägga en kärna i vila). Här finns saker som påverkar prestanda negativt för Ryzen, alla dessa problem går dock att komma ducka för tillfället genom att köra "performance" profilen i Windows. Detta var något som bl.a. Toms Hardware tagit upp i sitt Ryzen-test, man kör normalt alltid med "balanced" profilen. För Ryzen har man testat både "balanced" och "performance", den senare presterar något bättre i spel.

För när det kommer till Unigine Heaven Benchmark så uppvisar den helt förväntat beteende givet hur Windows idag hanterar SMT, har fortfarande inte förstått vad @tellus82 anser problemet vara. Detta program använder inte cache-topologin till låsa program trådar till specifika CPU-trådar (vilket var det enda jag pekade på innan det hela spårade ur).

Programmet är multitrådat, en tråd är klart hårdare lastad än övriga och Windows verkar av någon anledning ha en förkärlek att lägga den på CPU-tråd #0 oavsett om det är en Ryzen eller en Core. Det finns jobb nog att fullt ut lasta ungefär två kärnor, fast det på betydligt fler trådar än två. Windows försöker hålla dessa trådar på en av det två CPU-trådarna i varje kärna när det finns mer CPU-kraft än nödvändigt (vilket är en fullt rimlig policy för SMT, Linux gör på samma sätt).

Om man specifikt låser ner Unigine Heaven Benchmark till en CPU-kärna och två trådar används båda trådarna till 100 %, i det läget blir CPU-delen flaskhals i mitt system. Detta skulle vara intressant att se även på Ryzen, om det inte blir på detta sett finns det ett problem.

Om man specifikt låser ner Unigine Heaven Benchmark till två CPU-kärna och fyra trådar används två CPU-trådar till nära 100 % (en per fysisk kärna) och två används mindre men är ändå lastade. I detta läge är GPU åter igen flaskhals i mitt system, vilket visar att det programmet är inte speciellt CPU-krävande. Åter igen, skulle vilja se motsvarande köras på Ryzen för det är beteendet som är förväntat.

Fast det var väl ändå aldrig kritiken mot Bulldozer? Kritiken var väl ändå att den presterade dåligt rakt över i saker som inte jobbade med alla trådar, vissa försökte förklara detta med en delad flyttalsdelen men den förklaringen höll inte riktigt vatten då problemet även gällde program som jobbar med heltal.

Nej XFR tillhör spec från AMD själva och det är samma över hela plattformen, precis raka motsatsen till MCE, en teknik som absolut inte tillhör Intel själva, en specifikation från dom eller ens plattformen i stort. TBM3. 0 Hade SweC kunnat använda för min del, problemet med just det är mjukvaran som krävs för det och hur det identifierar olika typer av kod som körs, tro det undviks mest pga väldigt varierande resultat.

Nej jag säger inte att Heaven benchmark har problem på något sätt, speciellt inte med Intel cpu'er, jag gav bara heaven som exempel på frågan efter program som uppvisar ett beteende på att undvika icke fysiska kärnor. Du ville se ett och du fick ett.
Anledningen till att det ens kom på tal var grunden att Windows scheduler verkar ha problem att korrekt identifiera Ryzen och specifikt att den tror ryzen 8c/16t är en 16c/16t lösning, huruvida detta stämmer kan jag inte svara på men det har tagits upp på reddit och på anandtech. Själv tror jag mer på problem att schedulern kör termisk lastbalansering med trådar över CCX klustren. Något som den egentligen inte behöver göra, alltså ping pongandet som sker med enskilda trådar över fler logiska kärnor, för mig behövs här antagligen en putsning på schedulern.

Skickades från m.sweclockers.com

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Avstängd
Skrivet av tellus82:

Jag tyckte att jag hade lagt ner mer än tillräckligt med tid på ämnet utan att dessutom gräva upp varenda ställe som faktiskt tar upp de riktiga frekvenserna. Här har du en av dom iaf...
https://cpugrade.com/amd-ryzen-thoughts.php
Den som skrivit artikeln kanske inte ger en helt korrekt bild av ryzen men infon på 6900k är vad jag kan se korrekt. Men som jag skrev tidigare är det lite svårare på just 6900k med frekvens då det blir betydligt mer beroende på typ av belastning du ger den, nu pratar jag inte antal trådar utan vilken typ av beräkning som görs, därför kan boost vid 8 trådar ge mellan 3.4-3.5GHz i slutändan, det beror på kylning och angiven tdp gräns. 7700k är betydligt enklare då den har stabil all core frekvens, likaså max turbo frekvens. Detta påverkar dock inte MCE i fallet 6900k mer än att skillnaden blir ännu större. Utförligt nog som svar tycker du?

Jag skulle nog inte dra allt för stora slutsatser från endast det där uttalandet men det skulle knappast vara förvånande att schedulern behöver en uppdatering för att få ryzen att prestera optimalt.

Skickades från
m.sweclockers.com

Skrivet av Jocke86:

@Yoshman: Intressanta inlägg! Du har säkert kollat in videon där någon pratar om att Ryzens architektur med två kluster kontra hur cachen är uppbyggd och hur Windows/enskilda applikationer hanterar trådar sätter käppar i hjulen för Ryzen i vissa spel bland annat. Vederbörande trodde att det här kunde komma att patchas i Windows för vissa av problem. För att förtydliga: Misstänker du att det inte är möjligt att lösa eventuella problem på det sättet?

är ju standard idag att bios och liknande behöver tweaks pga en bred bas av användar hårdvara.
är sällan hårdvara släpps felfri från diverse mjukvaror interaction.
vänta 6 månader och allt kommer vara riktigt bra när tillverkare fått arbeta med Ryzen ordentligt.

Visa signatur

Träna bort dyslexin. Ryzen 3600 - asus B350plus - Msi Vega56 - Acer 1440p 144hz - M.2 ssd - asus essence stx - Sennheiser hd600 - Corsair 750w - 16gb ram 3ghz - atcs 840 - luftkylt - Felsökning? (Lär dig Googla)

Permalänk
Datavetare
Skrivet av Jocke86:

@Yoshman: Intressanta inlägg! Du har säkert kollat in videon där någon pratar om att Ryzens architektur med två kluster kontra hur cachen är uppbyggd och hur Windows/enskilda applikationer hanterar trådar sätter käppar i hjulen för Ryzen i vissa spel bland annat. Vederbörande trodde att det här kunde komma att patchas i Windows för vissa av problem. För att förtydliga: Misstänker du att det inte är möjligt att lösa eventuella problem på det sättet?

Vissa saker kan absolut förbättras om schedulern designas för att vara medveten om att det finns två CCX som inte delar L3$. Däremot tror jag folk har orealistiska förväntningar på hur mycket detta kan ge och verkar som väldigt få inser vilka fall som detta hjälper.

Ta fallet där man kör något som är "embarrassingly parallel" och "working-set" är så pass stort att det ofta spiller över i L3$. Kan t.ex. tänka mig att t.ex. 7-zip är ett exempel. Om Windows får för sig att flytta en tråd mellan CCX så är detta klart dåligt då de två CCX:erna har nödvändigtvis inte samma information i sin L2$/L3$, en trådflytt mellan CCX är här helt klart något man vill undvika.

Så i den här typen av applikation kan man absolut få se en viss boost om Windows scheduler patchas.

Men det kommer inte hjälpa spel eller något annat där kärnor måste kommunicera sinsemellan. Här är "problemet" (fel att kalla det problem, precis som allt annat är designen av cache en avvägning där en visst val är bättre i vissa lägen och sämre i andra) att ha en icke-inkluderande cache på en nivå (L3 i detta fall) där nivån under täcker färre kärnor (L2 är privat i Zen) gör det mer kostsamt att hålla synen av RAM koherent över alla kärnor.

Fördelen med en icke-inkluderande cache är att den effektiva storleken på cachen blir summan av L2$ och L3$, vilket är en fördel i fall som är "embarrassingly parallel" då dessa typiskt inte har någon core-to-core kommunikation att tala om (om de har det blir det i praktiken aldrig perfekt skalning och är således inte längre "embarrassingly parallel"). Finns inte heller någon nackdel i latens med icke-inkluderande policy i fall där data är relativt statiskt och läses ofta (read-mostly, rätt vanligt att en delmängd av data är väldigt mycket "read-mostly").

Så här är problemet inte direkt relaterat till att det finns två CCX, det är i grunden relaterat till valet av cache-design. Det valet gör core-to-core kommunikation, vare sig det är inom eller mellan CCX, dyrare än vad det blir med motsvarande design som har en L3$ som inkluderar alla nivåer under och täcker alla kärnor.

Skrivet av erixon:

Varför då? Om man både anropar den andra CCX och minneskontroller var för skulle då access tiden dikteras av ram om den finns i den andra CCX? (och bandbredd för den delen)
Om den datan finns i den andra CCX så skall den vara den nyaste och man kan ignorera datan som kommer i från ram, skulle det inte finnas i den andra CCX så kommer den från ram efter som man redan har frågat efter datan.

Eller har jag totalt missat något?

Informationen om att det faktiskt är så att båda anropen måste komma tillbaka verkar ju komma från AMD, så borde vara rätt. Och förklaringen i så fall tror jag åter igen ligger i x86 minneskonsistensmodell, om NÅGON kärna ser att minnescell A, B, C, D uppdateras i just den ordningen säger Total Store Order att ALLA kärnor måste se just den ordningen. Det är extremt strikt, onödigt strikt givet hur i princip alla programspråk i slutändan valde att definiera sina minnesmodeller (tänk på att C++ faktiskt inte hade en specifikation för detta innan 2011, att multicore program skrivna i C/C++ fungerade innan var egentligen utanför standarden).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Datavetare
Skrivet av tellus82:

Nej XFR tillhör spec från AMD själva och det är samma över hela plattformen, precis raka motsatsen till MCE, en teknik som absolut inte tillhör Intel själva, en specifikation från dom eller ens plattformen i stort. TBM3. 0 Hade SweC kunnat använda för min del, problemet med just det är mjukvaran som krävs för det och hur det identifierar olika typer av kod som körs, tro det undviks mest pga väldigt varierande resultat.

Nej jag säger inte att Heaven benchmark har problem på något sätt, speciellt inte med Intel cpu'er, jag gav bara heaven som exempel på frågan efter program som uppvisar ett beteende på att undvika icke fysiska kärnor. Du ville se ett och du fick ett.
Anledningen till att det ens kom på tal var grunden att Windows scheduler verkar ha problem att korrekt identifiera Ryzen och specifikt att den tror ryzen 8c/16t är en 16c/16t lösning, huruvida detta stämmer kan jag inte svara på men det har tagits upp på reddit och på anandtech. Själv tror jag mer på problem att schedulern kör termisk lastbalansering med trådar över CCX klustren. Något som den egentligen inte behöver göra, alltså ping pongandet som sker med enskilda trådar över fler logiska kärnor, för mig behövs här antagligen en putsning på schedulern.

Skickades från m.sweclockers.com

Men det du inte verkar vilja ta in är detta: att undvika att lägga last på båda CPU-trådarna i en fysisk kärna är RÄTT beteende, så den graf du postade visar ju att Windows uppför sig på FÖRVÄNTAT sätt även på Ryzen.

Och ovan har överhuvudtaget inget med att cache-topologin visas på fel sätt. Faktum är att om det hade påverkat hade Windows behandlat alla CPU-trådar som fysiska kärnor. DET hade varit ett stort problem, men åter igen, grafen över CPU-last du postade visar med otrolig tydlighet att Windows föredrar att lägga jobb på var annan CPU-kärna. CPU-trådar ligger ju som AaBbCcDd|EeFfGgHh hos Ryzen så alla udda CPU-trådar ligger på samma fysiska kärna som den CPU-tråd precis innan, man räknar alltid från #0 så första CPU-tråden (A) är ett jämnt nummer och den delar fysiska kärna med nummer #1 (a).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Datavetare
Skrivet av tellus82:

Nej XFR tillhör spec från AMD själva och det är samma över hela plattformen, precis raka motsatsen till MCE, en teknik som absolut inte tillhör Intel själva, en specifikation från dom eller ens plattformen i stort.

Säger inte emot något du skriver här.

Konstaterar bara att om MCE finns som beskriven funktion och är påslagen som förval så spelar det ingen roll för mig som kund vem som specificerat vad. Om det inte fungerar är produkten trasig och jag kan enkelt begära få problemet åtgärdat. Så från perspektivet som användare betyder det att MCE kommer fungera i 100 % av fallen, precis som "fabriksöverklockade" GPUer kommer fungera i 100 % av fallen. Om det av någon anledning strular har jag fått en defekt produkt som ska ersättas.

Håller också med om att MCE bör vara avslaget vid test, men man skulle gärna få göra några testskott som visar ungefär hur mycket mer man kan förvänta sig få i praktiken då ingen lär köra med det avslaget.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Men det du inte verkar vilja ta in är detta: att undvika att lägga last på båda CPU-trådarna i en fysisk kärna är RÄTT beteende, så den graf du postade visar ju att Windows uppför sig på FÖRVÄNTAT sätt även på Ryzen.

Och ovan har överhuvudtaget inget med att cache-topologin visas på fel sätt. Faktum är att om det hade påverkat hade Windows behandlat alla CPU-trådar som fysiska kärnor. DET hade varit ett stort problem, men åter igen, grafen över CPU-last du postade visar med otrolig tydlighet att Windows föredrar att lägga jobb på var annan CPU-kärna. CPU-trådar ligger ju som AaBbCcDd|EeFfGgHh hos Ryzen så alla udda CPU-trådar ligger på samma fysiska kärna som den CPU-tråd precis innan, man räknar alltid från #0 så första CPU-tråden (A) är ett jämnt nummer och den delar fysiska kärna med nummer #1 (a).

Grafen kommer från min burk... Trodde det var rätt uppenbart

Skrivet av Yoshman:

Säger inte emot något du skriver här.

Konstaterar bara att om MCE finns som beskriven funktion och är påslagen som förval så spelar det ingen roll för mig som kund vem som specificerat vad. Om det inte fungerar är produkten trasig och jag kan enkelt begära få problemet åtgärdat. Så från perspektivet som användare betyder det att MCE kommer fungera i 100 % av fallen, precis som "fabriksöverklockade" GPUer kommer fungera i 100 % av fallen. Om det av någon anledning strular har jag fått en defekt produkt som ska ersättas.

Håller också med om att MCE bör vara avslaget vid test, men man skulle gärna få göra några testskott som visar ungefär hur mycket mer man kan förvänta sig få i praktiken då ingen lär köra med det avslaget.

Det är fullt möjligt att det fungerar i alla lägen men det är precis lika möjligt att det inte gör det, man har ingen garanti att MCE är stabilt, speciellt inte på X99 plattformen. Fördelen med saker som foljer tillverkarens specifikation är att då har du också en viss garanti att det är stabilitet i grejerna, ASUS som mestadels står för MCE håller ingen garanti alls för stabilitet med MCE påslaget.
Skillnaden mellan denna lösning och fabriksklockade gpu'er är att dessa testas på fabriken att klara alla krav på stabilitet, termiska förhållanden och prestanda, dom är mer eller mindre binnade att gå i dom frekvenserna. När man slår på MCE så har inga sådana tester utförts på just din processor, det är trots allt just din processor som blir den avgörande faktorn, inte moderkortet som står för MCE.

Skickades från m.sweclockers.com

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Hjälpsam

Tycker att Windows scheduler verkar vara för "hoppig", tror att både Intel och AMD skull tjäna på ett lugnare uppträdande.

Visa signatur

AMD Ryzen 7 5700X | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/51gntq | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/gwcxfs
HTPC | https://valid.x86.fr/gqtxws |

Permalänk

Detta kanske redan tagits upp men verkar som att Ryzen hålls tillbaka av Windows 10.

http://wccftech.com/amd-ryzen-performance-negatively-affected...

Visa signatur

Stationär Speldator: AMD Ryzen 7 2700 I AMD Radeon 6750 XT
Bärbar Speldator: AMD Ryzen 5 5600H I Nvidia RTX 3050 Ti

Permalänk
Medlem

en liten lustig klipp jag hittade på reddit.

orealistisk men lite skoj att se.

Visa signatur

GamingRig: Cooler Master NR200P/ASUS ROG STRIX B550-I GAMING/AMD Ryzen 5 5700G/Noctual NH-D12L/ASUS PRIME Radeon RX 9070 OC 16GB/Corsair SF750 Platinum/Kingston Fury Beast 2x16GB 3600MHz CL18/

Permalänk
Medlem
Skrivet av Bernd_P1:

en liten lustig klipp jag hittade på reddit.

https://youtu.be/Njm0MBOwFTM

orealistisk men lite skoj att se.

Det är inte jätte orealistiskt direkt, känner ett tjugotal folk på nätet som multiboxar MMO's på ett eller annat sätt, där kan man ha ända upp till 12 eller fler klienter igång samtidigt av ett spel som sedan kopplas ihop genom mjukvara som tar över directinput för varje & sen kör du via macron. I sådana situationer kan jag garantera att ryzen kommer prestera långt bättre än en 7700k. Nu är detta en rätt hårt nischad marknad men den finns fortfarande. Andra alternativ är såklart VM's där man kanske avdelar två kärnor till en server och på så vis slipper en extra burk för ändamålet. Det finns många användningar för extra kärnor.

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem
Skrivet av Ratatosk:

Tycker att Windows scheduler verkar vara för "hoppig", tror att både Intel och AMD skull tjäna på ett lugnare uppträdande.

Just termisk lastbalansering är ett besvärligt kapitel, kikar man på trådhoppandet så ser man efter ett tag ett mönster, kika på Prime prestanda hos Ryzen och den är apkass, mer så än den realistiskt borde vara, tittar man sedan på hur prime95 får sitt arbete utspridet så förstår man ganska snabbt att det inte är till gagn för ryzen.

En screenshot från min burk under Prime95 belastning av en tråd, första två tredjedelar i grafen är idle tillstånd, spiken anger start av prime95, kärna 1 har redan en viss belastning utöver Prime95

Här har vi typexempel på en entrådig belastning som sprids ut över alla åtta logiska kärnorna pga termisk lastbalansering, något som Ryzen absolut inte tjänar på med tanke på CCX, sen kan man fundera på varför vissa program lastbalanseras medans andra inte gör det, kika bara på min tidigare bild av Heaven benchmark där det mycket uppenbart lastas på fysiska kärnor men också primärt på kärna 1. Även på Prime95 lastas det lite mer på fysisk kärna kontra HT/SMT (0,5-1%) dito men det finns ingen fokus på en kärna, trots att det handlar om en ensam arbetstråd.

Exakt hur windows scheduler funkar vet jag inte och jag vet inte om MS själva gör det xD

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem
Skrivet av Yoshman:

Men det du inte verkar vilja ta in är detta: att undvika att lägga last på båda CPU-trådarna i en fysisk kärna är RÄTT beteende, så den graf du postade visar ju att Windows uppför sig på FÖRVÄNTAT sätt även på Ryzen.

Och ovan har överhuvudtaget inget med att cache-topologin visas på fel sätt. Faktum är att om det hade påverkat hade Windows behandlat alla CPU-trådar som fysiska kärnor. DET hade varit ett stort problem, men åter igen, grafen över CPU-last du postade visar med otrolig tydlighet att Windows föredrar att lägga jobb på var annan CPU-kärna. CPU-trådar ligger ju som AaBbCcDd|EeFfGgHh hos Ryzen så alla udda CPU-trådar ligger på samma fysiska kärna som den CPU-tråd precis innan, man räknar alltid från #0 så första CPU-tråden (A) är ett jämnt nummer och den delar fysiska kärna med nummer #1 (a).

öh, bilden var på en Core-CPU, inte en Ryzen. några trådar för lite för att vara Ryzen:)

Permalänk
Medlem
Skrivet av Swedish Berserk:

Detta kanske redan tagits upp men verkar som att Ryzen hålls tillbaka av Windows 10.

http://wccftech.com/amd-ryzen-performance-negatively-affected...

Precis vad jag sa tidigare, när det då lastbalanseras med trådar över dessa kärnor kommer man få problem med program som normalt ska lastas på fysiska kärnor i första hand.

Skrivet av wccftech:

Not All Threads Are Created Equal
Windows 10′ scheduler correctly identifies Intel’s hyper-threads as lesser performing than principal core threads and schedules tasks in a way that’s takes advantage of the additional throughput without negatively impacting performance. Unfortunately the scheduler currently is not able to differentiate principal core threads from virtual SMT threads with Ryzen and in fact sees 16 thread Ryzen 7 processors as processors with 16 physical cores with equal resources per thread.

Because it does not give any preferential prioritization of scheduling tasks to primary threads over SMT threads like it does on Intel platforms, a massively larger percentage of tasks can and do end up getting scheduled for a virtual SMT thread rather than a principal core thread. Resulting in significant artificial performance degradation.

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem

@Yoshman Som jag läser dina inlägg om saken så tror du inget på att Ryzen's SMT skall kunna optimeras genom en windowsuppdatering, har jag förstått det korrekt då? (Du behöver inte skriva en lång tirad, bara ja eller nej)

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--Asrock Z790i--2X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B

Permalänk
Medlem
Skrivet av marcusOCZ:

@Yoshman Som jag läser dina inlägg om saken så tror du inget på att Ryzen's SMT skall kunna optimeras genom en windowsuppdatering, har jag förstått det korrekt då? (Du behöver inte skriva en lång tirad, bara ja eller nej)

Han menar att det inte kommer bli en sådan enorm förbättring som många verkar tro.

Skickades från m.sweclockers.com