Permalänk
Medlem
Skrivet av marcusOCZ:

När det gäller minnen så fungerar Samsung "B" die mycket bra med Ryzen. Det är faktist det DDR4 med brukbara hastigheter som också har bra yield. Allt med 3200 och cl15 eller mindre är till 99% Samsung "b" die. Hittils verkar det inte finnas 16GB single rank per sticka, så skall man fylla moderkortet med 4 stickor måste man nog ta till tack med lägre bandbredd.

Andra minnen kommer garanterat fungera bra det också, men inte än. Finns inget moderkort till Ryzen med bra bios där man kan tweaka timings och subtimings ännu. G.skill 3200 upp till 4000 har samsung "b".

G.skill 3200 och uppåt gäller det även CL16 minnen???

tex dessa: https://www.proshop.se/MINNE/GSkill-TridentZ-RGB-DDR4-3200-C1...

Visa signatur

| MB MSI S02 Inet edition | CPU 7700K @ 4.8 Ghz (DELID) | CPU KYL NZXT X52 240mm RAD | GPU EVGA RTX3080 FTW3 ULTRA GAMING | RAM 16Gb Corsair 3600Mhz@3600 CL16 | SSD Gigabyte NVMe 1Tb | Chassi Fractal Design S2 TG | PSU EVGA Supernova 750W G2 |

Permalänk
Medlem
Skrivet av liket:

...

Det verkar även confirmed att både 6-core och 4-core kommer ha två CCX:er.:
http://www.anandtech.com/show/11202/amd-announces-ryzen-5-apr...

Från anand-länken:

Citat:

We have confirmation from AMD that there are no silly games going to be played with Ryzen 5. The six-core parts will be a strict 3+3 combination, while the four-core parts will use 2+2. This will be true across all CPUs, ensuring a consistent performance throughout.

Då kanske de har slagit av halva L3 i varje CCX i 1400 ändå. Då den bara har 8Mb L3 hade jag väntat mig att den skulle bestå av en ensam CCX.

Visa signatur

Här hade jag en historik sen 1990-talet, men den blev tillslut för lång. Aktiva maskiner 2022-framåt:
Work/Play/Everythingstation: AMD Epyc 7443p, Pop OS host, Win10 + Linux guests (KVM/Qemu)
Work/Play nr 2: AMD Phenom II 1090t, Debian + Win 10 (dual boot)
Server x3: Epyc 7252 (TrueNAS Core), Atom 2550 (FreeBSD, backup), Opteron 6140 (Ubuntu, off prem backup)
Retrohörna under uppbyggnad: Dual Pentium Pro 200MHz, Pentium P54C 90MHz, Gravis Ultrasound MAX

Permalänk
Medlem
Skrivet av Oegat:

Från anand-länken:
Då kanske de har slagit av halva L3 i varje CCX i 1400 ändå. Då den bara har 8Mb L3 hade jag väntat mig att den skulle bestå av en ensam CCX.

Man kan ju dock själv tycka att ett L3 för ett CCX vore det klart mer jämna alternativet, med tanke på att alla kärnor i sådana fall ha samma latens mot alla kärnor, vilket i överlag skulle ge högre prestanda. 2+2 och halva L3 cache avstängt låter väldigt mysko, men vad vet man egentligen.

Visa signatur

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Permalänk
Medlem

Lite dåligt av AMD där faktiskt, inte undra på att det har varit problem med en del moderkort. Detta kommer i alla fall mogna och dom flesta buggarna lär vara lösta inom en snar framtid.

Visa signatur

“When a clown moves into a palace he doesn’t become a king, the palace instead becomes a circus.”

Permalänk
Medlem
Skrivet av p_stman:

G.skill 3200 och uppåt gäller det även CL16 minnen???

tex dessa: https://www.proshop.se/MINNE/GSkill-TridentZ-RGB-DDR4-3200-C1...

Ganska säker på att det är Hynix. Hade inte satsat på de.

https://www.prisjakt.nu/produkt.php?p=4113789

Dom däremot om du skall ha RGB på G.Skill.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--Asrock Z790i--2X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B

Permalänk
Medlem
Skrivet av wowsers:

Situationen förbättrar sig fort! Vid det här laget kommer man inte ens behöva tweaka något när Ryzen 3 kommer ut (satsar nog själv på en 1600/1600X senare i år). Hur många ns till RAM låg saker på tidigare/vid launch?

Mellan 80-100ns, och Zen har också en DDR3500 divider, men den är inte synlig än tills AMD släpper ny AGESA i Maj. 3500MT och CL14 kommer kan nog ge 65ns och högre data fabric hastighet=mer prestanda Ryzen har inte sett sina bästa dagar än

Skrivet av Ratatosk:

@Enigma: Motherboard [Trial version], verkar som att du kan få veta vilket moderkort du har, om du köper Pro versionen.
On Topic: verkar riktigt lovande.
Planerar inte att klocka CPU:n, minnena skall jag dock testa, men eftersom även mina är Corsair Lpx 3000 MT/s, och 4st dessutom, verkar det inte lovande, de snurrar just nu i 2133.

Glömskhet kommer med åldern, så tur att CPU-Z är gratis så man inte glömmer vilken mammabräda man sitter med

Du har tyvärr den värsta kombinationen av RAM i ditt fall, 4st DIMM's och dom där kör Micron eller Hynix IC's vilka inte klockar någon vidare på AM4. Ännu värre är det om du dessutom sitter med dubbelsidiga minnen i en 4DIMM config.

Skrivet av Dunder:

Grymt! Blev ett mail till dom. Den gamle TRUE120 får nytt liv. Gott att ha den gamle trotjänaren till övers för fler testriggar. ( @sAAb ifall du inte såg hans länk )

Skrivet av wowsers:

Problemet då vore att halva cache skulle ha massor högre latency än cache på CCX där kärnorna ligger

Fortfarande lägre latens än RAM.

Skrivet av wowsers:

En fråga, vilket användningsområde annat än bragging rights har man för 16MB L3 och 4 kärnor?

Spel älskar i regel cache

Skrivet av sAAb:

Jag har haft en avvaktande hållning med Ryzen för att se vilka minnen som kan vara bra.

G.Skill Flare X har enligt pressmeddelande från 4 mars fungerat vid 3200 MHz för 4x16 GB.,

Nu finns en bitter tråd på Reddit där man börjar kalla situationen "fucky"; jag kan bara gissa vad som menas med det.

https://www.reddit.com/r/Amd/comments/5zjer0/gskill_flare_x_d...

Nja, jag avvaktar lite till.

Mycket okunnigt folk på reddit. Alla minnen med Samsung IC's fungerar ypperligt med Ryzen oberoende av moderkort då IMC sitter i processorn. Alla G.Skills högre klockade DDR4 använder dessa IC's, därav jag köpte mina tidigt då Samsung är ett säkert kort. Flare X är exakt samma minnen som Trident Z, fast med AMP preset, alternativt andra subtimings vilket kvittar i slutändan.

Skrivet av p_stman:

G.skill 3200 och uppåt gäller det även CL16 minnen???

tex dessa: https://www.proshop.se/MINNE/GSkill-TridentZ-RGB-DDR4-3200-C1...

Inte CL16 modellen om du ska ha 3200MT, CL14 har Samsung x-die. Jag körde på 3600MT CL16 och AMD släpper ny AGESA i April som kommer ge 3500MT divider Ganska givet att satsa på bra minnen när data fabric och minneskontrollern i Zen lägger sig på samma frekvens som RAM:

https://community.amd.com/community/gaming/blog/2017/03/14/ti...

Citat:

1. The AMD Ryzen™ processor does not offer memory dividers for DDR4-3000 or DDR4-3400. Users shooting for higher memory clocks should aim for 3200 or 3500 MT/s.

7. Finally, as part of AMDs ongoing development of the new AM4 platform, AMD will increase support for overclocked memory configurations with higher memory multipliers. We intend to issue updates to motherboard partners in May that will enable them, on whatever products they choose, to support speeds higher than the current DDR4-3200 limit without refclk adjustments.

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Medlem

Jag sa ganska tidigt att Zen ÄR en högfrekvensdesign. Tysken närmar sig 6GHz med kväve:

http://hwbot.org/submission/3473875_der8auer_cpu_frequency_ry...

Återstår att se hur frekvensen klättrar uppåt med luft och vattenkylning. Tillverkningsprocessen mognar givetvis med tiden men det kan behövas en del mindre optimeringar i designen för att nå högre frekvenser med luft/vatten. Detta har man gjort historiskt med en ny revision/stepping. Zen2, eller Ryzen 2 kommer med stor sannolikhet förbättra frekvenserna och mycket annat därtill. Så vitt jag vet har Zen 2 gjort tape-out och AMD går med blodad tand som tåget nu.

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Avstängd
Skrivet av Enigma:

Sa ganska tidigt att Zen ÄR en högfrekvensdesign. Tysken närmar sig 6GHz med kväve:

https://pbs.twimg.com/media/C7E-afxXwAAfJdu.jpg

http://hwbot.org/submission/3473875_der8auer_cpu_frequency_ry...

Återstår att se hur frekvensen klättrar uppåt med luft och vattenkylning. Tillverkningsprocessen mognar givetvis med tiden men det kan behövas en del mindre optimeringar i designen för att nå högre frekvenser med luft/vatten. Detta har man gjort historiskt med en ny revision/stepping. Zen2, eller Ryzen 2 kommer med stor sannolikhet förbättra frekvenserna och mycket annat därtill. Så vitt jag vet har Zen 2 gjort tape-out och AMD går med blodad tand som tåget nu.

@Enigma
Riktigt bra om den klarar 5802.93MHz på 0.787V
Den klarar säkert 7GHz på 1V under morgondagen om vi håller tummarna och de höjjer frontspänningen lite på motstånden till kondensatorerna.

Är det några supraledare med i bilden?

Permalänk
Medlem
Skrivet av Esster:

@Enigma
Riktigt bra om den klarar 5802.93MHz på 0.787V
Den klarar säkert 7GHz på 1V under morgondagen om vi håller tummarna och de höjjer frontspänningen lite på motstånden till kondensatorerna.

Är det några supraledare med i bilden?

Hehe nja spänningen som rapporteras i CPU-Z stämmer inte. Vcore i detta fall är ca 1.9v.

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Medlem

Körde lite mer på min 1700 och den gör 4125Mhz på ~1.4vcore:

Finns lite till att ge men som bekant så skenar spänningen extremt för att nå högre frekvens här, därav bara test i enkeltrådat:

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Medlem

Mycket intressant video angående spelprestandan.

Visa signatur

Fractal Design Pop XL Air RGB | ASRock Z690 Taichi | i5-12600k | Corsair 32GB (2x16GB) DDR5 6000MHz CL30 | Gigabyte RTX 5070 12GB Gaming OC

Nintendo Switch | PlayStation 5 +PS4 Pro | Xbox Series X + One X
Min FZ Profil

Permalänk
Medlem

@Vangen:

Han i videon har ju så totalt fel att det blir pinsamt.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--Asrock Z790i--2X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B

Permalänk
Medlem
Skrivet av Vangen:

Mycket intressant video angående spelprestandan.

https://www.youtube.com/watch?v=m1amGwPnUuA

Vi har diskuterat detta under lång tid i tråden, kommunikation mellan CCX vare sig det är trådförflyttning pga schedulern eller cache begäran så har det effekten av dels adderad latens men också lägre bandbredd mot l3 på andra CCX klustret.
Tyvärr verkar inte ryzen ägare här på SweC särskilt intresserade av att undersöka vad man själv kan påverka/tweaka. Vi har redan nämnt schedulern och där har vi två saker man kan göra, det ena är att förhindra trådförflyttning genom att låsa affinity, inte alltid lösningen om man behöver säg 6 kärnor, då kommer det flyttas runt trådar inom dom sex ändå. En annan tweak är timern som schedulern jobbar efter, denna är i win10 dynamisk mellan 0,5 och 15,625ms. För spel hamnar den nästan alltid på 0,5ms,vid detta låga värde sker det flest trådförflyttningar per sekund som i sin tur drar ner prestanda i onödan i vissa situationer. Timern kan dock göras statisk och med ett justerbart värde, problemet med denna tweak är att timern är ett trubbigt instrument som vid pillande på drabbar långt mer saker än man vill. En annan timertweak som inte pillar på timern men ändå har inverkan på just trådförflyttningar är quantum/quanta värdet i Windows, detta kan justeras från sitt vanliga 6 till server värdet 12, detta är effektivt den multipel som schedulern applicerar på timern. Enda nackdelen att justera q värdet är att alla bakgrundsprocesser får samma q värde som förgrund vilket det normalt inte är, standar är 6 förgrund och 2 bakgrund, för att då undvika att det i bakgrunden stjäl CPU tid så måste man manuellt korrigera prioritet till högre eller hög på saker i förgrund. Denna tweak ger i slutändan ett dubbelt högt q värde som i sin tur endast bör halvera antalet trådförflyttningar per sekund. Man dubblerar den tid som en arbetstråd får innan den forceras vidare till annan kärna av schedulern.

Edit: Angående bandbredd över infinity fabric, den har angetts till 22GB/s per 32bit vid 1066MHz, vid full bredd skulle det vara 176GB/s (256bit). Detta kan faktiskt höjas genom högre internminneseklock vilket enligt utsago ska öka även fabric hastigheten, vid 3500Mt minnen borde då bandbredden pressas upp till ~289GB/s (halva minnseklock) Nu är dock frågan hur pass brett inter CCX kommunikation sker, om det är bara 32bit eller dynamiskt upp till 256bit?

Skickades från m.sweclockers.com

Visa signatur

| nVidia RTX3090FE | R9 5800X3D | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 12TB nvme, 2TB sata SSD | RM1000x | Creative X4 | Antec C8 | Alienware aw3821dw | >Antec C8 Custom Loop< |

Permalänk
Medlem
Skrivet av Ratatosk:

@Bernd_P1: I artikeln påstås bla. att en orsak till att ITX korten är försenade, är att framtagandet av dess layout försenas eftersom "man jobbar febrilt för att optimera mjukvara för sina första AM4 ATX-moderkort."
Javisst deras kretskortsdesigners har fullt upp med att utveckla mjukvara, de hinner inte ta fram ITX brädor.

Nej den källan saknar all trovärdighet, verkar handla om damagekontroll, genom att skylla på andra (AMD) via "läckor".

De jobbar inte med samma saker nej, men de är ju ändå beroende av varandra. Kretskortsdesignerna kanske är färdiga, men måste nu vänta på att mjukvara/uefi fixas till på redan lanserade produkter innan ITX-korten får kärlek.

Skickades från m.sweclockers.com

Visa signatur

WS: AMD 7800X3D | ASUS Rog Strix B650E-I | 32GB G.Skill Flare X5 6000 | MSI RX 6800 | Samsung PM981a 1TB | Louqe Ghost S1
Laptop: ASUS UX32LN | i7-4510U | 12GB DDR3 | 13.3" FHD | 256GB SSD
Server: Intel Xeon E5-2660 | 32GB DDR3 | UnRaid

Permalänk
Medlem
Skrivet av Enigma:

"Problemet då vore att halva cache skulle ha massor högre latency än cache på CCX där kärnorna ligger :P"
Fortfarande lägre latens än RAM.

Sant, men resultatet skulle vara markant bättre om man bara valde att använda ett CCX till fullo (än att köra två halva CCX, halverat L3 och allt)

Visa signatur

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Permalänk
Entusiast

En liten heads upp för ni som kanske kör Ryzen på Windows 7/8.1: https://arstechnica.com/information-technology/2017/03/micros... Microsoft being Microsoft...

Och som en liten extra bonus på det så har nu HardwareUnboxed testat Ryzen i Windows 7 VS Windows 10: https://www.youtube.com/watch?v=LXGza3q2qzM

Visa signatur

Den digitala högborgen: [Fractal Design Meshify C] ≈ [Corsair RM850x] ≈ [GeForce RTX 3080] ≈ [AMD Ryzen 7 7800X3D ≈ [Noctua NH-U14S] ≈ [G.Skill Flare X5 32GB@6GHz/CL30] ≈ [MSI MAG B650 TOMAHAWK] ≈ [Kingston Fury Renegade 2 TB] ≈

Permalänk
Medlem
Skrivet av Sisyfos:

En liten heads upp för ni som kanske kör Ryzen på Windows 7/8.1: https://arstechnica.com/information-technology/2017/03/micros... Microsoft being Microsoft...

Och som en liten extra bonus på det så har nu HardwareUnboxed testat Ryzen i Windows 7 VS Windows 10: https://www.youtube.com/watch?v=LXGza3q2qzM

Fast med Windows Update MiniTool går det väl att ladda ner med fortfarande?

Visa signatur

Coca Cola missbrukare Förbjuden dryck för mig pga diabetes
AMD älskare
Katt älskare

Permalänk
Medlem

Med en divider på 3500 som AMD skall uppdatera till så blir denna flaskhals mer eller mindre borta nu när man ser hur mycket det ger med snabbare ram. Dessutom slipper man pilla med BLCK och med de bekymmer det kan ge. NvME diskar gillar nog visst inte högre bussklocka har jag läst. Ska man bencha och pilla med blck så bör man nog ha en god gammal sata ssd eller sata m.2

Dessutom tror jag vi får se nya revisioner av moderkorten då. Vid 3500 på ram tror jag verkligen vi får se vad Ryzen går för och med möjligheter att ändra på subtimings så får vi också se vad latens på ram ger när flaskhalsen förhoppningsvis har flyttats.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--Asrock Z790i--2X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B

Permalänk
Hjälpsam
Skrivet av wowsers:

Undrar vad den totala bandbredden blir vid de vanligaste RAM hastigheterna

256 bitars bus är 32 Bytes i bredd, ta det gånger 1066 (för minnen som går i 2133) så får vi 34 GB/s, samma som till minnena om de går i dual mode.
Betydligt högre än jag trodde.

Visa signatur

AMD Ryzen 7 5700X | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/51gntq | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/gwcxfs
HTPC | https://valid.x86.fr/gqtxws |

Permalänk

Hur mycket tror ni det kommer att skilja mellan Ryzen 5 1500X och Ryzen 5 1400? Tänker mest på den halverade mängden L3 cache kan det påverka prestandan mycket?

Visa signatur

Stationär Speldator: AMD Ryzen 7 2700 I AMD Radeon 6750 XT
Bärbar Speldator: AMD Ryzen 5 5600H I Nvidia RTX 3050 Ti

Permalänk
Medlem
Skrivet av Ratatosk:

256 bitars bus är 32 Bytes i bredd, ta det gånger 1066 (för minnen som går i 2133) så får vi 34 GB/s, samma som till minnena om de går i dual mode.
Betydligt högre än jag trodde.

Så några vanliga RAM hastigheter och bandbredder borde då bli...

RAM hastiheter

2133 MT/s

2400 MT/s

2666 MT/s

2933 MT/s

3200 MT/s

3500 MT/s

infinity fabric bandbredd

34.1 GB/s

38.4 GB/s

42.7 GB/s

46.9 GB/s

51.2 GB/s

56.0 GB/s

Om alla uträkningar stämmer

Visa signatur

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Permalänk
Medlem

@Swedish Berserk:

Det beror på om det blir 1 CCX-kluster eller 2 och det beror på om du tänker dig att överklocka.

Om du kommer överklocka kommer båda sannolikt att nå upp till samma klockhastighet, baserat på 1700-1800X.

Vid samma hastighet så blir det dock mindre latens för kärnorna att prata inom 1 CCX-kluster, jämfört med att prata mellan kluster. Min förväntan är att 1 kluster ger högre prestanda vid en given klockhastighet än att ha 2 kärnor på varje kluster.

@wowsers
Jag undrar var gränsen går där den interna bandbredden slutar att vara en flaskhals, eller om flaskhalsen går hela vägen upp till den interna bandbredden mellan kärnorna?

Nästa fråga är också om det är lättare att clocka Infinity fabric om man bara har ett aktivt CCX-kluster? Och hur stora är skillnaden mellan att ha 2 minneskanaler och att ha 1? Finns det någon chans att en potentiell ökning i minneshastighet p.g.a. att man bara har en minneskontroller blir högre än förlusten av de 2 kanalerna?

Permalänk
Medlem

@Enigma:
Du som verkar ha koll på RAM kan väll hjälpa en stackare som är ny på både hårdvaror och mjukvaror och inte lärt sig om RAM ännu.

Jag köpte dessa (RAM) tidigare då jag viste att RAM skulle börja gå upp i pris, kommer de funka fullt ut (3200MHz) med Ryzen R7 1800X?
Tänker köra XMP, vad anser du om XMP? såg någon video där moderkoretet (han påstod att det var Ryzen CPU...) dödade ett av minnena vid aktivering av XMP... men känns som det är nått som är sällsynt/otur.
http://www.corsair.com/en-gb/vengeance-lpx-32gb-2x16gb-ddr4-d...

Beställde detta modekort då det stod "Supports DDR4-3200+(OC) Memory"
https://www.msi.com/Motherboard/X370-GAMING-PRO-CARBON.html#p...

Permalänk
Datavetare
Skrivet av Ratatosk:

256 bitars bus är 32 Bytes i bredd, ta det gånger 1066 (för minnen som går i 2133) så får vi 34 GB/s, samma som till minnena om de går i dual mode.
Betydligt högre än jag trodde.

Var väl ändå självklart att Infinity fabric minst måste matcha bandbredden för dual-channel RAM, eller? Om så inte hade varit fallet vore det omöjligt för CPUn att utnyttja full bandbredd för RAM då både CCX och minneskontroller är klienter till Infinity fabric.

Vidare får man tänka på att denna kapacitet delas även av all I/O, d.v.s. all PCIe-traffik måste också få plats i bandbredden som Infinity Fabric har.

Som @wowsers nämner ovan påminner just kopplingen RAM<->CPU-kärna i Zen rätt mycket om hur IBM designade POWER8. I båda fallen har man lyft ur minneskontroller från att vara en integrerad del av CPUn, i någon bemärkelse har man återinfört "north bridge" där NB nu representeras av en xbar-buss.

I både Zen och POWER8 resulterade det i högre latens mot RAM. Men fördelen är att man har en mindre tight koppling mellan CPU-kärnan och protokollet som RAM pratar. I fallet POWER8 har man ett helt eget protokoll, CPUn pratar överhuvudtaget inte med RAM utan med det man kallar Centaur som i första ledet består av en eDRAM-cache (L4$). POWER8 kan därför enkelt stödja både DDR3 och DDR4 utan att det påverkar designen av CPU-kärnan.

Däremot skiljer sig Zen och POWER8 i hur de hanterar L3$, inte allt för vågad gissning att detta kommer av att IBM hade långt mer svängrum i sina val då minneskonsistensmodellen i POWER ISA är långt mindre strikt än vad som är fallet för x86. Många hänger upp sig på att x86 har CISC-rötter, det är totalt irrelevant idag då designen ändå är en RISC internt.

Om det är något som är ett problem för x86 så är det den onödigt strikta minneskonsistensmodellen, den är tyvärr något som gör x86 mindre lämpad för SMP än t.ex. POWER och ARM. Blir ingen jätteskillnad i prestanda, men detta är något som AMD/Intel tyvärr måste kasta rätt mycket mer kisel på jämfört med andra och det begränsar hur "bred" design som är vettigt att göra. Apple har ju en "bredare" design i sin mobil CPU än vad AMD/Intel har i sina high-end designer...

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

@Gruarn: Att det blir 2 CCX:er på 4-kärniga är redan bekräftat, länkade en anandtechpost tidigare i tråden om det.

@Swedish Berserk: Jag googlade en youtubevideo åt dig där han visar prestandaskillnader mellan olika L3-cache på intel
https://www.youtube.com/watch?v=hTQssyGvAIk

tl;dw: Ibland lite, ibland en del. Med tanke på den lilla prisskillnaden så skulle jag säga att det är värt att betala för 1500x.

Permalänk
Hjälpsam
Skrivet av Yoshman:

Var väl ändå självklart att Infinity fabric minst måste matcha bandbredden för dual-channel RAM, eller? Om så inte hade varit fallet vore det omöjligt för CPUn att utnyttja full bandbredd för RAM då både CCX och minneskontroller är klienter till Infinity fabric.

Vidare får man tänka på att denna kapacitet delas även av all I/O, d.v.s. all PCIe-traffik måste också få plats i bandbredden som Infinity Fabric har.

Som @wowsers nämner ovan påminner just kopplingen RAM<->CPU-kärna i Zen rätt mycket om hur IBM designade POWER8. I båda fallen har man lyft ur minneskontroller från att vara en integrerad del av CPUn, i någon bemärkelse har man återinfört "north bridge" där NB nu representeras av en xbar-buss.

I både Zen och POWER8 resulterade det i högre latens mot RAM. Men fördelen är att man har en mindre tight koppling mellan CPU-kärnan och protokollet som RAM pratar. I fallet POWER8 har man ett helt eget protokoll, CPUn pratar överhuvudtaget inte med RAM utan med det man kallar Centaur som i första ledet består av en eDRAM-cache (L4$). POWER8 kan därför enkelt stödja både DDR3 och DDR4 utan att det påverkar designen av CPU-kärnan.

Däremot skiljer sig Zen och POWER8 i hur de hanterar L3$, inte allt för vågad gissning att detta kommer av att IBM hade långt mer svängrum i sina val då minneskonsistensmodellen i POWER ISA är långt mindre strikt än vad som är fallet för x86. Många hänger upp sig på att x86 har CISC-rötter, det är totalt irrelevant idag då designen ändå är en RISC internt.

Om det är något som är ett problem för x86 så är det den onödigt strikta minneskonsistensmodellen, den är tyvärr något som gör x86 mindre lämpad för SMP än t.ex. POWER och ARM. Blir ingen jätteskillnad i prestanda, men detta är något som AMD/Intel tyvärr måste kasta rätt mycket mer kisel på jämfört med andra och det begränsar hur "bred" design som är vettigt att göra. Apple har ju en "bredare" design i sin mobil CPU än vad AMD/Intel har i sina high-end designer...

Doh!
Klart som fan! tänkte inte på IF ligger mellan CPU och minne.

Visa signatur

AMD Ryzen 7 5700X | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/51gntq | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/gwcxfs
HTPC | https://valid.x86.fr/gqtxws |

Permalänk
Datavetare
Skrivet av tellus82:

Vi har diskuterat detta under lång tid i tråden, kommunikation mellan CCX vare sig det är trådförflyttning pga schedulern eller cache begäran så har det effekten av dels adderad latens men också lägre bandbredd mot l3 på andra CCX klustret.
Tyvärr verkar inte ryzen ägare här på SweC särskilt intresserade av att undersöka vad man själv kan påverka/tweaka. Vi har redan nämnt schedulern och där har vi två saker man kan göra, det ena är att förhindra trådförflyttning genom att låsa affinity, inte alltid lösningen om man behöver säg 6 kärnor, då kommer det flyttas runt trådar inom dom sex ändå. En annan tweak är timern som schedulern jobbar efter, denna är i win10 dynamisk mellan 0,5 och 15,625ms. För spel hamnar den nästan alltid på 0,5ms,vid detta låga värde sker det flest trådförflyttningar per sekund som i sin tur drar ner prestanda i onödan i vissa situationer. Timern kan dock göras statisk och med ett justerbart värde, problemet med denna tweak är att timern är ett trubbigt instrument som vid pillande på drabbar långt mer saker än man vill. En annan timertweak som inte pillar på timern men ändå har inverkan på just trådförflyttningar är quantum/quanta värdet i Windows, detta kan justeras från sitt vanliga 6 till server värdet 12, detta är effektivt den multipel som schedulern applicerar på timern. Enda nackdelen att justera q värdet är att alla bakgrundsprocesser får samma q värde som förgrund vilket det normalt inte är, standar är 6 förgrund och 2 bakgrund, för att då undvika att det i bakgrunden stjäl CPU tid så måste man manuellt korrigera prioritet till högre eller hög på saker i förgrund. Denna tweak ger i slutändan ett dubbelt högt q värde som i sin tur endast bör halvera antalet trådförflyttningar per sekund. Man dubblerar den tid som en arbetstråd får innan den forceras vidare till annan kärna av schedulern.

Edit: Angående bandbredd över infinity fabric, den har angetts till 22GB/s per 32bit vid 1066MHz, vid full bredd skulle det vara 176GB/s (256bit). Detta kan faktiskt höjas genom högre internminneseklock vilket enligt utsago ska öka även fabric hastigheten, vid 3500Mt minnen borde då bandbredden pressas upp till ~289GB/s (halva minnseklock) Nu är dock frågan hur pass brett inter CCX kommunikation sker, om det är bara 32bit eller dynamiskt upp till 256bit?

Skickades från m.sweclockers.com

Hur reder du ut att schemaläggaren faktiskt kör oftare än var 15,6 ms? Det enda jag ser i dokumentationen är att en högre upplösning på system timern gör det möjligt att få bättre upplösning i anrop som WaitForSingleObject och liknande.

I normalfallet kan man bara blir uppväckt med var 15,6 ms. Vad spel och liknande verkar göra är att ökar upplösningen via timeBeginPeriod/timeEndPeriod. Detta gör det möjligt att sova med ner till millisekundupplösning.

Dock verkar fortfarande schemaläggaren köra var 15,6 ms då OS-tick värdet verkar uppdateras med samma frekvens oavsett vilken upplösning man begär. I alla fall enligt detta program (resultatet blir alltid 15 eller 16 ms oavsett upplösning på tick-timer).

// ticktock.cpp : Figure out the resolution of the Window tick-counter. #include "stdafx.h" #include <windows.h> #include <iostream> #pragma comment(lib, "Winmm.lib") using namespace std; int main() { DWORD y; for (int i = 0; i < 100; i += 10) { UINT uPeriod = i + 1; if (timeBeginPeriod(uPeriod) != TIMERR_NOERROR) { cout << "Failed to change tick resolution" << endl; } y = GetTickCount(); DWORD z = y; while (z == y) { z = GetTickCount(); } cout << z - y << endl; if (timeEndPeriod(uPeriod) != TIMERR_NOERROR) { cout << "Failed to revert tick resolution" << endl; } } cin >> y; return 0; }

Dold text

Angående bandbredd: finns ju inget sätt att med x86 kod beskriva något som utför CCX-till-CCX kommunikation, så att prata om bandbredd för detta blir meningslöst.

Däremot kan man göra minnesoperationer och i Zen går dessa både till andra CCX och RAM i fall där man missar lokal cache. Bandbredd för en viss minnestransaktion dikteras då av single-channel bandbredd då varje enskild access går till en av de två minneskanalerna.

En minneskanal är 64-bitar bred (8 bytes) och data läses både på stigande och fallande flank, vilken man kan se som en effektiv minnesbredd på 128-bitar (alt. kan man se det som 64-bitar med dubbla frekvensen).

Vid DDR4-2667MT får man då en bandbredd på: 1,333 (frekvens) * 16 (effektiv bredd i bytes) = 21,3 GB/s som AMD verkar runda uppåt till 22 GB/s. Så det är vad 22 GB/s siffran i CCX-till-CCX bandbredd som bl.a. hardware.fr nämner.

Total kapacitet på Infinity Fabric är dubbla, d.v.s. 43 GB/s, detta då bussen är 256-bitar (32 bytes) bred. Hela bandbredden kan absolut utnyttjas i lägen där flera CPU-kärnor samtidigt gör access mot RAM, men varje enskilt anrop går bara mot en minneskanal.

Tror just denna uppdelning av minnesaccesser över kanaler är en stor förklaringen till varför E-serien inte ser större nytta av sin minnesbandbredd. Det krävs att minst fyra minnesanrop kommer samtidigt och att de går mot minnesadresser som råkar sprida sig över alla fyra kanaler. Händer ofta i serverlaster som har enorma "working-set", händer väldigt sällan i desktop-laster som tenderar ha väldigt hög datalokalitet (så det mesta hamnar på en enda kanal).

Ryzen borde se samma effekt som Core. D.v.s. snabbare RAM fast bara en minneskanal kommer i de flesta fall vara snabbare än lite långsammare RAM med dubbla kanaler (där aggregerad bandbredd är väsentligt högre). Är alltså inte aggregerad bandbredd som är flaskhals utan bandbredd per kanal.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yippikayey:

@Enigma:
Du som verkar ha koll på RAM kan väll hjälpa en stackare som är ny på både hårdvaror och mjukvaror och inte lärt sig om RAM ännu.

Jag köpte dessa (RAM) tidigare då jag viste att RAM skulle börja gå upp i pris, kommer de funka fullt ut (3200MHz) med Ryzen R7 1800X?
Tänker köra XMP, vad anser du om XMP? såg någon video där moderkoretet (han påstod att det var Ryzen CPU...) dödade ett av minnena vid aktivering av XMP... men känns som det är nått som är sällsynt/otur.
http://www.corsair.com/en-gb/vengeance-lpx-32gb-2x16gb-ddr4-d...

Beställde detta modekort då det stod "Supports DDR4-3200+(OC) Memory"
https://www.msi.com/Motherboard/X370-GAMING-PRO-CARBON.html#p...

Överklockning av minnet styrs i princip uteslutande av processorn då minneskontrollern sitter i CPU. Jag vet inte vad för kretsar det sitter i dina minnen. Samsung's x-die serie är att föredra men det kan fungera hyfsat med andra minnen också. Det som är bra är att du tog 2 moduler istället för 4. Dina minnen är dubbelsidiga dock och sätter högre stress på minneskontrollern. AMD jobbar med en ny AGESA (den del av bios som AMD tillhandahåller) som ska släppas i Maj för att stödja fler minnen i högre frekvenser bättre, framför allt dubbelsidiga och för dom som kör 4x DIMM's. Jag tippar på att du inledningsvis kan nå DDR4-2933, men kanske 3200 med lite tur.

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Permalänk
Medlem

Sitter med en oöppnad R7 1700 hemma och funderar på om man ska vänta på R5 1600..
Surfar mest med datorn och spelar lite overwatch samt lol.
Ibland videoredigering.

Jobbigt beslut utan benchmarks

Visa signatur

/SAnDis - Pew pew

Permalänk
Medlem

@Enigma: Väldigt intressant, Tusen tack för kunskapen och en bra förklaring!
Att välja 2 moduler över 4st var tack och lov ett självklart val för mig