::: AMD Zen Samlingstråd :::

2017-03-16 23:12

Medlem

Plats: Avesta
Registrerad: Nov 2009

●

Skrivet av marcusOCZ:

När det gäller minnen så fungerar Samsung "B" die mycket bra med Ryzen. Det är faktist det DDR4 med brukbara hastigheter som också har bra yield. Allt med 3200 och cl15 eller mindre är till 99% Samsung "b" die. Hittils verkar det inte finnas 16GB single rank per sticka, så skall man fylla moderkortet med 4 stickor måste man nog ta till tack med lägre bandbredd.

Andra minnen kommer garanterat fungera bra det också, men inte än. Finns inget moderkort till Ryzen med bra bios där man kan tweaka timings och subtimings ännu. G.skill 3200 upp till 4000 har samsung "b".

Gå till inlägget

G.skill 3200 och uppåt gäller det även CL16 minnen???

tex dessa: https://www.proshop.se/MINNE/GSkill-TridentZ-RGB-DDR4-3200-C1...

Visa signatur

Rapportera Redigera

Citera flera Citera

2017-03-16 23:12

Permalänk

Oegat

Medlem ★

Registrerad: Jan 2003

●

Skrivet av liket:

...

Det verkar även confirmed att både 6-core och 4-core kommer ha två CCX:er.:
http://www.anandtech.com/show/11202/amd-announces-ryzen-5-apr...

Gå till inlägget

Från anand-länken:

Citat:

We have confirmation from AMD that there are no silly games going to be played with Ryzen 5. The six-core parts will be a strict 3+3 combination, while the four-core parts will use 2+2. This will be true across all CPUs, ensuring a consistent performance throughout.

Då kanske de har slagit av halva L3 i varje CCX i 1400 ändå. Då den bara har 8Mb L3 hade jag väntat mig att den skulle bestå av en ensam CCX.

Visa signatur

Här hade jag en historik sen 1990-talet, men den blev tillslut för lång. Aktiva maskiner 2022-framåt:
Work/Play/Everythingstation: AMD Epyc 7443p, Pop OS host, Win10 + Linux guests (KVM/Qemu)
Work/Play nr 2: AMD Phenom II 1090t, Debian + Win 10 (dual boot)
Server x3: Epyc 7252 (TrueNAS Core), Atom 2550 (FreeBSD, backup), Opteron 6140 (Ubuntu, off prem backup)
Retrohörna under uppbyggnad: Dual Pentium Pro 200MHz, Pentium P54C 90MHz, Gravis Ultrasound MAX

Rapportera Redigera

Citera flera Citera

2017-03-16 23:23

Permalänk

wowsers

Medlem

Registrerad: Jul 2015

●

Skrivet av Oegat:

Från anand-länken:
Då kanske de har slagit av halva L3 i varje CCX i 1400 ändå. Då den bara har 8Mb L3 hade jag väntat mig att den skulle bestå av en ensam CCX.

Gå till inlägget

Man kan ju dock själv tycka att ett L3 för ett CCX vore det klart mer jämna alternativet, med tanke på att alla kärnor i sådana fall ha samma latens mot alla kärnor, vilket i överlag skulle ge högre prestanda. 2+2 och halva L3 cache avstängt låter väldigt mysko, men vad vet man egentligen.

Senast redigerat 2017-03-16 23:35

Visa signatur

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Rapportera Redigera

Citera flera Citera

2017-03-16 23:48

Permalänk

MarkSix

Medlem ★

Registrerad: Jun 2008

●

Skrivet av GarfieldPower:

https://www.nordichardware.se/artikel/insider-moderkortstillv...

Gå till inlägget

Lite dåligt av AMD där faktiskt, inte undra på att det har varit problem med en del moderkort. Detta kommer i alla fall mogna och dom flesta buggarna lär vara lösta inom en snar framtid.

Visa signatur

“When a clown moves into a palace he doesn’t become a king, the palace instead becomes a circus.”

Rapportera Redigera

Citera flera Citera

2017-03-17 00:02

Permalänk

marcusOCZ

Medlem ★

Plats: Trondheim, Norge
Registrerad: Feb 2005

●

Skrivet av p_stman:

G.skill 3200 och uppåt gäller det även CL16 minnen???

tex dessa: https://www.proshop.se/MINNE/GSkill-TridentZ-RGB-DDR4-3200-C1...

Gå till inlägget

Ganska säker på att det är Hynix. Hade inte satsat på de.

https://www.prisjakt.nu/produkt.php?p=4113789

Dom däremot om du skall ha RGB på G.Skill.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--Asrock Z790i--2X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B

Rapportera Redigera

Citera flera Citera

2017-03-17 01:22

Permalänk

Enigma

Medlem ★

Plats: inside your microcode
Registrerad: Jan 2007

●

Skrivet av wowsers:

Situationen förbättrar sig fort! Vid det här laget kommer man inte ens behöva tweaka något när Ryzen 3 kommer ut (satsar nog själv på en 1600/1600X senare i år). Hur många ns till RAM låg saker på tidigare/vid launch?

Gå till inlägget

Mellan 80-100ns, och Zen har också en DDR3500 divider, men den är inte synlig än tills AMD släpper ny AGESA i Maj. 3500MT och CL14 kommer kan nog ge 65ns och högre data fabric hastighet=mer prestanda Ryzen har inte sett sina bästa dagar än

Skrivet av Ratatosk:

@Enigma: Motherboard [Trial version], verkar som att du kan få veta vilket moderkort du har, om du köper Pro versionen.
On Topic: verkar riktigt lovande.
Planerar inte att klocka CPU:n, minnena skall jag dock testa, men eftersom även mina är Corsair Lpx 3000 MT/s, och 4st dessutom, verkar det inte lovande, de snurrar just nu i 2133.

Gå till inlägget

Glömskhet kommer med åldern, så tur att CPU-Z är gratis så man inte glömmer vilken mammabräda man sitter med

Du har tyvärr den värsta kombinationen av RAM i ditt fall, 4st DIMM's och dom där kör Micron eller Hynix IC's vilka inte klockar någon vidare på AM4. Ännu värre är det om du dessutom sitter med dubbelsidiga minnen i en 4DIMM config.

Skrivet av Dunder:

De skickar ut fästen mot att man betalar frakten:

http://thermalright.com/2017/02/21/thermalright-amd-am4-cpu-m...

Gå till inlägget

Grymt! Blev ett mail till dom. Den gamle TRUE120 får nytt liv. Gott att ha den gamle trotjänaren till övers för fler testriggar. ( @sAAb ifall du inte såg hans länk )

Skrivet av wowsers:

Problemet då vore att halva cache skulle ha massor högre latency än cache på CCX där kärnorna ligger

Gå till inlägget

Fortfarande lägre latens än RAM.

Skrivet av wowsers:

En fråga, vilket användningsområde annat än bragging rights har man för 16MB L3 och 4 kärnor?

Gå till inlägget

Spel älskar i regel cache

Skrivet av sAAb:

Jag har haft en avvaktande hållning med Ryzen för att se vilka minnen som kan vara bra.

G.Skill Flare X har enligt pressmeddelande från 4 mars fungerat vid 3200 MHz för 4x16 GB.,

Nu finns en bitter tråd på Reddit där man börjar kalla situationen "fucky"; jag kan bara gissa vad som menas med det.

https://www.reddit.com/r/Amd/comments/5zjer0/gskill_flare_x_d...

Nja, jag avvaktar lite till.

Gå till inlägget

Mycket okunnigt folk på reddit. Alla minnen med Samsung IC's fungerar ypperligt med Ryzen oberoende av moderkort då IMC sitter i processorn. Alla G.Skills högre klockade DDR4 använder dessa IC's, därav jag köpte mina tidigt då Samsung är ett säkert kort. Flare X är exakt samma minnen som Trident Z, fast med AMP preset, alternativt andra subtimings vilket kvittar i slutändan.

Skrivet av p_stman:

G.skill 3200 och uppåt gäller det även CL16 minnen???

tex dessa: https://www.proshop.se/MINNE/GSkill-TridentZ-RGB-DDR4-3200-C1...

Gå till inlägget

Inte CL16 modellen om du ska ha 3200MT, CL14 har Samsung x-die. Jag körde på 3600MT CL16 och AMD släpper ny AGESA i April som kommer ge 3500MT divider Ganska givet att satsa på bra minnen när data fabric och minneskontrollern i Zen lägger sig på samma frekvens som RAM:

https://community.amd.com/community/gaming/blog/2017/03/14/ti...

Citat:

1. The AMD Ryzen™ processor does not offer memory dividers for DDR4-3000 or DDR4-3400. Users shooting for higher memory clocks should aim for 3200 or 3500 MT/s.

7. Finally, as part of AMDs ongoing development of the new AM4 platform, AMD will increase support for overclocked memory configurations with higher memory multipliers. We intend to issue updates to motherboard partners in May that will enable them, on whatever products they choose, to support speeds higher than the current DDR4-3200 limit without refclk adjustments.

Senast redigerat 2017-03-17 04:13

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Rapportera Redigera

Citera flera Citera (2)

2017-03-17 01:47

Permalänk

Enigma

Medlem ★

Plats: inside your microcode
Registrerad: Jan 2007

●

Jag sa ganska tidigt att Zen ÄR en högfrekvensdesign. Tysken närmar sig 6GHz med kväve:

http://hwbot.org/submission/3473875_der8auer_cpu_frequency_ry...

Återstår att se hur frekvensen klättrar uppåt med luft och vattenkylning. Tillverkningsprocessen mognar givetvis med tiden men det kan behövas en del mindre optimeringar i designen för att nå högre frekvenser med luft/vatten. Detta har man gjort historiskt med en ny revision/stepping. Zen2, eller Ryzen 2 kommer med stor sannolikhet förbättra frekvenserna och mycket annat därtill. Så vitt jag vet har Zen 2 gjort tape-out och AMD går med blodad tand som tåget nu.

Senast redigerat 2017-03-17 03:09

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Rapportera Redigera

Citera flera Citera (7)

2017-03-17 02:50

Permalänk

Esster

Avstängd

Registrerad: Mar 2017

●

Skrivet av Enigma:

Sa ganska tidigt att Zen ÄR en högfrekvensdesign. Tysken närmar sig 6GHz med kväve:

https://pbs.twimg.com/media/C7E-afxXwAAfJdu.jpg

http://hwbot.org/submission/3473875_der8auer_cpu_frequency_ry...

Återstår att se hur frekvensen klättrar uppåt med luft och vattenkylning. Tillverkningsprocessen mognar givetvis med tiden men det kan behövas en del mindre optimeringar i designen för att nå högre frekvenser med luft/vatten. Detta har man gjort historiskt med en ny revision/stepping. Zen2, eller Ryzen 2 kommer med stor sannolikhet förbättra frekvenserna och mycket annat därtill. Så vitt jag vet har Zen 2 gjort tape-out och AMD går med blodad tand som tåget nu.

Gå till inlägget

@Enigma
Riktigt bra om den klarar 5802.93MHz på 0.787V
Den klarar säkert 7GHz på 1V under morgondagen om vi håller tummarna och de höjjer frontspänningen lite på motstånden till kondensatorerna.

Är det några supraledare med i bilden?

Senast redigerat 2017-03-17 02:58

Rapportera Redigera

Citera flera Citera (1)

2017-03-17 03:10

Permalänk

Enigma

Medlem ★

Plats: inside your microcode
Registrerad: Jan 2007

●

Skrivet av Esster:

@Enigma
Riktigt bra om den klarar 5802.93MHz på 0.787V
Den klarar säkert 7GHz på 1V under morgondagen om vi håller tummarna och de höjjer frontspänningen lite på motstånden till kondensatorerna.

Är det några supraledare med i bilden?

Gå till inlägget

Hehe nja spänningen som rapporteras i CPU-Z stämmer inte. Vcore i detta fall är ca 1.9v.

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Rapportera Redigera

Citera flera Citera (2)

2017-03-17 04:10

Permalänk

Enigma

Medlem ★

Plats: inside your microcode
Registrerad: Jan 2007

●

Körde lite mer på min 1700 och den gör 4125Mhz på ~1.4vcore:

Finns lite till att ge men som bekant så skenar spänningen extremt för att nå högre frekvens här, därav bara test i enkeltrådat:

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Rapportera Redigera

Citera flera Citera (3)

2017-03-17 05:25

Permalänk

SVclocker

Medlem ★

Plats: Falun
Registrerad: Feb 2010

●

Mycket intressant video angående spelprestandan.

Visa signatur

Fractal Design Pop XL Air RGB | ASRock Z690 Taichi | i5-12600k | Corsair 32GB (2x16GB) DDR5 6000MHz CL30 | Gigabyte RTX 5070 12GB Gaming OC

Nintendo Switch | PlayStation 5 +PS4 Pro | Xbox Series X + One X
Min FZ Profil

Rapportera Redigera

Citera flera Citera

2017-03-17 07:09

Permalänk

marcusOCZ

Medlem ★

Plats: Trondheim, Norge
Registrerad: Feb 2005

●

@Vangen:

Han i videon har ju så totalt fel att det blir pinsamt.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--Asrock Z790i--2X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B

Rapportera Redigera

Citera flera Citera

2017-03-17 07:18

Permalänk

tellus82

Medlem ★

Plats: Sälen
Registrerad: Maj 2004

●

Skrivet av Vangen:

Mycket intressant video angående spelprestandan.

https://www.youtube.com/watch?v=m1amGwPnUuA

Gå till inlägget

Vi har diskuterat detta under lång tid i tråden, kommunikation mellan CCX vare sig det är trådförflyttning pga schedulern eller cache begäran så har det effekten av dels adderad latens men också lägre bandbredd mot l3 på andra CCX klustret.
Tyvärr verkar inte ryzen ägare här på SweC särskilt intresserade av att undersöka vad man själv kan påverka/tweaka. Vi har redan nämnt schedulern och där har vi två saker man kan göra, det ena är att förhindra trådförflyttning genom att låsa affinity, inte alltid lösningen om man behöver säg 6 kärnor, då kommer det flyttas runt trådar inom dom sex ändå. En annan tweak är timern som schedulern jobbar efter, denna är i win10 dynamisk mellan 0,5 och 15,625ms. För spel hamnar den nästan alltid på 0,5ms,vid detta låga värde sker det flest trådförflyttningar per sekund som i sin tur drar ner prestanda i onödan i vissa situationer. Timern kan dock göras statisk och med ett justerbart värde, problemet med denna tweak är att timern är ett trubbigt instrument som vid pillande på drabbar långt mer saker än man vill. En annan timertweak som inte pillar på timern men ändå har inverkan på just trådförflyttningar är quantum/quanta värdet i Windows, detta kan justeras från sitt vanliga 6 till server värdet 12, detta är effektivt den multipel som schedulern applicerar på timern. Enda nackdelen att justera q värdet är att alla bakgrundsprocesser får samma q värde som förgrund vilket det normalt inte är, standar är 6 förgrund och 2 bakgrund, för att då undvika att det i bakgrunden stjäl CPU tid så måste man manuellt korrigera prioritet till högre eller hög på saker i förgrund. Denna tweak ger i slutändan ett dubbelt högt q värde som i sin tur endast bör halvera antalet trådförflyttningar per sekund. Man dubblerar den tid som en arbetstråd får innan den forceras vidare till annan kärna av schedulern.

Edit: Angående bandbredd över infinity fabric, den har angetts till 22GB/s per 32bit vid 1066MHz, vid full bredd skulle det vara 176GB/s (256bit). Detta kan faktiskt höjas genom högre internminneseklock vilket enligt utsago ska öka även fabric hastigheten, vid 3500Mt minnen borde då bandbredden pressas upp till ~289GB/s (halva minnseklock) Nu är dock frågan hur pass brett inter CCX kommunikation sker, om det är bara 32bit eller dynamiskt upp till 256bit?

Skickades från m.sweclockers.com

Senast redigerat 2017-03-17 07:49

Visa signatur

Rapportera Redigera

Citera flera Citera (3)

2017-03-17 07:20

Permalänk

pellen

Medlem

Plats: Linköping
Registrerad: Mar 2003

●

Skrivet av Ratatosk:

@Bernd_P1: I artikeln påstås bla. att en orsak till att ITX korten är försenade, är att framtagandet av dess layout försenas eftersom "man jobbar febrilt för att optimera mjukvara för sina första AM4 ATX-moderkort."
Javisst deras kretskortsdesigners har fullt upp med att utveckla mjukvara, de hinner inte ta fram ITX brädor.

Nej den källan saknar all trovärdighet, verkar handla om damagekontroll, genom att skylla på andra (AMD) via "läckor".

Gå till inlägget

De jobbar inte med samma saker nej, men de är ju ändå beroende av varandra. Kretskortsdesignerna kanske är färdiga, men måste nu vänta på att mjukvara/uefi fixas till på redan lanserade produkter innan ITX-korten får kärlek.

Skickades från m.sweclockers.com

Visa signatur

Rapportera Redigera

Citera flera Citera (3)

2017-03-17 08:36

Permalänk

wowsers

Medlem

Registrerad: Jul 2015

●

Skrivet av Enigma:

"Problemet då vore att halva cache skulle ha massor högre latency än cache på CCX där kärnorna ligger :P"
Fortfarande lägre latens än RAM.

Gå till inlägget

Sant, men resultatet skulle vara markant bättre om man bara valde att använda ett CCX till fullo (än att köra två halva CCX, halverat L3 och allt)

Visa signatur

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Rapportera Redigera

Citera flera Citera

2017-03-17 08:51

Permalänk

Sisyfos

Entusiast ★

Plats: Linköping
Registrerad: Mar 2012

●

En liten heads upp för ni som kanske kör Ryzen på Windows 7/8.1: https://arstechnica.com/information-technology/2017/03/micros... Microsoft being Microsoft...

Och som en liten extra bonus på det så har nu HardwareUnboxed testat Ryzen i Windows 7 VS Windows 10: https://www.youtube.com/watch?v=LXGza3q2qzM

Visa signatur

Den digitala högborgen: [Fractal Design Meshify C] ≈ [Corsair RM850x] ≈ [GeForce RTX 3080] ≈ [AMD Ryzen 7 7800X3D ≈ [Noctua NH-U14S] ≈ [G.Skill Flare X5 32GB@6GHz/CL30] ≈ [MSI MAG B650 TOMAHAWK] ≈ [Kingston Fury Renegade 2 TB] ≈

Rapportera Redigera

Citera flera Citera

2017-03-17 09:05

Permalänk

AMD-FX

Medlem ★

Plats: Framför datorn
Registrerad: Nov 2013

●

Skrivet av Sisyfos:

En liten heads upp för ni som kanske kör Ryzen på Windows 7/8.1: https://arstechnica.com/information-technology/2017/03/micros... Microsoft being Microsoft...

Och som en liten extra bonus på det så har nu HardwareUnboxed testat Ryzen i Windows 7 VS Windows 10: https://www.youtube.com/watch?v=LXGza3q2qzM

Gå till inlägget

Fast med Windows Update MiniTool går det väl att ladda ner med fortfarande?

Visa signatur

~~Coca Cola missbrukare~~ Förbjuden dryck för mig pga diabetes
AMD älskare
Katt älskare

Rapportera Redigera

Citera flera Citera

2017-03-17 09:19

Permalänk

marcusOCZ

Medlem ★

Plats: Trondheim, Norge
Registrerad: Feb 2005

●

Med en divider på 3500 som AMD skall uppdatera till så blir denna flaskhals mer eller mindre borta nu när man ser hur mycket det ger med snabbare ram. Dessutom slipper man pilla med BLCK och med de bekymmer det kan ge. NvME diskar gillar nog visst inte högre bussklocka har jag läst. Ska man bencha och pilla med blck så bör man nog ha en god gammal sata ssd eller sata m.2

Dessutom tror jag vi får se nya revisioner av moderkorten då. Vid 3500 på ram tror jag verkligen vi får se vad Ryzen går för och med möjligheter att ändra på subtimings så får vi också se vad latens på ram ger när flaskhalsen förhoppningsvis har flyttats.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--Asrock Z790i--2X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B

Rapportera Redigera

Citera flera Citera (3)

2017-03-17 09:52

Permalänk

Ratatosk

Hjälpsam ★

Plats: Karlskoga
Registrerad: Jan 2007

●

Skrivet av wowsers:

Undrar vad den totala bandbredden blir vid de vanligaste RAM hastigheterna

Gå till inlägget

256 bitars bus är 32 Bytes i bredd, ta det gånger 1066 (för minnen som går i 2133) så får vi 34 GB/s, samma som till minnena om de går i dual mode.
Betydligt högre än jag trodde.

Senast redigerat 2017-03-17 09:58

Visa signatur

Rapportera Redigera

Citera flera Citera

2017-03-17 10:25

Permalänk

Swedish Berserk

Medlem ★

Plats: Skåne
Registrerad: Apr 2009

●

Hur mycket tror ni det kommer att skilja mellan Ryzen 5 1500X och Ryzen 5 1400? Tänker mest på den halverade mängden L3 cache kan det påverka prestandan mycket?

Visa signatur

Stationär Speldator: AMD Ryzen 7 2700 I AMD Radeon 6750 XT
Bärbar Speldator: AMD Ryzen 5 5600H I Nvidia RTX 3050 Ti

Rapportera Redigera

Citera flera Citera

2017-03-17 10:27

Permalänk

wowsers

Medlem

Registrerad: Jul 2015

●

Skrivet av Ratatosk:

256 bitars bus är 32 Bytes i bredd, ta det gånger 1066 (för minnen som går i 2133) så får vi 34 GB/s, samma som till minnena om de går i dual mode.
Betydligt högre än jag trodde.

Gå till inlägget

Så några vanliga RAM hastigheter och bandbredder borde då bli...

RAM hastiheter	2133 MT/s	2400 MT/s	2666 MT/s	2933 MT/s	3200 MT/s	3500 MT/s
infinity fabric bandbredd	34.1 GB/s	38.4 GB/s	42.7 GB/s	46.9 GB/s	51.2 GB/s	56.0 GB/s

Om alla uträkningar stämmer

Visa signatur

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Rapportera Redigera

Citera flera Citera (1)

2017-03-17 10:45

Permalänk

Gruarn

Medlem ★

Plats: Strängnäs
Registrerad: Sep 2003

●

@Swedish Berserk:

Det beror på om det blir 1 CCX-kluster eller 2 och det beror på om du tänker dig att överklocka.

Om du kommer överklocka kommer båda sannolikt att nå upp till samma klockhastighet, baserat på 1700-1800X.

Vid samma hastighet så blir det dock mindre latens för kärnorna att prata inom 1 CCX-kluster, jämfört med att prata mellan kluster. Min förväntan är att 1 kluster ger högre prestanda vid en given klockhastighet än att ha 2 kärnor på varje kluster.

@wowsers
Jag undrar var gränsen går där den interna bandbredden slutar att vara en flaskhals, eller om flaskhalsen går hela vägen upp till den interna bandbredden mellan kärnorna?

Nästa fråga är också om det är lättare att clocka Infinity fabric om man bara har ett aktivt CCX-kluster? Och hur stora är skillnaden mellan att ha 2 minneskanaler och att ha 1? Finns det någon chans att en potentiell ökning i minneshastighet p.g.a. att man bara har en minneskontroller blir högre än förlusten av de 2 kanalerna?

Rapportera Redigera

Citera flera Citera

2017-03-17 11:12

Permalänk

Yippikayey

Medlem ★

Registrerad: Dec 2016

●

@Enigma:
Du som verkar ha koll på RAM kan väll hjälpa en stackare som är ny på både hårdvaror och mjukvaror och inte lärt sig om RAM ännu.

Jag köpte dessa (RAM) tidigare då jag viste att RAM skulle börja gå upp i pris, kommer de funka fullt ut (3200MHz) med Ryzen R7 1800X?
Tänker köra XMP, vad anser du om XMP? såg någon video där moderkoretet (han påstod att det var Ryzen CPU...) dödade ett av minnena vid aktivering av XMP... men känns som det är nått som är sällsynt/otur.
http://www.corsair.com/en-gb/vengeance-lpx-32gb-2x16gb-ddr4-d...

Beställde detta modekort då det stod "Supports DDR4-3200+(OC) Memory"
https://www.msi.com/Motherboard/X370-GAMING-PRO-CARBON.html#p...

Rapportera Redigera

Citera flera Citera

2017-03-17 11:25

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av Ratatosk:

256 bitars bus är 32 Bytes i bredd, ta det gånger 1066 (för minnen som går i 2133) så får vi 34 GB/s, samma som till minnena om de går i dual mode.
Betydligt högre än jag trodde.

Gå till inlägget

Var väl ändå självklart att Infinity fabric minst måste matcha bandbredden för dual-channel RAM, eller? Om så inte hade varit fallet vore det omöjligt för CPUn att utnyttja full bandbredd för RAM då både CCX och minneskontroller är klienter till Infinity fabric.

Vidare får man tänka på att denna kapacitet delas även av all I/O, d.v.s. all PCIe-traffik måste också få plats i bandbredden som Infinity Fabric har.

Som @wowsers nämner ovan påminner just kopplingen RAM<->CPU-kärna i Zen rätt mycket om hur IBM designade POWER8. I båda fallen har man lyft ur minneskontroller från att vara en integrerad del av CPUn, i någon bemärkelse har man återinfört "north bridge" där NB nu representeras av en xbar-buss.

I både Zen och POWER8 resulterade det i högre latens mot RAM. Men fördelen är att man har en mindre tight koppling mellan CPU-kärnan och protokollet som RAM pratar. I fallet POWER8 har man ett helt eget protokoll, CPUn pratar överhuvudtaget inte med RAM utan med det man kallar Centaur som i första ledet består av en eDRAM-cache (L4$). POWER8 kan därför enkelt stödja både DDR3 och DDR4 utan att det påverkar designen av CPU-kärnan.

Däremot skiljer sig Zen och POWER8 i hur de hanterar L3$, inte allt för vågad gissning att detta kommer av att IBM hade långt mer svängrum i sina val då minneskonsistensmodellen i POWER ISA är långt mindre strikt än vad som är fallet för x86. Många hänger upp sig på att x86 har CISC-rötter, det är totalt irrelevant idag då designen ändå är en RISC internt.

Om det är något som är ett problem för x86 så är det den onödigt strikta minneskonsistensmodellen, den är tyvärr något som gör x86 mindre lämpad för SMP än t.ex. POWER och ARM. Blir ingen jätteskillnad i prestanda, men detta är något som AMD/Intel tyvärr måste kasta rätt mycket mer kisel på jämfört med andra och det begränsar hur "bred" design som är vettigt att göra. Apple har ju en "bredare" design i sin mobil CPU än vad AMD/Intel har i sina high-end designer...

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (5)

2017-03-17 11:43

Permalänk

liket

Medlem

Plats: Umeå
Registrerad: Jul 2001

●

@Gruarn: Att det blir 2 CCX:er på 4-kärniga är redan bekräftat, länkade en anandtechpost tidigare i tråden om det.

@Swedish Berserk: Jag googlade en youtubevideo åt dig där han visar prestandaskillnader mellan olika L3-cache på intel
https://www.youtube.com/watch?v=hTQssyGvAIk

tl;dw: Ibland lite, ibland en del. Med tanke på den lilla prisskillnaden så skulle jag säga att det är värt att betala för 1500x.

Rapportera Redigera

Citera flera Citera

2017-03-17 11:58

Permalänk

Ratatosk

Hjälpsam ★

Plats: Karlskoga
Registrerad: Jan 2007

●

Skrivet av Yoshman:

Var väl ändå självklart att Infinity fabric minst måste matcha bandbredden för dual-channel RAM, eller? Om så inte hade varit fallet vore det omöjligt för CPUn att utnyttja full bandbredd för RAM då både CCX och minneskontroller är klienter till Infinity fabric.

Vidare får man tänka på att denna kapacitet delas även av all I/O, d.v.s. all PCIe-traffik måste också få plats i bandbredden som Infinity Fabric har.

Som @wowsers nämner ovan påminner just kopplingen RAM<->CPU-kärna i Zen rätt mycket om hur IBM designade POWER8. I båda fallen har man lyft ur minneskontroller från att vara en integrerad del av CPUn, i någon bemärkelse har man återinfört "north bridge" där NB nu representeras av en xbar-buss.

I både Zen och POWER8 resulterade det i högre latens mot RAM. Men fördelen är att man har en mindre tight koppling mellan CPU-kärnan och protokollet som RAM pratar. I fallet POWER8 har man ett helt eget protokoll, CPUn pratar överhuvudtaget inte med RAM utan med det man kallar Centaur som i första ledet består av en eDRAM-cache (L4$). POWER8 kan därför enkelt stödja både DDR3 och DDR4 utan att det påverkar designen av CPU-kärnan.

Däremot skiljer sig Zen och POWER8 i hur de hanterar L3$, inte allt för vågad gissning att detta kommer av att IBM hade långt mer svängrum i sina val då minneskonsistensmodellen i POWER ISA är långt mindre strikt än vad som är fallet för x86. Många hänger upp sig på att x86 har CISC-rötter, det är totalt irrelevant idag då designen ändå är en RISC internt.

Om det är något som är ett problem för x86 så är det den onödigt strikta minneskonsistensmodellen, den är tyvärr något som gör x86 mindre lämpad för SMP än t.ex. POWER och ARM. Blir ingen jätteskillnad i prestanda, men detta är något som AMD/Intel tyvärr måste kasta rätt mycket mer kisel på jämfört med andra och det begränsar hur "bred" design som är vettigt att göra. Apple har ju en "bredare" design i sin mobil CPU än vad AMD/Intel har i sina high-end designer...

Gå till inlägget

Doh!
Klart som fan! tänkte inte på IF ligger mellan CPU och minne.

Visa signatur

Rapportera Redigera

Citera flera Citera

2017-03-17 12:06

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av tellus82:

Vi har diskuterat detta under lång tid i tråden, kommunikation mellan CCX vare sig det är trådförflyttning pga schedulern eller cache begäran så har det effekten av dels adderad latens men också lägre bandbredd mot l3 på andra CCX klustret.
Tyvärr verkar inte ryzen ägare här på SweC särskilt intresserade av att undersöka vad man själv kan påverka/tweaka. Vi har redan nämnt schedulern och där har vi två saker man kan göra, det ena är att förhindra trådförflyttning genom att låsa affinity, inte alltid lösningen om man behöver säg 6 kärnor, då kommer det flyttas runt trådar inom dom sex ändå. En annan tweak är timern som schedulern jobbar efter, denna är i win10 dynamisk mellan 0,5 och 15,625ms. För spel hamnar den nästan alltid på 0,5ms,vid detta låga värde sker det flest trådförflyttningar per sekund som i sin tur drar ner prestanda i onödan i vissa situationer. Timern kan dock göras statisk och med ett justerbart värde, problemet med denna tweak är att timern är ett trubbigt instrument som vid pillande på drabbar långt mer saker än man vill. En annan timertweak som inte pillar på timern men ändå har inverkan på just trådförflyttningar är quantum/quanta värdet i Windows, detta kan justeras från sitt vanliga 6 till server värdet 12, detta är effektivt den multipel som schedulern applicerar på timern. Enda nackdelen att justera q värdet är att alla bakgrundsprocesser får samma q värde som förgrund vilket det normalt inte är, standar är 6 förgrund och 2 bakgrund, för att då undvika att det i bakgrunden stjäl CPU tid så måste man manuellt korrigera prioritet till högre eller hög på saker i förgrund. Denna tweak ger i slutändan ett dubbelt högt q värde som i sin tur endast bör halvera antalet trådförflyttningar per sekund. Man dubblerar den tid som en arbetstråd får innan den forceras vidare till annan kärna av schedulern.

Edit: Angående bandbredd över infinity fabric, den har angetts till 22GB/s per 32bit vid 1066MHz, vid full bredd skulle det vara 176GB/s (256bit). Detta kan faktiskt höjas genom högre internminneseklock vilket enligt utsago ska öka även fabric hastigheten, vid 3500Mt minnen borde då bandbredden pressas upp till ~289GB/s (halva minnseklock) Nu är dock frågan hur pass brett inter CCX kommunikation sker, om det är bara 32bit eller dynamiskt upp till 256bit?

Skickades från m.sweclockers.com

Gå till inlägget

Hur reder du ut att schemaläggaren faktiskt kör oftare än var 15,6 ms? Det enda jag ser i dokumentationen är att en högre upplösning på system timern gör det möjligt att få bättre upplösning i anrop som WaitForSingleObject och liknande.

I normalfallet kan man bara blir uppväckt med var 15,6 ms. Vad spel och liknande verkar göra är att ökar upplösningen via timeBeginPeriod/timeEndPeriod. Detta gör det möjligt att sova med ner till millisekundupplösning.

Dock verkar fortfarande schemaläggaren köra var 15,6 ms då OS-tick värdet verkar uppdateras med samma frekvens oavsett vilken upplösning man begär. I alla fall enligt detta program (resultatet blir alltid 15 eller 16 ms oavsett upplösning på tick-timer).

// ticktock.cpp : Figure out the resolution of the Window tick-counter.

#include "stdafx.h"
#include <windows.h>
#include <iostream>

#pragma comment(lib, "Winmm.lib")

using namespace std;

int main()
{
    DWORD y;
    for (int i = 0; i < 100; i += 10) {
        UINT uPeriod = i + 1;
        if (timeBeginPeriod(uPeriod) != TIMERR_NOERROR) {
            cout << "Failed to change tick resolution" << endl;
        }

        y = GetTickCount();
        DWORD z = y;
        while (z == y) {
            z = GetTickCount();
        }
        cout << z - y << endl;

        if (timeEndPeriod(uPeriod) != TIMERR_NOERROR) {
            cout << "Failed to revert tick resolution" << endl;
        }
    }
    cin >> y;
    return 0;
}

Dold text

Angående bandbredd: finns ju inget sätt att med x86 kod beskriva något som utför CCX-till-CCX kommunikation, så att prata om bandbredd för detta blir meningslöst.

Däremot kan man göra minnesoperationer och i Zen går dessa både till andra CCX och RAM i fall där man missar lokal cache. Bandbredd för en viss minnestransaktion dikteras då av single-channel bandbredd då varje enskild access går till en av de två minneskanalerna.

En minneskanal är 64-bitar bred (8 bytes) och data läses både på stigande och fallande flank, vilken man kan se som en effektiv minnesbredd på 128-bitar (alt. kan man se det som 64-bitar med dubbla frekvensen).

Vid DDR4-2667MT får man då en bandbredd på: 1,333 (frekvens) * 16 (effektiv bredd i bytes) = 21,3 GB/s som AMD verkar runda uppåt till 22 GB/s. Så det är vad 22 GB/s siffran i CCX-till-CCX bandbredd som bl.a. hardware.fr nämner.

Total kapacitet på Infinity Fabric är dubbla, d.v.s. 43 GB/s, detta då bussen är 256-bitar (32 bytes) bred. Hela bandbredden kan absolut utnyttjas i lägen där flera CPU-kärnor samtidigt gör access mot RAM, men varje enskilt anrop går bara mot en minneskanal.

Tror just denna uppdelning av minnesaccesser över kanaler är en stor förklaringen till varför E-serien inte ser större nytta av sin minnesbandbredd. Det krävs att minst fyra minnesanrop kommer samtidigt och att de går mot minnesadresser som råkar sprida sig över alla fyra kanaler. Händer ofta i serverlaster som har enorma "working-set", händer väldigt sällan i desktop-laster som tenderar ha väldigt hög datalokalitet (så det mesta hamnar på en enda kanal).

Ryzen borde se samma effekt som Core. D.v.s. snabbare RAM fast bara en minneskanal kommer i de flesta fall vara snabbare än lite långsammare RAM med dubbla kanaler (där aggregerad bandbredd är väsentligt högre). Är alltså inte aggregerad bandbredd som är flaskhals utan bandbredd per kanal.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (4)

2017-03-17 14:18

Permalänk

Enigma

Medlem ★

Plats: inside your microcode
Registrerad: Jan 2007

●

Skrivet av Yippikayey:

@Enigma:
Du som verkar ha koll på RAM kan väll hjälpa en stackare som är ny på både hårdvaror och mjukvaror och inte lärt sig om RAM ännu.

Jag köpte dessa (RAM) tidigare då jag viste att RAM skulle börja gå upp i pris, kommer de funka fullt ut (3200MHz) med Ryzen R7 1800X?
Tänker köra XMP, vad anser du om XMP? såg någon video där moderkoretet (han påstod att det var Ryzen CPU...) dödade ett av minnena vid aktivering av XMP... men känns som det är nått som är sällsynt/otur.
http://www.corsair.com/en-gb/vengeance-lpx-32gb-2x16gb-ddr4-d...

Beställde detta modekort då det stod "Supports DDR4-3200+(OC) Memory"
https://www.msi.com/Motherboard/X370-GAMING-PRO-CARBON.html#p...

Gå till inlägget

Överklockning av minnet styrs i princip uteslutande av processorn då minneskontrollern sitter i CPU. Jag vet inte vad för kretsar det sitter i dina minnen. Samsung's x-die serie är att föredra men det kan fungera hyfsat med andra minnen också. Det som är bra är att du tog 2 moduler istället för 4. Dina minnen är dubbelsidiga dock och sätter högre stress på minneskontrollern. AMD jobbar med en ny AGESA (den del av bios som AMD tillhandahåller) som ska släppas i Maj för att stödja fler minnen i högre frekvenser bättre, framför allt dubbelsidiga och för dom som kör 4x DIMM's. Jag tippar på att du inledningsvis kan nå DDR4-2933, men kanske 3200 med lite tur.

Visa signatur

[ AMD 9800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Linux EndeavourOS ][ LG 34GN850 ]

Rapportera Redigera

Citera flera Citera (1)

2017-03-17 14:52

Permalänk

SAnDis

Medlem ★

Plats: Malmö
Registrerad: Okt 2003

●

Sitter med en oöppnad R7 1700 hemma och funderar på om man ska vänta på R5 1600..
Surfar mest med datorn och spelar lite overwatch samt lol.
Ibland videoredigering.

Jobbigt beslut utan benchmarks

Visa signatur

/SAnDis - Pew pew

Rapportera Redigera

Citera flera Citera

2017-03-17 14:52

Permalänk

Yippikayey

Medlem ★