Vill du vara del av diskussionerna i forumet, ställa frågor eller hjälpa andra? Registrera dig här!

AMD "Renoir" för stationära datorer spöar "Matisse" i minnesprestanda

Trädvy Permalänk
Cyberman
Registrerad
Dec 1999

AMD "Renoir" för stationära datorer spöar "Matisse" i minnesprestanda

En mindre mängd cacheminne och färre kärnor hjälper till att sänka minneslatenser till under 50 nanosekunder.

Läs hela artikeln här

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa leder till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Trädvy Permalänk
Medlem
Plats
Märsta
Registrerad
Aug 2008

4333 CL14 !? Inte dåligt klockat det minnet inte, haha.. Spännande.

Fractal Define 7, Aorus X570 Xtreme, Ryzen 3950X, Fractal Celsius+ S36, 64GB G.Skill Trident Z Neo (3600 CL16), ASUS Strix RTX 2080 Ti, Aorus NVMe 2TB + 2x Samsung 850 EVO 2TB SSD.

Trädvy Permalänk
Hjälpsam
Plats
Karlskoga
Registrerad
Jan 2007

Kanske AMD planerade ett hybridship med GDDR5M till Kavari, det rann dock ur sanden när Elpida gick i konkurs.
https://www.hardware.fr/news/13530/ces-gddr5m-victime-deboire...
En APU hade kunnat bli något helt annat än den är i dag.

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 5 3600 | AMD RX 5700 | 64 GB Corsair | https://valid.x86.fr/sztxhr | Seasonic FOCUS Plus 550W Gold.
HTPC | https://valid.x86.fr/ez1zxw |

Trädvy Permalänk
Medlem
Plats
Malmö
Registrerad
Okt 2013

Och i jämförelse med Intel då?

Trädvy Permalänk
Medlem
Registrerad
Okt 2011

Bådar gott för gaming om man bara kan skrämma upp frekvensen på kärnorna mycket! 8 kärnor räcker gott för det

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Mar 2004

Anledningen att Zen 2 inte skalar med minnen är att det inte går att köra IF 1:1 över 1900MHz, den ändrar till en multipel. Annars har Zen 2 runt 65ns latency redan vid 3600-3733MHz minnen. Hade IF gått att köra högre hade det gått att komma nära resultatet i artikeln med en vanlig Zen 2.

Så den stora nyheten är inte latency, utan att IF går att köra fort.

Sen att man har tokklockat RAM med 1.8V Vdimm och troligen vattenkylning på RAM bör beaktas

3900X X470/NH-D15 32GB-3733 MSI RTX2070 Super Gaming NZXT H700 || 3700X B550/H150i 32GB-3800 GTX1660 Super Cooler Master NR600 || 2700X 32GB-2933 GTX1070FE Phanteks P400 || 6700K 8GB-3200 GTX980FE Silverstone Grandia 09B || 4790K 16GB-2400 GTX970 Antec VSK4000E-U3 https://folding.extremeoverclocking.com/user_summary.php?s=&u...

Trädvy Permalänk
Medlem
Registrerad
Okt 2011
Skrivet av the squonk:

Anledningen att Zen 2 inte skalar med minnen är att det inte går att köra IF 1:1 över 1900MHz, den ändrar till en multipel. Annars har Zen 2 runt 65ns latency redan vid 3600-3733MHz minnen. Hade IF gått att köra högre hade det gått att komma nära resultatet i artikeln med en vanlig Zen 2.

Så den stora nyheten är inte latency, utan att IF går att köra fort.

Sen att man har tokklockat RAM med 1.8V Vdimm och troligen vattenkylning på RAM bör beaktas

Eftersom IO/die inte är ett separat chip så slipper man ett extra hopp över infinity fabric också, så inte bara IF-länkens hastighet

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Mar 2004
Skrivet av medbor:

Eftersom IO/die inte är ett separat chip så slipper man ett extra hopp över infinity fabric också, så inte bara IF-länkens hastighet

Det är sant, Zen 3 kommer troligen inte att ha riktigt lika bra latency. Sen att det är liten mängd L3 minskar också latensen. Men störst del är nog den mycket höga IF-frekvensen imho.

Något som är intressant är att många nya B550-moderkort listar 5100MHz som maximal minnes OC, varför kan man undra?

3900X X470/NH-D15 32GB-3733 MSI RTX2070 Super Gaming NZXT H700 || 3700X B550/H150i 32GB-3800 GTX1660 Super Cooler Master NR600 || 2700X 32GB-2933 GTX1070FE Phanteks P400 || 6700K 8GB-3200 GTX980FE Silverstone Grandia 09B || 4790K 16GB-2400 GTX970 Antec VSK4000E-U3 https://folding.extremeoverclocking.com/user_summary.php?s=&u...

Trädvy Permalänk
Medlem
Registrerad
Okt 2011
Skrivet av the squonk:

Det är sant, Zen 3 kommer troligen inte att ha riktigt lika bra latency. Sen att det är liten mängd L3 minskar också latensen. Men störst del är nog den mycket höga IF-frekvensen imho.

Något som är intressant är att många nya B550-moderkort listar 5100MHz som maximal minnes OC, varför kan man undra?

Man kan ju alltid drömma och hoppas!

Jag har inte undersökt maximal if-frekvens närmare på mobila zen2, men den kan absolut stödja högre frekvenser

Trädvy Permalänk
Medlem
Registrerad
Jul 2012
Skrivet av the squonk:

Det är sant, Zen 3 kommer troligen inte att ha riktigt lika bra latency. Sen att det är liten mängd L3 minskar också latensen. Men störst del är nog den mycket höga IF-frekvensen imho.

Något som är intressant är att många nya B550-moderkort listar 5100MHz som maximal minnes OC, varför kan man undra?

En av anledningarna till varför jag börjat kika på B550 moderkort på sistone.

Mitt X470 dog plötsligt och hade väldigt tur där webhallen gav mig full retur. Vet dock inte om det har o göra med för att det var knappt ett år gammalt, men kul i vilket fall som helst.

Bara svårt att välja då priserna är så knasiga. Om man vill ha lite bättre B550 så är man redan inne på x570 priser.

Och dum som jag är så tycker jag att de prisvärda b450 msi max ser fula ut :')

MB: Asus X470-f |CPU: Ryzen 5, 3600
GPU: MSI 1070 Gaming X
PSU: Rm750x v2
Ram: G.skill Trident Z 14-14-14-34 3200 Mhz 2x 8gb

Trädvy Permalänk
Medlem
Plats
Malmö
Registrerad
Jan 2004

Någon som kan förklara för en gammal gubbe hur mindre cache-minne ger lägre minneslatenser?
Min naiva bild av hur det funkar får det inte att gå ihop, om det inte är något med arkitekturen att göra eller specifika tester (som att man hämtar data som inte finns i cache).
Färre kärnor kan jag ju tänkta mig sänker latensen om de delar cache, eftersom det blir _mer_ cache för varje kärna och högre sannolikhet att man behöver gå via slöare minne för att få fram datan.

Tacksam för förtydligande.

Trädvy Permalänk
Medlem
Registrerad
Okt 2016
Skrivet av Cadzon:

Och i jämförelse med Intel då?

https://www.anandtech.com/show/14664/testing-intel-ice-lake-1...

Kolla 9900K där. Ser ut att vara strax över 60ns (full random, så att Intel’s prefetcher inte stör).

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Mar 2004

Min 6700K med 3200MHz minne är nere på 43ns, så en hel del bättre just i det avseendet ....

3900X X470/NH-D15 32GB-3733 MSI RTX2070 Super Gaming NZXT H700 || 3700X B550/H150i 32GB-3800 GTX1660 Super Cooler Master NR600 || 2700X 32GB-2933 GTX1070FE Phanteks P400 || 6700K 8GB-3200 GTX980FE Silverstone Grandia 09B || 4790K 16GB-2400 GTX970 Antec VSK4000E-U3 https://folding.extremeoverclocking.com/user_summary.php?s=&u...

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Mar 2004
Skrivet av Confusion:

Någon som kan förklara för en gammal gubbe hur mindre cache-minne ger lägre minneslatenser?
Min naiva bild av hur det funkar får det inte att gå ihop, om det inte är något med arkitekturen att göra eller specifika tester (som att man hämtar data som inte finns i cache).
Färre kärnor kan jag ju tänkta mig sänker latensen om de delar cache, eftersom det blir _mer_ cache för varje kärna och högre sannolikhet att man behöver gå via slöare minne för att få fram datan.

Tacksam för förtydligande.

Det går snabbare att hämta data ur ett mindre cache eftersom det inte är lika mycket att söka igenom = kortare söktid. Det går också snabbare att flusha. Nu pratar vi nanosekunder, men ändå snabbare. Sen att prestanda kan bli lidande eftersom det inte går att lagra lika mycket i det är en helt annan sak.

3900X X470/NH-D15 32GB-3733 MSI RTX2070 Super Gaming NZXT H700 || 3700X B550/H150i 32GB-3800 GTX1660 Super Cooler Master NR600 || 2700X 32GB-2933 GTX1070FE Phanteks P400 || 6700K 8GB-3200 GTX980FE Silverstone Grandia 09B || 4790K 16GB-2400 GTX970 Antec VSK4000E-U3 https://folding.extremeoverclocking.com/user_summary.php?s=&u...

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Mar 2004
Skrivet av draanexle:

En av anledningarna till varför jag börjat kika på B550 moderkort på sistone.

Mitt X470 dog plötsligt och hade väldigt tur där webhallen gav mig full retur. Vet dock inte om det har o göra med för att det var knappt ett år gammalt, men kul i vilket fall som helst.

Bara svårt att välja då priserna är så knasiga. Om man vill ha lite bättre B550 så är man redan inne på x570 priser.

Och dum som jag är så tycker jag att de prisvärda b450 msi max ser fula ut :')

Har ett Asus Strix B550-F, rätt strippat på finesser med det viktiga finns och framförallt vad det verkar väl lämpat för OC. När Kitguru testade med all core OC på 3950X presterade det samma i alla tester som X570 Crosshair VIII som kostar över 5000Kr. Det var tom bättre i något test. Känner mig nöjd med det kortet, behöver inte en massa extra jox. Vill man ha lite bättre I/O kan man satsa på TUF X570-Plus som elektriskt är i stort sett samma kort fast med X570.

3900X X470/NH-D15 32GB-3733 MSI RTX2070 Super Gaming NZXT H700 || 3700X B550/H150i 32GB-3800 GTX1660 Super Cooler Master NR600 || 2700X 32GB-2933 GTX1070FE Phanteks P400 || 6700K 8GB-3200 GTX980FE Silverstone Grandia 09B || 4790K 16GB-2400 GTX970 Antec VSK4000E-U3 https://folding.extremeoverclocking.com/user_summary.php?s=&u...

Trädvy Permalänk
Medlem
Registrerad
Okt 2016
Skrivet av Confusion:

Någon som kan förklara för en gammal gubbe hur mindre cache-minne ger lägre minneslatenser?
Min naiva bild av hur det funkar får det inte att gå ihop, om det inte är något med arkitekturen att göra eller specifika tester (som att man hämtar data som inte finns i cache).
Färre kärnor kan jag ju tänkta mig sänker latensen om de delar cache, eftersom det blir _mer_ cache för varje kärna och högre sannolikhet att man behöver gå via slöare minne för att få fram datan.

Tacksam för förtydligande.

Enkelt uttryckt: fler ställen att kolla på.

Något längre: säg att du har 10 000 mappar, numrerade från 0 till 9999, i ett lager. Eftersom det tar tid att gå ut på lagret, väljer du att ha de 100 senaste inne på ditt kontor - en cache. Om du bara använder de 100 senaste rakt av, måste du kolla igenom 100 mappar varenda gång du får en fråga för att se om den du vill ha finns där innan du ens går ut på lagret och hämtar något. Inte så effektivt.

Ett annat sätt hade varit att du tittar på de två sista siffrorna, och sparar i cachen efter detta. Du gör helt enkelt platser numrerade 0-99, och när du sparar en mapp så sparar du den i ett fack som motsvarar de två sista siffrorna i numret. Mapp nummer 1234 sparas alltså i fack nummer 34, och mapp nummer 5678 i fack 78. När det kommer in en fråga om mapp nummer 2222, behöver du bara titta i fack nummer 22 för att se om du har den på kontoret, och annars får du gå ut på lagret. Detta innebär att din latency går ner.

Problemet här är att om du har två mappar med samma slutsiffror som används ofta, så kommer de inte att cachas. Mapp nummer 1122 och mapp nummer 3322 hamnar ju i samma fack, så om man ofta läser bägge två så gör cachen ingen nytta. En lösning då är att göra cachen tvåfaldig (eng. 2-way). Du sparar helt enkelt de två senaste som slutar på varje nummer. Nu har du en cache som är dubbelt så stor, och risken att du får gå ut på lagret är mindre. Nackdelen är dock att du nu måste titta på två ställen innan du går ut på lagret - din latency har gått upp lite. I praktiken märks inte alltid detta eftersom latency är i hela klockcykler, men någonstans går man över en gräns och får lägga på en cykel. Många cachar är 4-way eller 8-way idag.

Men varför måste det bli så, om jag ökar storleken på cachen? Varför kan jag inte bara göra varje ”way” dubbelt så stor? För en människa är det naturligtvis lättare att titta på slutsiffror, men datorn kör ju med binära tal, så varje dubbling måste ju fungera? Det är här x86 visar sitt fula tryne. Jag var inne på detta i ARM-tråden tidigare idag och det är fortfarande komplext med varför, men i korthet: om en ”way” är större än en sida i det virtuella minnessystemet, så måste man hämta flera värden ur cachen och sedan, när svaret från TLBn kommer, kasta bort alla utom ett. Det drar bandbredd och det kostar energi, och det vill man gärna undvika.

Trädvy Permalänk
Medlem
Plats
Trondheim, Norge
Registrerad
Feb 2005
Skrivet av Cadzon:

Och i jämförelse med Intel då?

Samma 4233 och cl14 och samma sekundära och tertiära på Intel borde ge ca 35ns, eller ca 34% mindre latency i samma test.

Ryzen 1700--GTX 1080--Go XLR--Shure SM7B

9900K@5.2--2X8GB G.Skill Ripjaws 3600 @ 4000 16-16-16-34--Inno3D RTX 2080 Ti AIO--Rog Strix Z390-F--Noctua NH-D15

-----------Twitch-------------

Trädvy Permalänk
Medlem
Registrerad
Okt 2011

4233 MT -> 1/4.233 ns = 0.236ns per cykel

Teoretisk gräns vid 14 cycles CAS latency är då
3.3ns

Jag kanske är ute och cyklar men är det inte lite segt att ligga på 10-15 ggr responstiden?

Trädvy Permalänk
Medlem
Registrerad
Okt 2016
Skrivet av medbor:

4233 MT -> 1/4.233 ns = 0.236ns per cykel

Teoretisk gräns vid 14 cycles CAS latency är då
3.3ns

Jag kanske är ute och cyklar men är det inte lite segt att ligga på 10-15 ggr responstiden?

CAS = Column Access Strobe = tiden det tar att få tillbaka data från att du skickat kolumn-adressen - om du redan har rätt rad aktiv! Gör du en slumpvis läsning så är det inte så.

Trädvy Permalänk
Medlem
Registrerad
Okt 2011
Skrivet av mpat:

CAS = Column Access Strobe = tiden det tar att få tillbaka data från att du skickat kolumn-adressen - om du redan har rätt rad aktiv! Gör du en slumpvis läsning så är det inte så.

Ok, bra att veta!

Vad blir då en rimligt slumpmässig access i cykler då? Jag räknade med 14 för att det gavs i exemplet, tror dock inte det är över 100, men jag kan ha fel

Trädvy Permalänk
Medlem
Registrerad
Okt 2016
Skrivet av medbor:

Ok, bra att veta!

Vad blir då en rimligt slumpmässig access i cykler då? Jag räknade med 14 för att det gavs i exemplet, tror dock inte det är över 100, men jag kan ha fel

Du får lägga ihop ett antal saker. För det första måste du lägga till latencyn för sista cachen i processorn, eftersom den inte försöker söka i minnet förrän den inte hittar något där. Den beskrivs vanligen i cykler, så multiplicera med processorns klockfrekvens. Därefter får du lägga ihop de tre siffrorna i minnes-specen (om det t.ex står 14-15-16 så tar du 14+15+16 och får 45) för att få antalet cykler som det tar att få upp första slumpvisa bitten. Detta får då multipliceras med den verkliga klockfrekvensen för minnet - jag tror att du hade den effektiva frekvensen förra gången, vilken är dubbelt så stor eftersom det är DDR. Där någonstans hamnar väl det teoretiska värdet.

Trädvy Permalänk
Datavetare
Plats
Stockholm
Registrerad
Jun 2011
Skrivet av marcusOCZ:

Samma 4233 och cl14 och samma sekundära och tertiära på Intel borde ge ca 35ns, eller ca 34% mindre latency i samma test.

Någonstans där ja

Intels minneslatens beror på faktorer som

  • antal kärnor, latensen över ring-bussen är linjärt proportionellt mot antal kärnor. Zen kör med en crossbar så där är latens oberoende av antal kärnor (däremot är antalet transistorer man behöver i en x-bar kvadratiskt mot antal anslutningar, finns inga gratisluncher...)

  • "uncore" frekvens, d.v.s. frekvensen man kör bl.a. ringbussen på

Däremot undrar jag vad det är som AIDA64 verkligen mäter, hittar ingen superbra beskrivning.

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Mar 2004

@Yoshman: I fallet Ryzen så är ju intercore latency nästan mer intressant, det är det som flaskas av IF, det går tydligen att se i Sisoft Sandra.

3900X X470/NH-D15 32GB-3733 MSI RTX2070 Super Gaming NZXT H700 || 3700X B550/H150i 32GB-3800 GTX1660 Super Cooler Master NR600 || 2700X 32GB-2933 GTX1070FE Phanteks P400 || 6700K 8GB-3200 GTX980FE Silverstone Grandia 09B || 4790K 16GB-2400 GTX970 Antec VSK4000E-U3 https://folding.extremeoverclocking.com/user_summary.php?s=&u...

Trädvy Permalänk
Medlem
Plats
Linköping
Registrerad
Jun 2007
Skrivet av medbor:

4233 MT -> 1/4.233 ns = 0.236ns per cykel

Teoretisk gräns vid 14 cycles CAS latency är då
3.3ns

CL anges i klockcykler, inte överföringscykler, och DDR4-4233 har en klockcykel på 0.472ns eftersom klockfrekvensen ligger på 2116.5 MHz. Minnet i artikeln var iofs. DDR4-4333, vilket ger en klockcykel på 0.462ns, men det spelar väl kanske ingen större roll för frågeställningen.

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Mar 2004
Skrivet av perost:

CL anges i klockcykler, inte överföringscykler, och DDR4-4233 har en klockcykel på 0.472ns eftersom klockfrekvensen ligger på 2116.5 MHz. Minnet i artikeln var iofs. DDR4-4333, vilket ger en klockcykel på 0.462ns, men det spelar väl kanske ingen större roll för frågeställningen.

Det var i vilket fall extremklockat minne och inte speciellt indikativt för vilken prestanda vi kommer att få se inledningsvis.

3900X X470/NH-D15 32GB-3733 MSI RTX2070 Super Gaming NZXT H700 || 3700X B550/H150i 32GB-3800 GTX1660 Super Cooler Master NR600 || 2700X 32GB-2933 GTX1070FE Phanteks P400 || 6700K 8GB-3200 GTX980FE Silverstone Grandia 09B || 4790K 16GB-2400 GTX970 Antec VSK4000E-U3 https://folding.extremeoverclocking.com/user_summary.php?s=&u...

Trädvy Permalänk
Medlem
Registrerad
Nov 2011
Skrivet av Confusion:

Någon som kan förklara för en gammal gubbe hur mindre cache-minne ger lägre minneslatenser?
Min naiva bild av hur det funkar får det inte att gå ihop, om det inte är något med arkitekturen att göra eller specifika tester (som att man hämtar data som inte finns i cache).
Färre kärnor kan jag ju tänkta mig sänker latensen om de delar cache, eftersom det blir _mer_ cache för varje kärna och högre sannolikhet att man behöver gå via slöare minne för att få fram datan.

Tacksam för förtydligande.

Som vissa nämnt så påverkar storleken på cachen. Men. Jag skulle vilja påstå att det är helt fel uttryckt i artikeln. Det är inte tack vare den mindre cachen vi ser den stora skillnaden i latens, utan för att det är en enda krets. I Matisse, alltså vanliga Zen 2-processorer, så är minneskontroller i en separat krets. Det är ett extra hopp till minnet. I Renoir så är CPU, nordbrygga inklusive minneskontroller, och GPU i samma krets. Det ger kortare latenser. Det kan vara så att de anser att de klarar sig med mindre L3 just för att det är så mycket kortare latens till RAM. Det kan alltså vara så att L3 är litet för att RAM-latensen är låg mer än att latens är låg för att L3 är litet.

https://www.sweclockers.com/test/27760-amd-ryzen-9-3900x-och-...

Tycker även att man kunde uttryckt tydligare att man i de modeller som har mer än 2 CCX, alltså CPU-kluster, så har man två kretsar med processorkärnor. Alltså två chiplets.

Trädvy Permalänk
Medlem
Plats
Trondheim, Norge
Registrerad
Feb 2005
Skrivet av the squonk:

Det var i vilket fall extremklockat minne och inte speciellt indikativt för vilken prestanda vi kommer att få se inledningsvis.

Nej, men det ger en pekpinne på vad som är möjligt med Renoir på Desktop. Det är ett jättesprång jämfört med Zen2 vi har idag.

Tyvärr är det fortfarande alltför lite.

Ryzen 1700--GTX 1080--Go XLR--Shure SM7B

9900K@5.2--2X8GB G.Skill Ripjaws 3600 @ 4000 16-16-16-34--Inno3D RTX 2080 Ti AIO--Rog Strix Z390-F--Noctua NH-D15

-----------Twitch-------------

Trädvy Permalänk
Medlem
Plats
Trondheim, Norge
Registrerad
Feb 2005
Skrivet av Aleshi:

Som vissa nämnt så påverkar storleken på cachen. Men. Jag skulle vilja påstå att det är helt fel uttryckt i artikeln. Det är inte tack vare den mindre cachen vi ser den stora skillnaden i latens, utan för att det är en enda krets. I Matisse, alltså vanliga Zen 2-processorer, så är minneskontroller i en separat krets. Det är ett extra hopp till minnet. I Renoir så är CPU, nordbrygga inklusive minneskontroller, och GPU i samma krets. Det ger kortare latenser. Det kan vara så att de anser att de klarar sig med mindre L3 just för att det är så mycket kortare latens till RAM. Det kan alltså vara så att L3 är litet för att RAM-latensen är låg mer än att latens är låg för att L3 är litet.

https://cdn.sweclockers.com/artikel/bild/72039?l=eyJyZXNvdXJjZSI6IlwvYXJ0aWtlbFwvYmlsZFwvNzIwMzkiLCJmaWx0ZXJzIjpbInQ9YXJ0aWNsZUZ1bGwiXSwicGFyYW1zIjp7ImNhY2hlQnVzdGVyIjoiMjAyMDA0MDgifSwia2V5IjoiMzU5MGU4NDNjNDBmYmE2OTJkM2Q3Y2M2MzBlYTRjYmMifQ%3D%3D
https://www.sweclockers.com/test/27760-amd-ryzen-9-3900x-och-...

Tycker även att man kunde uttryckt tydligare att man i de modeller som har mer än 2 CCX, alltså CPU-kluster, så har man två kretsar med processorkärnor. Alltså två chiplets.
https://cdn.sweclockers.com/artikel/bild/72040?l=eyJyZXNvdXJjZSI6IlwvYXJ0aWtlbFwvYmlsZFwvNzIwNDAiLCJmaWx0ZXJzIjpbInQ9YXJ0aWNsZUZ1bGwiXSwicGFyYW1zIjp7ImNhY2hlQnVzdGVyIjoiMjAyMDA0MDgifSwia2V5IjoiYWEzMzI0Yzc2NGY2MTQ5ODI1NGJjMzBmNmNiZTliZjgifQ%3D%3D

Blir spännande att se vad just L3 gör faktist. @Yoshman har en cpu från en generation där det var just cache som var förändringen i princip (och priset på den tiden). Det gav faktist ganska rejäla resultat i spel vill jag minnas.

Ryzen 1700--GTX 1080--Go XLR--Shure SM7B

9900K@5.2--2X8GB G.Skill Ripjaws 3600 @ 4000 16-16-16-34--Inno3D RTX 2080 Ti AIO--Rog Strix Z390-F--Noctua NH-D15

-----------Twitch-------------

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Mar 2004
Skrivet av marcusOCZ:

Tyvärr är det fortfarande alltför lite.

För att få lägre latens än Intel, ja, men för att förbättra generell prestanda och kanske passera Intel i allt annat än latens så är det lovande. Som sagts ovan, min 6700K från 2015 har galet låg latens till minnet men det är inget direkt fartmonster i alla applikationer för det.

3900X X470/NH-D15 32GB-3733 MSI RTX2070 Super Gaming NZXT H700 || 3700X B550/H150i 32GB-3800 GTX1660 Super Cooler Master NR600 || 2700X 32GB-2933 GTX1070FE Phanteks P400 || 6700K 8GB-3200 GTX980FE Silverstone Grandia 09B || 4790K 16GB-2400 GTX970 Antec VSK4000E-U3 https://folding.extremeoverclocking.com/user_summary.php?s=&u...

Trädvy Permalänk
Medlem
Plats
Stockholm
Registrerad
Mar 2004
Skrivet av marcusOCZ:

Blir spännande att se vad just L3 gör faktist. @Yoshman har en cpu från en generation där det var just cache som var förändringen i princip (och priset på den tiden). Det gav faktist ganska rejäla resultat i spel vill jag minnas.

Broadwell med extra L4 cache, det var antagligen för dyrt att använda wafers för L4 för att fortsätta, men det fungerade bra ända tills DDR4 kom upp lite i fart och gjorde den relativt långsamma L4 mer eller mindre onödig.

Nu har ju Zen 3 en intressant förbättring i cache i och med att varje CCD får gemensamt cache för ingående CCX. Zen 2 har ett cache för varje CCX.

3900X X470/NH-D15 32GB-3733 MSI RTX2070 Super Gaming NZXT H700 || 3700X B550/H150i 32GB-3800 GTX1660 Super Cooler Master NR600 || 2700X 32GB-2933 GTX1070FE Phanteks P400 || 6700K 8GB-3200 GTX980FE Silverstone Grandia 09B || 4790K 16GB-2400 GTX970 Antec VSK4000E-U3 https://folding.extremeoverclocking.com/user_summary.php?s=&u...