AMD avslöjar Epyc "Rome" med 64 kärnor Zen 2 och PCI Express 4.0

Permalänk
Medlem

Mycket intressant, ~7% snabbare med ~14% fler kärnor, fast vad som verkligen kommer vara intressant är hur mycket mer/mindre prestanda man får per watt.

Vad bilderna avslöjar så verkar det som att vi får 8-kärniga CCX särade fysiskt, med fyra distinkt separata numa zoner, inte olikt vad vi såg med första generationens EPYC. Den enda skillnaden jag ser är att all traffik för kärnor passerar genom IOX kretsen, vilket jag inte ens vet är positivt eller negativt (snabbare/saktare än nuvarande?).

Vill gärna höra vad @Yoshman har för ord om designen, för jag har ingen aning vad jag ska tolka själv.

EDIT: Glömde att jämföra storlek på kretsar!

Ritade ut vars gamla zeppelin kretsar skulle vara placerade i jämförelse med denna:

Detta visar att 8 kärnor CCX plus PCIe av vad folk verkar skriva tar upp ungefär 1/3 av vad en nuvarande zeppelin krets tar upp. Kretsen i mitten är ca 2x ytan av vad en zeppelin krets är, så det känns som att designen har mer att dölja än bara IO, om detta är pga att L3 är avvisat till IOX (känns inte så troligt) eller något helt annat återstår att se.

Visa signatur

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Permalänk
Hjälpsam
Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Medlem

Ser ut som 8x8 setup så 8 core CCX verkar kunna vara en realitet, det vore inte helt fel, ensam CCX för 8/16 cpu

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Inofficiell ambassadör

Dubblerad prestanda per sockel... när de har dubblerat antal kärnor per sockel. Så ingen ökning av IPC och/eller klockfrekvens???

Skickades från m.sweclockers.com

Visa signatur

Mobo Aorus B550 Pro V2 CPU Ryzen 5600X RAM Corsair Vengance 16GB @ 36000 MHZ
GPU MSI GTX 1080 ti Gaming X Skärm Acer X34A

Permalänk
Avstängd
Skrivet av Xyborg:

Dubblerad prestanda per sockel... när de har dubblerat antal kärnor per sockel. Så ingen ökning av IPC och/eller klockfrekvens???

Skickades från m.sweclockers.com

Flyttals prestanda fyrdubblas.

Visa signatur

2600x||16GB @3000Mhz 14-14-10-14-32-46||Vega 64||1TB SSD||HX1000 plat||FD R6 TG vit||CH VII||H100i V2||SST-ARM22SC||SG 32" QHD 144 Hz VA|| https://folding.extremeoverclocking.com/team_summary.php?s=&t...

Permalänk
Trollfabrik 🫶🏻
Skrivet av wowsers:

Mycket intressant, ~7% snabbare med ~14% fler kärnor, fast vad som verkligen kommer vara intressant är hur mycket mer/mindre prestanda man får per watt.

Vad bilderna avslöjar så verkar det som att vi får 8-kärniga CCX särade fysiskt, med fyra distinkt separata numa zoner, inte olikt vad vi såg med första generationens EPYC. Den enda skillnaden jag ser är att all traffik för kärnor passerar genom IOX kretsen, vilket jag inte ens vet är positivt eller negativt (snabbare/saktare än nuvarande?).

Vill gärna höra vad @Yoshman har för ord om designen, för jag har ingen aning vad jag ska tolka själv.

EDIT: Glömde att jämföra storlek på kretsar!

Ritade ut vars gamla zeppelin kretsar skulle vara placerade i jämförelse med denna:
https://i.imgur.com/oNJ4U9H.jpg
Detta visar att 8 kärnor CCX plus PCIe av vad folk verkar skriva tar upp ungefär 1/3 av vad en nuvarande zeppelin krets tar upp. Kretsen i mitten är ca 2x ytan av vad en zeppelin krets är, så det känns som att designen har mer att dölja än bara IO, om detta är pga att L3 är avvisat till IOX (känns inte så troligt) eller något helt annat återstår att se.

Nu har jag inte hunnit kolla på kretsstorlekar och ha nån utarbetad gissning själv, men I/O tar väl upp en rätt ansenlig del av ytan i en Zeppelin-krets? IOX-kretsen tillverkas fortfarande på 14 nanometer och ska husera alla åtta minneskanaler, 128 stycken PCI Express 4.0 samt allra minst (för bakåtkompatibilitet) all annan I/O som Zeppelin huserar. På det bör det rimligen gå åt en hel del yta för att kommunicera (åtta Infinity Fabric-bussar) med de åtta beräkningskretsarna. Tycker ändå inte storleken på IOX är allt för anmärkningsvärd när jag funderar på vad som måste finnas där.

Skrivet av Ratatosk:

Ett monster.
Visar sig att ryktena om 8 CCX och en central krests för IO verkar stämma.

Skrivet av tellus82:

Ser ut som 8x8 setup så 8 core CCX verkar kunna vara en realitet, det vore inte helt fel, ensam CCX för 8/16 cpu

Åtta kärnor per CCX känns ändå rimligt, likaså att 8 kärnor/16 trådar består för AM4. Har alltid känts i överkant att AMD skulle höja antalet kärnor på sin mainstreamplattform. Ser fram emot att testa Zen 2 i vår!

Skrivet av Xyborg:

Dubblerad prestanda per sockel... när de har dubblerat antal kärnor per sockel. Så ingen ökning av IPC och/eller klockfrekvens???

Skickades från m.sweclockers.com

Man får ha i åtanke att saker inte skalar perfekt och att saker som interconnect (det AMD kallar Infinity Fabric) rimligen bör ta en allt större del av strömbudgeten med så här många kärnor. Om de lyckats bibehålla liknande klockfrekvenser som Epyc "Naples" till samma strömförbrukning är det en stor bedrift och ett gigantiskt kliv för en generation. Att IPC blir högre över brädet är redan givet (i synnerhet vid flyttal), frågan är hur mycket och i vilka scenarion.

Visa signatur

Kontaktas enklast via PM. Önskas svar i forumet citera mina inlägg eller pinga @Jacob. Finns även på Twitter.

"Science and technology have progressed to the point where what we build is only constrained by the limits of our own imaginations." – Justin R. Rattner

Permalänk
Medlem

Kommer gå åt en solid klick med koppar till den där.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--RTX 2080Ti--Gigabyte Z690 Aorus Master--4X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B
Skärmar: Neo G8 4K 240hz--Huawei 3440x1440 165hz

Permalänk
Inaktiv

Angående satsning på flyttalsdelen så kan man tycka att detta skulle kunna köras på grafikkortet. Men det är väldigt svårt att utnyttja grafikkort i lite mer bättre datorer, först och främst bör man slänga allt vad Nvida Geforce heter rakt ner i papperskorgen och sedan skaffa ett riktigt grafikkort som Nvida Quadro. Men hur lätt är det att säg 50 instanser av olika vm att utnyttja ett sådant kort? PCI passthrough låser väl kortet till ett vm?

Jag personligen hade dock nu klarat mig med flyttalsdelen, det jag stör mig på är att det är så omständligt/svårt att få ut grafikprestanda från grafikkort till just grafik. Vilket bättre flyttalsdel på Epic inte hjälper något med. Har man som sagt 50st VM igång och alla ska nyttja kraften från sitt grafikkort så blir det problem.

Permalänk
Hjälpsam
Skrivet av wowsers:

Mycket intressant, ~7% snabbare med ~14% fler kärnor, fast vad som verkligen kommer vara intressant är hur mycket mer/mindre prestanda man får per watt.

Vad bilderna avslöjar så verkar det som att vi får 8-kärniga CCX särade fysiskt, med fyra distinkt separata numa zoner, inte olikt vad vi såg med första generationens EPYC. Den enda skillnaden jag ser är att all traffik för kärnor passerar genom IOX kretsen, vilket jag inte ens vet är positivt eller negativt (snabbare/saktare än nuvarande?).

Vill gärna höra vad @Yoshman har för ord om designen, för jag har ingen aning vad jag ska tolka själv.

EDIT: Glömde att jämföra storlek på kretsar!

Ritade ut vars gamla zeppelin kretsar skulle vara placerade i jämförelse med denna:
https://i.imgur.com/oNJ4U9H.jpg
Detta visar att 8 kärnor CCX plus PCIe av vad folk verkar skriva tar upp ungefär 1/3 av vad en nuvarande zeppelin krets tar upp. Kretsen i mitten är ca 2x ytan av vad en zeppelin krets är, så det känns som att designen har mer att dölja än bara IO, om detta är pga att L3 är avvisat till IOX (känns inte så troligt) eller något helt annat återstår att se.

Misstänker en bla en massiv Cache.
Tror inte att CCX klustren kommunicerar med IO delen via ett annat CCX, de kopplas nog in ganska lika, däremot finns säkert en intern kommunikation mellan klustrerna.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Medlem

Hoppas på att konsumentversionen av Zen 2 blir riktigt bra. 3700X eller vad den kan tänkas heta.

Visa signatur

Asus B650 TUF, Ryzen 7600X, 32GB 6000mhz DDR5, Corsair RM1000X, Powercolor 6900XT Red Devil Ultimate, 360mm Corsair AIO, MSI Velox 100P Airflow. Kingston KC3000 M.2.

Permalänk
Medlem
Skrivet av jacozz:

Själv undrar jag mest vad detta innebär för nästa generation Ryzen för oss hemma-PC-användare.

* Bättre prestanda/effekt-förhållande. Definitivt!
* Med största sannolikhet högre prestanda.
* Förhoppningsvis stöd för PCIe 4.0 (i kombination med nytt moderkort, men jag kommer behålla mitt gamla).

Skrivet av VadSaDu:

PCI-E 4.0, skulle inte den kunna leverera en massa extra spänning?

Finns inte en chans att de ökar från 12V.

Skrivet av JBerger:

... Företag skiter i om en processor kostar 40 eller 80 tusen när konsulten kostar flera tusen i timmen; det är småpotatis i jämförelse).

Skrivet av anon159643:

Talar du från egen erfarenhet att företag brukar köpa det bästa av allt? Min erfarenhet är det mycket dritt som de kör med och det ska snålas till den förbannelse på allt. Detta från mellanstora till de absolut största företagen i landet.

Oftare tittas väl på totalkostnaden och ROI?
I vissa specifika fall är få kärnor det ekonomiskt mest fördelaktiga på grund av hur programlicenserna är uppbyggda. Då vinner Intel.

Skrivet av Baxtex:

... Inte som att Intel skulle skicka några pre production samples till AMD direkt för att benchmarka.

Hmm... Vi jämför vår processor som är ett halvår från release med konkurrentens som är ett år från release... undrar vilken som har minst buggar vinner?

Skrivet av Ratatosk:

Visar sig att ryktena om 8 CCX ...

Skrivet av wowsers:

Vad bilderna avslöjar så verkar det som att vi får 8-kärniga CCX särade fysiskt, ...

Tror ni verkligen de gjort om Zen så mycket?
Befintliga processorer har ju fyra kärnor per CCX, med två CCX per Zeppelin (åtta kärnor) som minsta enhet.
Jag utgår ifrån att det är åtta (uppdaterade) Zeppelin med två CCX i varje!

Skrivet av wowsers:

Mycket intressant, ~7% snabbare med ~14% fler kärnor, fast vad som verkligen kommer vara intressant är hur mycket mer/mindre prestanda man får per watt.

Mycket bättre. I/O-delen har (nästan) inget att vinna på krympning när det kommer till effektivitet.

Skrivet av wowsers:

... all trafik för kärnor passerar genom IOX kretsen, vilket jag inte ens vet är positivt eller negativt (snabbare/saktare än nuvarande?).

Jim har kollat mycket på egenskaperna för chiplets:

Permalänk
Medlem
Skrivet av Jacob:

Nu har jag inte hunnit kolla på kretsstorlekar och ha nån utarbetad gissning själv, men I/O tar väl upp en rätt ansenlig del av ytan i en Zeppelin-krets? IOX-kretsen tillverkas fortfarande på 14 nanometer och ska husera alla åtta minneskanaler, 128 stycken PCI Express 4.0 samt allra minst (för bakåtkompatibilitet) all annan I/O som Zeppelin huserar. På det bör det rimligen gå åt en hel del yta för att kommunicera (åtta Infinity Fabric-bussar) med de åtta beräkningskretsarna. Tycker ändå inte storleken på IOX är allt för anmärkningsvärd när jag funderar på vad som måste finnas där.
Åtta kärnor per CCX känns ändå rimligt, likaså att 8 kärnor/16 trådar består för AM4. Har alltid känts i överkant att AMD skulle höja antalet kärnor på sin mainstreamplattform. Ser fram emot att testa Zen 2 i vår!
Man får ha i åtanke att saker inte skalar perfekt och att saker som interconnect (det AMD kallar Infinity Fabric) rimligen bör ta en allt större del av strömbudgeten med så här många kärnor. Om de lyckats bibehålla liknande klockfrekvenser som Epyc "Naples" till samma strömförbrukning är det en stor bedrift och ett gigantiskt kliv för en generation. Att IPC blir högre över brädet är redan givet (i synnerhet vid flyttal), frågan är hur mycket och i vilka scenarion.

Är väl ändå kring klustren som är flaskhalsen i konsumentversionen. Spelar ingen roll vilken förbättreing av IPC eller hur mycket frekvens man kan få ut när det stoppar någon annanstans. När dom mer eller mindre tvingar folk till EN produsent av minneskretsar för att få ut i närheten av det konkurrenten får ut och fortfarande ligger minst 10% efter idag, så tvivlar jag på att dom gör det samma igen.

En Ryzen idag med 2666 minne i CL16 eller trögare är seriöst gimpad på många ställen. Det säger jag som Ryzenägare och som är jättenöjd.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--RTX 2080Ti--Gigabyte Z690 Aorus Master--4X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B
Skärmar: Neo G8 4K 240hz--Huawei 3440x1440 165hz

Permalänk
Hjälpsam

@Olle P: Med ryktena om 8 CCX menade jag 8 st CCX-kluster med 2*4 kärnor, vilket ger 64 kärnor totalt.
Skall förtydliga.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Medlem
Skrivet av Zilanto:

Undra om PCI-E 4.0 kommer till konsumentprodukterna med Zen 2 också. Om de kommer så är det en given uppgradering nästa år för mig i alla fall.

Utveckling är bra absolut, men av ren nyfikenhet vad får dig att se pärleporten med version 4.0 mot tidigare 3.0. Konsumentledet nyttjar iprincip bara gpuer med 3.0 och prestandan mellan 8x och 16x läge är försumbar. 4.0 och dess massiva bandbredd kommer alltså inte komma till nytta i huvudtaget.

Permalänk
Medlem
Skrivet av marcusOCZ:

Är väl ändå kring klustren som är flaskhalsen i konsumentversionen. Spelar ingen roll vilken förbättreing av IPC eller hur mycket frekvens man kan få ut när det stoppar någon annanstans. När dom mer eller mindre tvingar folk till EN produsent av minneskretsar för att få ut i närheten av det konkurrenten får ut och fortfarande ligger minst 10% efter idag, så tvivlar jag på att dom gör det samma igen.

En Ryzen idag med 2666 minne i CL16 eller trögare är seriöst gimpad på många ställen. Det säger jag som Ryzenägare och som är jättenöjd.

Ryzen 2 (Zen+) hade inte alls samma problem med minnen som Ryzen (Zen) hade, så det kommer med största sannolikhet inte vara något problem nu heller

Visa signatur

CPU: R7 5800X3D | GPU: XFX 6900XT Merc 319 | MB: Gigabyte X570 PRO-I| RAM: 2x16 Corsair LPX@3600MHz CL18|Cooling: Scythe Ninja 5 (Noctua A12x25)|PSU: Corsair SF750|SSD: Samsung 970 EVO Plus 1TB + Corsair MP510 4TB + Samsung 850 EVO 2TB + Samsung 850 PRO 2TB|CASE:NR200P

Permalänk
Medlem

Nu är Rome bara ett test men om AMD menar på att 7nm och deras nya teknologi ger 2 sek bättre tid så meh..
Men tar gladeligen PCI-E 4.0 och 7nm överlag välkommet

Visa signatur

Star Citizen ❤

Permalänk
Medlem
Skrivet av Triton242:

Utveckling är bra absolut, men av ren nyfikenhet vad får dig att se pärleporten med version 4.0 mot tidigare 3.0. Konsumentledet nyttjar iprincip bara gpuer med 3.0 och prestandan mellan 8x och 16x läge är försumbar. 4.0 och dess massiva bandbredd kommer alltså inte komma till nytta i huvudtaget.

Vad jag vet är varken Xeon eller Epyc särskilt inriktade mot vanliga konsumenter privat.
PCI-E 4.0 ger oss möjligheten till snabbare NVMe raid prestanda. Kommer ju kunna cruncha höga siffror disk data

Visa signatur

Star Citizen ❤

Permalänk
Medlem

Jag är mest glad åt PCI-Express 4

Visa signatur

.: Learn the system, Play the system, Break the system :.

Permalänk
Inofficiell ambassadör
Skrivet av Jacob:

Åtta kärnor per CCX känns ändå rimligt, likaså att 8 kärnor/16 trådar består för AM4. Har alltid känts i överkant att AMD skulle höja antalet kärnor på sin mainstreamplattform. Ser fram emot att testa Zen 2 i vår!

Man får ha i åtanke att saker inte skalar perfekt och att saker som interconnect (det AMD kallar Infinity Fabric) rimligen bör ta en allt större del av strömbudgeten med så här många kärnor. Om de lyckats bibehålla liknande klockfrekvenser som Epyc "Naples" till samma strömförbrukning är det en stor bedrift och ett gigantiskt kliv för en generation. Att IPC blir högre över brädet är redan givet (i synnerhet vid flyttal), frågan är hur mycket och i vilka scenarion.

Då lät det ju helt plötsligt lite mer lovande igen! Jag ser verkligen fram emot testerna i vår!

Visa signatur

Mobo Aorus B550 Pro V2 CPU Ryzen 5600X RAM Corsair Vengance 16GB @ 36000 MHZ
GPU MSI GTX 1080 ti Gaming X Skärm Acer X34A

Permalänk
Medlem

Någon som reagerar på att vi börjar närma oss en sådan här mer och mer?

https://cdn.instructables.com/F5V/GNWD/HCB8I98S/F5VGNWDHCB8I9...

Bara jag som blir orolig?

Permalänk
Medlem
Skrivet av Tomika:

Nu är Rome bara ett test men om AMD menar på att 7nm och deras nya teknologi ger 2 sek bättre tid så meh..
Men tar gladeligen PCI-E 4.0 och 7nm överlag välkommet

det var 2 sekunder bättre tid jämfört med ett 2x28c xeon platinum-system

Visa signatur

CPU: R7 5800X3D | GPU: XFX 6900XT Merc 319 | MB: Gigabyte X570 PRO-I| RAM: 2x16 Corsair LPX@3600MHz CL18|Cooling: Scythe Ninja 5 (Noctua A12x25)|PSU: Corsair SF750|SSD: Samsung 970 EVO Plus 1TB + Corsair MP510 4TB + Samsung 850 EVO 2TB + Samsung 850 PRO 2TB|CASE:NR200P

Permalänk
Datavetare

Tycker det kvarstår ett rätt rejält frågetecken kring hur mycket desktop Zen2 kommer skilja sig från server Zen2. Personligen tror jag det är ett misstag att försöka återanvända allt för mycket i båda segmenten då deras krav har divergerat rätt kraftigt senaste 10-15 åren.

Ser flera dra slutsatsen att CPU-kretsarna numera skulle bestå av en CCX med 8-kärnor. Finns det någon konkret information alls som pekar på detta? Det som talar emot är

  • man verkar inte ha ändrat mikroarkitekturen speciellt mycket utöver att öka bredden på SIMD-enheterna till 256-bitar

  • kärnor och L3$ är ihopkopplade med en cross-bar i Zen, om man inte ändrat detta till Zen2 känns 8 kärnor per CCX rätt osannolikt då antalet transistorer ökar exponentiellt(!) med antalet kopplingar i en x-bar. X-bar har fördelar i att ha väldigt låg och helt homogen latens för alla noder, nackdelen är hur den skalar

Också rätt mycket spekulation kring om PCIe-kontroller ligger i I/O-kretsen eller i CPU-kretsarna. AnandTech spekulerar att PCIe ligger i CPU-kretsarna, vilket beroende på hur man tänkt göra desktop-varianten kan vara vettigt. Men hoppas ändå AT spekulerar fel här och finns lite saker som blir konstigt om PCIe-kontroller inte ligger i I/O-kretsen.

Både Epyc och Ryzen är pin-kompatibel, så antalet PCIe lär vara det samma. Då man dubblat antalet CPU-kretsar i Epyc Rome skulle endera hälften av kretsarna ha 32-PCIe (vilket är fallet i Zen1) alt. så skulle alla fått 16-PCIe vilket ställer till det för desktop då den plattformen behöver 24 PCIe (16 till GPU och liknande, 4 är dedicerade till NVMe samt 4 går till chipset). Ligger PCIe-kontroller i I/O-chippet krävs bara en variant av kretsen för desktop (om nu desktop ens har en I/O-krets).

Sågade Epyc Naples designen vid fotknölarna när den lanserades förra året, en sågning som sågades av den AMD-vänliga expertpanelen här på forumet (tydligen var problemet bara att vi programmerare inte är kapabla att lösa saker som att kommunicera snabbare än ljuset och så...). Tycker ändå det faktum att man helt designade om den delen pekar på att man efter två försök (Magny Cours och Epyc Naples) med i princip identiskt resultat borde kunna dra slutsatsen att det inte är en gångbar väg.

Vad man nu har gjort kommer fungera, det är en redan beprövad teknik. Vad man gör nu är på ett logiskt plan helt identiskt med tidigare front-side bus + north-bridge. Är ju det Intel gjorde med Core2Quad (två klistrade kärnor, men OS:et samt program såg och kunde jobba med resultatet som en CPU inte som flera separata CPUer som råkar dela paket).

Faktum är att IBM har en produkt med väldigt snarlik design, zEnterprise 196

CPU-krets

I/O-krets

Flera CPU chiplets kopplade till en I/O-krets

Och rimligen borde förklaringen till den väldigt stora I/O-kretsen i Epyc Rome ligga i att man stoppat dit en relativt stor L4$.

Att återgå till en front-side bus (som nu råkar prata infinity fabric protokollet) och north-bridge ger högre minneslatens. Går inte att fixa latensen mot RAM, men däremot kan man minska genomsnittlig latens som CPU-kretsarna "ser" genom att stoppa in L4$ i I/O-kretsen.

På det stora hela: detta är, till skillnad från Naples, "chiplets done right"!!!

Ovan ställer än mer frågetecken kring hur desktop Zen2 kommer se ut. En stor L4$ är inte direkt billig och även om en sådan minskar genomsnittlig latens så ökar varje extra nivå av cache latens mot RAM. För desktop är latens viktigare än för servers, så frågan är om man ändå skapar en speciell desktop variant av CPU-kretsen där minneskontroller fortfarande är integrerad.

Om så är fallet lär vi se samma sak mellan Ryzen och Threadripper som vi ser mellan SKL-S och SKL-X, HEDT kommer tappa prestanda relativt konsumentversioner för de flesta program. Självklart finns nischer där HEDT ändå är vettig, men det blir då som SKL-X där nischen klart krymper i storlek.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

@sweisdapro: Ja, och 28x2 = ?. Så för att vara 7nm är jag inte imponerad av prestandan i Rome jämfört mot nuvarande 8180 x 2.

Visa signatur

Star Citizen ❤

Permalänk
Datavetare
Skrivet av Esseboy:

Flyttals prestanda fyrdubblas.

Detta är exempel på lysande PR!

AMD uttalande om fördubblad flyttalsprestanda per kärna och cykel är tekniskt sett helt korrekt.

Man körde även en C-ray demo, som de med lite teknisk koll vet är i princip en ren flyttalsdemo som likt Cinebench är "embarrassingly parallel" samt körs helt ur lokal L1/L2 cache och därför skalar perfekt med CPU-kärnor. Där visar man att en single-socket Epyc Rome är snabbare än en toppmodellen av dual socket Skylake SP.

Slutsats man vet väldigt många kommer dra: flyttalsprestanda är generellt sett bättre i Zen2 jämfört med Skylake SP och demon visade rimligen att man verkligen har fyrdubblat flyttalskapacitet (för vem har koll på hur Intels system stod sig mot Epyc Naples?).

Vad ovan egentligen säger: flyttalsprestanda fyrdubblades inte i det generella fallet, man fyrdubblade SIMD-kapaciteten. Det är ändå väldigt bra då alla moderna program som är flyttalsberoende använder i praktiken SIMD. Man fördubblade den skalära flyttalsprestandan, det enbart då man fördubblade antalet CPU-kärnor.

C-ray använder överhuvudtaget inte SIMD, det använder 1900-tals skalära flyttalsberäkningar där redan Zen drog helt jämnt med Skylake (och Skylake är bara marginellt bättre än någon annan Core-design på denna punkt).

En fördubbling av SIMD-prestanda tar AMD från att vara 1/4 så snabb som Skylake SP räknat per cykel och kärna till att nu vara 1/2 så snabb. Undrar varför man inte körde en demo med något av de program man pratade om tidigare i presentationen, d.v.s. de som faktiskt körs i dagens datacenter och på HPC? D.v.s. de som drar nytta av SIMD.

Däremot kommer man nu dra jämnt med Intel på konsumentsidan sett till SIMD, Cannon Lake / Ice Lake har AVX-512 men alla siffror (inklusive läckta GB4 för Ice Lake) pekar på att man ändå stannat på 256-bitars data-väg!

Det skrivet: Epyc Rome kommer vara lysande på HPC laster då många av dessa inte har rå beräkningskraft som primär flaskhals utan minnesbandbredd. Det är t.ex. orsaken varför Crays highest-end superdator inte kör Skylake SP eller Epyc, den kör Cavium Thunder X2 som har en monolitisk CPU med 8 minneskanaler.

Epyc har mer bandbredd per socket jämfört med både Skylake SP och kommande Cascade Lake SP så man kommer så sig riktigt väl i många HPC-laster. Dock har Rome mindre bandbredd per socket än Cascade Lake AP, det och flera andra saker indikerar att AP inte är en generell serverprodukt utan en nischprodukt för HPC (t.ex. om ryktet att AP saknar SMT är det ännu en indikation på en nischad HPC-produkt, SMT avaktiveras ofta i HPC-laster men är normalt väldigt användbart i servers).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Tomika:

@sweisdapro: Ja, och 28x2 = ?. Så för att vara 7nm är jag inte imponerad av prestandan i Rome jämfört mot nuvarande 8180 x 2.

Tror man ska se lite förbi rå-prestandan i detta fall (dessutom är det en demo-produkt)
https://www.komplett.se/product/965188/datorutrustning/datork...
8180 har 205W TDP, och 115k som pris, vilket sätter intels CPU-kostnad till 230k, och en TDP på 405W
Ligger AMD på samma TDP som förut , och liknande pris, är detta enormt imponerande

Visa signatur

CPU: R7 5800X3D | GPU: XFX 6900XT Merc 319 | MB: Gigabyte X570 PRO-I| RAM: 2x16 Corsair LPX@3600MHz CL18|Cooling: Scythe Ninja 5 (Noctua A12x25)|PSU: Corsair SF750|SSD: Samsung 970 EVO Plus 1TB + Corsair MP510 4TB + Samsung 850 EVO 2TB + Samsung 850 PRO 2TB|CASE:NR200P

Permalänk
Medlem
Skrivet av Tomika:

@sweisdapro: Ja, och 28x2 = ?. Så för att vara 7nm är jag inte imponerad av prestandan i Rome jämfört mot nuvarande 8180 x 2.

Du kanske skulle fundera dels vad 2st 8180 kostar och dels vad dom drar i ström och hur begränsad den plattformen blir i jämförelse,128 lanes pci-e 4 för ensam sockel är inte illa pinkat med nya epyc. Att lyckas med bedriften att få 9 dies på samma interposer och att få upp antalet kärnor till 64 med ökad bredd på flyttal per cpu kärna från 128 bit till 256, detta enligt AMD till samma strömbudget som nuvarande 32 kärniga. Tycker du att det verkligen inte är imponerande?

Skickades från m.sweclockers.com

Visa signatur

| nVidia RTX3090FE | R9 5950x | MSI x570 Unify | Ballistix sport 3000c15 32GB DR@3800c16 | Custom Loop EKWB | 9TB nvme, 3TB sata SSD | RM1000x | Creative X4 | Lian Li o11 Dynamic | Alienware aw3821dw | >Zen2 på 3-400 mobo< | >x570 VRM< | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Permalänk
Medlem
Skrivet av Yoshman:

... frågetecken kring hur mycket desktop Zen2 kommer skilja sig från server Zen2. Personligen tror jag det är ett misstag att försöka återanvända allt för mycket i båda segmenten då deras krav har divergerat rätt kraftigt senaste 10-15 åren.

Jag håller med om divergerande krav.
Konsumentprocessorn behöver inte massor av kärnor, utan hellre färre snabba.

Skrivet av Yoshman:

Ser flera dra slutsatsen att CPU-kretsarna numera skulle bestå av en CCX med 8-kärnor. Finns det någon konkret information alls som pekar på detta? ...
... frågan är om man ändå skapar en speciell desktop variant av CPU-kretsen där minneskontroller fortfarande är integrerad.

Jag utgår från att varje chiplet är en krympt version av Zeppelin, som i princip är en komplett CPU med två stycken CCX.
Då kan nya Ryzen (upp till åtta kärnor) innehålla en sådan chiplet, utan behov av separat I/O-krets.

Permalänk
Medlem

@Tomika: Jag kanske tolkade inlägget fel, jag uppffattade uppgradering som något du tänkte för konsumentplatform.
Självklart finns det användningsområden men inte mycket på konsument nivå, därav mitt svar.

Permalänk
Medlem
Skrivet av sweisdapro:

Ryzen 2 (Zen+) hade inte alls samma problem med minnen som Ryzen (Zen) hade, så det kommer med största sannolikhet inte vara något problem nu heller

Det är brist på prestandan som är det generella problemet. Inkompabilitet var det första som i stort sett lösts med Zen+. På minnebandbredd har inte Ryzen en chans mot dagens Intel. 4000 mhz klaras det enkelt på Intel. Det är många spel som visar på bättre prestanda med bättre bandbredd på minnet när man kommer upp i de hastigheterna.

Visa signatur

14900KF--Apex Encore--RTX 4090--G.Skill 2x24GB DDR5-8000--Dynamic Evo XL
12900K--RTX 2080Ti--Gigabyte Z690 Aorus Master--4X16GB DDR5 6000
Ljud: Lewitt Connect 6--Shure SM7B
Skärmar: Neo G8 4K 240hz--Huawei 3440x1440 165hz

Permalänk
Medlem
Skrivet av Tomika:

Nu är Rome bara ett test men om AMD menar på att 7nm och deras nya teknologi ger 2 sek bättre tid så meh..
Men tar gladeligen PCI-E 4.0 och 7nm överlag välkommet

2 sekunder bättre än Intels dual-socket. Färre socklar är alltid att föredra, så att kunna byta ner till singel-socket utan att förlora prestanda (t.o.m bättre prestanda!) är väl inget annat än fantastiskt?