AMD avslöjar Epyc "Rome" med 64 kärnor Zen 2 och PCI Express 4.0

Trädvy Permalänk
Medlem
Registrerad
Jul 2015

Mycket intressant, ~7% snabbare med ~14% fler kärnor, fast vad som verkligen kommer vara intressant är hur mycket mer/mindre prestanda man får per watt.

Vad bilderna avslöjar så verkar det som att vi får 8-kärniga CCX särade fysiskt, med fyra distinkt separata numa zoner, inte olikt vad vi såg med första generationens EPYC. Den enda skillnaden jag ser är att all traffik för kärnor passerar genom IOX kretsen, vilket jag inte ens vet är positivt eller negativt (snabbare/saktare än nuvarande?).

Vill gärna höra vad @Yoshman har för ord om designen, för jag har ingen aning vad jag ska tolka själv.

EDIT: Glömde att jämföra storlek på kretsar!

Ritade ut vars gamla zeppelin kretsar skulle vara placerade i jämförelse med denna:

Detta visar att 8 kärnor CCX plus PCIe av vad folk verkar skriva tar upp ungefär 1/3 av vad en nuvarande zeppelin krets tar upp. Kretsen i mitten är ca 2x ytan av vad en zeppelin krets är, så det känns som att designen har mer att dölja än bara IO, om detta är pga att L3 är avvisat till IOX (känns inte så troligt) eller något helt annat återstår att se.

"Oh glorious cheeseburger… we bow to thee. The secrets of the universe are between the buns..."
"All my farts come straight from hell, you're already dead if you notice a smell"

Trädvy Permalänk
Hjälpsam
Plats
Karlskoga
Registrerad
Jan 2007

AMD Ryzen 7 1700 | Vega RX 64 | https://valid.x86.fr/fgqnte | Stockkylaren | Bitfenix Whisper M 750W | Corsair 600T Graphite vit.
AMD FX8350 | Polaris RX 460 4 GB | https://valid.x86.fr/0q5pkm | Cooler Master V 700W | 32 GB ECC-Minnen.
HTPC | https://valid.x86.fr/ez1zxw |

Trädvy Permalänk
Medlem
Plats
Sälen
Registrerad
Maj 2004

Ser ut som 8x8 setup så 8 core CCX verkar kunna vara en realitet, det vore inte helt fel, ensam CCX för 8/16 cpu

3DMark | R7 1800x | Asrock X370 Prof. Gaming | Corsair 16GB LPX 3733 c17 (sr-bdie@ 3466c14) | Corsair h150i Pro | MSI GTX1080 Gaming X | 500GB 970EVO, 1050GB MX300, 2x 120GB 510, 3TB 7200rpm | RM750x | Xonar Phoebus | Phanteks Enthoo Evolv Atx | Acer Z35 | Logitech G810 & SS Rival 500 | Xbox One | Elite Controller | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Trädvy Permalänk
Inofficiell ambassadör
Plats
Gävle
Registrerad
Jan 2011

Dubblerad prestanda per sockel... när de har dubblerat antal kärnor per sockel. Så ingen ökning av IPC och/eller klockfrekvens???

Skickades från m.sweclockers.com

Mobo MSI Z97 Gaming 5 CPU Intel i7 4790k: 4,6 Ghz @ 1,26v RAM Corsair Vengange Pro 16GB @ 2400MHZ
GPU MSI GTX 1080 ti Gaming X Skärm Acer X34A

Trädvy Permalänk
Medlem
Plats
Finland
Registrerad
Jul 2009
Skrivet av Xyborg:

Dubblerad prestanda per sockel... när de har dubblerat antal kärnor per sockel. Så ingen ökning av IPC och/eller klockfrekvens???

Skickades från m.sweclockers.com

Flyttals prestanda fyrdubblas.

2700x @4,4 Ghz,1,47 8C/8T || 16GB DDR4 @3200 Mhz @14-14-14-30-44-307-1T || RX Vega 64 Strix @1,4 Ghz Core, 0,9 Ghz Mem @0,85 V @150 W (BFV)|| 1TB SSD (MX500) || Corsair HX1000 platinum || FD R6 TS vit (Noctua & Noiseblocker fläktar) || Crosshair Hero VII || Corsair H100i V2|| Silverstone SST-ARM22SC skärmstativ || Samsung 32" QHD 144 Hz VA + Asus 27" FHD 60 Hz IPS ||

Trädvy Permalänk
Chefredaktör
Jacob Hugosson
Plats
Gävle
Registrerad
Okt 2007
Skrivet av wowsers:

Mycket intressant, ~7% snabbare med ~14% fler kärnor, fast vad som verkligen kommer vara intressant är hur mycket mer/mindre prestanda man får per watt.

Vad bilderna avslöjar så verkar det som att vi får 8-kärniga CCX särade fysiskt, med fyra distinkt separata numa zoner, inte olikt vad vi såg med första generationens EPYC. Den enda skillnaden jag ser är att all traffik för kärnor passerar genom IOX kretsen, vilket jag inte ens vet är positivt eller negativt (snabbare/saktare än nuvarande?).

Vill gärna höra vad @Yoshman har för ord om designen, för jag har ingen aning vad jag ska tolka själv.

EDIT: Glömde att jämföra storlek på kretsar!

Ritade ut vars gamla zeppelin kretsar skulle vara placerade i jämförelse med denna:
https://i.imgur.com/oNJ4U9H.jpg
Detta visar att 8 kärnor CCX plus PCIe av vad folk verkar skriva tar upp ungefär 1/3 av vad en nuvarande zeppelin krets tar upp. Kretsen i mitten är ca 2x ytan av vad en zeppelin krets är, så det känns som att designen har mer att dölja än bara IO, om detta är pga att L3 är avvisat till IOX (känns inte så troligt) eller något helt annat återstår att se.

Nu har jag inte hunnit kolla på kretsstorlekar och ha nån utarbetad gissning själv, men I/O tar väl upp en rätt ansenlig del av ytan i en Zeppelin-krets? IOX-kretsen tillverkas fortfarande på 14 nanometer och ska husera alla åtta minneskanaler, 128 stycken PCI Express 4.0 samt allra minst (för bakåtkompatibilitet) all annan I/O som Zeppelin huserar. På det bör det rimligen gå åt en hel del yta för att kommunicera (åtta Infinity Fabric-bussar) med de åtta beräkningskretsarna. Tycker ändå inte storleken på IOX är allt för anmärkningsvärd när jag funderar på vad som måste finnas där.

Skrivet av Ratatosk:

Ett monster.
Visar sig att ryktena om 8 CCX och en central krests för IO verkar stämma.

Skrivet av tellus82:

Ser ut som 8x8 setup så 8 core CCX verkar kunna vara en realitet, det vore inte helt fel, ensam CCX för 8/16 cpu

Åtta kärnor per CCX känns ändå rimligt, likaså att 8 kärnor/16 trådar består för AM4. Har alltid känts i överkant att AMD skulle höja antalet kärnor på sin mainstreamplattform. Ser fram emot att testa Zen 2 i vår!

Skrivet av Xyborg:

Dubblerad prestanda per sockel... när de har dubblerat antal kärnor per sockel. Så ingen ökning av IPC och/eller klockfrekvens???

Skickades från m.sweclockers.com

Man får ha i åtanke att saker inte skalar perfekt och att saker som interconnect (det AMD kallar Infinity Fabric) rimligen bör ta en allt större del av strömbudgeten med så här många kärnor. Om de lyckats bibehålla liknande klockfrekvenser som Epyc "Naples" till samma strömförbrukning är det en stor bedrift och ett gigantiskt kliv för en generation. Att IPC blir högre över brädet är redan givet (i synnerhet vid flyttal), frågan är hur mycket och i vilka scenarion.

Kontaktas enklast via PM, nyhetstips skickas helst genom SweClockers kontaktformulär. Önskas svar i forumet citera mina inlägg eller pinga @Jacob. Finns även på Twitter.

"Science and technology have progressed to the point where what we build is only constrained by the limits of our own imaginations." – Justin R. Rattner

Trädvy Permalänk
Medlem
Plats
Trondheim, Norge
Registrerad
Feb 2005

Kommer gå åt en solid klick med koppar till den där.

Ryzen 1700 @3750--2X8GB G.Skill 3600 @3333mhz-14-14-14-14-30-44--GTX 1080 med Corsair H105 plus Kraken adapter--EK Kylning på CPU-EVGA 850 G3--Handfull SSD

9900K@5.2--2X8GB G.Skill Ripjaws 3600 @ 4133 17-17-17-36--Gigabyte Windforce 2080 TI--Rog Strix Z390-F--Noctua NH-D15

-----------Twitch-------------

Trädvy Permalänk
Medlem
Plats
Karlstad
Registrerad
Nov 2010

Angående satsning på flyttalsdelen så kan man tycka att detta skulle kunna köras på grafikkortet. Men det är väldigt svårt att utnyttja grafikkort i lite mer bättre datorer, först och främst bör man slänga allt vad Nvida Geforce heter rakt ner i papperskorgen och sedan skaffa ett riktigt grafikkort som Nvida Quadro. Men hur lätt är det att säg 50 instanser av olika vm att utnyttja ett sådant kort? PCI passthrough låser väl kortet till ett vm?

Jag personligen hade dock nu klarat mig med flyttalsdelen, det jag stör mig på är att det är så omständligt/svårt att få ut grafikprestanda från grafikkort till just grafik. Vilket bättre flyttalsdel på Epic inte hjälper något med. Har man som sagt 50st VM igång och alla ska nyttja kraften från sitt grafikkort så blir det problem.

Trädvy Permalänk
Hjälpsam
Plats
Karlskoga
Registrerad
Jan 2007
Skrivet av wowsers:

Mycket intressant, ~7% snabbare med ~14% fler kärnor, fast vad som verkligen kommer vara intressant är hur mycket mer/mindre prestanda man får per watt.

Vad bilderna avslöjar så verkar det som att vi får 8-kärniga CCX särade fysiskt, med fyra distinkt separata numa zoner, inte olikt vad vi såg med första generationens EPYC. Den enda skillnaden jag ser är att all traffik för kärnor passerar genom IOX kretsen, vilket jag inte ens vet är positivt eller negativt (snabbare/saktare än nuvarande?).

Vill gärna höra vad @Yoshman har för ord om designen, för jag har ingen aning vad jag ska tolka själv.

EDIT: Glömde att jämföra storlek på kretsar!

Ritade ut vars gamla zeppelin kretsar skulle vara placerade i jämförelse med denna:
https://i.imgur.com/oNJ4U9H.jpg
Detta visar att 8 kärnor CCX plus PCIe av vad folk verkar skriva tar upp ungefär 1/3 av vad en nuvarande zeppelin krets tar upp. Kretsen i mitten är ca 2x ytan av vad en zeppelin krets är, så det känns som att designen har mer att dölja än bara IO, om detta är pga att L3 är avvisat till IOX (känns inte så troligt) eller något helt annat återstår att se.

Misstänker en bla en massiv Cache.
Tror inte att CCX klustren kommunicerar med IO delen via ett annat CCX, de kopplas nog in ganska lika, däremot finns säkert en intern kommunikation mellan klustrerna.

AMD Ryzen 7 1700 | Vega RX 64 | https://valid.x86.fr/fgqnte | Stockkylaren | Bitfenix Whisper M 750W | Corsair 600T Graphite vit.
AMD FX8350 | Polaris RX 460 4 GB | https://valid.x86.fr/0q5pkm | Cooler Master V 700W | 32 GB ECC-Minnen.
HTPC | https://valid.x86.fr/ez1zxw |

Trädvy Permalänk
Medlem
Plats
Linköping
Registrerad
Jun 2004

Hoppas på att konsumentversionen av Zen 2 blir riktigt bra. 3700X eller vad den kan tänkas heta.

Dreamcast is forever. Shenmue lives!

Trädvy Permalänk
Medlem
Plats
Sundsvall
Registrerad
Okt 2003
Skrivet av jacozz:

Själv undrar jag mest vad detta innebär för nästa generation Ryzen för oss hemma-PC-användare.

* Bättre prestanda/effekt-förhållande. Definitivt!
* Med största sannolikhet högre prestanda.
* Förhoppningsvis stöd för PCIe 4.0 (i kombination med nytt moderkort, men jag kommer behålla mitt gamla).

Skrivet av VadSaDu:

PCI-E 4.0, skulle inte den kunna leverera en massa extra spänning?

Finns inte en chans att de ökar från 12V.

Skrivet av JBerger:

... Företag skiter i om en processor kostar 40 eller 80 tusen när konsulten kostar flera tusen i timmen; det är småpotatis i jämförelse).

Skrivet av Johan86c:

Talar du från egen erfarenhet att företag brukar köpa det bästa av allt? Min erfarenhet är det mycket dritt som de kör med och det ska snålas till den förbannelse på allt. Detta från mellanstora till de absolut största företagen i landet.

Oftare tittas väl på totalkostnaden och ROI?
I vissa specifika fall är få kärnor det ekonomiskt mest fördelaktiga på grund av hur programlicenserna är uppbyggda. Då vinner Intel.

Skrivet av Baxtex:

... Inte som att Intel skulle skicka några pre production samples till AMD direkt för att benchmarka.

Hmm... Vi jämför vår processor som är ett halvår från release med konkurrentens som är ett år från release... undrar vilken som har minst buggar vinner?

Skrivet av Ratatosk:

Visar sig att ryktena om 8 CCX ...

Skrivet av wowsers:

Vad bilderna avslöjar så verkar det som att vi får 8-kärniga CCX särade fysiskt, ...

Tror ni verkligen de gjort om Zen så mycket?
Befintliga processorer har ju fyra kärnor per CCX, med två CCX per Zeppelin (åtta kärnor) som minsta enhet.
Jag utgår ifrån att det är åtta (uppdaterade) Zeppelin med två CCX i varje!

Skrivet av wowsers:

Mycket intressant, ~7% snabbare med ~14% fler kärnor, fast vad som verkligen kommer vara intressant är hur mycket mer/mindre prestanda man får per watt.

Mycket bättre. I/O-delen har (nästan) inget att vinna på krympning när det kommer till effektivitet.

Skrivet av wowsers:

... all trafik för kärnor passerar genom IOX kretsen, vilket jag inte ens vet är positivt eller negativt (snabbare/saktare än nuvarande?).

Jim har kollat mycket på egenskaperna för chiplets:

För övrigt anser jag att MS FlightSim X borde vara standard som ett av benchmarkprogrammen.

Trädvy Permalänk
Medlem
Plats
Trondheim, Norge
Registrerad
Feb 2005
Skrivet av Jacob:

Nu har jag inte hunnit kolla på kretsstorlekar och ha nån utarbetad gissning själv, men I/O tar väl upp en rätt ansenlig del av ytan i en Zeppelin-krets? IOX-kretsen tillverkas fortfarande på 14 nanometer och ska husera alla åtta minneskanaler, 128 stycken PCI Express 4.0 samt allra minst (för bakåtkompatibilitet) all annan I/O som Zeppelin huserar. På det bör det rimligen gå åt en hel del yta för att kommunicera (åtta Infinity Fabric-bussar) med de åtta beräkningskretsarna. Tycker ändå inte storleken på IOX är allt för anmärkningsvärd när jag funderar på vad som måste finnas där.
Åtta kärnor per CCX känns ändå rimligt, likaså att 8 kärnor/16 trådar består för AM4. Har alltid känts i överkant att AMD skulle höja antalet kärnor på sin mainstreamplattform. Ser fram emot att testa Zen 2 i vår!
Man får ha i åtanke att saker inte skalar perfekt och att saker som interconnect (det AMD kallar Infinity Fabric) rimligen bör ta en allt större del av strömbudgeten med så här många kärnor. Om de lyckats bibehålla liknande klockfrekvenser som Epyc "Naples" till samma strömförbrukning är det en stor bedrift och ett gigantiskt kliv för en generation. Att IPC blir högre över brädet är redan givet (i synnerhet vid flyttal), frågan är hur mycket och i vilka scenarion.

Är väl ändå kring klustren som är flaskhalsen i konsumentversionen. Spelar ingen roll vilken förbättreing av IPC eller hur mycket frekvens man kan få ut när det stoppar någon annanstans. När dom mer eller mindre tvingar folk till EN produsent av minneskretsar för att få ut i närheten av det konkurrenten får ut och fortfarande ligger minst 10% efter idag, så tvivlar jag på att dom gör det samma igen.

En Ryzen idag med 2666 minne i CL16 eller trögare är seriöst gimpad på många ställen. Det säger jag som Ryzenägare och som är jättenöjd.

Ryzen 1700 @3750--2X8GB G.Skill 3600 @3333mhz-14-14-14-14-30-44--GTX 1080 med Corsair H105 plus Kraken adapter--EK Kylning på CPU-EVGA 850 G3--Handfull SSD

9900K@5.2--2X8GB G.Skill Ripjaws 3600 @ 4133 17-17-17-36--Gigabyte Windforce 2080 TI--Rog Strix Z390-F--Noctua NH-D15

-----------Twitch-------------

Trädvy Permalänk
Hjälpsam
Plats
Karlskoga
Registrerad
Jan 2007

@Olle P: Med ryktena om 8 CCX menade jag 8 st CCX-kluster med 2*4 kärnor, vilket ger 64 kärnor totalt.
Skall förtydliga.

AMD Ryzen 7 1700 | Vega RX 64 | https://valid.x86.fr/fgqnte | Stockkylaren | Bitfenix Whisper M 750W | Corsair 600T Graphite vit.
AMD FX8350 | Polaris RX 460 4 GB | https://valid.x86.fr/0q5pkm | Cooler Master V 700W | 32 GB ECC-Minnen.
HTPC | https://valid.x86.fr/ez1zxw |

Trädvy Permalänk
Medlem
Plats
Tystberga
Registrerad
Jul 2001
Skrivet av Zilanto:

Undra om PCI-E 4.0 kommer till konsumentprodukterna med Zen 2 också. Om de kommer så är det en given uppgradering nästa år för mig i alla fall.

Utveckling är bra absolut, men av ren nyfikenhet vad får dig att se pärleporten med version 4.0 mot tidigare 3.0. Konsumentledet nyttjar iprincip bara gpuer med 3.0 och prestandan mellan 8x och 16x läge är försumbar. 4.0 och dess massiva bandbredd kommer alltså inte komma till nytta i huvudtaget.

GAMLA KLENODER 486 DX266@80| P54CP75@90| P54C 150@188| P55C166@233| P2 Celeron 433@520| Dual celeron 366@550|Dual P3 Coppermine 650@880|Athlon 1700+@3200+|Athlon 3200+@4000+|Core2duo 8400@4,2| I7 860@3,8|CD2 7400@3,0|I3 2120|I7 2600k@4,7
AKTIVA SYSTEM4790K@4,85|HTPC I5 4670K@STOCK |Lenovo X1 Thinkpad|KID1 I7 860@STOCK |KID2 2500k@stock

Trädvy Permalänk
Medlem
Plats
Lund
Registrerad
Mar 2017
Skrivet av marcusOCZ:

Är väl ändå kring klustren som är flaskhalsen i konsumentversionen. Spelar ingen roll vilken förbättreing av IPC eller hur mycket frekvens man kan få ut när det stoppar någon annanstans. När dom mer eller mindre tvingar folk till EN produsent av minneskretsar för att få ut i närheten av det konkurrenten får ut och fortfarande ligger minst 10% efter idag, så tvivlar jag på att dom gör det samma igen.

En Ryzen idag med 2666 minne i CL16 eller trögare är seriöst gimpad på många ställen. Det säger jag som Ryzenägare och som är jättenöjd.

Ryzen 2 (Zen+) hade inte alls samma problem med minnen som Ryzen (Zen) hade, så det kommer med största sannolikhet inte vara något problem nu heller

CPU: R7 1700 @3.8GHz | GPU: EVGA 1080 Ti SC Black Hybrid(2x SilentWings 3 Highspeed)(core: 1627 MHz, Mem: 11208 MHz) | MB: MSI X370 Gaming Pro Carbon| RAM: 2x8 GB G.Skill Ripjaws V @3200MHz CL14|Cooling: Fractal Design Celsius S24 (Corsair ML120)|PSU: EVGA Supernova G3 750W|SSD: Samsung 960 EVO 500GB + Samsung 950 pro 512GB + Samsung 850 EVO 500GB + Intel DC S3510 480 GB + 850 EVO 2TB|HDD: WD Black 1TB|FANS: Corsair ML140 x2|CASE: Fractal Design Meshify C|RGB: 4x Phanteks Halo + LED-slinga + GPU-holder

Trädvy Permalänk
Medlem
Registrerad
Feb 2003

Nu är Rome bara ett test men om AMD menar på att 7nm och deras nya teknologi ger 2 sek bättre tid så meh..
Men tar gladeligen PCI-E 4.0 och 7nm överlag välkommet

.:. 101218 - Mitt allt .:.
http://www.escapefromtarkov.se/ - Svensk EFT Discord

Trädvy Permalänk
Medlem
Registrerad
Feb 2003
Skrivet av Triton242:

Utveckling är bra absolut, men av ren nyfikenhet vad får dig att se pärleporten med version 4.0 mot tidigare 3.0. Konsumentledet nyttjar iprincip bara gpuer med 3.0 och prestandan mellan 8x och 16x läge är försumbar. 4.0 och dess massiva bandbredd kommer alltså inte komma till nytta i huvudtaget.

Vad jag vet är varken Xeon eller Epyc särskilt inriktade mot vanliga konsumenter privat.
PCI-E 4.0 ger oss möjligheten till snabbare NVMe raid prestanda. Kommer ju kunna cruncha höga siffror disk data

.:. 101218 - Mitt allt .:.
http://www.escapefromtarkov.se/ - Svensk EFT Discord

Trädvy Permalänk
Medlem
Plats
-
Registrerad
Jul 2002

Jag är mest glad åt PCI-Express 4

.:Wks: Cooler Master Silencio 650|Core i5 3570 3.4 GHz|Asus P8Z77-V|8 GB| GT 465|1xDell U2311H, 2xAlienware AW2210 2xEizo 19|OCZ Revo 3 Drive 120 + Raptor 150:.
.:Server: Har ett gäng :) :.
-Learn the system, Play the system, Break the system-

Trädvy Permalänk
Inofficiell ambassadör
Plats
Gävle
Registrerad
Jan 2011
Skrivet av Jacob:

Åtta kärnor per CCX känns ändå rimligt, likaså att 8 kärnor/16 trådar består för AM4. Har alltid känts i överkant att AMD skulle höja antalet kärnor på sin mainstreamplattform. Ser fram emot att testa Zen 2 i vår!

Man får ha i åtanke att saker inte skalar perfekt och att saker som interconnect (det AMD kallar Infinity Fabric) rimligen bör ta en allt större del av strömbudgeten med så här många kärnor. Om de lyckats bibehålla liknande klockfrekvenser som Epyc "Naples" till samma strömförbrukning är det en stor bedrift och ett gigantiskt kliv för en generation. Att IPC blir högre över brädet är redan givet (i synnerhet vid flyttal), frågan är hur mycket och i vilka scenarion.

Då lät det ju helt plötsligt lite mer lovande igen! Jag ser verkligen fram emot testerna i vår!

Mobo MSI Z97 Gaming 5 CPU Intel i7 4790k: 4,6 Ghz @ 1,26v RAM Corsair Vengange Pro 16GB @ 2400MHZ
GPU MSI GTX 1080 ti Gaming X Skärm Acer X34A

Trädvy Permalänk
Medlem
Registrerad
Apr 2006

Någon som reagerar på att vi börjar närma oss en sådan här mer och mer?

https://cdn.instructables.com/F5V/GNWD/HCB8I98S/F5VGNWDHCB8I9...

Bara jag som blir orolig?

Trädvy Permalänk
Medlem
Plats
Lund
Registrerad
Mar 2017
Skrivet av Tomika:

Nu är Rome bara ett test men om AMD menar på att 7nm och deras nya teknologi ger 2 sek bättre tid så meh..
Men tar gladeligen PCI-E 4.0 och 7nm överlag välkommet

det var 2 sekunder bättre tid jämfört med ett 2x28c xeon platinum-system

CPU: R7 1700 @3.8GHz | GPU: EVGA 1080 Ti SC Black Hybrid(2x SilentWings 3 Highspeed)(core: 1627 MHz, Mem: 11208 MHz) | MB: MSI X370 Gaming Pro Carbon| RAM: 2x8 GB G.Skill Ripjaws V @3200MHz CL14|Cooling: Fractal Design Celsius S24 (Corsair ML120)|PSU: EVGA Supernova G3 750W|SSD: Samsung 960 EVO 500GB + Samsung 950 pro 512GB + Samsung 850 EVO 500GB + Intel DC S3510 480 GB + 850 EVO 2TB|HDD: WD Black 1TB|FANS: Corsair ML140 x2|CASE: Fractal Design Meshify C|RGB: 4x Phanteks Halo + LED-slinga + GPU-holder

Trädvy Permalänk
Datavetare
Plats
Stockholm
Registrerad
Jun 2011

Tycker det kvarstår ett rätt rejält frågetecken kring hur mycket desktop Zen2 kommer skilja sig från server Zen2. Personligen tror jag det är ett misstag att försöka återanvända allt för mycket i båda segmenten då deras krav har divergerat rätt kraftigt senaste 10-15 åren.

Ser flera dra slutsatsen att CPU-kretsarna numera skulle bestå av en CCX med 8-kärnor. Finns det någon konkret information alls som pekar på detta? Det som talar emot är

  • man verkar inte ha ändrat mikroarkitekturen speciellt mycket utöver att öka bredden på SIMD-enheterna till 256-bitar

  • kärnor och L3$ är ihopkopplade med en cross-bar i Zen, om man inte ändrat detta till Zen2 känns 8 kärnor per CCX rätt osannolikt då antalet transistorer ökar exponentiellt(!) med antalet kopplingar i en x-bar. X-bar har fördelar i att ha väldigt låg och helt homogen latens för alla noder, nackdelen är hur den skalar

Också rätt mycket spekulation kring om PCIe-kontroller ligger i I/O-kretsen eller i CPU-kretsarna. AnandTech spekulerar att PCIe ligger i CPU-kretsarna, vilket beroende på hur man tänkt göra desktop-varianten kan vara vettigt. Men hoppas ändå AT spekulerar fel här och finns lite saker som blir konstigt om PCIe-kontroller inte ligger i I/O-kretsen.

Både Epyc och Ryzen är pin-kompatibel, så antalet PCIe lär vara det samma. Då man dubblat antalet CPU-kretsar i Epyc Rome skulle endera hälften av kretsarna ha 32-PCIe (vilket är fallet i Zen1) alt. så skulle alla fått 16-PCIe vilket ställer till det för desktop då den plattformen behöver 24 PCIe (16 till GPU och liknande, 4 är dedicerade till NVMe samt 4 går till chipset). Ligger PCIe-kontroller i I/O-chippet krävs bara en variant av kretsen för desktop (om nu desktop ens har en I/O-krets).

Sågade Epyc Naples designen vid fotknölarna när den lanserades förra året, en sågning som sågades av den AMD-vänliga expertpanelen här på forumet (tydligen var problemet bara att vi programmerare inte är kapabla att lösa saker som att kommunicera snabbare än ljuset och så...). Tycker ändå det faktum att man helt designade om den delen pekar på att man efter två försök (Magny Cours och Epyc Naples) med i princip identiskt resultat borde kunna dra slutsatsen att det inte är en gångbar väg.

Vad man nu har gjort kommer fungera, det är en redan beprövad teknik. Vad man gör nu är på ett logiskt plan helt identiskt med tidigare front-side bus + north-bridge. Är ju det Intel gjorde med Core2Quad (två klistrade kärnor, men OS:et samt program såg och kunde jobba med resultatet som en CPU inte som flera separata CPUer som råkar dela paket).

Faktum är att IBM har en produkt med väldigt snarlik design, zEnterprise 196

CPU-krets

I/O-krets

Flera CPU chiplets kopplade till en I/O-krets

Och rimligen borde förklaringen till den väldigt stora I/O-kretsen i Epyc Rome ligga i att man stoppat dit en relativt stor L4$.

Att återgå till en front-side bus (som nu råkar prata infinity fabric protokollet) och north-bridge ger högre minneslatens. Går inte att fixa latensen mot RAM, men däremot kan man minska genomsnittlig latens som CPU-kretsarna "ser" genom att stoppa in L4$ i I/O-kretsen.

På det stora hela: detta är, till skillnad från Naples, "chiplets done right"!!!

Ovan ställer än mer frågetecken kring hur desktop Zen2 kommer se ut. En stor L4$ är inte direkt billig och även om en sådan minskar genomsnittlig latens så ökar varje extra nivå av cache latens mot RAM. För desktop är latens viktigare än för servers, så frågan är om man ändå skapar en speciell desktop variant av CPU-kretsen där minneskontroller fortfarande är integrerad.

Om så är fallet lär vi se samma sak mellan Ryzen och Threadripper som vi ser mellan SKL-S och SKL-X, HEDT kommer tappa prestanda relativt konsumentversioner för de flesta program. Självklart finns nischer där HEDT ändå är vettig, men det blir då som SKL-X där nischen klart krymper i storlek.

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Trädvy Permalänk
Medlem
Registrerad
Feb 2003

@sweisdapro: Ja, och 28x2 = ?. Så för att vara 7nm är jag inte imponerad av prestandan i Rome jämfört mot nuvarande 8180 x 2.

.:. 101218 - Mitt allt .:.
http://www.escapefromtarkov.se/ - Svensk EFT Discord

Trädvy Permalänk
Datavetare
Plats
Stockholm
Registrerad
Jun 2011
Skrivet av Esseboy:

Flyttals prestanda fyrdubblas.

Detta är exempel på lysande PR!

AMD uttalande om fördubblad flyttalsprestanda per kärna och cykel är tekniskt sett helt korrekt.

Man körde även en C-ray demo, som de med lite teknisk koll vet är i princip en ren flyttalsdemo som likt Cinebench är "embarrassingly parallel" samt körs helt ur lokal L1/L2 cache och därför skalar perfekt med CPU-kärnor. Där visar man att en single-socket Epyc Rome är snabbare än en toppmodellen av dual socket Skylake SP.

Slutsats man vet väldigt många kommer dra: flyttalsprestanda är generellt sett bättre i Zen2 jämfört med Skylake SP och demon visade rimligen att man verkligen har fyrdubblat flyttalskapacitet (för vem har koll på hur Intels system stod sig mot Epyc Naples?).

Vad ovan egentligen säger: flyttalsprestanda fyrdubblades inte i det generella fallet, man fyrdubblade SIMD-kapaciteten. Det är ändå väldigt bra då alla moderna program som är flyttalsberoende använder i praktiken SIMD. Man fördubblade den skalära flyttalsprestandan, det enbart då man fördubblade antalet CPU-kärnor.

C-ray använder överhuvudtaget inte SIMD, det använder 1900-tals skalära flyttalsberäkningar där redan Zen drog helt jämnt med Skylake (och Skylake är bara marginellt bättre än någon annan Core-design på denna punkt).

En fördubbling av SIMD-prestanda tar AMD från att vara 1/4 så snabb som Skylake SP räknat per cykel och kärna till att nu vara 1/2 så snabb. Undrar varför man inte körde en demo med något av de program man pratade om tidigare i presentationen, d.v.s. de som faktiskt körs i dagens datacenter och på HPC? D.v.s. de som drar nytta av SIMD.

Däremot kommer man nu dra jämnt med Intel på konsumentsidan sett till SIMD, Cannon Lake / Ice Lake har AVX-512 men alla siffror (inklusive läckta GB4 för Ice Lake) pekar på att man ändå stannat på 256-bitars data-väg!

Det skrivet: Epyc Rome kommer vara lysande på HPC laster då många av dessa inte har rå beräkningskraft som primär flaskhals utan minnesbandbredd. Det är t.ex. orsaken varför Crays highest-end superdator inte kör Skylake SP eller Epyc, den kör Cavium Thunder X2 som har en monolitisk CPU med 8 minneskanaler.

Epyc har mer bandbredd per socket jämfört med både Skylake SP och kommande Cascade Lake SP så man kommer så sig riktigt väl i många HPC-laster. Dock har Rome mindre bandbredd per socket än Cascade Lake AP, det och flera andra saker indikerar att AP inte är en generell serverprodukt utan en nischprodukt för HPC (t.ex. om ryktet att AP saknar SMT är det ännu en indikation på en nischad HPC-produkt, SMT avaktiveras ofta i HPC-laster men är normalt väldigt användbart i servers).

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Trädvy Permalänk
Medlem
Plats
Lund
Registrerad
Mar 2017
Skrivet av Tomika:

@sweisdapro: Ja, och 28x2 = ?. Så för att vara 7nm är jag inte imponerad av prestandan i Rome jämfört mot nuvarande 8180 x 2.

Tror man ska se lite förbi rå-prestandan i detta fall (dessutom är det en demo-produkt)
https://www.komplett.se/product/965188/datorutrustning/datork...
8180 har 205W TDP, och 115k som pris, vilket sätter intels CPU-kostnad till 230k, och en TDP på 405W
Ligger AMD på samma TDP som förut , och liknande pris, är detta enormt imponerande

CPU: R7 1700 @3.8GHz | GPU: EVGA 1080 Ti SC Black Hybrid(2x SilentWings 3 Highspeed)(core: 1627 MHz, Mem: 11208 MHz) | MB: MSI X370 Gaming Pro Carbon| RAM: 2x8 GB G.Skill Ripjaws V @3200MHz CL14|Cooling: Fractal Design Celsius S24 (Corsair ML120)|PSU: EVGA Supernova G3 750W|SSD: Samsung 960 EVO 500GB + Samsung 950 pro 512GB + Samsung 850 EVO 500GB + Intel DC S3510 480 GB + 850 EVO 2TB|HDD: WD Black 1TB|FANS: Corsair ML140 x2|CASE: Fractal Design Meshify C|RGB: 4x Phanteks Halo + LED-slinga + GPU-holder

Trädvy Permalänk
Medlem
Plats
Sälen
Registrerad
Maj 2004
Skrivet av Tomika:

@sweisdapro: Ja, och 28x2 = ?. Så för att vara 7nm är jag inte imponerad av prestandan i Rome jämfört mot nuvarande 8180 x 2.

Du kanske skulle fundera dels vad 2st 8180 kostar och dels vad dom drar i ström och hur begränsad den plattformen blir i jämförelse,128 lanes pci-e 4 för ensam sockel är inte illa pinkat med nya epyc. Att lyckas med bedriften att få 9 dies på samma interposer och att få upp antalet kärnor till 64 med ökad bredd på flyttal per cpu kärna från 128 bit till 256, detta enligt AMD till samma strömbudget som nuvarande 32 kärniga. Tycker du att det verkligen inte är imponerande?

Skickades från m.sweclockers.com

3DMark | R7 1800x | Asrock X370 Prof. Gaming | Corsair 16GB LPX 3733 c17 (sr-bdie@ 3466c14) | Corsair h150i Pro | MSI GTX1080 Gaming X | 500GB 970EVO, 1050GB MX300, 2x 120GB 510, 3TB 7200rpm | RM750x | Xonar Phoebus | Phanteks Enthoo Evolv Atx | Acer Z35 | Logitech G810 & SS Rival 500 | Xbox One | Elite Controller | :::AMD Zen Minnesguide:::|:::AMD Zen & Zen+ Överklockningsguide:::

Trädvy Permalänk
Medlem
Plats
Sundsvall
Registrerad
Okt 2003
Skrivet av Yoshman:

... frågetecken kring hur mycket desktop Zen2 kommer skilja sig från server Zen2. Personligen tror jag det är ett misstag att försöka återanvända allt för mycket i båda segmenten då deras krav har divergerat rätt kraftigt senaste 10-15 åren.

Jag håller med om divergerande krav.
Konsumentprocessorn behöver inte massor av kärnor, utan hellre färre snabba.

Skrivet av Yoshman:

Ser flera dra slutsatsen att CPU-kretsarna numera skulle bestå av en CCX med 8-kärnor. Finns det någon konkret information alls som pekar på detta? ...
... frågan är om man ändå skapar en speciell desktop variant av CPU-kretsen där minneskontroller fortfarande är integrerad.

Jag utgår från att varje chiplet är en krympt version av Zeppelin, som i princip är en komplett CPU med två stycken CCX.
Då kan nya Ryzen (upp till åtta kärnor) innehålla en sådan chiplet, utan behov av separat I/O-krets.

För övrigt anser jag att MS FlightSim X borde vara standard som ett av benchmarkprogrammen.

Trädvy Permalänk
Medlem
Plats
Tystberga
Registrerad
Jul 2001

@Tomika: Jag kanske tolkade inlägget fel, jag uppffattade uppgradering som något du tänkte för konsumentplatform.
Självklart finns det användningsområden men inte mycket på konsument nivå, därav mitt svar.

GAMLA KLENODER 486 DX266@80| P54CP75@90| P54C 150@188| P55C166@233| P2 Celeron 433@520| Dual celeron 366@550|Dual P3 Coppermine 650@880|Athlon 1700+@3200+|Athlon 3200+@4000+|Core2duo 8400@4,2| I7 860@3,8|CD2 7400@3,0|I3 2120|I7 2600k@4,7
AKTIVA SYSTEM4790K@4,85|HTPC I5 4670K@STOCK |Lenovo X1 Thinkpad|KID1 I7 860@STOCK |KID2 2500k@stock

Trädvy Permalänk
Medlem
Plats
Trondheim, Norge
Registrerad
Feb 2005
Skrivet av sweisdapro:

Ryzen 2 (Zen+) hade inte alls samma problem med minnen som Ryzen (Zen) hade, så det kommer med största sannolikhet inte vara något problem nu heller

Det är brist på prestandan som är det generella problemet. Inkompabilitet var det första som i stort sett lösts med Zen+. På minnebandbredd har inte Ryzen en chans mot dagens Intel. 4000 mhz klaras det enkelt på Intel. Det är många spel som visar på bättre prestanda med bättre bandbredd på minnet när man kommer upp i de hastigheterna.

Ryzen 1700 @3750--2X8GB G.Skill 3600 @3333mhz-14-14-14-14-30-44--GTX 1080 med Corsair H105 plus Kraken adapter--EK Kylning på CPU-EVGA 850 G3--Handfull SSD

9900K@5.2--2X8GB G.Skill Ripjaws 3600 @ 4133 17-17-17-36--Gigabyte Windforce 2080 TI--Rog Strix Z390-F--Noctua NH-D15

-----------Twitch-------------

Trädvy Permalänk
Medlem
Plats
Helsingfors
Registrerad
Jun 2004
Skrivet av Tomika:

Nu är Rome bara ett test men om AMD menar på att 7nm och deras nya teknologi ger 2 sek bättre tid så meh..
Men tar gladeligen PCI-E 4.0 och 7nm överlag välkommet

2 sekunder bättre än Intels dual-socket. Färre socklar är alltid att föredra, så att kunna byta ner till singel-socket utan att förlora prestanda (t.o.m bättre prestanda!) är väl inget annat än fantastiskt?