AMD avslöjar fler detaljer om arkitekturen Zen 2 på 7 nanometer

Permalänk
Medlem
Visa signatur

CPU: R7 5800X3D | GPU: XFX 6900XT Merc 319 | MB: Gigabyte X570 PRO-I| RAM: 2x16 Corsair LPX@3600MHz CL18|Cooling: Scythe Ninja 5 (Noctua A12x25)|PSU: Corsair SF750|SSD: Samsung 970 EVO Plus 1TB + Corsair MP510 4TB + Samsung 850 EVO 2TB + Samsung 850 PRO 2TB|CASE:NR200P

Permalänk

Det finns ju möjlighet Zen 2 kommer slå Intel i både performance och pris, hehe. Det kommer bli en så besvikelse för alla intel fans här i sweclockers.
Kommer vara som julafton, ser fram emot bara den.

Permalänk
Medlem

Till er som undrar lite över klockhastighet.

MI60 har 14,7 TFlops FP32. MI25 har 12,3 TFLOPS FP32.
Givet att de har samma antal CU:s så ger det en 20% prestandaökning. (De verkar förresten ha samma antal CU:s om man ser på bilden på kretsen). Det här är dock från 14nm och inte 12nm. För 12nm så sa de att det var en 10% performance improvement och då gick man från 4,1Ghz till 4,3Ghz på Zen+.

MI25 ligger på ungefär samma nivå som Vega64 (ej vattenkylda). Med drygt samma TDP.

Men de har skrivit ner prestandaökningen från 35% (computex) till 25% idag. GPU:s och CPU:s är rätt så annorlunda dock, GPU:s tenderar att vara större begränsad av TDP. Så man bör räkna med aningen lägre prestandaökningar på Zen2. 4,7Ghz kanske är rimligt? Kanske till och med upp till 4,9Ghz i bästa fall på några kärnor.

Som gamer är jag dock mer intresserad av hur mycket de reducerat latenser och så.

Permalänk
Medlem

Perfekt!
Detta borde innebära att 2700X kommer säljas här i marknaden nästa år till överkomliga priser...
Tack AMD!

Skickades från m.sweclockers.com

Visa signatur

Asus Sabertooth X58 - Xeon X5680 - 12GB DDR3 - ASUS GTX1080 8GB

Permalänk
Medlem
Visa signatur

🖥️ AMD Ryzen 3700x, MSI B350 Mortar Arctic, Corsair lpx 3200, Sapphire 6900XT Nitro, Mbpro 15, MacMini.

Permalänk
Medlem
Skrivet av KoAoL:

Spännande, men än så länge ordbajs. De har lovat mycket på senare tid som i slutändan blivit sådär. Men nu ligger de ju steget före på 7nm och det är intressant. Man hoppas ju ändå någonstans att det stämmer. Dax för ett rejält kliv, eller iaf ett långt steg i förhållande till småskutten vi haft ett tag.

Har de? De lovade 40% högre prestanda från Piledriver. De fick nästan 50%. De lovade 5-10% bättre prestanda med Ryzen 2. Man fick nästan 15%. Faktum är att AMD har levererat mer än de lovat vid både Ryzen 1 och lanseringen av Ryzen 2.

Skrivet av NcLr:

Perfekt!
Detta borde innebära att 2700X kommer säljas här i marknaden nästa år till överkomliga priser...
Tack AMD!

Skickades från m.sweclockers.com

Tycker iof. att redan idag så ligger 2700X på överkomliga priser med tanke på vad man får.

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem

Hmm... ser ut som om 1 chiplet = 8 kärnor, 8 cores ccx?
Ryzen/7 = 2 chiplets? (16 kärnor)
Ryzen/5 = 1 chiplet (8 kärnor)

Eller, vad tror ni?

Visa signatur

🖥️ AMD Ryzen 3700x, MSI B350 Mortar Arctic, Corsair lpx 3200, Sapphire 6900XT Nitro, Mbpro 15, MacMini.

Permalänk
Medlem
Skrivet av Xinpei:

Tycker iof. att redan idag så ligger 2700X på överkomliga priser med tanke på vad man får.

Absolut! Men är man opportunist så är man...

Skickades från m.sweclockers.com

Visa signatur

Asus Sabertooth X58 - Xeon X5680 - 12GB DDR3 - ASUS GTX1080 8GB

Permalänk

Nu är frågan om man ska vänta på zen2 eller slå till på 2700x

Skickades från m.sweclockers.com

Permalänk
Medlem
Skrivet av NcLr:

Perfekt!
Detta borde innebära att 2700X kommer säljas här i marknaden nästa år till överkomliga priser...
Tack AMD!

Skickades från m.sweclockers.com

Säljs det inte till redan överkomliga priser?
Allt är ju relativt men jag tycker en riktigt bra processor som 2700x är rätt billig helt ny från butik och faktiskt rätt ny på marknaden fortfarande..

Nu är jag själv i en väldigt jobbig situation där jag ska sälja min dator och byta ner mig till M-itx , inte för att jag vill utan för att jag måste.
Så jag har bara en laptop nu och tänkte ju köpa på mig nya delar under vintern för att bygga en liten gaming-rigg..Nu måste jag köpa en "tillfällig" processor bara för att invänta den nya Zen2 .. Hade planer mpå att köpa en ny 2700x men det känns ju dumt om man bara ska ha den några månader innan man säljer för Zen2

Visa signatur

Citera för svar!

Permalänk
Medlem

1 chiplet med 8 kärnor till en gaming-rig för ett billigt pris låter kanske inte helt orimligt då? Då kan man slippa kommunikation mellan chiplets helt också?

Permalänk
Medlem

Satan var små cpu-chippen är?!
Undrar om Ryzen kommer använda samma chip + nedbantat IO-chip eller om man kör ett monolitiskt 7nm chip?
Hur tänker man med APU:erna?
chiplets därmed? Kanske 3 chip? 1 cpu + IO + GPU?

Visa signatur

🖥️ AMD Ryzen 3700x, MSI B350 Mortar Arctic, Corsair lpx 3200, Sapphire 6900XT Nitro, Mbpro 15, MacMini.

Permalänk
Medlem
Skrivet av Thooomsiboy:

Nu är frågan om man ska vänta på zen2 eller slå till på 2700x

Skickades från m.sweclockers.com

Du kan ju köpa dig en 2700X nu och sedan bara köpa en Zen 2 CPU när de lanserar eller när du känner för att uppgradera eftersom det är samma socket och oftast behövs bara en biosuppdatering.

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem

25% högre klockfrekvens ger ca. 4.6 GHz basfrekvens och 5.4 GHz boost för Ryzen 3700X. Känns som det kan bli en uppgradering

Visa signatur

Ryzen 7 3800X, Asus Prime X370 Pro, 32 GB LPX 3600, Gainward RTX 3060 Ti Ghost, 7 TB SSD + 4 TB HDD

Permalänk
Medlem
Skrivet av NcLr:

Perfekt!
Detta borde innebära att 2700X kommer säljas här i marknaden nästa år till överkomliga priser...
Tack AMD!

Skickades från m.sweclockers.com

Det gör det. Vet redan nu at min 2700X kommer ligga ute till försäljning när jag lagt vantarna på min "3700X", eller vad det kan tänkas att den får för namn Så gött att kunna uppgradera och behålla moderkortet

Visa signatur

ozzed.net Min egenkomponerade 8-bit musik. Gillar du musiken från gamla klassiska NES eller Gameboy och liknande är det värt ett besök. :) Jag finns också på Spotify, Bandcamp, Jamendo, Youtube, och du kan även följa mig på Twitter och Facebook.
Vet du att du har fel? Signalera detta tydligt med Argumentationsfel och gärna Whataboutism.

Permalänk
Medlem
Skrivet av Ozzed:

Det gör det. Vet redan nu at min 2700X kommer ligga ute till försäljning när jag lagt vantarna på min "3700X", eller vad det kan tänkas att den får för namn Så gött att kunna uppgradera och behålla moderkortet

9900X kommer den garanterat att heta!

Visa signatur

Fractal Design Meshify 2 Compact w/ Dark Tint | Intel i5 12600K | Asus ROG Strix B660-F | 32 GB Corsair DDR5 5600 MHz CL36 | MSI Geforce RTX 3060 TI Ventus 2X OCV1 | 512 GB Samsung Pro 850 SSD + 2TB WD Black SN850 NVME PCI-E 4.0 | Corsair RM750X |

Permalänk
Medlem
Skrivet av Xinpei:

9900X kommer den garanterat att heta!

IT'S OVER NINE THOUSAND!!!!!

Visa signatur

ozzed.net Min egenkomponerade 8-bit musik. Gillar du musiken från gamla klassiska NES eller Gameboy och liknande är det värt ett besök. :) Jag finns också på Spotify, Bandcamp, Jamendo, Youtube, och du kan även följa mig på Twitter och Facebook.
Vet du att du har fel? Signalera detta tydligt med Argumentationsfel och gärna Whataboutism.

Permalänk
Avstängd

Nästa gen från AMD kommer nog bli hård för Intel.

Permalänk
Datavetare

Förstod inte vad AMD höll på med när de släppte första generationen Epyc, man hade testat samma design ett antal år tidigare i sin dual-chip Magny cours Opteron och resultatet då blev på det stora hela identiskt med resultatet nu.

Vad man har nu är "chiplets done right". En I/O-krets som hanterar RAM, PCIe etc och har kopplingar mot CPU-kretsar är en välbeprövad design. Det är i sak en tillbakagång till "front-side bus" samt en "north bridge".

Det faktum att också Intel sagt att man också kommer gå till en sådan design ihop med deras superklister EMIB

från Intels Technology and Manufacturing Day sommaren 2017

pekar ju på att även de tror på en sådan design.

Fördelen med en integrerad minneskontroller är lägre latens. Givet hur mycket AMD pratade om HPC och datacenter ser jag inte en återgång till en front-side bus och en off-die minneskontroller som ett gigantiskt problem. Bandbredd är viktigare än latens där.

Är inte alls lika övertygad om att designen är optimal för skrivbordet. Inte heller säkert att man kommer använda en sådan design för skrivbordet för det stod "Zen 2 base Epyc processor" på sliden där man visade detta

Dold text

Kul att man lägger resurser på att kunna köra AVX instruktioner i full hastighet, det är exakt vad man sa med att flyttalsdelarna numera är 256-bitars. Misstänker att vissa som hävdar att "inget använder AVX" kommer ändra åsikt inom kort

Att man tar SIMD på allvar är viktigt, rätt övertygad om att användningen av detta kommer öka rätt mycket framöver då det (nästan 20 år efter att SSE introducerades) numera finns ett enkelt och standardiserat sätt att använda SIMD optimeringar i egen kod utan att ta till assembler.

SIMD används redan väldigt inom maskininlärning, HPC och andra områden. Men där används det i form av bibliotek, har fram till väldigt nyligen varit relativt svårt för enskilda programmerare att utnyttja tekniken på ett mer generellt plan.

Även om Cannon Lake / Ice lake får AVX-512 så verkar det som Intel stannar på 256-bitars data-väg i konsumentprodukter. Så där kommer Zen2 dra jämnt med Intels modeller sett till kapacitet per kärna och per cykel. Ger dock inte så mycket för demonstrationen med C-ray som värdemätare på flyttalskapacitet på servers, C-ray använder överhuvudtaget inte SSE/AVX så man tog där helt bort Intels fördel med att serverkretsarna har 512-bitars SIMD data-väg.

Oroväckande lite nämndes om heltalsprestanda. Är ju där Zen ligger efter Skylake i IPC och heltalsprestanda är långt viktigare för majoriteten av det vi gör på skrivbordet (och server, fast då maskininlärning blir allt viktigare där flyttas även prestandafokus från heltal till SIMD).

Det enda som nämndes kring saker som påverkar heltalsprestanda var "bättre branchpredictor" (säg en CPU-release där detta _inte_ varit en av förbättringspunkterna) samt större mikro-op-cache.

Större mikro-op-cache är nog ändå viktigt för Zen. Av någon anledning har man valt en 64 kB L1I$ som är fyra set-associativ i Zen, en sådan design möjliggör inte parallell uppslagning av L1I$ data och TBL (64 kB / 4 = 16 kB och måste vara <= 4 kB för att parallell uppslagning ska vara möjligt, vilket det är för L1D$ då den är 32 kB och 8 set-associativ).

Sett någon förklaringen att man försöker kompensera designvalet av L1 instruktions-cache med mer aggressiv prefetching. Finns fall där det inte verkar fungera så bra, man faller efter Skylake rätt mycket, och andra fall där det fungerar riktigt bra. Större mikro-op-cache borde kunna minska fallen eller i alla fall lindra fallen där det fungerar dåligt då saker som ligger i mikro-op-cache i princip helt kan hoppa förbi "front-end".

En annan fördel med större mikro-op-cache är att front-end bara kan avkoda upp till fyra x86 instruktioner medan "back-end" i Zen (som förutom bredden av flyttalsdelen verkar se rätt lika ut) har totalt 10 pipe-lines (två minnesportar, fyra heltalsportar och fyra flyttalsportar). Intel har motsvarande problem i att front-end har lägre kapacitet (upp till fem x86 instruktioner per cykel) än mikro-op-cachen, men å andra sidan har man lite färre portar (fyra minnesportar och fyra heltals/flyttalsportar).

Kan verka lustigt att Skylake kan ha högre IPC trots smalare back-end, förklaringen där ligger med stor sannolikhet i att Core-serien har en central schemaläggare så man kan plocka upp till 8 mikro-ops ur en kö med upp till ~100 element medan Zen har en distribuerad schemaläggare där varje port kan plocka micro-ops ur en lokala kö med upp till ~14 element.

I fall med lite mer snedfördelad mix på instruktioner eller lite haveri i minnesportarna p.g.a. mycket cache-missar är en central schemaläggare mer effektiv. En distribuerad schemaläggare drar dock mindre ström och är väsentligt enklare att designa.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

@Yoshman:

Citat:

En I/O-krets som hanterar RAM, PCIe etc och har kopplingar mot CPU-kretsar är en välbeprövad design.

Anandtech påstår att PCIe inte ligger i det klustret, utan på varje CPU-chip.

https://www.anandtech.com/show/13560/amd-unveils-chiplet-desi...

Jag tycker att det verkar konstigt av många skäl, men tyckte att det var värt att påpeka.

I sammanhanget Intel och avkodningsbredd: Intels avkodare kan spotta ur sig totalt 5 uops. Om den komplexa dekodern får en x86-instruktion som blir 3 uops, kan det bara bli ytterligare två x86-instruktioner avkodade den cykeln, och bägge dessa måste vara sådana som bara ger en uop. AMD är lite mer flexibla här. Intels uop-cache kan också bara leverera 6 uop per cykel, och det går inte att blanda mellan cache och dekoder. Det borde dock gå att få till en svit av kod som exekverar 6 instruktioner per cykel, men tester visar att det nästan aldrig funkar, koden trillar ner på 4 i bredd. Således har Intel en annan flaskhals. De gissningar jag har sett pekar mot att bandbredden i rename är begränsad till 4 operationer per cykel, så det går bara att hålla de där 6 operationerna om 4 av dem kan ”svetsas” (uop fusion) så att det blir fyra par.

Skickades från m.sweclockers.com

Visa signatur

5900X | 6700XT

Permalänk
Medlem

@Xinpei Ryzen har de definitivt lyckats med. Ska bli kul att följa hur deras 7nm mognar i förhållande till 10nm++++++ som är körd in i väggen nu. Sedan var det inte så svårt att följa upp bulldozer, den arkitekturen var inte bra.
Är man sedan tidigare van vid framstegen under 90- och 00- talen är det inte lätt att bli imponerad. Sitter själv på en 3770k som är över 6 år nu. Iofs på sista versen antagligen men den gör jobbet galant. Hade man haft en 5 år gammal CPU 2005 hade man varit helt rökt på spelfronten.

Visa signatur

Kids, always eat your vegetables and ALWAYS check run as administrator.

Permalänk
Medlem
Skrivet av jacozz:

Satan var små cpu-chippen är?!
Undrar om Ryzen kommer använda samma chip + nedbantat IO-chip eller om man kör ett monolitiskt 7nm chip?
Hur tänker man med APU:erna?
chiplets därmed? Kanske 3 chip? 1 cpu + IO + GPU?

Skall dom hålla sig till att kunna använda samma chiplets i server, hedt & konsument som man gjort hitills blir det nog svårt att slippa undan I/O chipet. Men det lär vara nerskalat, typ 1/2 chip till Threadripper och 1/4 chip till Ryzen. Just idén att kunna återanvända samma moduler över nästan hela produktlinjen (allt utom APU) är ju ett genidrag om du frågar mig.

Permalänk
Medlem
Skrivet av KoAoL:

@Xinpei Ryzen har de definitivt lyckats med. Ska bli kul att följa hur deras 7nm mognar i förhållande till 10nm++++++ som är körd in i väggen nu. Sedan var det inte så svårt att följa upp bulldozer, den arkitekturen var inte bra.
Är man sedan tidigare van vid framstegen under 90- och 00- talen är det inte lätt att bli imponerad. Sitter själv på en 3770k som är över 6 år nu. Iofs på sista versen antagligen men den gör jobbet galant. Hade man haft en 5 år gammal CPU 2005 hade man varit helt rökt på spelfronten.

Du menar 14nm++++++++?

O ena sidan kan man tycka Bulldozer är lätt att följa upp. Den var ju trotts allt en design som inte alls passade moderna workloads. Men sammtidigt, att göra så fel och sedan vända om och göra så rätt... det är nog inte så himla lätt. Man jag är glad de gjort det. Se vad detta fört med sig. Fatta hur mycket inovation och hur mycket mer för pengarna vi konsumenter hade fått om marknaden var nära 50/50.

Visa signatur

Huvudriggen är en Gigabyte Aorus Xtreme | 128gb DDR5 6000 | Ryzen 7950X | 3080Ti
Utöver det är det för många datorer, boxar och servar för att lista :P

Permalänk
Datavetare
Skrivet av mpat:

@Yoshman:

Anandtech påstår att PCIe inte ligger i det klustret, utan på varje CPU-chip.

https://www.anandtech.com/show/13560/amd-unveils-chiplet-desi...

Jag tycker att det verkar konstigt av många skäl, men tyckte att det var värt att påpeka.

I sammanhanget Intel och avkodningsbredd: Intels avkodare kan spotta ur sig totalt 5 uops. Om den komplexa dekodern får en x86-instruktion som blir 3 uops, kan det bara bli ytterligare två x86-instruktioner avkodade den cykeln, och bägge dessa måste vara sådana som bara ger en uop. AMD är lite mer flexibla här. Intels uop-cache kan också bara leverera 6 uop per cykel, och det går inte att blanda mellan cache och dekoder. Det borde dock gå att få till en svit av kod som exekverar 6 instruktioner per cykel, men tester visar att det nästan aldrig funkar, koden trillar ner på 4 i bredd. Således har Intel en annan flaskhals. De gissningar jag har sett pekar mot att bandbredden i rename är begränsad till 4 operationer per cykel, så det går bara att hålla de där 6 operationerna om 4 av dem kan ”svetsas” (uop fusion) så att det blir fyra par.

Skickades från m.sweclockers.com

Vad som är teoretisk maximal "sustained rate" är i fallet x86 rätt ordentligt irrelevant då man i praktiken väldigt sällan når över 2 x86 instruktioner per cykel i verkliga program. Högsta jag någonsin uppmätt i genomsnittlig IPC är 3,1 för Skylake och 2,2 för Zen (micro-benchmark i Python mätt med respektive CPUs "performance counter" så det ska vara ett exakt mått på x86 instruktioner per cykel i genomsnitt).

Precis som du skriver är avkodarna mer flexibla i Zen, tre av fyra avkodare i Skylake kan bara hantera instruktioner som resulterar i en uop (men dessa är i.o.f.s. väldigt vanliga i praktiken). Så flaskhalsen verkar inte ligga i avkodaren.

Dock rätt säker att heltalsberäkningar i ett skriptspråkt som Python inte är "best-case" för Zen om man vill maximera IPC-siffran. Givet hur back-end ser ut i Zen borde man få maximal IPC om man blandar heltalsberäkningar med en "optimal" mix av flyttal (där får man nog testa sig fram). Värdet av en sådan mätning kan man i.o.f.s. ifrågasätta, skulle knappast bli ett vettigt program utan bara ett sätt att maximera IPC.

Det faktum att båda designerna kan färdigställa (retire) upp till åtta uops per cykel (i Intels fall upp från fyra i Broadwell) pekar på att enda relevanta sättet att öka genomsnittlig IPC nu är att försöka få så mycket som möjligt gjort när dispatch-kön/köerna är full/fulla (vilket kan bli fallet efter olika former av back-end stalls).

Men sen finns ju numera Apples A12 att kika på. Uppenbarligen är det möjligt att skruva upp flödet genom front-end rätt ordentligt, men är fullt möjligt att det bara går på en lite vettigare designad ISA än x86...

En väldigt sannolik förklaring till varför man kanske inte lagt så mycket krut på heltalsdelen i Zen2 är ju att man redan är rätt nära taken för vad som är möjligt givet typisk x86 kod. Det är en horribel ISA som man redan lyckats baxa väsentligt mycket längre än vad nog något hade gissat för ett par årtionden sedan.

Innan 64-bitars ARM / RISC-V fanns alltid räddningsplankan att alla då existerande ISA hade rejäla grodor, så på det stora hela var ingen direkt överlägsen. Definitivt inte mer överlägsen än vad Moores lag kunde släta över på relativt kort tid... Men haveri av Moores lag och datacenter CPUer med väldigt många kärnor blottlägger verkligen svagheterna i x86 (icke-optimal minneskonsistensmodell för multicore, kärnor som tar onödigt mycket transistorer p.g.a. extremt många instruktioner som har variabel storlek, etc)!

PCIe på CPU-delen känns inte helt optimalt, men är trots allt mindre viktigt än att man nu fixat till en vettig RAM-konfiguration. 4 NUMA-zoner per socket som Epyc Naples hade var helt enkelt en nischprodukt, man hade aldrig kunna ta några större marknadsandelar med den designen.

PCIe på CPU-delen kanske ger en vink om att desktop-versionen av Zen2 kanske ändå kommer i en variant med integrerad minneskontroller? Tror en klar splitt här mellan desktop och server är att föredra. Servers vill ha massor med bandbredd och kan i många fall bättre handskas med lite högre latens. Desktop är nästan alltid primärt latensbegränsat, fördelen med integrerad minneskontroller är just lägre latens.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av jacozz:

Hmm... ser ut som om 1 chiplet = 8 kärnor, 8 cores ccx?
Ryzen/7 = 2 chiplets? (16 kärnor)
Ryzen/5 = 1 chiplet (8 kärnor)

Eller, vad tror ni?

Det hade ryktats om att Ryzen 3700 skulle släppas med 12 kärnor för att, iom övergången till 7nm, så skulle AMD ha lyckats att få in 6 kärnor per krets, men de har bevisligen överträffat detta och fått in hela 8 kärnor.

Skulle inte bli förvånad om vi skulle få se Ryzen 3700 med 16 kärnor.

Visa signatur

3900X | Asus C8H | Trident Z 3800 | 6800 XT | MP600 | HX1000i | Core P5 | EK-WB

Permalänk
Medlem

Låter ju väldigt trevlig när man läser om det hela. Hoppas nu bara de släpper Picasso APUerna i första steget o inte 9 månader senare.

Skickades från m.sweclockers.com

Visa signatur

Regn är snö på sommarn.

Permalänk
Medlem

Missar alla den stora grejen här? Folk pratar om 12 och 16 kärnor fortfarande. Vilket många (inklusive jag själv) ansett varit troligt med tanke på Rome på 48 och 64 kärnor.
Men, det ser onekligen ut som att Rome har 8st chiplets kopplade till I/O-kretsen. Det innebär 8-kärnor per chiplet.
Så, grejen alla verkar missa. Hur ser Ryzen baserad på Zen 2 ut? Är det också 8-kärnor som varje chiplet har hos Rome? Har de också chiplets med extern I/O-krets? Kan vi se 2st chiplets på en I/O krets för 16 kärnor på AM4? Eller görs de med helt egna kretsar med inbyggd I/O?

Permalänk
Medlem

Vad är ni villiga att betala för för en 3700x om den är ca 25% snabbare än 2700x? 3000? 5000? 7000?

Permalänk
Medlem

Chiplets. APU.

Permalänk
Medlem
Skrivet av Yoshman:

Oroväckande lite nämndes om heltalsprestanda. Är ju där Zen ligger efter Skylake i IPC och heltalsprestanda är långt viktigare för majoriteten av det vi gör på skrivbordet (och server, fast då maskininlärning blir allt viktigare där flyttas även prestandafokus från heltal till SIMD).

Det enda som nämndes kring saker som påverkar heltalsprestanda var "bättre branchpredictor" (säg en CPU-release där detta _inte_ varit en av förbättringspunkterna) samt större mikro-op-cache.

"Better instruction pre-fetching" nämns också