Rykte: AMD "Zen" skymtas i prestandatester

2016-04-03 15:46

Inaktiv

Registrerad: Jan 2002

●

Skrivet av KalBumling:

Nano/fury x är ju single slot om man kör custom water, sen finns det ju div 3e part nvidia som också är single med vattenblock. Aldrig varit ett fan av single slot luftkylning, prestandan finns helt enkelt inte där.

Gå till inlägget

Fortfarande beroende av extern kylning så kortet tar inte enbart upp den där enda kortplatsen. HD4850 låg på 110W TDP vilket fortfarande var för mycket för att kyla bra. Är ju ändå rätt begränsat med utrymme.

Skrivet av Zotamedu:

Standardkylaren var skräp på 4850 så jag slängde på en Accelero S1 vilket gav mig lägre temperaturer trots att jag körde den passivt. Det blev typ 10 grader svalare trots avsaknad av fläkt och grafikkortet blev helt tyst. Många körde S1 till 4870 också men det var gränsfall att det gick utan fläkt så det var vanligt att modda dit en 120 mm fläkt med lite buntband.

Gå till inlägget

Jo, körde just Acclero S1 (tror jag, den större kylarvarianten iallafall) på kortet jag hade innan, 8800GTS 512MB. Dock blir kortet riktigt stort om man behövde montera på en fläkt också. Speciellt då i ett mATX-chassi.

HD4870 var ett klart roligare kort, GDDR5 istället för GDDR3 samt större minnesmängd gjorde det till ett bättre kort. Lite galet att vi suttit på GDDR5 i snart åtta år nu dessutom, HD4870 var ju första grafikkortet med den minnestypen.

Skrivet av Herr Kantarell:

Konstigt att tråden börjar handla om grafikkort istället.

Gå till inlägget

Hehe, ja det brukar ju halka emellan. Om det är sedvanliga urspårningar eller det faktum att AMD har en speciell position på marknaden (ensamma om att kunna tillverka (högpresterande) x86-baserade processorer och samtidigt ha grafikkretsar som ligger i prestandatoppen. Varken Intel eller Nvidia har samma läge. Visst, Intel har snabbare processorer men ingen annan tillverkare har processorer som är i nivå med vad AMD's processorer ändå klarar av.

Viktigare att AMD får till en bra CPU nu än att deras GPU blir bra. Intel är ett större hot än vad Nvidia någonsin lär bli.

Rapportera Redigera

Citera flera Citera

2016-04-03 18:47

Permalänk

Exxovion

Avstängd

Plats: Norrköping
Registrerad: Jul 2015

●

Ska bli intressant o se hur den presterar i praktiken.

Rapportera Redigera

Citera flera Citera

2016-04-03 18:56

Permalänk

Ratatosk

Hjälpsam ★

Plats: Karlskoga
Registrerad: Jan 2007

●

Skrivet av SeF.Typh00n:

Och så tydligen var detta också ett aprilskämt (delvis?)

http://www.semiaccurate.com/forums/showpost.php?p=259047&post...

Gå till inlägget

En länk senare i den tråden du länkade till.
http://www.bitsandchips.it/52-english-news/6815-speculations-...

Visa signatur

Rapportera Redigera

Citera flera Citera (1)

2016-04-03 20:45

Permalänk

Tumnus

Avstängd

Plats: Umeå
Registrerad: Feb 2009

●

Skrivet av Marsupilami:

Intressant att 6700K är snabbare vid minnesläsning med dual-channel DDR4-2133 jämfört med Zen-processorns dual-channel DDR4-2400. Känns ju inte direkt betryggande.

Gå till inlägget

Skillnaden är väl att 6700K är en släppt produkt medan denna Zen är en A0 alltså är fortfarande i teststadiet.

Skrivet av Ratatosk:

En länk senare i den tråden du länkade till.
http://www.bitsandchips.it/52-english-news/6815-speculations-...

Gå till inlägget

Huh..

Visa signatur

||NZXT H440 Black/Red||Intel i5 2500k @ 4,2GHz ||Noctua NH-D14 ||GA-Z77X-UD3H ||8 gb Corsair Vengeance 1600mhz DDR3 ||MSI GeForce GTX 970 ||OCZ Agility 3 120GB SSD ||Samsung Spinpoint F3 1TB ||Corsair HX750W||
Software is like sex, it's better when it's free. - Linus Torvalds

Rapportera Redigera

Citera flera Citera

2016-04-03 21:29

Permalänk

Yoshman

Datavetare ★

Plats: Stockholm
Registrerad: Jun 2011

●

Skrivet av dahippo:

Har en lite annorlunda fråga och utgår från frågeställningen"inget är bättre än svagaste länk". Om man jämför AMDs SMT(Zen) mot Intels SMT. Vad är effektivast, menar inte IPC utan när AMD (Zen) kommer att använda SMT tar de 4 kärnor till en enhet, där varje kärna har 4 ALU, 2 AGU och en FPU del med 2x128 bits FMAC(som klarar 256 bits AVX). Intel SMT(Haswell) utgår från 2 kärnor och har per kärna 4 ALU och 2 AGU och likvärdig FMAC och AVX2. När de har 4 trådar per cykel är 1a 2 på uppgående fyrkants våg medans de sista 2 är på nergående fyrkants våg(kallat HT)?. Hur löser AMD sin SMT är det 4 eller 8 trådar och vilken är effektivast. Någon som har en ide?

Gå till inlägget

Allt för få detaljer kring Zen är känd för att man ska kunna göra någon som helst rimlig gissning kring sådant.

Sedan fungerar inte SMT som du beskriver med att trådar kör på fallande resp. stigande klockflank, finns heller inget i Intels design som utgår från två kärnor. I Zen verkar däremot en "unit" vara fyra kärnor som delar direktaccess till samma L3$-partition.

Varje klockcykel kan Core2 till Broadwell avkoda fyra x86-instruktioner (eller fem vid macro-op fusion). Skylake kan avkoda fem/sex (macro-op fusion). Av allt att döma verkar Zen kunna avkoda fyra x86-instruktioner. Detta gäller oavsett om en eller två trådar används per kärna, däremot finns vad jag vet ingen information om huruvida instruktionerna kommer från en specifik tråd varje klockcykel (rätt troligt ändå) eller om de kan komma från båda trådarna samma cykel.

För alla dessa CPUer delas sedan x86-instruktionerna upp i RISC-liknande interna instruktioner, dessa stoppas sedan in i en lista över instruktioner "in-flight" (out-of-order fönstret) eller en av två sådana listor i Zen, där verkar heltal och flyttal ha separata köer (enligt läckt information, Bulldozer till Steamroller har två sådana listor). Från denna lista kan sedan Core 2 till Ivy Bridge ta upp till sex micro-ops medan Haswell och senare kan ta upp till åtta micro-ops. Av den information som finns kring Zen kan man gissa att den kan ta upp till sex micro-ops.

Fast det är betydligt mer komplicerat än så... Tittar man på Skylake så måste fyra av dessa micro-ops vara beräkningar och gå till heltals/flyttals ALU, två kan vara läsning eller skrivning, en kan bara vara skrivning och den sista är dedikerad för att skriva data till L1D$ (något som i Bulldozer till Streamroller i stället "kostar" en heltalslot, d.v.s. en mindre ALU kan utföras i sådant läge, ingen aning hur Zen fungerar här).

Ska man beskriva det lite enkelt så har Core2-Ivy Bridge 3 ALU och 2 AGU, Haswell och senare har 4 ALU och 3 AGU medan Zen har 4 ALU och 2 AGU. Fast det säger inte mycket mer än vad peak-rate är, det intressanta är genomsnittlig IPC och den kan inte utläsas från detta då den beror på långt fler faktorer.

Tittar man på Intels CPUer och specifikt på SMT så ökade effekten en del i Haswell tack vare högre kapacitet i "back-end". Effekten av SMT ökade rätt mycket i Skylake för heltalsintensiv kod, rimligen för att en enda tråd har väldigt svårt att fylla den högre kapaciteten i "front-end". Däremot tenderar kod som använder SSE/AVX inte få speciellt stor effekt av SMT, gissningsvis för sådan kod ofta är begränsad av kapacitet för flyttalsmultiplikation eller FMA (båda har relativt hög latens 5 cykler innan Skylake, 4 cykler för Skylake, i princip alla heltalsinstruktioner har 1 cykels latens).

Skrivet av Ratatosk:

En länk senare i den tråden du länkade till.
http://www.bitsandchips.it/52-english-news/6815-speculations-...

Gå till inlägget

Fast det sista som står där känns rätt taget ur luften

"Last, but not the least, the part of the news about Intel was true. It seems that Intel will commercialize a 10 cores Broadwell-E due to its own internal Zen simulations (Intel has some data we don't know, yet, and has skilled engineers that know what they do). Zen will have 8 cores, while Broadwell-E 10 cores. So, Intel will have the “King of the Hill”, but Zen seems to be very good in the mid range of the market (AKA, gaming and enthusiast configurations)."

Finns ingen rimlig möjlighet för Intel att göra några vettiga simuleringar av Zen givet den information som är känd. Enda konkreta informationen kring Zens interna design så här långt är väldigt översiktlig information från presentationer samt informationen i GCC-patchen som gav antal ALU, AGU och antal flyttalspipelines.

Finns t.ex. ingen information om exakt vad varje ALU är kapabel till, latens på olika instruktioner, latens mot cache, storlek på out-of-order fönster, storlek på load resp store buffers etc. En vild gissning är ungefär lika bra som en simulering givet informationen som finns så här långt.

Man blundar helt för elefanten i rummet: Xeon E5 finns i tre "smaker", LCC, MCC och HCC (Low/Medium/High Core Count). E-serien har så här långt innefattat alla modeller i LCC-gruppen, med Haswell (Xeon E5 v3) hade denna grupp upp till 8 kärnor medan Broadwell (Xeon E5 v4) har upp till 10 kärnor i LCC-gruppen.

Det som är unikt för LCC-gruppen är att alla kärnor och L3-cache segment sitter på en enda dubbelriktad ringbuffer samt en enda minneskontroller som hanterar fyra kanaler. MCC och HCC har två dubbelriktade ringbuffertar och två minneskontroller som hanterar två kanaler var, mer komplicerad systemagent (uncore) och därmed dyrare krets vilket inte lämpar sig för en konsumentmodell.

Senast redigerat 2016-04-03 21:52

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Rapportera Redigera

Citera flera Citera (6)

2016-04-03 21:50

Permalänk

Ratatosk

Hjälpsam ★

Plats: Karlskoga
Registrerad: Jan 2007

●

Skrivet av Tumnus:

Huh..

Gå till inlägget

http://www.semiaccurate.com/forums/showpost.php?p=259156&post...

Visa signatur

Rapportera Redigera

Citera flera Citera

2016-04-03 21:55

Permalänk

Ratatosk

Hjälpsam ★

Plats: Karlskoga
Registrerad: Jan 2007

●

@Yoshman: Japp verkar konstigt.
Det är svårt att lita på några rykten om Zen, med tanke på att Zen släpps ett halvår senare än Polaris, som vi knappt vet någonting om.

Visa signatur

Rapportera Redigera

Citera flera Citera

2016-04-03 22:42

Permalänk

Tumnus

Avstängd

Plats: Umeå
Registrerad: Feb 2009

●

Skrivet av Ratatosk:

http://www.semiaccurate.com/forums/showpost.php?p=259156&post...

Gå till inlägget

*Insert salt here*

Visa signatur

||NZXT H440 Black/Red||Intel i5 2500k @ 4,2GHz ||Noctua NH-D14 ||GA-Z77X-UD3H ||8 gb Corsair Vengeance 1600mhz DDR3 ||MSI GeForce GTX 970 ||OCZ Agility 3 120GB SSD ||Samsung Spinpoint F3 1TB ||Corsair HX750W||
Software is like sex, it's better when it's free. - Linus Torvalds

Rapportera Redigera

Citera flera Citera

2016-04-03 23:45

Permalänk

dahippo

Medlem ★

Plats: Malmö
Registrerad: Maj 2013

●

@Tumnus:
Det är inte helt omöjligt. Att simulera görs överallt. De vet hur x86 koden skall tillämpas så det finns inte så mycket koden kan avika i hantering mer än i överlappande steg från prefeich till sista cachen. På så sätt kan de säkert "re-engineer" hur Zen löser problem(tekniker och pengar har de) Det blir isåfall till uncore men även de följer standarder.
Edit: Man får komma ihåg att moderkortstillverkare, grafikkortstillverkare, bios-kodare, programvara, OS, kod-standarder osv. är en källa till information, inofficiellt och officiellt.

Senast redigerat 2016-04-04 00:21

Rapportera Redigera

Citera flera Citera

2016-04-04 08:40

Permalänk

sgtspiff

Medlem

Registrerad: Jun 2006

●

Blir bara mer o mer spännande med Zen för varje falska och sanna rykten som hittar ut.
Var lägger dem sig?
Lite knäppt att jämföra mot Intels generationer då AMD säkert kommer kunna få fram vissa processorer som vinner över Intels i prestanda/pris matchen. Frågan är bara var dessa kommer ligga i skalan i7-2600K - i7 6700K?

Visa signatur

Regn är snö på sommarn.

Rapportera Redigera

Citera flera Citera

2016-04-04 12:41

Permalänk

_Merc_

Avstängd

Registrerad: Mar 2012

●

Skrivet av ramlösa:

Håller mig extremt pessimistisk tills den lanserars, Bulldozer var ett jävla skämt när den släpptes. Phenom X6 1100T var snabbare i princip alla lägen, högre IPC och drog mindre ström.
Enligt AMD var Bullsdozer det bästa sen skivat bröd och sen dess har Intel varit det enda alternativet för riktiga speldatorer och laptops.
Att AMD fortfarande finns som ett självständigt företag är för mig en gåta?

Ska uppgradera till vintern när BF5 släpps, har AMD något i närheten av Intels I5k model till ett vettigt pris, så kanske.
Jag är dock jävligt skeptisk, sista gången AMD släppte något riktigt grymt var Radeon 4870 och till en viss del Radeon 290.

Gå till inlägget

Dude. Amds grafikkort har varit riktigt bra sedan 7970 som fortfarande hönger med bättre än kortert nvidia 680 som folk ansåg var bättre. Men tiden visar på bättre kvalite hos amd.

Visa signatur

New: Asus x370 prime pro, Ryzen 1700 (@3.925ghz) , Ripjaws V 16GB 3600 MHz (@3200mhz 14c). https://valid.x86.fr/curj7r
Radeon VII.

Rapportera Redigera

Citera flera Citera (8)

2016-04-04 13:59

Permalänk

-=Sh/\rK=-

Medlem

Plats: Göteborg
Registrerad: Apr 2005

●

Skrivet av anon5930:

Det har betydelse. Eurogamers Digital Foundry-avdelninig testade detta nyligen med 2500K med tidsenliga långsammare DDR3-minnen och snabbare DDR3-minnen. Skillnader kan märkas i olika spel: http://www.eurogamer.net/articles/digitalfoundry-2016-is-it-f...

Tidigare var det inte så stor skillnad men med dagens spel och spelmotorer verkar behovet av högre minnesbandbredd ha ökat. Inte helt dumt att överväga lite snabbare minnen om möjligt.

Gå till inlägget

Redan på Core2Quaden tid kunde jag få 10fps mer i battlefield3 64 spelare multiplayer med en Q9550@4ghz och 5870 crossfire enbart genom att tweaka mitt överklockningsminne till max. Så helt nytt är det inte.

Visa signatur

Rapportera Redigera

Citera flera Citera

2016-04-04 15:14

Permalänk

KalBumling

Medlem ★

Plats: Skogen
Registrerad: Maj 2002

●

Skrivet av -=Sh/\rK=-:

Redan på Core2Quaden tid kunde jag få 10fps mer i battlefield3 64 spelare multiplayer med en Q9550@4ghz och 5870 crossfire enbart genom att tweaka mitt överklockningsminne till max. Så helt nytt är det inte.

Gå till inlägget

Core2 hade dock ingen integrerad minneskontroller och tjänade rätt bra på att köra med högre minnesfrekvenser så länge dom va syncade med FSB. Det var mest senare med nehalem som minnesprestandan drog iväg och processorerna inte var tillräckligt snabba för att utnyttja all bandbredd med högpresterande ddr3.

Rapportera Redigera

Citera flera Citera

2016-04-04 17:18

Permalänk

-=Sh/\rK=-

Medlem

Plats: Göteborg
Registrerad: Apr 2005

●

Skrivet av KalBumling:

Core2 hade dock ingen integrerad minneskontroller och tjänade rätt bra på att köra med högre minnesfrekvenser så länge dom va syncade med FSB. Det var mest senare med nehalem som minnesprestandan drog iväg och processorerna inte var tillräckligt snabba för att utnyttja all bandbredd med högpresterande ddr3.

Gå till inlägget

Jo så var det ju till stor del. Men redan då så predikades det en del att minnet knappt spela någon roll så länge det var en viss hastighet.

Visa signatur

Rapportera Redigera

Citera flera Citera

2016-04-04 18:02

Permalänk

KalBumling

Medlem ★

Plats: Skogen
Registrerad: Maj 2002

●

Skrivet av -=Sh/\rK=-:

Jo så var det ju till stor del. Men redan då så predikades det en del att minnet knappt spela någon roll så länge det var en viss hastighet.

Gå till inlägget

Definitivt, dom största vinsterna på den tiden handlade också om att få ner latenserna så lågt som möjligt och bandbredden var sekundär bortsett från vissa specifika områden.

Rapportera Redigera

Citera flera Citera

2016-04-11 22:05

Permalänk

thomas_skane

Medlem ★

Plats: Wales
Registrerad: Feb 2005

●

Skrivet av anon5930:

Det har betydelse. Eurogamers Digital Foundry-avdelninig testade detta nyligen med 2500K med tidsenliga långsammare DDR3-minnen och snabbare DDR3-minnen. Skillnader kan märkas i olika spel: http://www.eurogamer.net/articles/digitalfoundry-2016-is-it-f...

Tidigare var det inte så stor skillnad men med dagens spel och spelmotorer verkar behovet av högre minnesbandbredd ha ökat. Inte helt dumt att överväga lite snabbare minnen om möjligt.

Gå till inlägget

Intressant, ganska stor skillnad också!

Rapportera Redigera

Citera flera Citera

Rykte: AMD "Zen" skymtas i prestandatester

Externa nyheter