AMD satsar på hög prestanda per kärna med Zen enligt läckt presentation

Permalänk
Medlem

Dom konkar nog innan detta lanseras, alt får så pass stor penningbrist att lanseringen inte kan genomföras. I bästa fall blir någon del av företaget uppköpt av någon...

Permalänk
Medlem
Skrivet av dannesthlm:

Dom konkar nog innan detta lanseras, alt får så pass stor penningbrist att lanseringen inte kan genomföras. I bästa fall blir någon del av företaget uppköpt av någon...

Är också lite rädd för det, vi får se om grafikkorten kan hålla dem i liv tills dess. Annars blir det nog en trevlig arkitektur.

Visa signatur

Ryzen 9 5950X, 32GB 3600MHz CL16, SN850 500GB SN750 2TB, B550 ROG, 3090 24 GB
Har haft dessa GPUer: Tseng ET6000, Matrox M3D, 3DFX Voodoo 1-3, nVidia Riva 128, TNT, TNT2, Geforce 256 SDR+DDR, Geforce 2mx, 3, GT 8600m, GTX460 SLI, GTX580, GTX670 SLI, 1080 ti, 2080 ti, 3090 AMD Radeon 9200, 4850 CF, 6950@70, 6870 CF, 7850 CF, R9 390, R9 Nano, Vega 64, RX 6800 XT
Lista beg. priser GPUer ESD for dummies

Permalänk
Skrivet av dannesthlm:

Dom konkar nog innan detta lanseras, alt får så pass stor penningbrist att lanseringen inte kan genomföras. I bästa fall blir någon del av företaget uppköpt av någon...

Företaget får ju in lite på Xbox och PS 4 försäljningen Så tror inte dom är helt borta vid lansering, dessutom om man ska gå efter hur lång tid det tar att få en cpu färdig och klar (vad jag läst mig till). Så tror jag dom större utgifterna är redan betalda för ZEN. Är väl mer distribution och lagerkostnader som kommer vara en stor utgiftspost ihop med produktionskostnader.

Även med dåliga siffror får dom ändå in rätt mycket (även om det inte är tillräckligt för att gå plus).

Visa signatur

Min spel rigg:FD Define R4|VX 550W|i5 2500K|Corsair LP 4GBX2|Mammabräda P67 Extreme4|GTX 670 windforce|23tum u2312hm
Min gamla/HTPC:AMD 6000+|Ram 2GbX2|Radeon HD5770| XFX 450/nu XFX 550
Mitt bygge: ByggloggFri frakt INET:Fraktfritt sweclockers vid köp över 500kr

#Gilla inlägg som är bra & Använd citera/@"namn" vid snabbt svar

Permalänk
Medlem
Skrivet av Zcenicx:

....AMD är helt enkelt hopplöst efter sina konkurrenter och de halkar bara längre och längre efter....

Skulle gissa på att när vi går över till grafen om några år så dör AMD.
Tvivlar enormt hårt på att de har någon RnD i närheten av god nog att ta klivet från kisel till grafen.

Eller dör var kanske att ta i, men "evigt förpassade till budget kretsar och inbyggda system" kanske.

Visa signatur

SweClockers Dark Pearl tema: http://www.sweclockers.com/forum/trad/1484891
(Rek. Stylus)

Permalänk
Datavetare
Skrivet av pa1983:

Slutsatserna i sweclockers artikel är osannolika och tyvärr säger diagrammet inte mycket alls så det är aldelse för mycket önsketänkande i artikel.

Pcper har klart bättre analys av vad man kan anta och inte och i slutändan säger tyvärr bilden inte speciellt mycket.

http://www.pcper.com/news/Processors/AMD-Zen-Diagram-Leaked-a...

Den nya bilden, den med lite punkter om cachehierarkin, är den enskilt mest informationsvärdefulla som släppts om Zen så här långt. AMD har använt exklusiv policy för cachen sedan K7. Exklusiv cache gör att man i stort sett kan addera storleken på de nivåer som är exklusiva, fungerade riktigt bra så länge det bara var en CPU-kärna (även om det redan då hade högre latens än inklusive cache). När man gick till multicore så borde fördelarna med inklusive cache vara uppenbara, dels lägre latens men man får även s.k. "snoop-filter" (sätt att lura ut om någon annan CPU-kärna har en cacheline som man är på väg att skriva till) gratis via den cache som delas mellan kärnor (L3 i Zen och Intels "Core").

Ska bli intressant att se vilken latens man lyckas få till med 512kB L2 och 128kB L1(?). Ser inte var PcPerspective får 128kB L1 från, det låter också för stort för att vara L1D, 64kB L1I + 64kB L1D är mer rimligt (samma som Athlon/Phenom).

Inte bara fördelar med stor L1D, Intel har ju väldigt hög associationsnivå på sin L1D (8 set på 32kB, de flesta andra har 2 set på 32/64kB), gräver man lite mer inser man att det är väldigt genomtänkt då TLB och L1D uppslagning kan göras samtidigt på Intels CPUer då 32kB (storlek på cache) / 8 (antal set) = 4kB per set -> är storleken på en page -> vilket betyder att man inte behöver den fysiska adressen (som kommer från TLB) för att veta vilken index en eventuell cache-träff har då den bestäms av de nedre 12 bitarna (6 bitar är index och 6 bitar är offset in i cache-line) som är samma för den fysiska och den virtuella adressen (2^12 = 4096).

Svårt att se att man får in 16 set i L1D, vilket betyder att man måste köra med fysiskt taggad, fysiskt indexerad cache -> TLB måste hända innan L1D -> högre latens.

Edit: inser att det också förklarar 16kB L1D$ som Bulldozer-serien har (många var förvånad varför man valde en sådan liten cache när man kört med 64kB innan), är ju exakt samma anledning då den är 4-set associativ 16kB / 4 = 4kB. Det är helt enkelt svårt att bygga en L1$ med hög associationsnivå utan att strömförbrukning och/eller latens drar iväg, så man stannade vid 4-set vilket då begränsade storleken till 16kB.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Piledriver var i princip en prestandabugfixad Bulldozer, fanns en del missar i store-forward logiken och branch-predictorn fungerande inte riktigt heller som tänk när båda trådarna användes i en och samma modul. Det blev inte fel resultat, men väl lägre prestanda är förväntat. Man lade också till några nya instruktioner, bl.a. FMA3 (Bulldozer hade FMA fast enligt FMA4)

I Steamroller jobbade man vidare med branch-predictor, men enligt Anger Fogs undersökningar är det i grunden samma design sedan Bulldozer. Den stora förändringen här var att separat avkodare per CPU-tråd samt att L1I$ ökade i storlek med 50% och gick från 2 set till 3 set associativitet, ökade storleken på TLB, förbättrad prestanda för vissa AVX-instruktioner.

Ivy Bridge fick några nya instruktioner, bl.a. möjlighet till "äkta" slump och F16C (som även Bulldozer har). I front-end gick man från en statisk separation av flera resurser som är separat per CPU-tråd till att de dynamiskt anpassar sig efter last (så om endast en tråd används får den alla resurser). Att flytta data mellan register kan helt utföras i front-end i Ivy Bridge.

Haswell fick en ganska stor förändring i back-end, ett gäng nya instruktioner (bl.a. AVX2), en ökning av storleken out-of-order fönstret.

Broadwell ökade out-of-order fönster ännu lite till, 50% större L2-TLB, separata TLB för 1GB pages, förändringar i branch-predictor, 67% snabbare flyttalsmultiplikation (3 cykler i stället för 5). Broadwell har fått mer nyheter i CPU-delen än man först tror, men kanske inte så intressant för många här på SweC då denna CPU-version blir mest bara något för bärbara enheter.

I varje modell har fått minskad latens för att köra virtualiserade operativsystem (för t.ex. VMenter/exit och Extended Page Table).

Skulle säga att om Bulldozer -> Piledriver -> Steamroller ska ses som nya arkitekturer så ska man definitivt även se Ivy Bridge -> Haswell -> Broadwell som nya arkitekturer. Att effekten blir mindre i "vanliga" program på Intels modeller är för att de är längre till högre i den graf Zotamedu postade om "law of diminishing returns". Kör man med väldigt stora dataset så märks förbättringar kring TLB och virtualisering, men det är inget "vanliga" användare märker.

Är fullt medveten om att IB och BW är lite mer än bara krympningar, syns tydligt i benchmarks om inte annat. IB ger ungefär lika mycket IPC-förbättringar som Haswell. Dock har ju intel valt att kalla dem Tick. Man kan väl säga att det alltid varit lite tock i intels ticks också.
Men det var också därför jag nöjde mig med att säga att AMD inte är så dåliga på att få nya arkitekturer, istället för att säga att de skulle vara bättre som svar på H_Bozz's diss av AMDs utvecklingstakt på arkitekturer. De mäter inte det där helt lika. Tycker båda företagen haft rätt hög takt på arkitekturförbättringar senaste åren. Förr kunde det gå en del tid mellan nämnvärda förändringar i kärnorna.

Permalänk
Medlem
Skrivet av Broken-arrow:

Företaget får ju in lite på Xbox och PS 4 försäljningen Så tror inte dom är helt borta vid lansering, dessutom om man ska gå efter hur lång tid det tar att få en cpu färdig och klar (vad jag läst mig till). Så tror jag dom större utgifterna är redan betalda för ZEN. Är väl mer distribution och lagerkostnader som kommer vara en stor utgiftspost ihop med produktionskostnader.

Även med dåliga siffror får dom ändå in rätt mycket (även om det inte är tillräckligt för att gå plus).

Får lite dåliga vibbar av nya grafikkorten också, känns inte helt seriöst att köra de redan alldeles för gamla nuvarande korten ett varv till i nya serien. Känns "sneaky". Det gör det också lätt att tro att även 390 även till stora delar gammal teknik fast med större krets och med nya minnet "påmoddat" på enklaste vis.

Detta är ju baserat på rykten iof, men jag har lätt att tro att dom stämmer...

Permalänk
Skrivet av dannesthlm:

Får lite dåliga vibbar av nya grafikkorten också, känns inte helt seriöst att köra de redan alldeles för gamla nuvarande korten ett varv till i nya serien. Känns "sneaky". Det gör det också lätt att tro att även 390 även till stora delar gammal teknik fast med större krets och med nya minnet "påmoddat" på enklaste vis.

Detta är ju baserat på rykten iof, men jag har lätt att tro att dom stämmer...

Är inte så simpelt att byta minnen, gpu:n måste ju konstrueras om.

Sen har det blivit riktigt dåligt med 200 kort i handeln (vissa märken i alla fall är det rätt tunt med kort). Så kan ju stämma med senaste ryckte jag hörde (som cirkulerat två gånger) att det bli nya kort i 300 serien, men AMD håller riktigt tyst om hur dom tänkt göra.

Visa signatur

Min spel rigg:FD Define R4|VX 550W|i5 2500K|Corsair LP 4GBX2|Mammabräda P67 Extreme4|GTX 670 windforce|23tum u2312hm
Min gamla/HTPC:AMD 6000+|Ram 2GbX2|Radeon HD5770| XFX 450/nu XFX 550
Mitt bygge: ByggloggFri frakt INET:Fraktfritt sweclockers vid köp över 500kr

#Gilla inlägg som är bra & Använd citera/@"namn" vid snabbt svar

Permalänk
Medlem
Skrivet av Zcenicx:

Båda deras konkurrenter är både tillverkningstekniskt och utvecklingsmässigt ganska långt före AMD, och anledningen heter pengar.

Nyfiken. Hur är Nvidia ganska långt före AMD tillverkningstekniskt?