AMD haussar arkitekturen Zen – erkänner Bulldozer som ett misslyckande

Permalänk
Medlem
Skrivet av Superlight:

Japp.. Kanske en repris på Phenom II fast med 3 i.

Phenom II? Du menar väl kanske Duron 600 eller Athlon Slot A som verkligen rörde om i grytan.

Permalänk
Entusiast
Skrivet av tal666:

Är detta en nyhet ?
Är det kanske en gammal nyhet ?
Är det en bekräftelse och ett löfte ?

Man erkänner att man försökt sälja och säljer en undermålig produkt som många kritiserat och de förnekat, som många bevisat, men de fortsatt smutskasta de granskande källorna... utan att ens be om ursäkt att man målat upp, något som aldrig funnit... = ? ? ?

- Räcker verkligen denna " Bekräftelse " gällande deras beteende och/eller försäljningsverksamhet, deras löften och tidigare historia ?
- Är det så enkelt att de miljontals som hittills trott, men, kanske de flesta vetat, men ändock, de påstått så mycket mer, än de kunnat infria,
att det räcker i efterhand att bekräfta det som vissa vetat... utan att ens folk anklagar dem för att vara oseriösa, eller de använt falsk marknadsföring eller liknande...
- skulle jag köpt en Processor och trott... ens hälften av det dom påstått / och då bott i USA så hade iallafall jag ställt mig i ledet för en sådan där grupptalan mot AMD... för jag skulle känt mig lurad...

- okej, det är väl bra att de än dag erkänner sina fel och brister... men, enbart genom att räkna upp personer som ska vara bra på ett ämne, innebär inte att det pluppar ut ett super-chips i andra ändan, det kanske medgiver, det gör det möjligtvis mer möjligt men, som många säger, Det återstår och se, Ifall AMD kan infria sina löften...

Dold text

p.s tycker dessutom de ska anställa sina före detta, ( jag hoppas och tror för guds skull att de är sparkade för länge sedan... ) PR- ansvariga, för att dagen efter sparka dem än gång till... enbart för att de gjorde ett så lögnaktigt och dåligt jobb med denna lansering att de därför förtjänar än mer förnedring och åthutningar... för vad de en gång i tiden påstod... d.s.
- Lögn(er/are) och bedragare skall få det dom förtjänar... är min åsikt. o.s.v.

Det var längesedan de gick ut och sa att Bulldozer var ett misslyckande. När smutskastade de källor som sa emot? När den först släpptes så gick de ut och sa att en av orsakerna till den dåliga prestandan var kopplat till Windows scheduler som inte hade koll på hur den bäst skulle sprida ut laster över de olika kärnorna eftersom den inte visste att de satt ihop i moduler. Det åtgärdades senare och gav ett par procent extra prestanda. Fast det var inte att smutskasta källorna.

När använde de falsk marknadsföring? När ljög de? Bulldozer var en stor anledningen till att många högt uppsatta fick sparken. De har sparkat väldigt mycket folk sen dess.

Det stämmer att bra namn inte automatiskt ger en bra CPU men de är folk som konsekvent visat att de vet vad de gör. AMD har också visat att de fortfarande kan göra CPUer.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Medlem

Jaha, ska man vänta till 2016 innan det är dags att bygga ny dator då kanske?
Jag var ju sugen till somaren 2015...
Kul att AMD kan ha något nytt på G

Permalänk
Inofficiell ambassadör

Hmmm, intressant! Jag har inte haft en AMD CPU i en spel-dator sen min Athlon 64 3000+. Lyckades klocka upp den till 2,2 GHz mins jag. Ahh.. det var tider det, när de tillverkade saker på 130nm! Vem vet, kanske blir min nuvarande CPU utbytt till en AMD iaf? Borde ju vara dags att byta någon gång runt 2016-2017.

Visa signatur

Mobo Aorus B550 Pro V2 CPU Ryzen 5600X RAM Corsair Vengance 16GB @ 36000 MHZ
GPU MSI GTX 1080 ti Gaming X Skärm Acer X34A

Permalänk
Medlem

Intel behöver bli seriöst hotad på marknaden igen, så man spottar ut teknik man redan har planerat att släppa 3-4 år fram men tänkt mjölka ur konsumenterna miljarder för.

Hoppas innerligt att AMD har något kul att bjuda på, 2016. (Fy vad långt fram!)

Permalänk
Medlem
Skrivet av Yoshman:

Går inte AMD lite brett med tanke på deras resurser? I SweC artikeln om K12

Den andra är att AMD arbetar på en syskonarkitektur baserad på ARMv8. Inte helt olikt Project Skybridge kommer ARM-kärnan K12 vara kompatibel med bolagets framtida högpresterande x86-arkitektur som ersätter Bulldozer.

Läser jag rätt om jag tolkar det som att man tänker göra Skybridge som är en pinkompatibel sockel för low-power ARM och en framtida x86 (efterföljaren till Puma). Ovanpå det ska man designa en egen ARMv8 design, K12 + en x86 variant som är pinkompatibel med K12.

Riktigt coolt om det fungerar, men finns det något hopp om att man har en möjlighet att få ihop alla dessa spår givet de resurser man har?

Verkar inte finnas några detaljer överhuvudtaget kring Zen, men bara det faktum att det ska vara en "big-core" design och att den har SMT tyder på att man siktar på en "bred" design. Största problemet med Bulldozer var egentligen inte CMT, det var att man gjorde (för att vara "big-core" 2011) en rätt "smal" design och förlitade sig på väldigt hög klockfrekvens för att nå bra enkeltrådprestanda, något som inte fungerade i vare sig P4 eller POWER6.

En "bred" design är inte heller garanterad succé, Itanium är en av de bredaste designer som någonsin skapats och den blev inte så lyckad. Men Apple verkar ju ha lyckats väldigt bra med Cyclone som är med råge den "bredaste" ARM-designen som existerar så här långt. Att ha erfarenhet därifrån lär vara väldigt värdefullt.

Vad menas med bred design?

Visa signatur

Min spel rigg:FD Define R4|VX 550W|i5 2500K|Corsair LP 4GBX2|Mammabräda P67 Extreme4|GTX 670 windforce|23tum u2312hm
Min gamla/HTPC:AMD 6000+|Ram 2GbX2|Radeon HD5770| XFX 450/nu XFX 550
Mitt bygge: ByggloggFri frakt INET:Fraktfritt sweclockers vid köp över 500kr

#Gilla inlägg som är bra & Använd citera/@"namn" vid snabbt svar

Permalänk
Datavetare
Skrivet av DavidtheDoom:

Borde inte övergången från CMT till SMP innebära en ganska mycket lättare miljö för OS/programmerare att nyttja resurserna som finns även i desktopmiljö. Tanken du lägger fram där AMD levererar processorer(opterons eller annan server avart) som kanske har lite lägre IPS än intels Xeon men levererar 3 eller kanske tom 4 trådar på ungefär samma energieffektivitet skulle vara mycket intressant för datacenter tror jag. (även om energieffektivetet inte kommer på direkten så kanske det kommer med iteration 2 eller 3 på den?)

Speciellt om man kan kombinera detta med en passande ARM CPU för de beräkningarna som ARM är effektivare på, på samma bräda så volym-inköp möjliggörs. Vad gör det omöjligt att erbjuda moderkort där en Opteron kan ha 2-3ARM processorer som slavar för beräkningar så som PS3 hade med sin PPE kärna som kontrollerade 7st SPEs?
Sedan att AMDs GCN arkitektur är bra på OpenCL beräkningar är inte heller helt dumt. Är det början på ett komplett system som AMD kan leverera till slutkund?

Önskemål:
Sedan skulle det såklart vara trevligt att ha en dedikerad enhet per kärna som sköter skrivandet till minne (istället som bulldozer hade en ALU som fick sköta skrivningarna(tror det var en ALU)).
Och lite tajtare latenser till L-cache såklart.
Hoppas verkligen AMD lyckas driva in kapitalet via sina APU:er och inte behöver stressa ut denna arkitektur.

Försöker man se hur AMD resonerade kring CMT så verkar de haft utgångspunkten att SMT inte är helt optimalt för skrivbordet då det påverkar enkeltrådprestanda negativt (vilket till viss del är sant). Så tror AMD främst försökte göra en desktop-CPU, inte en server-CPU.

CMT hade också varit bättre än SMT för skrivbordet om ökningen i transistorer för att få två bra presterande CPU-trådar per modul hade legat på den nivå som man initialt trodde, har för mig att PR-siffran låg på ca 15% fler transistorer. Problemet är att även 15% är betydligt mycket mer än de 5% som SMT krävde på P4, är mindre idag. Det andra är att 15% inte räckte, man fick fortfarande kvar för många nackdelar p.g.a. delade resurser.

Det är definitivt inte omöjligt att designa en CPU om presterar mer per fysiska kärna än dagens Haswell, bara stoppa in fler CPU-trådar. Problemet är att AMD var inte helt fel ute med att SMT har problem på skrivbordet, en CPU-kärna med 3-4 eller till och med 8 (som SPARC T2-T5) trådar kommer inte vara optimal för interaktiva laster. En möjlig väg är att AMD siktar på skrivbordet/mobila enheter med sina "small-core" designer och går all in på servers på "big-core", K12 verkar i alla fall vara en ren server-krets (även om det finns väldigt lite konkret kring denna än). Finns dock rätt många saker även på en server där enkeltrådprestanda är viktigt, både POWER8 och SPARC T5 verkar innehålla logik för att kunna ändra antal CPU-trådar man har per kärna beroende på typ av last. T5 har ju rätt imponerande bandbredd och i absolut "rätt" last presterar den väldigt bra trots att den faktiskt bara kan köra två SPARC instruktioner per klockcykel, sett till prestanda per CPU-tråd är den däremot chanslös mot Xeon/POWER.

Bra perf/W är ett måste redan från start. En CPU riktad mot datacenter som inte ligger i topp på detta är DoA då en väldigt stor del av totala livscykelkostnaden kommer just från kostnad för el. Så inte alls orimligt att det är just detta man siktar på, fler trådar än de två Intel har gör det möjligt att utföra mer arbete per fysiska CPU-kärna.

Att däremot göra något som presterar bättre än Haswell per CPU-tråd blir nog väldigt svårt, framförallt givet hur långt före Intel verkar vara alla andra vad det gäller att designa en CPU-cache med låg latens vilket är extremt viktigt för att kunna mata en enskild CPU-tråd med data i tid. Flera CPU-trådar per CPU-kärna är ett effektivt sätt att minska kravet på låg latens från CPU-cachen, att 8 trådar ens är vettig någonstans för SPARC trots en bredd på två instruktioner per cykel är att man till stor del ignorerat cachen (vilket gör designen värdelös för skrivbordet) och helt förlitar sig på att någon/några tråd(ar) alltid har den data som behövs för att man ska kunna göra nyttigt jobb i den fysiska kärnan. Kan inte så mycket om design av relationsdatabaser, men där verkar många trådar per CPU-tråd vara rätt användbart.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Datavetare
Skrivet av Broken-arrow:

Vad menas med bred design?

Att den kan avkoda och köra väldigt många instruktioner per klockcykel. Fram till första Pentium kunde x86 köra max en instruktion per cykel, Pentium var den första x86 som var "superskalär" (kunde köra mer än en instruktion per cykel) då den kunde köra upp till två instruktioner per cykel.

Idag har du Silvermont, Jaguar, ARM Cortex A7/A8/A9/A12 som alla exempel på CPUer som kan avkoda upp till två instruktioner per cykel och betecknas som "smala".

Athlon/Phenom/PIII, ARM Cortex A15 och Qualcomm Krait 400 är alla exempel på CPUer som kan avkoda upp till tre instruktioner per cykel.

Haswell är lite lurig. Den kan avkoda fyra instruktioner per cykel, men vissa kombinationer som en "compare" följt av ett hopp baserat på hur "compare" gick slås ihop (macro op fusion) innan avkodning. Så i detta fall blir två x86 instruktioner avkodade som en instruktion vilket då gör att man kan avkoda fem instruktioner per cykel i vissa fall.

Bulldozer/Piledriver kan alla avkoda 4 instruktioner per modul, Kaveri kan göra det per CPU-tråd. Blev ingen större fördel i Kaveri i alla fall, i teorin kan varje modul köra upp till 4 instruktioner per cykel, men två av dessa "pipeline" är extremt begränsade i vad de kan köra så i praktiken beter sig denna design väldigt mycket som om den bara är två instruktioner bred per CPU-tråd.

Apples Cyclone kan avkoda och köra upp till 6 instruktioner per cykel (enligt den black-box undersökning som AnandTech gjorde) och är därför väldigt "bred".

Finns ju två sätt att få bra prestanda per CPU-tråd: hög frekvens eller hög IPC. Om man ignorerar strömförbrukning så kommer en design som är 2 bred och kör på 2GHz alltid vara snabbare i praktiken än en som är 4 bred och kör på 1GHz. Det är en väldigt snabb "diminishing return" efter man passerat en bredd på 2-3, men det andra problemet vi har är att strömförbrukningen går spikrakt upp i himlen vid 3-4GHz. Så det handlar väldigt mycket om avvägning idag. En bredare design drar mer ström per cykel än en smal design, så även om man ignorerar kostnad är det inte självklart att man ska gå så brett som möjligt.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Att den kan avkoda och köra väldigt många instruktioner per klockcykel. Fram till första Pentium kunde x86 köra max en instruktion per cykel, Pentium var den första x86 som var "superskalär" (kunde köra mer än en instruktion per cykel) då den kunde köra upp till två instruktioner per cykel.

Idag har du Silvermont, Jaguar, ARM Cortex A7/A8/A9/A12 som alla exempel på CPUer som kan avkoda upp till två instruktioner per cykel och betecknas som "smala".

Athlon/Phenom/PIII, ARM Cortex A15 och Qualcomm Krait 400 är alla exempel på CPUer som kan avkoda upp till tre instruktioner per cykel.

Haswell är lite lurig. Den kan avkoda fyra instruktioner per cykel, men vissa kombinationer som en "compare" följt av ett hopp baserat på hur "compare" gick slås ihop (macro op fusion) innan avkodning. Så i detta fall blir två x86 instruktioner avkodade som en instruktion vilket då gör att man kan avkoda fem instruktioner per cykel i vissa fall.

Bulldozer/Piledriver kan alla avkoda 4 instruktioner per modul, Kaveri kan göra det per CPU-tråd. Blev ingen större fördel i Kaveri i alla fall, i teorin kan varje modul köra upp till 4 instruktioner per cykel, men två av dessa "pipeline" är extremt begränsade i vad de kan köra så i praktiken beter sig denna design väldigt mycket som om den bara är två instruktioner bred per CPU-tråd.

Apples Cyclone kan avkoda och köra upp till 6 instruktioner per cykel (enligt den black-box undersökning som AnandTech gjorde) och är därför väldigt "bred".

Finns ju två sätt att få bra prestanda per CPU-tråd: hög frekvens eller hög IPC. Om man ignorerar strömförbrukning så kommer en design som är 2 bred och kör på 2GHz alltid vara snabbare i praktiken än en som är 4 bred och kör på 1GHz. Det är en väldigt snabb "diminishing return" efter man passerat en bredd på 2-3, men det andra problemet vi har är att strömförbrukningen går spikrakt upp i himlen vid 3-4GHz. Så det handlar väldigt mycket om avvägning idag. En bredare design drar mer ström per cykel än en smal design, så även om man ignorerar kostnad är det inte självklart att man ska gå så brett som möjligt.

Tackar för förklaringen då är jag med på noterna.

Visa signatur

Min spel rigg:FD Define R4|VX 550W|i5 2500K|Corsair LP 4GBX2|Mammabräda P67 Extreme4|GTX 670 windforce|23tum u2312hm
Min gamla/HTPC:AMD 6000+|Ram 2GbX2|Radeon HD5770| XFX 450/nu XFX 550
Mitt bygge: ByggloggFri frakt INET:Fraktfritt sweclockers vid köp över 500kr

#Gilla inlägg som är bra & Använd citera/@"namn" vid snabbt svar

Permalänk
Medlem

Om det blir en bra uppgradering från min ivy i5 4.7 ghz så blir det nog ett köp

Visa signatur

3570k 4.7 ghz - ASUS 660ti - 4*4gb - 840 250gb
Citera för svar
/Jacob

Permalänk
Moderator
Festpilot 2020, Antiallo
Skrivet av Yoshman:

Försöker man se hur AMD resonerade kring CMT så verkar de haft utgångspunkten att SMT inte är helt optimalt för skrivbordet då det påverkar enkeltrådprestanda negativt (vilket till viss del är sant). Så tror AMD främst försökte göra en desktop-CPU, inte en server-CPU.

CMT hade också varit bättre än SMT för skrivbordet om ökningen i transistorer för att få två bra presterande CPU-trådar per modul hade legat på den nivå som man initialt trodde, har för mig att PR-siffran låg på ca 15% fler transistorer. Problemet är att även 15% är betydligt mycket mer än de 5% som SMT krävde på P4, är mindre idag. Det andra är att 15% inte räckte, man fick fortfarande kvar för många nackdelar p.g.a. delade resurser.

Det är definitivt inte omöjligt att designa en CPU om presterar mer per fysiska kärna än dagens Haswell, bara stoppa in fler CPU-trådar. Problemet är att AMD var inte helt fel ute med att SMT har problem på skrivbordet, en CPU-kärna med 3-4 eller till och med 8 (som SPARC T2-T5) trådar kommer inte vara optimal för interaktiva laster. En möjlig väg är att AMD siktar på skrivbordet/mobila enheter med sina "small-core" designer och går all in på servers på "big-core", K12 verkar i alla fall vara en ren server-krets (även om det finns väldigt lite konkret kring denna än). Finns dock rätt många saker även på en server där enkeltrådprestanda är viktigt, både POWER8 och SPARC T5 verkar innehålla logik för att kunna ändra antal CPU-trådar man har per kärna beroende på typ av last. T5 har ju rätt imponerande bandbredd och i absolut "rätt" last presterar den väldigt bra trots att den faktiskt bara kan köra två SPARC instruktioner per klockcykel, sett till prestanda per CPU-tråd är den däremot chanslös mot Xeon/POWER.

Bra perf/W är ett måste redan från start. En CPU riktad mot datacenter som inte ligger i topp på detta är DoA då en väldigt stor del av totala livscykelkostnaden kommer just från kostnad för el. Så inte alls orimligt att det är just detta man siktar på, fler trådar än de två Intel har gör det möjligt att utföra mer arbete per fysiska CPU-kärna.

Att däremot göra något som presterar bättre än Haswell per CPU-tråd blir nog väldigt svårt, framförallt givet hur långt före Intel verkar vara alla andra vad det gäller att designa en CPU-cache med låg latens vilket är extremt viktigt för att kunna mata en enskild CPU-tråd med data i tid. Flera CPU-trådar per CPU-kärna är ett effektivt sätt att minska kravet på låg latens från CPU-cachen, att 8 trådar ens är vettig någonstans för SPARC trots en bredd på två instruktioner per cykel är att man till stor del ignorerat cachen (vilket gör designen värdelös för skrivbordet) och helt förlitar sig på att någon/några tråd(ar) alltid har den data som behövs för att man ska kunna göra nyttigt jobb i den fysiska kärnan. Kan inte så mycket om design av relationsdatabaser, men där verkar många trådar per CPU-tråd vara rätt användbart.

Att du drar in SPARC och hur den sköter data och cache med antalet trådar gör det väldigt tydligt för mig hur betydande det är att ha snabb respons. Dock måste SPARC vara bra trevlig för numbercrunching?

Får hoppas att de inte går åt det hållet att de bara använder sina small cores på desktop sidan. Såvida de inte vidare utvecklar de designerna till "big-core" eller åtminstone gör skillnaden mellan dagens Jaguar och intels Big-core "Core serie" mindre märkbar.
Var inte problemet med Jaguar att de är svåra att få upp i frekvenser mycket högre än 3GHz och fortfarande vara energieffektiva? Sedan är 2-issue lite väl lågt om man jämför med konkurrenten för att göra det trevligt i prestanda toppen.

Sidenote:
Har dock hört att VIA har en väldigt bred design, är det bara pga många iops/c eller innefattar det även komplexa instruktioner som stöds på deras x86, dvs deras decoder klarar av att kombinera aritmetiska operationer med branches precis som haswell kan eller kanske tom ännu mer avancerade instruktioner?

Visa signatur

 | PM:a Moderatorerna | Kontaktformuläret | Geeks Discord |
Testpilot, Skribent, Moderator & Geeks Gaming Huvudadmin

Permalänk
Medlem

Skönt att höra att de ändå har ambitioner kvar för prestandasegmentet. Tidigare har de gett sken av att helt släppa segmentet och enbart satsa på APU.

Visa signatur

Gilla min Guide till sweclockers tävlingen! :D : #12510535

Min Sweclockers-låt som aldrig deltog i Jultävlingen. Enjoy! https://www.youtube.com/watch?feature=player_embedded&v=g7gof...

Permalänk
Datavetare
Skrivet av DavidtheDoom:

Att du drar in SPARC och hur den sköter data och cache med antalet trådar gör det väldigt tydligt för mig hur betydande det är att ha snabb respons. Dock måste SPARC vara bra trevlig för numbercrunching?

Nope, för numbercrunching behöver man en snabb och relativt stor cache kopplat med hög kapacitet per cykel. Just numbercrunching var en av de få saker som Itanium (som är väldigt "bred") var riktigt bra på.

Det som SPARC är bra på är saker där det är väldigt osannolikt att man har hög s.k. "spatial" eller "temporal" lokalitet. Gissar att har man en väldigt stor relationsdatabas så blir det ganska troligt att data ändå trillar ur cache innan man vill ha samma data igen.

SPARC Tn har också väldigt hög bandbredd i det som motsvarar QPI på Intel. Har inte riktigt förstått poängen med detta då QPI bara används för att hålla CPU-cachen koherent mellan olika CPU-sockets och program som orsakar mycket cache-koherenstrafik är normalt korkat skrivna program som aldrig kommer skala speciellt väl över CPU-kärnor. Men gissar igen att för relationsdatabaser så kanske man måste skriva logik som orsakar mycket cache-koherenstrafik, något som leder till hög latens för minnesoperationer och många CPU-trådar är i praktiken enda sättet att "gömma" den latensen.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Hjälpsam
Skrivet av Zotamedu:

Det var längesedan de gick ut och sa att Bulldozer var ett misslyckande. När smutskastade de källor som sa emot? När den först släpptes så gick de ut och sa att en av orsakerna till den dåliga prestandan var kopplat till Windows scheduler som inte hade koll på hur den bäst skulle sprida ut laster över de olika kärnorna eftersom den inte visste att de satt ihop i moduler. Det åtgärdades senare och gav ett par procent extra prestanda. Fast det var inte att smutskasta källorna.

När använde de falsk marknadsföring? När ljög de? Bulldozer var en stor anledningen till att många högt uppsatta fick sparken. De har sparkat väldigt mycket folk sen dess.

Det stämmer att bra namn inte automatiskt ger en bra CPU men de är folk som konsekvent visat att de vet vad de gör. AMD har också visat att de fortfarande kan göra CPUer.

Tror fortfarande att en del av den dåliga prestandan delvis beror på Windows Scheduler, den låter processerna hoppa för mycket mellan kärnorna, detta drabbar även Intel, men det verkar som att AMD drabbas hårdare, skillnaden mellan AMD och Intel minskar något i Linux, som har en bättre scheduler.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Skrivet av Yoshman:

Den ligger väl på ca 15-20% rent generellt, finns specifika områden som t.ex. flyttalsberäkningar som kan använda AVX där prestanda är ungefär fördubblat. Men tvivlar stark på att Intel lutar sig tillbaka med tanke på att de är sin egen värsta konkurrent, när prestandaförbättringen är så låg den är nu så finns det ingen rationell anledning för den stora massan att uppgradera. Det man lever på nu är att perf/W har ökat rätt rejält och majoriteten kör numera inte traditionella stationära PC.

Lite andra saker som pekar på att det kanske inte är möjligt att öka enkeltrådprestanda är att ingen har lyckats bygga en CPU-kärna som kan klockas mer än 3-4GHz utan att strömförbrukningen rusar iväg. Ingen har heller lyckats bygga en CPU-kärna med högre IPC än Haswell. Haswell kan i teorin köra upp till 4 x86 instruktioner per CPU-cykel (och upp till 8 µops per cykel).

Apples A7 (Cyclone) kan enligt AnandTechs undersökning köra upp till 6 ARM instruktioner per CPU-cykel och kan trots det som bäst matcha Haswell i IPC (dock med en mycket lägre frekvens) i Geekbench, i alla riktiga program ligger den efter.

IBM POWER7 kan avkoda upp till 6 och köra upp till 8 PowerPC instruktioner per cykel, inte heller den klår Haswell i utfört arbete per CPU-tråd, men POWER7 och Haswell är de två designen idag med högst genomsnittlig IPC och POWER7 kan nå högre utför arbete per kärna tack vare 4 CPU-trådar per kärna.

Vad är poängen med detta? Det kanske är så att det helt enkelt går att få ut speciellt mycket bättre IPC då det finns en begränsning i hur stor parallellism som går att extrahera ur en enda instruktionsström. Forskning visar att den teoretiskt maximala IPC man kan nå varierar en del med uppgift, men det ligger ungefär på 2 eller strax däröver. Haswell ligger redan där, har under mätningar sett upp till IPC på 2.5 som högst i riktiga program.

Är därför SMT (Simultaneous MultiThreading) är en så vettig idé, framförallt på servers där IPC ofta ligger klart lägre än vad man ser på typiska desktop-program. SMT är bl.a. bra för det gör det vettigt att ha väldigt "breda" designer då flera instruktionsströmmar betyder mycket högre parallellism, POWER7 kan köra upp till 4 trådar per CPU-kärna vilket, något som då gör det möjligt att använda den väldigt breda designen. En väldigt "bred" design betyder också att man typiskt får bättre IPC nära bara en tråd används, vilket gör en sådan design vettig.

Att ha en "bred" design utan SMT kan fungera, vilket Cyclone visar. Problemet är att det bara fungerar i vissa typer av applikationer, typiskt väldigt små/simpla program som i stort sett helt körs ur L1-cachen (Geekbench), fungerar inte alls bra på en server eller i andra typer av "svåra" laster.

Ska därför bli väldigt intressant att höra hur AMD tänker kring Zen, att optimera för server kräver lite andra val än att optimera för skrivbordet. Låter lite som man tänker sikta mer på servers, så kanske blir fler än två trådar per CPU-kärna med mer fokus på bandbredd. Skrivbordet kräver mer fokus på maximal prestanda per CPU-tråd och fokus på låg latens, bandbredd är ett icke-problem i dagens "big-core" CPUer för skrivbordet, vilket bl.a. syns på E-serien där dessa dubbelt så höga bandbredd i stort sätt inge ger någon fördel alls mot andra modeller.

Hur ligger POWER8 med sina 12 kärnor med 8 vägs SMT till?? Dubbla vektorenheter är lite gulligt! Allt färdigt i en SoC som kan klara 16vägs SMP(tror jag). Dock används en variant av nordbrygga för att ansluta RAM. En Centaur+ som kan hantera HMC vore inte fel. Annat som inte vore så dumt skulle kunna vara IB on-chip, dvs en mellanox variant.

IBM verkar ha gjort hemläxan, gcc har en P8kapabel backend(-march=power8 och -mtune=power8), linuxstöd fixades i 3.8, KVM uppdateras as we speak.
Det finns "BIOS" (OPAL?) på github.

Återstår att se hur de lyckas licensiera ut det o få igång konkurens mellan chipsbrännande foundries.

Måste vara djävulskt coolt att gå till jobbet om man heter Stewart Smith

Permalänk
Datavetare
Skrivet av CamelCase:

Hur ligger POWER8 med sina 12 kärnor med 8 vägs SMT till?? Dubbla vektorenheter är lite gulligt! Allt färdigt i en SoC som kan klara 16vägs SMP(tror jag). Dock används en variant av nordbrygga för att ansluta RAM. En Centaur+ som kan hantera HMC vore inte fel. Annat som inte vore så dumt skulle kunna vara IB on-chip, dvs en mellanox variant.

IBM verkar ha gjort hemläxan, gcc har en P8kapabel backend(-march=power8 och -mtune=power8), linuxstöd fixades i 3.8, KVM uppdateras as we speak.
Det finns "BIOS" (OPAL?) på github.

Återstår att se hur de lyckas licensiera ut det o få igång konkurens mellan chipsbrännande foundries.

Måste vara djävulskt coolt att gå till jobbet om man heter Stewart Smith

Problemet med både POWER och SPARC T är att en 18 kärnors Intel Xeon E5 må vara dyr (ca $4000 per CPU-krets) men man får ändå lägga på en nolla till för att komma till prislappen på de två förra... Inte så lätt att hitta system där den extra kostnaden går att motivera, framförallt inte när Intel numera typiskt får fler "vinster/världsrekord" än de andra vid release av nya modeller i den benchmarks som man använder för servers. Nya 2x 18 kärniga Xeon E5 slog 27 "världsrekord". Oracle (och tidigare SUN) brukar ju slå väldigt mycket på trumman över de "världsrekord" man slagit, men de har aldrig haft den här utdelningen på en ny modell. Tycker själv dessa benchmarks är rätt ointressanta då det alltid är möjligt att slå ett rekord bara man väljer ett tillräckligt extremt fall som passar sin egen design.

Har ändå lite känsla för svagheter och styrkor på båda dessa då jag jobbat mycket med PowerPC (som numera är kompatibel på instruktionsnivå med POWER) och har en gång i tiden jobbat en hel del med att optimera för SPARC (blivit en del SPARC assembler hackande).

En sak man ska komma ihåg med SMT är att det för programmeraren är ganska trevligt. Att effektivt skriva program för ett system med 2*N fysiska kärnor är väldigt mycket svårare än att göra samma sak för N kärnor. Programutvecklingen påverkas däremot inte av antal CPU-trådar, snarare så att det blir lättare ju fler trådar man har. Anledning är att all form av synkronisering mellan fysiska kärnor är något man måste sky som pesten då det är väldigt dyrt/långsamt, men synkronisering mellan CPU-trådar körandes på samma fysiska CPU-kärna är i stort sätt "gratis" + att med flera trådar så är det ett mindre problem att synkronisera mot andra trådar då det bara "stallar" en CPU-tråd, inte hela CPU-kärnan.

Just POWER7/8 har en annan sak: det finns modeller med nästa 100MB LLC (Last Level Cache)! IBM och Oracle verkar ha väldigt olika uppfattning om hur viktig cache är för en server, ska bli intressant att se hur AMD ställer sig på den skalan, ska man titta på Cyclone så verkar det som designerna där lutar åt IBM hållet (även om nu Cyclone är designad för en helt annan marknad).

Att IBM lägger så mycket krut på både GCC och Linux-stöd för POWER8 visar att man inser att det är en förutsättning för att lyckas. Intel lägger ju väldigt mycket resurser på GCC och Linux också, bl.a. så köpte man CilkArts för att sedan skänka deras teknik (Cilk+) till GCC-projektet + att man hade avlönade programmerare som tog hand om integrationen. Här har AMD uppförsbacke i att man helt enkelt inte har dessa resurser, både IBM och Intel ser numera till att stödet för att använda nya modeller finns redan innan modellen lanseras, något som naturligtvis snabbar på användningen av de nyheter man stoppat in.

Även ARM har uppförsbacke vad det gäller stöd för HW-finesser i kärnan och bra kompilator stöd. Jobbar just nu en hel del med ARM på Linux och det är rätt frustrerande när man jämför stödet mellan x86 (främst Intel) och ARM. Möjligheten att hitta detaljer kring hur en viss ARM CPU-systemkrets fungerar är ofta väldigt svårt, både AMD och Intel är _långt_ mycket mer öppna med hur de designat sina x86 CPUer.

För att återgå till POWER8. Dokumentet du länkar till nämner just att SMT8 normalt sett inte ger speciellt mycket, men för relationsdatabas (MySQL i dokumentet) så ger det ändå en del just p.g.a. av hur man använder mutexes (som är synkroniserade objekt). Så massor med CPU-trådar verkar helt klart vara användbart just för RDB.

Inga tvivel om att POWER8 är ett monster, men pris och till viss del strömförbrukning gör den rätt ointressant för alla utom de med väldigt specifika krav. AMD lär rikta in sig på den breda massan precis som Intel.

EDIT: blev lite väl långt, gjorde en till post

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Datavetare

På tal om "breda" designer. Läste på lite om POWER8...

Den kan avkoda (issue) upp till 8 instruktioner och kan internt påbörja (dispatch) 10 instruktioner per cykel. Som jämförelse med Haswell så kan HSW avkoda 4 x86 instruktioner och internt påbörja 8 µops per cykel.
POWER8 kan faktiskt har mer än 100MB LLC och den har en bandbredd mot RAM på upp till 230GB/s, d.v.s mer bandbredd än de värsta grafikkorten fast här talar vi om 100-tals GB eller till och med TB av RAM.

POWER8 har (tack vare sin bredd och 8 trådar per kärna) "rekordet" i heltalstestet SPECint_rate_2006 räknat per CPU-kärnan (finns modeller med upp till 12 kärnor per krets), men Xeon E5 2600 v3 har "rekordet" per CPU-tråd och per CPU-sockel (tack vare två trådar per kärna och max 18 kärnor per krets).

Nördporr på hög nivå att läsa om dessa CPUer. Måste hitta en anledning till varför de ska uppdatera den 2x Xeon 2600 v1 som jag har som arbetsstation på jobbet

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Låt mig gissa intel, eller någon okänd aktör har patent på "simultaneous multithreading". Inte sant?

Visa signatur

No man is free who is not master of himself

Permalänk

Själv så sitter jag på endast Intel/Nvidia men vill fanimeg att AMD får upp en architektur som sparkar arsle och tuggar tuggumi.

Visa signatur

CPU i9-9900K GPU ASUS RTX 2080 TI Strix OC MB ASUS STRIX Z390-E RAM Corsair VENGEANCE RGB 32GB DDR4 3200MHz Case Fractal Design Define C PSU EVGA G3 850W Cooling Noctua D15
Monitor MSI Optix MAG342CQR SSD Samsung 970 EVO 500GB 860 EVO 500GB 860 QVO 2TB + QVO 4TB PLEX Server 2x HC560 20TB+WD RED 2x10TB+12TB

Permalänk
Datavetare
Skrivet av Luminous:

Låt mig gissa intel, eller någon okänd aktör har patent på "simultaneous multithreading". Inte sant?

IBM var först att forska kring SMT, i slutet av 60-talet... Så nej. Oavsett så har Intel och AMD korslicensieringsavtal tack vare att Intel är beroende av att kunna använda 64-bitars x86.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Moderator
Festpilot 2020, Antiallo

https://www.youtube.com/watch?v=SOTFE7sJY-Q

Här har ni en video där Keller uttalar sig om nästa omgång med processorer.

Måste även få fråga: Vart kommer "Haussar" ifrån och vad betyder det? Är det en väldigt försvenskling av Housing. I så fall skulle jag föreslå House:ar.

Visa signatur

 | PM:a Moderatorerna | Kontaktformuläret | Geeks Discord |
Testpilot, Skribent, Moderator & Geeks Gaming Huvudadmin

Permalänk
Skrivet av Yoshman:

Problemet med både POWER och SPARC T är att en 18 kärnors Intel Xeon E5 må vara dyr (ca $4000 per CPU-krets) men man får ändå lägga på en nolla till för att komma till prislappen på de två förra... Inte så lätt att hitta system där den extra kostnaden går att motivera, framförallt inte när Intel numera typiskt får fler "vinster/världsrekord" än de andra vid release av nya modeller i den benchmarks som man använder för servers. Nya 2x 18 kärniga Xeon E5 slog 27 "världsrekord". Oracle (och tidigare SUN) brukar ju slå väldigt mycket på trumman över de "världsrekord" man slagit, men de har aldrig haft den här utdelningen på en ny modell. Tycker själv dessa benchmarks är rätt ointressanta då det alltid är möjligt att slå ett rekord bara man väljer ett tillräckligt extremt fall som passar sin egen design.

Det är väl helt en fråga om volymer? Som sagt, den där extra nollan gäller säkert om du köper ett helt system från IBM. Men den avgörande punkten med POWER8 är troligen inte tekniken utan affärsmodellen, dvs licensiering a la ARM. På tal om ARM, får de inte ordning på standardisering med SBSA så missar de snart tåget.

Permalänk
Medlem
Skrivet av DavidtheDoom:

https://www.youtube.com/watch?v=SOTFE7sJY-Q

Här har ni en video där Keller uttalar sig om nästa omgång med processorer.

Måste även få fråga: Vart kommer "Haussar" ifrån och vad betyder det? Är det en väldigt försvenskling av Housing. I så fall skulle jag föreslå House:ar.

Minns ej ordets ursprung men läs här http://g3.spraakdata.gu.se/saob/show.phtml?filenr=1/94/130.ht...

Visa signatur

Storburk: Ryzen 7 3700X, MSI B450M Mortar, FD Define Mini, CM M2 Silent 720W, 32 GB, RX 5700 XT 8GB, NVME SSD + HDD - HTPC: Ryzen 5 2400G, 16 GB, NVME SSD, BeQuiet 550W

Permalänk
Moderator
Festpilot 2020, Antiallo
Skrivet av Videoapan:

Ett tyskt ord av ett franskt ord av latiska "Altus". Snyggt. Nu har man lärt sig ngt nytt.

Visa signatur

 | PM:a Moderatorerna | Kontaktformuläret | Geeks Discord |
Testpilot, Skribent, Moderator & Geeks Gaming Huvudadmin

Permalänk
Avstängd

Ta inte ut något i förskott, man sa ju samma sak om Bulldozer innan den kom.
(Klipp, klistra och basha nu ungar. )

Men jag hoppas verkligen att dom har något riktigt grymt på gång, det står i princip still på CPU-fronten just nu tack vare att AMD inte kunnat konkurera i prestandasegmentet. För min del spelar det ingen roll om det står AMD, Intel eller något annat märke för den delen, det enda jag bryr mig om är prestandan i relation till det jag tänkt använda produkten till.

Permalänk
Medlem

Som många av oss sa.. men som fanboys vägrade erkänna.

Alltid roligt att se fjantar böla

Och ja, du är en fjant om du bryr dig om ett företag så pass mycket, det är bara ett företag som vill tjäna pengar på de produkter de gör och uppenbarligen klantade de till det så som många av oss tidigare hävdade.

Visa signatur

Intel Core i7 8700K, MSI GeForce GTX 1080 Ti 11GB Gaming X, Samsung 960 EVO 1TB, MSI Z370 GAMING M5, Corsair 32GB (4x8GB) DDR4 3200MHz CL16 Vengeance, EVGA Supernova G3 850W

INTEL CORE I7 3930K 3.20GHZ 12MB S-2011, FRACTAL DESIGN MIDITOWER DEFINE R3, CORSAIR HX 1050W, ASUS RAMPAGE IV FORMULA, Asus STRIX GTX970, CORSAIR 16GB DDR3 DOMINATOR QUAD 1866MHZ CL9 (4X4GB) Ljud: ASUS Xonar D2X/XDT 7.1 | Elac 5.1 +förstärkare | Cambridge dacmagic plus | Astro gaming A40 | Sennheiser HD 650
You ask me if I have a god complex? Let me tell you something, I am god!

Permalänk
Hjälpsam
Skrivet av IceDread:

Som många av oss sa.. men som fanboys vägrade erkänna.

Alltid roligt att se fjantar böla

Och ja, du är en fjant om du bryr dig om ett företag så pass mycket, det är bara ett företag som vill tjäna pengar på de produkter de gör och uppenbarligen klantade de till det så som många av oss tidigare hävdade.

Det är inte fjantigt att vilja ha en fungerande konkurrens, två jämnstora aktörer pressar priserna och stimulerar utveckling.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Medlem

Hoppas AMD kan komma igen, känns som att intel har dominerat rätt kraftigt de senaste åren.

Visa signatur

Stationär: mITX 4670k GTX770 16gb RAM
Bärbar: Lenovo y50-70 4720HQ 960M 8GB RAM

Permalänk
Entusiast
Skrivet av Ratatosk:

Det är inte fjantigt att vilja ha en fungerande konkurrens, två jämnstora aktörer pressar priserna och stimulerar utveckling.

Lite intressant att ett oligopol klassas som fungerande konkurrens. Eller ja, tekniskt sett ett duopol.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Datavetare
Skrivet av Ratatosk:

Det är inte fjantigt att vilja ha en fungerande konkurrens, två jämnstora aktörer pressar priserna och stimulerar utveckling.

Som tur är så har marknaden för CPUer blivit som marknaden för operativsystem på skrivbordet: skillnaden mellan versioner är så minimal att det totalt kvittar för majoriteten av användarna vilken version/modell de kör. I det läget blir får även en dominant rejält konkurrens, av sina egna produkter! Om inte priset är konstant eller sjunkande så kommer ytterst få att köpa nya modeller.

Sedan har faktiskt Intel mer konkurrens på CPU-sidan än de haft på väldigt många år, från Qualcomm och till viss del även från Samsung, Allwinner, MediaTek m.fl.

Som konsument ska man aldrig vara trogen ett företag, de är inte din vän utan du är bara någon de vill klå på så mycket pengar som möjligt. Man ska köpa från det företag som för tillfället erbjuder bäst produkter för dig!

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer