AMD Zen får 40 procent högre prestanda än Excavator vid samma klockfrekvens

Permalänk
Medlem
Skrivet av Yoshman:

Man får vara väldigt tydligt med vad man menar med att Bulldozer skulle fungera bra på multitrådat. Det gick inte speciellt bra att skala den designen till 16 CPU-kärnor, resultatet blev inte snabbare än AMDs gamla 12-kärnor variant baserad på K10 och det blev långsammare än Intels 8-kärniga Xeon E5. CMT skalar "bättre" än SMT till flera kärnor enbart för att prestanda per tråd är usel, tror ingen skulle hurra om man minskade enkeltrådprestanda till 75% av vad den är idag på Intels CPUer för att sedan göra all kraft tillgänglig när båda trådarna används. "Skalningen" skulle då bli fantastisk bra, men enbart för man minskat enkeltrådprestanda.

Jämför man i7-2600 och FX-8350 så kan man konstatera att båda har ca 1.2 miljarder transistorer, båda använde 32nm. Den förra tar ändå 50% mindre kretsyta (hur mycket plats transistorer tar beror på användningsområde), innehåller en iGPU. I fall där alla 8 CPU-trådar används effektivt presterar dessa två modeller väldigt likvärdigt, i med trådar presterar den förra rejält mycket bättre. Var finns det något positivt i Bulldozer-desigen?

Nu verkar tyvärr den "läckta" presentationen på Zen vara fake (de presenterades inte här och finns diskussioner på flera techsiter om möjliga källor för dessa slides), men allt tyder ju på att Zen på många sätt är allt det Bulldozer inte var. Så inte ens AMD verkar tycka att det var något bra med dagens design.

Antag att det är så, förklara då varför det sker så mycket utveckling på serversidan där Intels dominans är större än vad den är på skrivbordet? Du tror inte det är så att mobilsidan utvecklas fort för det är dit de stora massorna går, serversidan utvecklas för att det är tekniskt vettigt att skala upp dessa modeller via fler CPU-kärnor (samt allt våra vanor med mobila enheter kräver allt större maskiner i datacentret)?

Desktopsidan har kört fast, det går inte att öka IPC. Jämför Broadwell och Silvermont, det skiljer mindre än en faktor 2 i IPC, tittar man på storleken på interna köer, storlek på out-of-order fönster, antal instruktioner som teoretiskt kan köra per cykel, etc så är Broadwell 4-10 gånger större/bredare på varje punkt. Man har med råge nått punkten där mer transistorer för att få upp IPC fungerar inte.

Det går inte heller att öka frekvensen speciellt lågt över 4GHz utan att strömförbrukning rusar. Och det är inte vettigt att öka antal CPU-kärnor då interaktiva program inte har någon nytta av det (spel är en form av simulering, gör man bara "rätt" typ av simulering skulle det definitivt gå att utnyttja massor med kärnor här).

Dold text

Vet inte om det är fejk alls. Sliden är identisk i design med övriga presentationen, numrering och placering av information stämmer perfekt, det är samma formspråk, teckensnitt och färgval. Den som i så fall förfalskat sliden måste fortfarande haft tillgång till presentationen i förväg för att pricka så bra med designen.
Kan vara så att AMD helt enkelt tog bort den delen, eller om den delen var för information bakom lyckta dörrar.

Permalänk
Avstängd

Zen bra väntar jag på för uppgradering.
Gött

Visa signatur

Träna bort dyslexin. Ryzen 3600 - asus B350plus - Msi Vega56 - Acer 1440p 144hz - M.2 ssd - asus essence stx - Sennheiser hd600 - Corsair 750w - 16gb ram 3ghz - atcs 840 - luftkylt - Felsökning? (Lär dig Googla)

Permalänk

Låter väldigt bra med 40% högre IPC jämfört med Excavator! Kommer bli riktigt skoj att se hur Zen kommer att prestera mot Bulldozer arkitekturen som AMD har nu.

Visa signatur

Bärbar Speldator: AMD Ryzen 5 5600H I Nvidia RTX 3050 Ti
Xiaomi Poco X3 Pro I Nvidia Shield TV V2 I PS4 I

Permalänk
Medlem
Skrivet av Swedish Berserk:

Låter väldigt bra med 40% högre IPC jämfört med Excavator! Kommer bli riktigt skoj att se hur Zen kommer att prestera mot Bulldozer arkitekturen som AMD har nu.

Man får inte glömma att Excavator ligger runt 15% över Piledriver i IPC heller. 5% över Steamroller som i sin tur är runt 5-15% över Piledriver beroende på applikation.

Permalänk
Medlem
Skrivet av Aleshi:

Man får inte glömma att Excavator ligger runt 15% över Piledriver i IPC heller. 5% över Steamroller som i sin tur är runt 5-15% över Piledriver beroende på applikation.

Så för att få ett hum kan man säga ca 50-60% ökning i IPC över Piledriver, om man nu antar att siffrorna från presentationen stämmer? I så fall borde den ju faktiskt närma sig Sandy Bridge eller till och med Ivy Bridge.

Visa signatur

Stationär: Fractal Design Meshify 2 Compact, Ryzen 7 5700x, MSI MAG B550 Tomahawk, Kingston HyperX Fury 32GB 3600Mhz CL18, Sapphire Radeon RX 5700 Pulse, Kingston KC3000 1TB, Kingston A2000 1TB, Seasonic Focus GX 650W, Noctua NH-U14S

NAS: Fractal Design Define R5, Ryzen 3 1200AF, Asus Prime B450M-A, 32GB ECC DDR4 @ 2133Mhz, 5x WD Red 4TB (Raidz2), WD Red 2TB (stripe), TrueNAS 12.0

Permalänk
Datavetare
Skrivet av Aleshi:

Vet inte om det är fejk alls. Sliden är identisk i design med övriga presentationen, numrering och placering av information stämmer perfekt, det är samma formspråk, teckensnitt och färgval. Den som i så fall förfalskat sliden måste fortfarande haft tillgång till presentationen i förväg för att pricka så bra med designen.
Kan vara så att AMD helt enkelt tog bort den delen, eller om den delen var för information bakom lyckta dörrar.

AMD har kommenterat dessa slide så här

These slides contain fabricated content and were not generated by or on behalf of AMD.

Hade de varit korrekta hade man sagt något i stil med "inga kommentarer". Här är någon som till och med bemöda sig att göra en datoranalys av presentationen som visar flera saker som tyder på att de är fake.

Däremot verkar den/de som gjort fake-slides ha hyfsad koll på processordesign, så det kan komma att visa sig att man inte gissade så illa (vilket i.o.f.s. inte är något jättebedrift då det inte fanns speciellt mycket detaljer). De detaljer som ändå presenterades har nagelfarits rätt hårt av extremt kunniga personer på RealWorldTech och där har man lite funderingar kring vettigheten i relativ storlek på L2$ kontra L3$ om det stämmer att de nu får inklusiv-policy (vilket vi definitivt får hoppas är fallet).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
99:e percentilen
Skrivet av skruvis:

Den verkliga prestandan är vad hela processorn verkligen kan prestera när den får visa vad den kan, singeltråd prestandan är bara en del av sanningen.

Inte för konsumenter. Vi vill ha hög enkeltrådad prestanda, då det är det absolut viktigaste för våra tillämpningar (exempelvis spel, men även skrivbordsarbete).

Citat:

Men visst är det märkligt att en del Intel proppar presterar ruggigt bra i singel prestanda jämfört med en FX propp för att sedan dala brutalt i prestanda jämfört med en FX propp i multithread prestanda.

Tycker inte det är så konstigt. AMD verkar ha försökt kompensera för låg IPC genom att pressa in många "kärnor". Därför vinner 8350 mot 4690K i flertrådade scenarier (vilket inte är särskilt relevant för spel):

4790K vinner fortfarande. (Notera för övrigt att det diagrammet visar resultat i stock, inte i samma klockfrekvens.)

Det är antagligen lättare att mata på med många kärnor än att designa snabba kärnor, men det är det sistnämnda som är viktigast i nästan alla sammanhang.

Visa signatur

Skrivet med hjälp av Better SweClockers

Permalänk
Entusiast
Skrivet av Peking:

Så för att få ett hum kan man säga ca 50-60% ökning i IPC över Piledriver, om man nu antar att siffrorna från presentationen stämmer? I så fall borde den ju faktiskt närma sig Sandy Bridge eller till och med Ivy Bridge.

Ja jag gjorde ett försök att räkna lite på det tidigare i tråden och om man ska extrapolera informationen från AMD (5 % och 40 %) och applicera det på entrådad prestanda i Cinebench så landar man på en IPC mellan Sandy Bridge och Ivy Bridge. Sen bygger det så klart på att siffrorna stämmer och att Cinebench är någon sorts representativt test. Slutgiltig prestanda är också kraftigt beroende av faktiskt klockfrekvens. Så många frågetecken men om allt stämmer så landar de på en vettig prestanda. Det känns inte heller som ett orimligt mål att matcha Sandy Bridge med tanke på det lilla vi vet om arkitekturen än så länge. Så det handlar alltså om en gissning men det är en rimlig gissning. Vi får vänta ett år och se om det faktiskt stämmer.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Datavetare
Skrivet av Zotamedu:

Ja jag gjorde ett försök att räkna lite på det tidigare i tråden och om man ska extrapolera informationen från AMD (5 % och 40 %) och applicera det på entrådad prestanda i Cinebench så landar man på en IPC mellan Sandy Bridge och Ivy Bridge. Sen bygger det så klart på att siffrorna stämmer och att Cinebench är någon sorts representativt test. Slutgiltig prestanda är också kraftigt beroende av faktiskt klockfrekvens. Så många frågetecken men om allt stämmer så landar de på en vettig prestanda. Det känns inte heller som ett orimligt mål att matcha Sandy Bridge med tanke på det lilla vi vet om arkitekturen än så länge. Så det handlar alltså om en gissning men det är en rimlig gissning. Vi får vänta ett år och se om det faktiskt stämmer.

Hamnar man inte rätt exakt på Nehalem med 40% upp från Steamroller i enkeltrådtestet av Cinebench? Utgår från att alla modeller kör på max "turbo" när bara en kärna används.

A10-7850K får 67 @4.0GHz, 40% IPC förbättring ger ett resultat på 94
i7-870 får 85 @3.6GHz, vid 4.0GHz skulle då resultatet bli 94

Lägger man på 5% till blir resultatet 97, i7 2600 @4GHz hamnar på 102

Alla resultat är här normaliserad till 4.0GHz eftersom AMD säger att IPC ökar med 40%, de säger inte att enkeltrådprestanda ökar med 40% och det är ju beroende på både IPC och frekvens.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Avstängd
Skrivet av Petterk:

Nej BD trådar och skalar inte bra med fler trådar, det är därför designen är trasig. Det finns ingen fix till den designen. Den är smal och att lägga in fler avkodare och mer flyttalsresurser gör den fortfarande smal och ineffektiv. I övrigt vet jag inte om jag svarar på ditt inlägg, inte kan det vara alkohol på en onsdag men det framgår inte riktigt vad du säger.

Tog en mys stund med dunken ..eller så var det en 1.5 åring som sprang runt som en energizer bunny som kan ha stört lite ..i.a.f ...BD skalar ok och är snabbare än i5 i bra scenario som cinebench multitrådat och problemet är även kodningen där belastningen hamnar på få cores och vist dom är inte effektivaste men inte alls så dålig som det påstås och fps problemen är relaterat till dx9 baserade spelmotorer och är ganska få spel/program som är drabbade så det är ett problem

Skrivet av Yoshman:

Man får vara väldigt tydligt med vad man menar med att Bulldozer skulle fungera bra på multitrådat. Det gick inte speciellt bra att skala den designen till 16 CPU-kärnor, resultatet blev inte snabbare än AMDs gamla 12-kärnor variant baserad på K10 och det blev långsammare än Intels 8-kärniga Xeon E5. CMT skalar "bättre" än SMT till flera kärnor enbart för att prestanda per tråd är usel, tror ingen skulle hurra om man minskade enkeltrådprestanda till 75% av vad den är idag på Intels CPUer för att sedan göra all kraft tillgänglig när båda trådarna används. "Skalningen" skulle då bli fantastisk bra, men enbart för man minskat enkeltrådprestanda.

Jämför man i7-2600 och FX-8350 så kan man konstatera att båda har ca 1.2 miljarder transistorer, båda använde 32nm. Den förra tar ändå 50% mindre kretsyta (hur mycket plats transistorer tar beror på användningsområde), innehåller en iGPU. I fall där alla 8 CPU-trådar används effektivt presterar dessa två modeller väldigt likvärdigt, i med trådar presterar den förra rejält mycket bättre. Var finns det något positivt i Bulldozer-desigen?

Nu verkar tyvärr den "läckta" presentationen på Zen vara fake (de presenterades inte här och finns diskussioner på flera techsiter om möjliga källor för dessa slides), men allt tyder ju på att Zen på många sätt är allt det Bulldozer inte var. Så inte ens AMD verkar tycka att det var något bra med dagens design.

Antag att det är så, förklara då varför det sker så mycket utveckling på serversidan där Intels dominans är större än vad den är på skrivbordet? Du tror inte det är så att mobilsidan utvecklas fort för det är dit de stora massorna går, serversidan utvecklas för att det är tekniskt vettigt att skala upp dessa modeller via fler CPU-kärnor (samt allt våra vanor med mobila enheter kräver allt större maskiner i datacentret)?

Desktopsidan har kört fast, det går inte att öka IPC. Jämför Broadwell och Silvermont, det skiljer mindre än en faktor 2 i IPC, tittar man på storleken på interna köer, storlek på out-of-order fönster, antal instruktioner som teoretiskt kan köra per cykel, etc så är Broadwell 4-10 gånger större/bredare på varje punkt. Man har med råge nått punkten där mer transistorer för att få upp IPC fungerar inte.

Det går inte heller att öka frekvensen speciellt lågt över 4GHz utan att strömförbrukning rusar. Och det är inte vettigt att öka antal CPU-kärnor då interaktiva program inte har någon nytta av det (spel är en form av simulering, gör man bara "rätt" typ av simulering skulle det definitivt gå att utnyttja massor med kärnor här).

Nu tänkte jag dekstop versionen med 8c till desktop då är inte strömförbrukningen så viktig och FX tar inte så mycket i snitt för dom har strömsparar funktioner och går ju inte konstant i fullload och effektiviteten på dom är inte top off the

Men cpu´n är fortfarande ett bra alternativ om man ser till pris/prestanda för en FX kan inte jämföras med en i7 då FX med oc når deras stock prestanda för redigering eller rendering men ligger inte i samma pris heller och även om intel har dubbel prestanda per core pga bättre ipc så är FX ett vettigt alternativ till i3/i5 med singelgrafikkort och slänger man in nya tittlar duger intels IPC inte för att i3an ska orka nå riktigt då dess totala beräknings kraft är för låg

Och jag säger inte att AMD är tekniskt överlägsna intel men hade fortfarande alla dagar i veckan tagit en FX över i3 och i många fall i5an om det inte är K då dom oftast är jävligt mycket dyrare än ett FX system och är som sagt få spel där man märker skillnaden med 1 grafikkort och i3 kan slå i7 och fx p.g.a ipc i fåtrådigt tunga saker men en FX håller längre man kan köra oc och samtidigt få dom till bra pris och det är det som varit amd´s fördel med fx serien så IPC är inte allt samma som många cores inte är allt

Visa signatur

i3 6100 - MSI b150m pro-vd - 8gb 2133 ddr4 - GTX 950 GAMING 2G - z400s 120gb ssd - 1tb WD blue - Corsair 500w

Permalänk
Medlem
Skrivet av Yoshman:

AMD har kommenterat dessa slide så här

These slides contain fabricated content and were not generated by or on behalf of AMD.

Hade de varit korrekta hade man sagt något i stil med "inga kommentarer". Här är någon som till och med bemöda sig att göra en datoranalys av presentationen som visar flera saker som tyder på att de är fake.

Däremot verkar den/de som gjort fake-slides ha hyfsad koll på processordesign, så det kan komma att visa sig att man inte gissade så illa (vilket i.o.f.s. inte är något jättebedrift då det inte fanns speciellt mycket detaljer). De detaljer som ändå presenterades har nagelfarits rätt hårt av extremt kunniga personer på RealWorldTech och där har man lite funderingar kring vettigheten i relativ storlek på L2$ kontra L3$ om det stämmer att de nu får inklusiv-policy (vilket vi definitivt får hoppas är fallet).

Jo sådan analys var jag inte medveten om att den var gjord, ganska uppenbart manipulerat. Om inte någon kille på AMD sitter och klipper och klistrar ihop sina slides på det där viset.
Men ja man behöver inte kunna jättemycket, många här på sweclockers hade kunnat göra det där. Jag hade kunnat manipulera fram den, jag vet inte om jag valt så stor L2 på en inklusive cache, men jag hade säkert gjort motsvarande misstag på en annan detalj. Tänkte faktiskt inte ens på de övriga slidesen utan tittade bara på den med diagrammet över beräkningsenheter när jag gjorde mitt uttalande.

Permalänk
Medlem
Skrivet av lord_vasagos:

Tog en mys stund med dunken ..eller så var det en 1.5 åring som sprang runt som en energizer bunny som kan ha stört lite ..i.a.f ...BD skalar ok och är snabbare än i5 i bra scenario som cinebench multitrådat och problemet är även kodningen där belastningen hamnar på få cores och vist dom är inte effektivaste men inte alls så dålig som det påstås och fps problemen är relaterat till dx9 baserade spelmotorer och är ganska få spel/program som är drabbade så det är ett problem

Fast skalningen fungerar ju inte, och egna avkodare per kärna/tråd och egen FPU hjälper inte. De har i princip gjort den 2-issue även med två trådar. Mantle och DX12 hjälper inte. De är för svaga och skalar för dåligt. 220W version hjälper inte. Bärbar med quad-core dög t.ex. inte till spel. I princip kan en Jaguarkärna vara snabbare, fördelen där är att de aldrig behöver konkurrera med Nehalemderivat på konsoler. Resurserna går inte att utnyttja i BD. Precis som Yosh säger så var K10 snabbare per kärna i multitrådat. Piledriver var ju ~70% av Ivy entrådat men en 8 kärnor/4M fick spö av en 4 kärnor/8T Intel. Mer trådar är ingen lösning här, och vi ser t.ex. inte samma effekt på AMD som på en dual-core Intel med HT i spel.

Permalänk
Medlem
Skrivet av Aleshi:

40% högre IPC räcker inte för att slå Intels IPC, men sedan får vi se vad pris, latenser och värmeutveckling landar på. Tror det kan bli grymt fint det där.

Med de där siffrorna så blir jag fortfarande inte förvånad om det är en Phenom III vi tittar på. En krympt Phenom II med dubblad FPU (2x256bit FMAC), snabb inclusive cache och HT är precis det jag önskat sedan BD kom. Och hittills matchar detta mina önskemål bra.

Det är precis vad jag också tror. Nu var det flera år sedan jag skrev det först, men hade de krympt Phenom II istället för att introducera Bulldozer hade det gått betydligt bättre ekonomiskt, en Phenom II på samma nod som första Bulldozern hade tagit upp betydligt mindre kretsyta och hade kunnat klockas nästan lika högt med en betydligt bättre IPC. Den hade kort och gott hängt med hyggligt och kunnat säljas med betydligt bättre ekonomi i produktionen pga den mindre kretsytan. Istället kom Bulldozer som kombinerade stor kretsyta med sämre singeltrådad prestanda än Phenom II trots högre klockfrekvens.

Permalänk
Avstängd
Skrivet av Petterk:

Fast skalningen fungerar ju inte, och egna avkodare per kärna/tråd och egen FPU hjälper inte. De har i princip gjort den 2-issue även med två trådar. Mantle och DX12 hjälper inte. De är för svaga och skalar för dåligt. 220W version hjälper inte. Bärbar med quad-core dög t.ex. inte till spel. I princip kan en Jaguarkärna vara snabbare, fördelen där är att de aldrig behöver konkurrera med Nehalemderivat på konsoler. Resurserna går inte att utnyttja i BD. Precis som Yosh säger så var K10 snabbare per kärna i multitrådat. Piledriver var ju ~70% av Ivy entrådat men en 8 kärnor/4M fick spö av en 4 kärnor/8T Intel. Mer trådar är ingen lösning här, och vi ser t.ex. inte samma effekt på AMD som på en dual-core Intel med HT i spel.

För att koden i t.e.x spelen är omodern och nyare spel kan nytja prestandan som battlefield gta osv men vid multi gpu lösnigar kan dom vara lite trött men det är även i5/i3 och skulle själv satsa i7 där.. sen mantle och DX12 hjälper AMD och är inget snack om den saken men du får mer fps pga ipc i dom flesta spel men där presterar FX bra och FX känns ganska mycket rappare än k10 phenom II när man sitter och använder dom t.o.m 81xx serien känns rappare än phenom II trots om hade bättre IPC än FX

sen bärbar med quad duger lika bra som intels dito om vi pratar integrerade där intel har snabb cpu svag gpu amd svag cpu snabb gpu

och vist är det så att prestanda skalar sämre över flera cores och säger inte det är ultimata cpu´n men dom funkar till allt utom guildwars och större battles där är enda det märks att dom är core svaga och skippar man flera gpu är dom ett bra val ....Har du använt och testat en FX ??

Visa signatur

i3 6100 - MSI b150m pro-vd - 8gb 2133 ddr4 - GTX 950 GAMING 2G - z400s 120gb ssd - 1tb WD blue - Corsair 500w

Permalänk
Medlem
Skrivet av Yxan:

Det är precis vad jag också tror. Nu var det flera år sedan jag skrev det först, men hade de krympt Phenom II istället för att introducera Bulldozer hade det gått betydligt bättre ekonomiskt, en Phenom II på samma nod som första Bulldozern hade tagit upp betydligt mindre kretsyta och hade kunnat klockas nästan lika högt med en betydligt bättre IPC. Den hade kort och gott hängt med hyggligt och kunnat säljas med betydligt bättre ekonomi i produktionen pga den mindre kretsytan. Istället kom Bulldozer som kombinerade stor kretsyta med sämre singeltrådad prestanda än Phenom II trots högre klockfrekvens.

Mindre kretsyta betyder inte bättre ekonomi. De har redan på förväg köpt upp ett antal wafers. Så det intressanta är om man kan fylla den redan förbetalda produktionen med kretsar som säljer, och kretsar som förhoppningsvis inte alla är trasiga. Stora kretsar är inte dåligt med bra yields, det är dock sämre med en process som är någorlunda lika. Kan du inte inte fylla produktionen får du ändå betala för den.

Att AMD inte ens haft någon Financial Analyst Day på 3 år är talande av hur de själva såg på sitt misslyckande. Men de har tagit in bra talang som kan leda projekt. Så illa går det inte igen. Däremot är grafikbranschen och GPUer i ett ganska dåligt ställe överlag just nu. AMD har helt trillat ut från diskreta kort på bärbara och det finns för tillverkare ingen vits att bumpa upp gpuer nu medan vi är i ett mellanskede. Apple har t.ex. ingen anledning att gå från mobila Kepler till Maxwell generation 1 i MacBook Pro, de får ändå inte HEVC-avkodare i hårdvara eller nya features för 3D. Prestandaskillnaden är inte heller stor (på samma TDP). De kan inte byta till AMD just nu eftersom AMD inte har några med lämplig strömförbrukning, och har för den delen inga mobila GCN1.2+ förutom 125W TDP Tonga-baserade M295X. Du får inte nya funktioner fören vi får se nästa generation där och dessutom orkar inte 28 nm så mycket till förutom för att bygga stora hungriga kretsar på desktop. 14 nm gpuer kommer inte fören nästa år och Fiji ska ju i princip vara en stor Tonga med HBM. På bärbara för Windows så är AMD värdelösa på drivrutinssidan också. Enduro/switchable graphics fungerar inte. Intel CPU plus AMD GPU måste lira på bärbara. De måste kunna samarbeta och du måste kunna växla ner till integrerade på ett bra sätt för att få någon batteritid. På tillverkningssidan kanske de inte kan göra så mycket och konkurrenten har samma förutsättningar där, men de måste tänka på fler segment. Spelmarknaden är viktig för dem, men många har flyttat till bärbara även där, likaså är de flesta arbetsstationer bärbara.

Trevligt att de designar en CPU för fläktlösa bärbara upp till server nu. För server är en marknad som är viktig för dem att återinträda. Nu spretar de inte överallt med produkter som inte passar någonstans. De har också tydliggjort att de inte vill in på telefoner/surfplattor (ARM-baserade/mobila operativsystem x86 och Windows vill de ju sälja för) och det är bra. Det krävs för mycket för att lyckas och det krävs mer än en bra CPU, och de skulle aldrig kunna dra nytt av deras grafikteknologi. Det finns inte kraft kvar när man bara skalar ner något gjort för desktop. De har ju inte en drivrutinsstack anpassad för de mobila operativsystem så Intel, ImgTec/PowerVR, ARM/Mali, Qualcomm/Adreno och t.o.m. Vivante ligger långt före dem. För både Nvidia och Intel tog det kanske 5 år innan de fick till drivrutiner. Nvidia har inte lyckas så bra. AMD har för de viktigare marknader att fokusera på server, bärbart och desktop. Det gäller ju både CPU och GPU. Det är ju ändå gammal AMD/ATI-teknik hos Qualcomm så de har redan bidragit där.

Permalänk
Medlem
Skrivet av Petterk:

Mindre kretsyta betyder inte bättre ekonomi. De har redan på förväg köpt upp ett antal wafers. Så det intressanta är om man kan fylla den redan förbetalda produktionen med kretsar som säljer, och kretsar som förhoppningsvis inte alla är trasiga. Stora kretsar är inte dåligt med bra yields, det är dock sämre med en process som är någorlunda lika. Kan du inte inte fylla produktionen får du ändå betala för den.

De har ju inte beställt kapacitet 5 år i förväg, utöver det så får de 50% fler kretsar för den redan beställda kapaciteten så kan de alltid sälja fler, köra stenhårt på lägre segment. Onödigt stora kretsar ger ju också högre värmeutveckling. Ska du ha 500 miljoner extra transistorer som ska arbeta för att utföra samma jobb så har du högre värmeutveckling. Och så då ja, du kan ju räkna med sämre yields, allra helst när värmeutvecklingen redan är hög.

Permalänk
Entusiast
Skrivet av Yoshman:

Hamnar man inte rätt exakt på Nehalem med 40% upp från Steamroller i enkeltrådtestet av Cinebench? Utgår från att alla modeller kör på max "turbo" när bara en kärna används.

A10-7850K får 67 @4.0GHz, 40% IPC förbättring ger ett resultat på 94
i7-870 får 85 @3.6GHz, vid 4.0GHz skulle då resultatet bli 94

Lägger man på 5% till blir resultatet 97, i7 2600 @4GHz hamnar på 102

Alla resultat är här normaliserad till 4.0GHz eftersom AMD säger att IPC ökar med 40%, de säger inte att enkeltrådprestanda ökar med 40% och det är ju beroende på både IPC och frekvens.

Jag tittade på testet med en kärna och normaliserad klockfrekvens. Sen gjorde jag antagandet att AMDs uttalande om 5 % högre prestanda i Excavator stämde och landade då på någonstans mellan Sandy Bridge och Ivy Bridge vid den specifika klockfrekvensen.

Alltså 67*1,05*1,4=98,49.
2600K har 97 och 3770K har 101.

Alltså ganska exakt mitt mellan Sandy och Ivy på samma frekvens. I det här fallet körs samtliga processorer på 2,8 GHz. Jag valde just det testet för att jag var för lat för att skala om resultatet baserat på frekvens manuellt. Fast det kanske inte skalar helt linjärt med frekvensen så långt i det testet. I teorin ska väl prestandan skala linjärt med klockfrekvens men verkligheten envisas ju med att sabba allt hela tiden.

Hur som helst så tycker jag fortfarande att det känns som en rimlig prestandanivå baserat på tillgänglig data. Sen om den faktiska prestandan blir Nahelem, Sandy eller Ivy vet vi väl först om ett år när alla testsidor fått leka ett par dagar med Zen.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Datavetare
Skrivet av Zotamedu:

Jag tittade på testet med en kärna och normaliserad klockfrekvens. Sen gjorde jag antagandet att AMDs uttalande om 5 % högre prestanda i Excavator stämde och landade då på någonstans mellan Sandy Bridge och Ivy Bridge vid den specifika klockfrekvensen.

Alltså 67*1,05*1,4=98,49.
2600K har 97 och 3770K har 101.

Alltså ganska exakt mitt mellan Sandy och Ivy på samma frekvens. I det här fallet körs samtliga processorer på 2,8 GHz. Jag valde just det testet för att jag var för lat för att skala om resultatet baserat på frekvens manuellt. Fast det kanske inte skalar helt linjärt med frekvensen så långt i det testet. I teorin ska väl prestandan skala linjärt med klockfrekvens men verkligheten envisas ju med att sabba allt hela tiden.

Hur som helst så tycker jag fortfarande att det känns som en rimlig prestandanivå baserat på tillgänglig data. Sen om den faktiska prestandan blir Nahelem, Sandy eller Ivy vet vi väl först om ett år när alla testsidor fått leka ett par dagar med Zen.

Ok, då är jag med. Är ju inte helt linjär skalning med frekvens då vissa saker som t.ex. bandbredd/latens mot RAM inte skalar alls med CPU-frekvens (nog ett icke-problem för Cinebench som verkar göra någon form av rendering), sedan vet jag inte riktigt hur korrekt det är att anta att AMDs modeller verkligen håller max turbo på 4.0GHz (flyttalberäkningar tenderar att dra mer ström). Intels modeller med hög TDP ligger i alla fall klistrade på max turbo när bara en kärna används. Vid 2.8GHz lär det i alla fall inte vara någon av de ingående modellerna som throttlar.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Alling:

Tycker inte det är så konstigt. AMD verkar ha försökt kompensera för låg IPC genom att pressa in många "kärnor". Därför vinner 8350 mot 4690K i flertrådade scenarier (vilket inte är särskilt relevant för spel):

Jag tycker att det är konstigt eftersom FX presterar uruselt & så dalar en del Intel proppar under denna eller ner mot denna "urusla" processor vilket måste betyda att dom är värdelösa i multitrådat!

Visa signatur

XFX Radeon RX 7700 XT Speedster QICK 319 Black Edition | AMD Ryzen R7 5700X | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury Beast DDR4 3600MHz 4x8GB | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | LG 27GL83A | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair Void Elite Wireless

Permalänk
Entusiast
Skrivet av Yoshman:

Ok, då är jag med. Är ju inte helt linjär skalning med frekvens då vissa saker som t.ex. bandbredd/latens mot RAM inte skalar alls med CPU-frekvens (nog ett icke-problem för Cinebench som verkar göra någon form av rendering), sedan vet jag inte riktigt hur korrekt det är att anta att AMDs modeller verkligen håller max turbo på 4.0GHz (flyttalberäkningar tenderar att dra mer ström). Intels modeller med hög TDP ligger i alla fall klistrade på max turbo när bara en kärna används. Vid 2.8GHz lär det i alla fall inte vara någon av de ingående modellerna som throttlar.

Ja baserat på resultatet hos de andra processorerna så verkar RAM och cache vara ointressant för Cinebench. Annars hade skillnaden varit större mellan till exempel i7 och Pentium. Så där har vi ett till frågetecknen på prestandan. Vad händer i ett test som är känsligare för prestanda och storlek på cache? De nämnde ju faktiskt latens mot cache i sina slides så de verkar ju vara medvetna om det i alla fall. Har de inte samma ingenjör som designade Cyclone med i teamet?

Nåja, det är kul att slänga omkring spekulationer i brist på konkret information. Tror den viktiga poängen här är att AMD inte siktar på att vinna prestandatronen, om de nu inte lyckas köra processorerna i betydligt högre frekvens än Intel vilket inte verkar troligt. Om prestandanivån stämmer så är den ju fullt tillräcklig för de flesta. Frågan blir då hur effektiv den är snarare än hur den absoluta prestandan är. De behöver inte slå Intel i toppsegmentet, de behöver kunna konkurrera på prestanda per watt. Ser ju onekligen intressant ut att de skalar Zen hela vägen ner till 5 W och upp till serverprocessorer.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Medlem
Skrivet av lord_vasagos:

För att koden i t.e.x spelen är omodern och nyare spel kan nytja prestandan som finns som battlefield gta osv men vid multi gpu lösnigar kan dom vara lite för trött men det är även i5/i3 och skulle själv satsa i7 där esn mantle och DX12 hjälper AMD och är inget snack om den saken men du får mer fps pga ipc i dom flesta spel men där presterar FX bra och FX känns ganska mycket rappare än k10 phenom II när man sitter och använder dom t.o.m 81xx serien känns rappare än phenom II trots om hade bättre IPC än FX

Dold text

sen bärbar med quad duger lika bra som intels dito om vi pratar integrerade där intel har snabb cpu svag gpu amd svag cpu snabb gpu

Citat:

och vist är det så att prestanda skalar sämre över flera cores och säger inte det är ultimata cpu´n men dom funkar till allt utom guildwars och större battles där är enda det märks att dom är core svaga och skippar man flera gpu är dom ett bra val ....Har du använt och testat en FX ??

Nej vi pratar om bärbara datorer med diskret grafikkort för spel. I klass med HD 7970m. Processorn är för svag i AMDs fall. Vi talar om ganska mainstreamspelande. Då pratar vi inte Broadwell vs Trinity/Kaveri heller.

Intels integrerade GPU är också starkare än sånt som 7850k.

När det gäller desktop, nej det finns ingen lösning på det hela. Folk hade konstiga förväntningar på scheduler-förändringar också, men det gör inget magiskt att hålla relaterade trådar på samma modul och det är inte magiskt med Mantle och DX12, riktiga spelmotorer har inga stora förbättringar med låg-overhead APIer och det är för det mesta annat än grafiken som blir kämpigt. Draw calls är inte problemet. Lågnivå är intressant ur andra perspektiv. Cachesystemet var inte bra. Det finns ingen fix, trasigt är trasigt det är därför de inte utvecklade det vidare som enligt planerna. Bland annat var det tänkt att en 10-kärnor (20 i MCM) Opteron på Piledriver skulle komma, det var också tänkt att ny sockel för server skulle komma mitt i allt, nya chipset o.s.v. inget av det hände och istället måste de starta om med nya grejer och det är bara att se på det istället för att försvara något de själva insåg var ofixbart. Detta trotts att Steamroller fick dedikerade avkodare och Excavator några ytterligare justeringar. Modern mjukvara kommer inte prestera bra på den omoderna plattformen i framtiden bara för att de blir bättre på mjukvaruutveckling. Om 8 heltalskärnor är slöare än 4 heltalskärnor så är något fel och kommer inte bli jämförbart bara för att man avlastar dessa. Det är inte för att Intel är bäst eller vad jag tycker om dem jag säger detta, det finns många andra med intressanta arkitekturer på ARM, Power/PPC och SPARC där många också valt breda processorer med IPC (eller DMIPS/MHz) bättre än AMDs på BD. Det är massor som slår AMD i prestanda per watt, även in-orderarkitekturer. Då menar jag i olika servertillämpningar. Det finns även bättre implementationer av CMT. Fast AMD är i ett område där de inte kan välja bort kraftfull FPU/SIMD-enhet så motivationen är inte klar vad det gäller CMT och spara på resurser i hårdvaran för att köra det på skrivbord eller HPC som de ändå måste tävla i. AMD var tvungen att utveckla något, men när det gick fel gjorde de i princip rätt som drog i bromsen och planera om. De har ändå byggt något som innehåller en hel del teknik som 10h och Stars inte har och de hade inte gått att göra allt för mycket med. Det blir i princip bra med Zen bara de hamnar på Nehalemnivå eller lite bättre. En sån plattform kan dessutom lira alla spel, det kan inte Piledriverbaserad FX på ett vettigt sett, och Mantle i en handfull spel hjälper ju inte de som sitter på Nvidiakort.

Permalänk
Medlem
Skrivet av Aleshi:

De har ju inte beställt kapacitet 5 år i förväg, utöver det så får de 50% fler kretsar för den redan beställda kapaciteten så kan de alltid sälja fler, köra stenhårt på lägre segment. Onödigt stora kretsar ger ju också högre värmeutveckling. Ska du ha 500 miljoner extra transistorer som ska arbeta för att utföra samma jobb så har du högre värmeutveckling. Och så då ja, du kan ju räkna med sämre yields, allra helst när värmeutvecklingen redan är hög.

Finns faktiskt inget lägre segment på den viktigaste marknaden – bärbara. Du får ju Core i3 med ett listpris på $225 dollar, och som finns i bärbara för cirka 3000kr inkl moms. Ingen är intresserad att göra billigare maskiner, det finns inte mycket pengar att spara och är prestandan sämre, batteritiden sämre varför skulle man då köpa det? På server är de också helt ute utan prestanda. Så jag vet inte vad det skulle förändra. Kapacitet köps långt i förväg och är inte så enkelt att förändra. AMD betala flera hundra miljoner dollar för att slippa från och revidera avtalet de hade med GF mellan 2011-idag.

GPUer med stor area säljer t.ex. så där kan vi inte tala om onödigt stora kretsar. 28nm är idag mycket bättre och mognare än när de införde det, t.ex. när de tillverkade första kiselrevisionen av Tahiti 2011. Storlek på processorer har inte bara med antalet transistorer att göra. Thuban på 6 kärnor har t.ex. över 900 miljoner och är alltså inte snålare om de inte nyttjade tätare "bibliotek". Värmeutveckling påverkar klockfrekvenser, men inte yields i den mån levande kretsar per wafer.

Permalänk
Datavetare
Skrivet av skruvis:

Jag tycker att det är konstigt eftersom FX presterar uruselt & så dalar en del Intel proppar under denna eller ner mot denna "urusla" processor vilket måste betyda att dom är värdelösa i multitrådat!

Hög totalt prestanda över många trådar fast relativ låg prestanda per tråd är en konfiguration som är optimal får extremt få verkliga användarfall. Inte på serversidan har man hittat speciellt mycket användning för detta. Man får definitivt klart bättre total-perf/W med många "whimpy" cores vilket drog igång idén kring mikroservers. I praktiken har det visat sig att t.ex. 4-kärnors low-voltage Xeon E3 nästan alltid är ungefär lika energieffektiv, fast presterar bättre på de flesta användarfall. Att vara bra på enkeltrådat och värdelöst på multitrådade program som faktiskt har nytta av många kärnor (finns en rad program som är multitrådade men ändå är mer effektiv på få snabba CPU-kärnor) är att vara helt rätt optimerad för mer än 9 av 10 program man kör på skrivbordet.

Vissa peka på att de kör flera program samtidigt och därför kan dra nytta av många kärnor. Bit-tech har just ett sådant test och trots att man kör fyra program samtidigt så är en i3-4130 (3.4GHz) snabbare än FX-8350 (4.0GHz). Det borde ge en känsla för hur extrem smal nisch en CPU, som bara presterar bra när 8 CPU-trådar får sträcka på benen rejält, är.

Det verkar även som Android-tillverkarna börjar nyktra till och fatta hur mycket bättre Apples design med två starka kärnor är, bl.a. LG släpper ju sitt flagskepp med "endast" två "big-cores" (Snapdragon 808) i stället för den throttlande handgrillen Snapdragon 810 med 4 "big-cores". Även fast Qualcomm pratat en hel del om octa-core är jag rätt säker på att deras kommande "Kryo" kommer vara en design som siktar på hög IPC och relativt få kärnor.

Ser tyvärr inte bättre ut än att väldigt många som designar CPUer har väldigt dålig koll på vad som är begränsningar för de som utvecklar programvara, många bara konstaterade att många enkla CPU-kärnor är i teorin mer energieffektivt och "man lurar säkert ut hur man ska använda många kärnor med tiden". Program som används interaktivt kommer inte inom överskådlig tid skala väl över mer än några enstaka CPU-trådar.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Datavetare
Skrivet av Petterk:

Finns faktiskt inget lägre segment på den viktigaste marknaden – bärbara. Du får ju Core i3 med ett listpris på $225 dollar, och som finns i bärbara för cirka 3000kr inkl moms. Ingen är intresserad att göra billigare maskiner, det finns inte mycket pengar att spara och är prestandan sämre, batteritiden sämre varför skulle man då köpa det? På server är de också helt ute utan prestanda. Så jag vet inte vad det skulle förändra. Kapacitet köps långt i förväg och är inte så enkelt att förändra. AMD betala flera hundra miljoner dollar för att slippa från och revidera avtalet de hade med GF mellan 2011-idag.

GPUer med stor area säljer t.ex. så där kan vi inte tala om onödigt stora kretsar. 28nm är idag mycket bättre och mognare än när de införde det, t.ex. när de tillverkade första kiselrevisionen av Tahiti 2011. Storlek på processorer har inte bara med antalet transistorer att göra. Thuban på 6 kärnor har t.ex. över 900 miljoner och är alltså inte snålare om de inte nyttjade tätare "bibliotek". Värmeutveckling påverkar klockfrekvenser, men inte yields i den mån levande kretsar per wafer.

Kolla figure 4, page 450, skulle säga att det finns ett rätt uppenbart samband mellan kretsarean och sannolikheten att den innehåller en "katastrofal" defekt (d.v.s att kretsen inte fungerar korrekt).

Sedan är "wafer" runda och kretsar typiskt kvadratiska, ren geometri (aliasingeffekter) säger att man får mindre spill runt kanterna med mindre kretsar.

Är helt sant att antal transistorer inte alls är en bra indikator på kretsstorlek, båda fallen är det ca 1.2 miljarder transistorer på 32nm

  • i7-2600: ~216 mm²

  • FX-8350: ~315mm²

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Vissa peka på att de kör flera program samtidigt och därför kan dra nytta av många kärnor. Bit-tech har just ett sådant test och trots att man kör fyra program samtidigt så är en i3-4130 (3.4GHz) snabbare än FX-8350 (4.0GHz). Det borde ge en känsla för hur extrem smal nisch en CPU, som bara presterar bra när 8 CPU-trådar får sträcka på benen rejält, är.

Så cinebench menar du är inget bra test mao.

Edit: Men DX12 kanske kan ändra på det lite?

Visa signatur

XFX Radeon RX 7700 XT Speedster QICK 319 Black Edition | AMD Ryzen R7 5700X | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury Beast DDR4 3600MHz 4x8GB | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | LG 27GL83A | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair Void Elite Wireless

Permalänk
Datavetare
Skrivet av skruvis:

Så cinebench menar du är inget bra test mao.

Du får svar på hur en viss CPU-modell presterar i ett program som utför en batch-operation (körtid med 100% CPU-last under väsentligt mer än enstaka sekunder) på något som inte bara är embarrassingly parallel utan också har väldigt mycket beräkningar per post som läses ur RAM.

D.v.s. det är något som har väldigt lite gemensamt med i princip allt annat du kör på din dator. Att det inte skalar alls lika väl vid multitasking av ändå rätt CPU-tunga program i Bit-tech testet beror på att även om problemet rent teoretiskt kan parallelliseras begränsas man i praktiken ofta av saker som I/O, flaskhalsar i CPU-cache/RAM, synkronisering mellan CPU-trådar etc.

Kör du någon gång på ett Linux-system ska du köra igång top och följa ett värde som heter "load average". Det är ett mått över hur många CPU-trådar som man teoretisk maximalt kunnat använda de senaste 1, 5 och 15 minuterna. Är extremt sällsynt att detta värde hamnar speciellt långt över 2.0 även när man jobbar med "tunga" saker. Visst, kör du race-tracing eller liknande kommer det vara rätt nära antal CPU-trådar men för t.ex. kompilering av C-kod (där varje fil kan kompileras helt oberoende av andra filer, men varje fil kompileras väldigt fort) är det svårt att nå över 4-5 i "load average" (skulle vilja nå högre då min jobbmaskin har 16 kärnor / 32 trådar).

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Du får svar på hur en viss CPU-modell presterar i ett program som utför en batch-operation (körtid med 100% CPU-last under väsentligt mer än enstaka sekunder) på något som inte bara är embarrassingly parallel utan också har väldigt mycket beräkningar per post som läses ur RAM.

D.v.s. det är något som har väldigt lite gemensamt med i princip allt annat du kör på din dator. Att det inte skalar alls lika väl vid multitasking av ändå rätt CPU-tunga program i Bit-tech testet beror på att även om problemet rent teoretiskt kan parallelliseras begränsas man i praktiken ofta av saker som I/O, flaskhalsar i CPU-cache/RAM, synkronisering mellan CPU-trådar etc.

Kör du någon gång på ett Linux-system ska du köra igång top och följa ett värde som heter "load average". Det är ett mått över de senaste 1, 5 och 15

Så cinebench är ett bra program oavsett om man kör enkeltrådat eller flertrådat.. men är det inte märkligt att Intel propparna tappar prestanda i flertrådat gentemot AMD´s cripplade kärnor eller som en del utryckt det "fake" kärnor eller inte riktiga kärnor mm. osv. t.o.m. något aphuvud som kallade dom för apelsinkärnor!"

Visa signatur

XFX Radeon RX 7700 XT Speedster QICK 319 Black Edition | AMD Ryzen R7 5700X | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury Beast DDR4 3600MHz 4x8GB | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | LG 27GL83A | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair Void Elite Wireless

Permalänk
Datavetare
Skrivet av skruvis:

Så cinebench är ett bra program oavsett om man kör enkeltrådat eller flertrådat.. men är det inte märkligt att Intel propparna tappar prestanda i flertrådat gentemot AMD´s cripplade kärnor eller som en del utryckt det "fake" kärnor eller inte riktiga kärnor mm. osv. t.o.m. något aphuvud som kallade dom för apelsinkärnor!"

Beror på hur du ser det när du säger "tappar". Skulle snarare se det som att med 8 kärnor når FX-8350 upp till samma nivå som 4-kärnors Sandy Bridge. Skulle inte hävda att det visar att Intel "skalar" dåligt.

Vilket är att skala bäst när alla CPU-trådar används mot när en tråd används

  • i3-4330 ökar prestanda med 2.6 gånger, det med 2 kärnor

  • A10-7850K ökar prestanda med 3.4 gånger, det med 4 "kärnor" (prestanda med alla kärnor är 89% av i3-4330)

  • i7-4790K ökar prestanda med 5.0 gånger, det med 4 kärnor

  • FX-8350 ökar prestanda med 6.5 gånger, det med 8 "kärnor" (prestanda med alla kärnor är 82% av i7-4790K)

Sedan är en av de mest kritiska komponenterna i en modern "big-core" CPU minnessystemet, det stressas överhuvudtaget inte i Cinebench. Program som är "elaka" mot CPU-cachen kan se rejält mycket bättre skalning med SMT än i ett program som Cinebench.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Petterk:

Mindre kretsyta betyder inte bättre ekonomi. De har redan på förväg köpt upp ett antal wafers. Så det intressanta är om man kan fylla den redan förbetalda produktionen med kretsar som säljer, och kretsar som förhoppningsvis inte alla är trasiga. Stora kretsar är inte dåligt med bra yields, det är dock sämre med en process som är någorlunda lika. Kan du inte inte fylla produktionen får du ändå betala för den.

Mindre kretsyta betyder i allmänhet bättre yield vid samma antal fel per wafer eftersom sannolikheten att en krets lyckas undgå att få ett ödesdigert fel ökar.

Jag hittade den här länken: http://www.anandtech.com/show/4955/the-bulldozer-review-amd-f...

Där ser du storleken på första generationens Bulldozer relativt Phenom IIx6 och Intels konkurrent Sandy Bridge. Sårhär såg det ut för fyra år sedan:

  1. CPU                Manufacturing Process      Cores      Transistor Count           Die Size

  2. AMD Bulldozer 8C           32nm                     8           1.2B*                315mm

  3. AMD Thuban 6C           45nm                     6               904M                346mm

  4. Intel Sandy Bridge 4C      32nm                     4              995M                216mm

En Phenom II i 32 nm hade varit 175 mm^2 stor om den krympts exakt proportionellt från 45 till 32 nm. Det är 55% av kretsytan för en 32 nm Bulldozer men påtagligt bättre prestanda per klocka i singeltråd och ungefär jämbördigt i flertrådat. Hur man än vänder på det så var Bulldozer en affärsmässig och teknisk katastrof. Tillverkningskostnaderna ökade relativt konkurrenten samtidigt som man inte kunde öka priserna.

Intels Sandy Bridge med åtta SMT trådar slog Bulldozer i prestanda och kostade samtidigt 2/3 av kretsytan i waferåtgång. Hade man kört med en krympt Phenom IIx6 i 32 nm så hade man haft samma gamla prestanda (allmänt bättre än Bulldozer ) men brukat upp till 20% mindre kretsyta än Intels konkurrentcpu. Då hade man kunnat konkurrera på en helt annan och mycket lägre prisnivå och ändå tjäna mer pengar än vad man gjorde på Bulldozer.

Alla kostnader när man producerar processorer kan inte räknas per wafer men resonemanget är ändå sunt ur ett affärsmässigt perspektiv. AMD gjorde helt enkelt ett totalt vansinnigt självmål av prestigeskäl eller på grund av gammaldags hederlig inkompetens i ledningen. De borde ha avbrutit projektet så fort de kommit så långt att de kunde beräkna produktionskostnaderna jämfört med en krympt Phenom II.

Permalänk
Medlem
Skrivet av Yoshman:

Beror på hur du ser det när du säger "tappar". Skulle snarare se det som att med 8 kärnor når FX-8350 upp till samma nivå som 4-kärnors Sandy Bridge. Skulle inte hävda att det visar att Intel "skalar" dåligt.

Vilket är att skala bäst när alla CPU-trådar används mot när en tråd används

  • i3-4330 ökar prestanda med 2.6 gånger, det med 2 kärnor

  • A10-7850K ökar prestanda med 3.4 gånger, det med 4 "kärnor" (prestanda med alla kärnor är 89% av i3-4330)

  • i7-4790K ökar prestanda med 5.0 gånger, det med 4 kärnor

  • FX-8350 ökar prestanda med 6.5 gånger, det med 8 "kärnor" (prestanda med alla kärnor är 82% av i7-4790K)

Sedan är en av de mest kritiska komponenterna i en modern "big-core" CPU minnessystemet, det stressas överhuvudtaget inte i Cinebench. Program som är "elaka" mot CPU-cachen kan se rejält mycket bättre skalning med SMT än i ett program som Cinebench.

Ok så det du säger är att FX serien inte är en dålig arkitektur utan det är programen som inte är optimerade för 8 kärnor etc.!

Eller man kanske kan utrycka det såhär svagheten i bulldozer arkitekturen är programvaror som är dåligt optimerat för typ 8 kärnor.

Visa signatur

XFX Radeon RX 7700 XT Speedster QICK 319 Black Edition | AMD Ryzen R7 5700X | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury Beast DDR4 3600MHz 4x8GB | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | LG 27GL83A | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair Void Elite Wireless