AMD: "Bulldozer har åtta kärnor"

Permalänk
Medlem
Skrivet av Yoshman:

Noterar något? De kretsar som har oberoende CPU-kärnor får samma prestanda per tråd oavsett om andra CPU-trådar är lastade, FX-8350 och i7-4790K när den kör båda CPU-trådar i samma kärna får lägre prestanda per tråd men ändå högre total prestanda genom den fysiska kärnan.

Gör man om detta men väljer två CPU-trådar på olika moduler i FX-8350 och olika CPU-kärnor i i7-4790K så kommer även dessa få samma prestanda på båda kärnorna och 200% total kapacitet.

D.v.s. oavsett vad man kallar AMDs moduler så finns överhuvudtaget inga tvivel om att de två CPU-kärnorna som delar modul är inte oberoende, anledningen är att de delar "front-end" (och är därmed en variant av SMT).

Problemet med det argumentet är att AMD aldrig påstått att de skulle ha något annat än en design med delade resurser som skalar sämre än CMP. Man kan inte hitta på saker bara för att man inte är nöjd.

Permalänk
Medlem
Skrivet av adzer:

Till er som tycker att bulldozer har 8kärnor: var går gränsen? 8st heltalsadderare och 1st FPU. Är det 8st kärnor? Den kan ju utföra 8st heltalsoperationer parallellt. Räcker inte det?.

Om ni kommer ihåg "The Connection Machine", CM-2, Det fanns en sådan på KTH på 1980-talet, den på KTH hade 8192 kärnor enligt tillverkaren men där fick 32 av kärnorna dela på en FPU.

Så 1 FPU på 32 kärnor räckte enligt dem.

Permalänk
Medlem

Prestanda.

@Yoshman:

Jo så är det ju.

Provade köra på några olika cpu:er, %:en anger prestanda per kärna när alla trådar exekverar. Detta relativt när bara en tråd exekverar.
gzip - endast heltalsberäkningar, fpu maximalt med flyttalsberäkningar.

FX-8350: gzip: 84%, fpu: 52% (8 trådar)
Phenom-II: gzip: 100%, fpu: 100% (6 trådar)
i7-4600U: gzip: 66%, fpu: 45% (4 trådar)
i5-4210U: gzip: 61%, fpu: 44% (4 trådar)
ArmV7: gzip: 66%, fpu: 100% (4 trådar, troligen minnesbandbredden som sänker gzip)

Så FX ligger ju klart närmare 8 kärnor än i5/i7 om man undantar fpu.

Permalänk
Medlem
Skrivet av Yoshman:

Vet inte om du missat det, men är just det faktum att inte ens heltalsdelen är "oberoende" som denna stämning verkar ha som utgångspunkt då han anser att "CPU-kärnor" ska just ha egenskapen av att vara oberoende.

Är väldigt enkelt att testa detta på din FX8350:

Kör ett enkeltrådat program som endera rapporterar antal beräkningar per tidsenhet eller där du mäter tiden det tar att utföra en beräkning, det ska vara uteslutande heltal så man inte blandar in FPU.

Kör sedan två instanser av detta program på olika CPU-trådar i samma modul.

Då det är två separata program saknar de helt inbördes beroende, skalningen över CPU-kärnor är alltså perfekt.

Vad du kommer se är detta om programmet får N beräkningar per tidsenhet

  • FX-8350: varje CPU-tråd kommer nu få runt 0,8 * N, d.v.s. totalt 160% mot att köra på en CPU-tråd

  • Jaguar: varje CPU-tråd kommer fortfarande få N, d.v.s. totalt 200% mot att köra på en CPU-tråd

  • Silvermont: varje CPU-tråd kommer fortfarande få N, d.v.s. totalt 200% mot att köra på en CPU-tråd

  • Core2 Quad: varje CPU-tråd kommer fortfarande få N, d.v.s. totalt 200% mot att köra på en CPU-tråd

  • i7-4790K: varje CPU-tråd kommer nu få runt 0,6 * N, d.v.s. totalt 120% mot att köra på en CPU-tråd

Noterar något? De kretsar som har oberoende CPU-kärnor får samma prestanda per tråd oavsett om andra CPU-trådar är lastade, FX-8350 och i7-4790K när den kör båda CPU-trådar i samma kärna får lägre prestanda per tråd men ändå högre total prestanda genom den fysiska kärnan.

Gör man om detta men väljer två CPU-trådar på olika moduler i FX-8350 och olika CPU-kärnor i i7-4790K så kommer även dessa få samma prestanda på båda kärnorna och 200% total kapacitet.

D.v.s. oavsett vad man kallar AMDs moduler så finns överhuvudtaget inga tvivel om att de två CPU-kärnorna som delar modul är inte oberoende, anledningen är att de delar "front-end" (och är därmed en variant av SMT).

Bekräftas också i artikeln nedan. Cirka 18% förlust med kärnor i samma modul.
https://www.extremetech.com/extreme/217672-analysis-amd-lawsu...

Kaveri sänker denna prestandaförlust dock, till cirka 10%. Dickey menar på att BD inte kan arbeta simultant över huvud taget och tappar 50% prestanda, vilket ju är felaktigt som bevisat.
"Dickey argues that AMD’s Bulldozer CPUs suffer from material performance degradation, and cannot perform eight instructions simultaneously and independently as claimed"
http://legalnewsline.com/stories/510646458-amd-faces-suit-ove...

De är ju inte oberoende av varandra, men måste de vara det? Varför behöver de vara det? Man kommer alltid komma tillbaka till frågan vad en CPU kärna är för något, och det kan inte en domstol bestämma.

Visa signatur

Ryzen 7 5800X3D | RX 7900 XT

Permalänk
Medlem
Skrivet av LPG:

Bekräftas också i artikeln nedan. Cirka 18% förlust med kärnor i samma modul.
https://www.extremetech.com/extreme/217672-analysis-amd-lawsu...
http://www.extremetech.com/wp-content/uploads/2015/11/CB-Scaling1.png

Kaveri sänker denna prestandaförlust dock, till cirka 10%. Dickey menar på att BD inte kan arbeta simultant över huvud taget och tappar 50% prestanda, vilket ju är felaktigt som bevisat.
"Dickey argues that AMD’s Bulldozer CPUs suffer from material performance degradation, and cannot perform eight instructions simultaneously and independently as claimed"
http://legalnewsline.com/stories/510646458-amd-faces-suit-ove...

De är ju inte oberoende av varandra, men måste de vara det? Varför behöver de vara det? Man kommer alltid komma tillbaka till frågan vad en CPU kärna är för något, och det kan inte en domstol bestämma.

Faktum är att prestandan minskar även om du kör på olika moduler, och AMD har aldrig gått ut med att varje kärna skulle vara helt oberoende. De gick ut tidigt att det handlar om kluster snarare än kärnor. T.o.m. marknadsteamet har varit tydliga med att FPUn är delad. Hur en processor presterar kan man såklart inte se efter antal kärnor eller dylikt, och AMDs BD jämfördes hela tiden med Intels fyrkärnor så det är inte som de påstod att den var dubbelt så bra. Trådarna körs oberoende av varandra t.o.m. i traditionell SMT-design. Heltalsklustren får i snitt upp till 2 instruktioner per cykel att arbeta med vid flertrådat. Säg att du lyckas nå 3 per modul, då är det 12 instruktioner/beräkningar per cykel (beroende på vad det är för instruktioner) som utförs.

https://web.archive.org/web/20111015031244/http://www.amd.com...
Är specifikationerna fel eller ljuger de på sin sida 15 okt 2011? Har svårt att se att så skulle vara fallet. Är det fel information i deras detaljerade manualer från samma tid? Knappast. Jämförde inte AMD deras FX-serie mot Intel 2500k och 2600k i deras egna slides oktober 2011? Jo det gjorde dem. Prestandamässigt visade de inte att den skulle dominera.

Permalänk
Hjälpsam

För att vara ironisk.
[ironi]
Alla CPU:r är enkelkärniga, om de delar resurser.
Resurser är även arbetsminne, hårddiskar, övrig IO, med mera.
Det innebär att de flesta av oss har en enkelkärnig CPU i våra maskiner.
Jag funderar på att stämma AMD, mina filkopieringar går inte åtta gånger så snabbt.[/ironi]

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk

Finns inte mycket egentligen att reda ut, hela OEM marknaden går ut på att blåsa kunder med meningslösa siffror.

Ska vi stämma hela datorbranschen för den enorma bluff dom satt i system?

AMD i detta fall är det tydligt att CPU:n har 8 kärnor, sen hur dom utnyttjas ser man bara när man använder den i spel och program. Allt annat är irrelevant, cpun kan ju bevisligen använda alla 8 kärnor.

Skulle snarare stämma OEM som kör 750ti med 4gb eller 250 med 4gb eller 970 med 500Mb som i praktiken inte går att använda effektivt i spel.

Finns riktiga bluffar som är mer värt att stämma för, än gripa efter halmstrån.

Men om något passar detta uttryck perfekt " only in amerika ".

Ja flera har lämnat tråden som hävat allt möjligt. Fx är inte 4 kärnig, men för spel är 1/2 starka kärnor bättre än 4/8 svaga

Skickades från m.sweclockers.com

Visa signatur

Min spel rigg:FD Define R4|VX 550W|i5 2500K|Corsair LP 4GBX2|Mammabräda P67 Extreme4|GTX 670 windforce|23tum u2312hm
Min gamla/HTPC:AMD 6000+|Ram 2GbX2|Radeon HD5770| XFX 450/nu XFX 550
Mitt bygge: ByggloggFri frakt INET:Fraktfritt sweclockers vid köp över 500kr

#Gilla inlägg som är bra & Använd citera/@"namn" vid snabbt svar

Permalänk
Medlem

@Broken-arrow

För spel krävs något som kör minst fyra trådar oavsett idag. Pentium K även högt överklockad får vissa spel att helt enkelt inte kunna liras och stannar upp, så det omöjligen blir det flyt som krävs för att spela. En processor med hyper-threading löser den biten. Enstaka spel vägrar t.o.m. att startas utan fyra trådar. På bärbara gäller fyrkärniga Intel-processorer när det handlar om spel och dedikerade grafikkort, en AMD-processor med 2M ligger så långt efter (mobil variant alltså) att det vore löjligt att köra en sådan i en spellaptop. Optimus stöds inte heller med AMD-cpuer. Vill man snåla där så kan man köra core i5 med diskret grafik, med lägre effektförbrukning och köret. Köpte någon en FX-8120 när de kom så kan de säkert lira spel på den. Kanske något sämre än 2500k/2600k den jämfördes emot, men det gällde även i oktober 2011 i de flesta spel. Är ju ingen överraskning där.

Det är svårt att rikta kritik mot marknadsföring som inte fanns, AMD har aldrig påstått att det rör sig om åtta kärnor utan delade resurser som kan arbeta helt oberoende med åtta trådar. Så länge de inte ljugit är ju allt som det ska vara. Planerna på att vidareutveckla BD gavs till viss del upp vilket gav ändringar i roadmap, men i dagsläget är det bara att vänta på Zen när det gäller AMDs produkter. De lär inte få några design-wins innan dess i alla fall. Vet inte vem som skulle blivit skadad annan än AMD av att de byggde en arkitektur som var så pass trasig att särskilt mycket mer prestanda inte kunde hämtas.

Permalänk
Hjälpsam

Man skall komma ihåg att Bulldozer togs fram som ett svar mot Intel 2500K, och där står den sig rätt bra, dess problem är att den sällan kan nyttja alla sina åtta kärnor, AMD trodde nog att applikationer skulle var mer flertrådade än vad som blev fallet.

Off Topic.
Lite lustigt, jag har programmerat, flertrådat sedan 1995, men jag har gjort det i Ada, som haft bra stöd för detta sedan 1983, konstaterade att C-Sharp närmar sig Ada83 i stöd för multitasking, men det är ännu inte där ännu, vi pratar då om ett mer än 30 år gammalt programspråk, senaste versionen av Ada är från 2012.
Jag kan givetvis programmera även i C++ (det är ju tyvärr det som gäller), men jag tycker uppriktigt sagt att det är ett riktigt skitspråk.

Visa signatur

AMD Ryzen 7 1700 | Saphire RX 5700 Pulse XT (Silent Mode) | 64 GB Kingston ECC | https://valid.x86.fr/z2ljhr | Stockkylaren | Bitfenix Whisper M 750W.
AMD Ryzen 9 5900X | AMD RX 5700 | 64 GB Micron ECC | https://valid.x86.fr/5krwxf
HTPC | https://valid.x86.fr/uuzli0 |

Permalänk
Skrivet av Petterk:

@Broken-arrow

För spel krävs något som kör minst fyra trådar oavsett idag. Pentium K även högt överklockad får vissa spel att helt enkelt inte kunna liras och stannar upp, så det omöjligen blir det flyt som krävs för att spela. En processor med hyper-threading löser den biten. Enstaka spel vägrar t.o.m. att startas utan fyra trådar. På bärbara gäller fyrkärniga Intel-processorer när det handlar om spel och dedikerade grafikkort, en AMD-processor med 2M ligger så långt efter (mobil variant alltså) att det vore löjligt att köra en sådan i en spellaptop. Optimus stöds inte heller med AMD-cpuer. Vill man snåla där så kan man köra core i5 med diskret grafik, med lägre effektförbrukning och köret. Köpte någon en FX-8120 när de kom så kan de säkert lira spel på den. Kanske något sämre än 2500k/2600k den jämfördes emot, men det gällde även i oktober 2011 i de flesta spel. Är ju ingen överraskning där.

Det är svårt att rikta kritik mot marknadsföring som inte fanns, AMD har aldrig påstått att det rör sig om åtta kärnor utan delade resurser som kan arbeta helt oberoende med åtta trådar. Så länge de inte ljugit är ju allt som det ska vara. Planerna på att vidareutveckla BD gavs till viss del upp vilket gav ändringar i roadmap, men i dagsläget är det bara att vänta på Zen när det gäller AMDs produkter. De lär inte få några design-wins innan dess i alla fall. Vet inte vem som skulle blivit skadad annan än AMD av att de byggde en arkitektur som var så pass trasig att särskilt mycket mer prestanda inte kunde hämtas.

Jo skrev det lite fort kunde ha nämnt 2 kärnor + HT Klantigt, men i i stora drag stämmer mitt inlägg att 2 kärnor är bra nog (om man bara kan effektivt använda alla resurser som just HT hjälper till med).

Just därför hela hans stämning faller platt, allt AMD marknadsfört stämmer med produkten varken mer eller mindre. Är inte värre än 3,5GB (4GB) minne eller kontorsgrafikkort med 4 eller 8Gb vram

AMD behöver verkligen rycka upp sig och verkligen göra bra produkter till laptop. Tror även OEM slänger in deras grejer i 7,5k kr + laptops också och inte bara 5k kr och under.

Visa signatur

Min spel rigg:FD Define R4|VX 550W|i5 2500K|Corsair LP 4GBX2|Mammabräda P67 Extreme4|GTX 670 windforce|23tum u2312hm
Min gamla/HTPC:AMD 6000+|Ram 2GbX2|Radeon HD5770| XFX 450/nu XFX 550
Mitt bygge: ByggloggFri frakt INET:Fraktfritt sweclockers vid köp över 500kr

#Gilla inlägg som är bra & Använd citera/@"namn" vid snabbt svar

Permalänk
Medlem
Skrivet av Pudeln:

Exact. För oss gamla amiganer så var det inget problem men AMDs sätt att se saker

Man kanske ska stämma alla som någonsin gjort CPUer utan FPUer ända tillbaka till 70-talet? Det är ju falsk marknadsföring helt klart.

Skönt med någon som fattar.

Skickades från m.sweclockers.com

Visa signatur

Min musik: https://www.youtube.com/channel/UCZKidNeIKsz8LZMO3VRcBdQ

Ryzen 3900x. Skärm: AOC cu34g2x/bk 144hz 34" ultrawide. RTX 2080ti

Laptop: MSI GT80 Titan Sli

Permalänk
Medlem
Skrivet av Yoshman:

Vet inte om du missat det, men är just det faktum att inte ens heltalsdelen är "oberoende" som denna stämning verkar ha som utgångspunkt då han anser att "CPU-kärnor" ska just ha egenskapen av att vara oberoende.

Är väldigt enkelt att testa detta på din FX8350:

Kör ett enkeltrådat program som endera rapporterar antal beräkningar per tidsenhet eller där du mäter tiden det tar att utföra en beräkning, det ska vara uteslutande heltal så man inte blandar in FPU.

Kör sedan två instanser av detta program på olika CPU-trådar i samma modul.

Då det är två separata program saknar de helt inbördes beroende, skalningen över CPU-kärnor är alltså perfekt.

Vad du kommer se är detta om programmet får N beräkningar per tidsenhet

  • FX-8350: varje CPU-tråd kommer nu få runt 0,8 * N, d.v.s. totalt 160% mot att köra på en CPU-tråd

  • Jaguar: varje CPU-tråd kommer fortfarande få N, d.v.s. totalt 200% mot att köra på en CPU-tråd

  • Silvermont: varje CPU-tråd kommer fortfarande få N, d.v.s. totalt 200% mot att köra på en CPU-tråd

  • Core2 Quad: varje CPU-tråd kommer fortfarande få N, d.v.s. totalt 200% mot att köra på en CPU-tråd

  • i7-4790K: varje CPU-tråd kommer nu få runt 0,6 * N, d.v.s. totalt 120% mot att köra på en CPU-tråd

Noterar något? De kretsar som har oberoende CPU-kärnor får samma prestanda per tråd oavsett om andra CPU-trådar är lastade, FX-8350 och i7-4790K när den kör båda CPU-trådar i samma kärna får lägre prestanda per tråd men ändå högre total prestanda genom den fysiska kärnan.

Gör man om detta men väljer två CPU-trådar på olika moduler i FX-8350 och olika CPU-kärnor i i7-4790K så kommer även dessa få samma prestanda på båda kärnorna och 200% total kapacitet.

D.v.s. oavsett vad man kallar AMDs moduler så finns överhuvudtaget inga tvivel om att de två CPU-kärnorna som delar modul är inte oberoende, anledningen är att de delar "front-end" (och är därmed en variant av SMT).

Efterssom att de delar på resurser så kan de ej köra 100℅. Stäng av en kärna per modul i bios om du vill att varje kärna går på 1.0.

Skickades från m.sweclockers.com

Visa signatur

Min musik: https://www.youtube.com/channel/UCZKidNeIKsz8LZMO3VRcBdQ

Ryzen 3900x. Skärm: AOC cu34g2x/bk 144hz 34" ultrawide. RTX 2080ti

Laptop: MSI GT80 Titan Sli

Permalänk
Datavetare
Skrivet av LPG:

De är ju inte oberoende av varandra, men måste de vara det? Varför behöver de vara det? Man kommer alltid komma tillbaka till frågan vad en CPU kärna är för något, och det kan inte en domstol bestämma.

Är ju precis frågan "Vad kan en kund i Kalifornien förvänta sig av en enhet med ett visst antal 'CPU-kärnor'?" som ska avgöras om detta mål nu kommer till rätten. En domstol kan mycket väl bestämma en sådan sak, däremot kan inte en domstol göra en teknisk definition av vad en "CPU-kärna" är.

Som jag skrivit flera gånger innan, personligen tycker jag det är rätt enkelt att göra en bra definition av "CPU-kärna" genom att titta på definitionen av SMT. Definitionen blir då: om CPU-trådarna kan köra instruktioner samtidigt och matchar specifikationen för "SMT" så är just SMT, annars är det "riktiga" CPU-kärnor. Med den definitionen har t.ex. PS4 åtta kärnor, FX-8350 har fyra kärnor (precis som CPUn själv hävdar), i7-4790 har fyra kärnor, Exynos 7420 har åtta kärnor.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer