AMD Bulldozer med åtta kärnor i prestandatest

Permalänk
Medlem
Skrivet av KimTjik:

...

"Gemene man" har väl i och för sig ingen använding av vare sig det ena eller andra. "Gemene man" är mer beroende av bra och effektfull reklam... och/eller ett känt varumärke för att säkra nattsömnen.

Gemene man slänger i ett halvbra konsumentgrafikkort, och plötsigt så krymper skillnader i prestanda mellan olika CPUer ganska mycket.

Men jag står fortf. fast vi att jag väntar på seriösa benching på färdig produkt för att få en bra uppfattning om prestanda och potentiell prestanda.

Visa signatur

|[●▪▪●]| #Lekburk#: Ryzen 3700X >-< GB-X570-AE >-< 32GB DDR4 >-< MSI RTX 3070 >-< 970 EVO 1TB SSD>--
--< Arctic Freezer 34 >-< FD Define R4 >-< Seasonic F.+ 650W >-< Acer XF270HUA >-< AOC Q2778VQE >--
#Servering#: Ryzen 1700@3,6GHz >-< Prime X470 Pro >-< 16GB DDR4 >-< GTX 1030 >-< 970 EVO 500GB SSD >--
--< Stockkylare >-< Antec P182 >-< Silver Power 600W >-< Samsung 245T |[●▪▪●]|

Permalänk
Medlem
Skrivet av RHWarrior:

Gemene man slänger i ett halvbra konsumentgrafikkort, och plötsigt så krymper skillnader i prestanda mellan olika CPUer ganska mycket.

Men jag står fortf. fast vi att jag väntar på seriösa benching på färdig produkt för att få en bra uppfattning om prestanda och potentiell prestanda.

För att inte glömma strömförbrukning och pris!

Prestanda/krona och prestanda/watt är liksom vad som är intressant för mig.

Permalänk
Medlem

Jo , men Intel valde en annan väg , som dom flesta svalde direkt , så det blir svårt för dom att kalla det 8 core nu , men 8 trådar är 8 trådar , hur än man räknar .

Visa signatur
Permalänk

8 trådar är fler än 3ghz.

Själv vill jag har det grymmaste så länge det inte kostar 10000 (för det är för mycket). Då håller det länge=bra och billigt i längden.

Visa signatur

Has anyone really been far even as decided to use even go want to do look more like?

Dem har köpt varsin studs matta. Dem köpte ochså en katt och döpte hon till maria. Katten tycker att det är kul och hoppa studs matta.

Permalänk
Medlem
Skrivet av x1zt:

Fast då hade väl Intel påstått att 2600k var en octocore också.

Nej, det kan dom (osäker på de/dem) inte då SB 2600(K) inte har åtta kärnor. Detta ämne togs upp i en fredagspanel.

Permalänk
Medlem
Skrivet av ETK-TIS:

Jo , men Intel valde en annan väg , som dom flesta svalde direkt , så det blir svårt för dom att kalla det 8 core nu , men 8 trådar är 8 trådar , hur än man räknar .

Och 4 kärnor är 4 kärnor, hur man än räknar.
Och 8 kärnor är 8 kärnor, hur man än räknar.
Vad är det du vill ha sagt?

Och prestanda är prestanda, hur man än räknar.

Permalänk
Entusiast
Skrivet av x1zt:

Tror jag är rätt säker på att jag skrev tidigare i tråden att i väldigt specifika områden som precis X264 (som jag även nämnde specifikt) kan man eventuellt få en fördel med en Phenom hexacore?
För gemene man är det fortfarande inte ett bra köp idag då en Sandy Bridge fortfarande är bättre på 90% av applikationerna.

Jag tycker fortfarande att bulldozer är en nästintill riktig octocore då den i jämförelse mot Phenom 2 t ex har exakt samma mängd heltalsberäkningsenheter och den har samma mängd FPUs (1x128) per core. Att kärnorna inom modulerna delar på mycket är ju bara ett resultat av tightare integration.

Jag är lite förundrad här dock, Cinebench R10 har inte stöd för AVX som jag förstått. Då bör bulldozer i teorin ha dubbla FPU prestandan eftersom den har 8x128bit mot SB som har 4x128bit FPU?
Vad missar jag här? För SB kan antingen köra 4x128 eller 4x256 med AVX om min google-fu stämmer.
Detsamma gäller för fritz chess benchmark, eftersom jag inte hittar något om AVX så antar jag att det inte stödjer det?
Då spekulerar jag lite vidare om att var avsiktligt av donanimhaber (som är först med allt inom AMD ändå nuförtiden känns det som) att köra Cinebench R10 som inte stödjer det.. Men någon med bättre koll får gärna berätta hur det ligger till på det området.

Hyperthreading är inte samma sak, det är bara en mjukvaruemulering för att kunna fylla cores med arbete bättre vid multithreadade uppgifter. AMD har en octocore med 128bit FPUs, Intel har en quadcore som låtsas vara en octocore för effektivare kunna fylla sina cores med arbete. Därav problemet när AMD fortfarande har svårt att prestera.

Den har 4 moduler som har totalt 8 heltalsberäkningsenheter och 8 128bit eller 4st 256bit FPUs.
SB har 4 heltalsberäkningsenheter och 4x128 eller 4x256bit FPUs.

För övrig känns det som det är på servrar bulldozer kommer till rätta (och främst är anpassade för känns det som?), ska bli intressant att se 16-core Interlagos CPUs testade sen.

Nästintill riktig octacore? Det är ju bara heltals biten som är dubblerad i varje modul. Fetch, decode och L2 är fortfarande delat. Det är inte nästintill en octacore, det är en quadcore med dubbla heltalsenheter. Anandtech har en fin bild.

Som du ser är en Bulldozer modul mer lik en enkel kärna än en tvåkärnig processor.

Sen tror jag att det där med kärnor snart kommer bli ett dött begrepp eftersom man bygger processorer på ett annat sätt nu. Olika typer av heltal, flyttal kommer blandas ihop på olika sätt och dessutom kommer det garanterat bakas in massa shaders i det hela också till en ända gröt.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Medlem
Skrivet av Kilroy:

Och 4 kärnor är 4 kärnor, hur man än räknar.
Och 8 kärnor är 8 kärnor, hur man än räknar.
Vad är det du vill ha sagt?

Och prestanda är prestanda, hur man än räknar.

Att av nån konstig anledning så räknas Intels CPU som 4+4 och AMD som 8 , när jag tycker att man ska räkna antal trådar = 8 .

Visa signatur
Permalänk
Medlem
Skrivet av ETK-TIS:

Att av nån konstig anledning så räknas Intels CPU som 4+4 och AMD som 8 , när jag tycker att man ska räkna antal trådar = 8 .

Jag tycker man ska räkna prestanda.

Permalänk
Medlem
Skrivet av Kilroy:

Jag tycker man ska räkna prestanda.

+1

Visa signatur

Chassi: Corsair 650D | Processor: Intel Core i5 3570K | Moderkort: Gigabyte GA-Z68XP-UD3P | Minne: Corsair 16 GB | SSD: Corsair Force GT 128 GB | Lagring: 3,5 TB | Grafikkort: HIS HD7870 | Nätaggregat: Corsair AX750W | Tangentbord: Microsoft Sidewinder X4 | Mus: Mionix Naos 5000

Permalänk
Medlem
Skrivet av Kilroy:

Jag tycker man ska räkna prestanda.

Fast då får man ju ta hela spektumet

Vad är prestandan när 4 trådar används.

Och vad är prestandan när 8 trådar används.

Skickades från m.sweclockers.com

Visa signatur

Thanks for the party, the house, the girls, the press, and..
Oh yeah, doing my laundry

Permalänk
Medlem
Skrivet av jesusbarnet:

Fast då får man ju ta hela spektrumet

Vad är prestandan när 4 trådar används.

Och vad är prestandan när 8 trådar används.

Jag tänker mer "vad är prestandan när program X används" och "vad är prestandan när program Y används" och sedan tittar man på vilka program man själv använder mest och tittar vilket som ligger närmast i hur det beter sig.

Permalänk
Medlem

Zotamedu, 4 moduler är 4 st frontends med fetch/decode och 8 st integerexekveringsenheter med 8 st integerkärnor (heltal) och 8 st integerschedular eller schemaläggare för heltal, och 4 st SIMD/integer/floatingpointexekveringsenheter med 4 st heltal-flyttalsschemaläggare som kan köra två stycken vanliga heltals-flyttalsoperationer (två 128-bit load) samtidigt istället för en. AMD kallar det för 8 kärnor själva.

Frontends med fetch/decode som pratar x86, dessa har en hård variant av SMT. Under där handlar det mest om arkitektur. Men det är organiserat som två heltalsenheter med schemaläggare som gör dubbelt så mycket arbete mot om de hade varit ensamma. SIMD/FPU med gemensam schemaläggare som kan köra sina två loads per cykel och jobba med båda. Vad det gäller Intel har de kört delad L2 i Core/Conroe. Hur väl AMDs val i slutändan fungerar beror på hur kraftig frontend de byggt. P4s kunde t ex baraavkoda en x86-operation per cykel det är inte fallet här, under samma period kunde andra arkitekturer som Power och Sparc köra fler än en instruktion per cykel, men det pga olika designval. Här kommer den kunna avkoda och skicka iväg tillräckligt många MacroOps parallellt (vilket inte frontend från K10 klarar då) för att hålla exekveringsenheterna igång. AMDs riktiga problem är om vi börjar använda 256-bitars AVX-operationer, då kommer de halka efter på FPU/kärna. Men precis som Sun kan de när behovet uppstår dubbla vektorenheterna även om det betyder att bygga om frontend. Det intressanta här är delat L1 instruktions-cache, delad frontend och dess 4 x86 decode-enheter per modul. Det finns inget som säger att detta måste vara slöare än två separata frontends som definitivt kan vara slöare. Det handlar mer om hur frontend med scheduleing/schemaläggning fungerar i helhet med fetch, queue och decoding. Inte hur många olika block den är utspridd över geografiskt. AMD har t ex 64KB instruction-cache medan SNB har 32KB, dessutom har data-cache ökat från two-way till four-way från K10 och är en riktigt stor förbättring jämför mot gamla K8. K10 hade bara 3 st decode-enheter per frontend/kärna jämfört med 4 st decode per frontend/modul här byggs frontend om lite gran som sagt se: http://www.realworldtech.com/includes/images/articles/bulldoz.... Det handlar alltså om 4 st x86 instruktioner per cykel, definitivt mer kapabel än K10s. Som förhoppningsvis ska generera operationer nog för att det ska fungera hyfsat. Men det betyder pga att det är en annan design, i slutändan inte är mer än 16 avkodade x86-instruktioner per cykel på en 8-core 4-modul AMD BD. Om mer behövs är dock inget vi kan svara på utan prestandan beror nog helt på andra saker. I verkligheten kommer ju inte en kärna hinna med t ex 4 instruktioner per cykel. Förmodligen inte ens två för det mesta. AMDs riktiga problem är dock att de inte har något som kommer direkt efter Bulldozer förutom vidareutvecklad Bulldozer. Intel byter arkitektur redan med Haswell.

Ska man räkna trådar, vilket man såklart även gör så är ju en Sun SPARC T3 128-trådar och det säger relativt lite om prestandan, det handlar om 16 kärnor med 16 flyttalsenheter på 1.65GHz. Dessutom har du saker som dubbla 10GbE ethernet-kontrollers inbyggt. Upp till 128GB minne per processor som är ganska mycket mer än vad våra x86-processorer klarar på 32GB per processor. T ex Nehalem-EX. Det finns hur som helst anledning till alla olika designval. T ex hade UltraSPARC T1 8 heltalskärnor och 1 vektorenhet (FPU) vilket i princip betyder att den måste ha delad frontend mellan alla kärnor, ingen kallade det en 1-core processor för det. Vilket den då också gjorde tillsammans med CMT-trådningen. Det finns många faktorer att ta in, det går inte att bestämma att flera element bara räknas som ett eller något sådant, i en GPU har du inte heller 1536 front-ends. I många multicore, accelerationsprocessorer, DSPs eller andra vektorenheter kommer du inte köra mer än en eller ett par front-ends även fast du har massor kompetenta fysiska block. En generell heltalsenhet räknas däremot som en processor/kärna enligt det traditionella. Men det finns också chip utan generel-purpose-del. Det är inte noll beräkningsenheter för det.