Globalfoundries redo för AMD Bulldozer

Permalänk
Medlem
Skrivet av jesusbarnet:

tror inte det finns nån information som bekräftar det ena eller det andra.

Att de 2 kärnorna i en modul kan arbeta ihop o ses som en kärna för operitivsystemet, alt att 8 trådar delas på de 8 kärnorna med 80% av kärnornas prestanda kommer väl från amd själva.

Permalänk
Medlem
Skrivet av storsnusaren:

Ja fast det är ju 8 kärnor.
Enligt någon artickel så skulle vi inte se processorn som en "x4 med ht" utan som en x8. men eftersom den inte kan ge 100% procent på alla 8 så.... (edit: om de inte arbetar i "par" med 4 trådar)

Core 2 Duo kan inte heller ge 100% på båda kärnorna då de har delad L2$, ska vi se de som en kärninga då?

Skrivet av storsnusaren:

Att de 2 kärnorna i en modul kan arbeta ihop o ses som en kärna för operitivsystemet, alt att 8 trådar delas på de 8 kärnorna med 80% av kärnornas prestanda kommer väl från amd själva.

De två integer enheterna kan inte jobba ihop på samma tråd, däremot kan FPU enheten antingen jobba på två separata 128-bit trådar eller en 256-bit AVX tråd. Och gällande prestanda förlusten när båda kärnorna används har AMD sagt att man får 180% prestanda, alltså 90% per kärna.

Permalänk
Medlem
Skrivet av Zarper:

Core 2 Duo kan inte heller ge 100% på båda kärnorna då de har delad L2$, ska vi se de som en kärninga då?

De två integer enheterna kan inte jobba ihop på samma tråd, däremot kan FPU enheten antingen jobba på två separata 128-bit trådar eller en 256-bit AVX tråd. Och gällande prestanda förlusten när båda kärnorna används har AMD sagt att man får 180% prestanda, alltså 90% per kärna.

Jaja AMD säger ju själva vi ska se den som 8 kärnig, vilket den är. Fast jag tycker det liknar någon form av bakvänd hyperthreading med fyra "moduler"

Begriper dock inte va det har för betydelse hur många kärnor den har? Prestanda/effekt är väl det som är intressant. O att bara hänga på fler kärnor ökar inte prestandan i fåtrådade applikationer vilket syns på phenom x6 vs intel x4.

Permalänk
Avstängd
Skrivet av storsnusaren:

Jaja AMD säger ju själva vi ska se den som 8 kärnig, vilket den är. Fast jag tycker det liknar någon form av bakvänd hyperthreading med fyra "moduler"

Begriper dock inte va det har för betydelse hur många kärnor den har? Prestanda/effekt är väl det som är intressant. O att bara hänga på fler kärnor ökar inte prestandan i fåtrådade applikationer vilket syns på phenom x6 vs intel x4.

zambezi skall ha tdp på 125w vilket är lika mycket som hos phenom x4 955. Detta innebär att prestandan per watt kan komma att mer än fördubblas.

Skulle bli förvånad ifall zambezi inte slår i7 980x i cinebench. Prestandan per klockcykel lär öka med 20-60%. Tyvärr så kommer nog intels PR byrå att bidra en hel del till intels favör.

Visa signatur

dator: amd phenom 965 C3 3616mhz. gigabyte 5850 @ 826MHZ. 4 GB xms3 ram 9-7-7-20. Gigabyte GA-790XTA-UD4. corsair TX 650W 80+. benq 2222hdl. logitech s220 speakers. 640GB Western Digital Caviar Blue SATA II. logitech. Logitech Deluxe 250 Keyboard Svart OEM.
os: genuine windows 7 ULTIMATE 64 bit + alla viktiga updateringar
Mobil: htc desire HD + telia max 25

Permalänk
Medlem
Skrivet av adolf512:

zambezi skall ha tdp på 125w vilket är lika mycket som hos phenom x4 955. Detta innebär att prestandan per watt kan komma att mer än fördubblas.

Skulle bli förvånad ifall zambezi inte slår i7 980x i cinebench. Prestandan per klockcykel lär öka med 20-60%. Tyvärr så kommer nog intels PR byrå att bidra en hel del till intels favör.

Amd borde göra en liknande reklam som denna http://www.youtube.com/watch?v=InUl4jriwec
då kan inte gå fel

Visa signatur

Thanks for the party, the house, the girls, the press, and..
Oh yeah, doing my laundry

Permalänk
Avstängd
Skrivet av jesusbarnet:

Amd borde göra en liknande reklam som denna http://www.youtube.com/watch?v=InUl4jriwec
då kan inte inte gå fel

Awesome. Jag kände till den filmen och de borde köra en variant med zambezi:
"most people doesn't know zambezi is faster even at single threded aplications"
-"KABRASH" där gick bulldozern in och krossade fasaden..

Visa signatur

dator: amd phenom 965 C3 3616mhz. gigabyte 5850 @ 826MHZ. 4 GB xms3 ram 9-7-7-20. Gigabyte GA-790XTA-UD4. corsair TX 650W 80+. benq 2222hdl. logitech s220 speakers. 640GB Western Digital Caviar Blue SATA II. logitech. Logitech Deluxe 250 Keyboard Svart OEM.
os: genuine windows 7 ULTIMATE 64 bit + alla viktiga updateringar
Mobil: htc desire HD + telia max 25

Permalänk
Medlem
Skrivet av Zarper:

Core 2 Duo kan inte heller ge 100% på båda kärnorna då de har delad L2$, ska vi se de som en kärninga då?

Med det sättet att se på det så är definitivt en Intel processor med Hyperthreading en dubbelkärnig processor. Tror du Hyperthreading är en transistorfri design? AMD har använt sig av 12% mer transistorer jämfört med en vanlig uppbyggd kärna för att möjliggöra en modul med två beräkningsenheter.

Kan vara kul att läsa om någon missat det:

Citat:

" -Bulldozer makes a fairly big break from how today's multicores are constructed. Today's dual-, quad-, and hexa-cores are based on single-cores strung together. They can share L2 or L3 cache, but generally are partitioned off from each other. With Bulldozer, the basic building block of a multi-core chip changes from a walled off single core to more of a duplex. Two cores are tightly intertwined and share fetch, decode, floating-point scheduler, and dual 128-bit fused-multiply-accumulate units, or FPUs. AMD says each module includes dedicated integer schedulers, pipelines, and L1 cache.

This, AMD says, is far superior to Intel's Hyper-Threading, which can bog down when the same resources are under load.

Hyper-Theading was introduced by Intel in 2002 and takes a single-core and shares its resources by creating a virtual core. In the Pentium 4 days, HT added a 10 to 15 percent performance increase, and in Core i7 chips, performance can be boosted 20 to 25 percent depending on the application.

Just adding dedicated, partitioned cores is a "brute force" approach that wastes resources, AMD says. With its shared resources, Bulldozer can reduce power consumption and shrink the die size, which in turn lowers the cost to produce the chip. AMD says the server version of its Bulldozer chip should deliver 33 percent more cores and a 50 percent increase in "throughput" in the same power envelope as a 12-core Magny-Cours Opteron chip.

One of the important things here is that Bulldozer is one of the first all-new designs from AMD in a decade, says analyst Nathan Brookwood of Insight 64. Brookwood says one of the more exciting design changes in Bulldozer is its ability to dynamically reallocate resources on single-threaded tasks. On a traditional dual-core, the resources for each walled off core cannot be combined. In Bulldozer, all of the resources of the module can be thrown at it a thread.

The single-core performance on some floating-point applications is going to be mind-boggling, Brookewood says"

Det snackas om höga klockfrekvenser också, vilket säljer bra med lite PR

Visa signatur

[ AMD 7800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Win10 PRO x64 ][ LG 34GN850 ]

Permalänk
Medlem
Skrivet av 2good4you:

Med det sättet att se på det så är definitivt en Intel processor med Hyperthreading en dubbelkärnig processor. Tror du Hyperthreading är en transistorfri design? AMD har använt sig av 12% mer transistorer jämfört med en vanlig uppbyggd kärna för att möjliggöra en modul med två beräkningsenheter.

Kan vara kul att läsa om någon missat det:

Det snackas om höga klockfrekvenser också, vilket säljer bra med lite PR

Hur du kan få det till att HT skulle vara två kärnor har jag inte en aning om. Det jag säger är att jag personligen tycker att kärnor borde räknas efter antalet beräkningsenheter. Att resurser i en processor är delade mellan kärnor är inget nytt och då blir frågan vilka delar som ska vara delade för att göra flera beräkningsenheter till en kärna?
Jag är väl medveten att HT tar transistorer, runt 5% per kärna har jag för mig att Intel har sagt. Men hur en enkel beräkningsenhet som blir matad med dubbla trådar kan bli 2 kärnor begriper jag inte riktigt.

Permalänk
Medlem
Skrivet av Zarper:

Hur du kan få det till att HT skulle vara två kärnor har jag inte en aning om. Det jag säger är att jag personligen tycker att kärnor borde räknas efter antalet beräkningsenheter. Att resurser i en processor är delade mellan kärnor är inget nytt och då blir frågan vilka delar som ska vara delade för att göra flera beräkningsenheter till en kärna?
Jag är väl medveten att HT tar transistorer, runt 5% per kärna har jag för mig att Intel har sagt. Men hur en enkel beräkningsenhet som blir matad med dubbla trådar kan bli 2 kärnor begriper jag inte riktigt.

Du missade att jag skrev ur ditt perspektiv att se på saken, varav jag skrev; Med det sättet att se på det så. Beräkningsenheten är en väldigt liten del av processorn och i princip alla resurser som fetch, decode, scheduler osv delas i Bulldozer. I en processor med flertrådsteknologi så delar man också resurser, med bl.a en mer aggressiv schemaläggare för att mata en exekveringsenhet mer effektivt enkelt förklarat.

En kärna är endast inte en beräkningsenhet, utan alla grundläggande resurser som evekveringsenheten är beroende av. Att jämföra en delad cachenivå i det läget är lite väl långsökt då det inte är en jämförelse i liknelse med det vi talar om här.

En processor med HT ses som två processorer av OS'et trots att den inte har två kompletta kärnor. En Bulldozermodul ses som två processorer trots att den fortfarande inte består av två kompletta kärnor. En extra komplett kärna hade krävt 100% fler transistorer, medan designen i Bulldozer kräver 12%. Om man också ser på strukturen på FPU'n så är det 4st FPU'er och inte 8st, även om den kan dela på sig beroende på operation/instruktionstyp.

Lösningen är betydligt mer lik Hyperthreading än två processorkärnor, men fungerar tvärtemot varandra.

Visa signatur

[ AMD 7800X3D // EK-Block @ custom loop, 2x420mm ][ MSI B650 Tomahawk ][ 32GB G.Skill Z5 Neo @ DDR6000 CL28 1T ][ AMD 7900XTX @ custom loop ][ Corsair 750D // Corsair RM1000X ][ 2TB Samsung 990PRO M.2 SSD ][ Win10 PRO x64 ][ LG 34GN850 ]

Permalänk
Medlem
Skrivet av 2good4you:

Du missade att jag skrev ur ditt perspektiv att se på saken, varav jag skrev; Med det sättet att se på det så. Beräkningsenheten är en väldigt liten del av processorn och i princip alla resurser som fetch, decode, scheduler osv delas i Bulldozer. I en processor med flertrådsteknologi så delar man också resurser, med bl.a en mer aggressiv schemaläggare för att mata en exekveringsenhet mer effektivt enkelt förklarat.

En kärna är endast inte en beräkningsenhet, utan alla grundläggande resurser som evekveringsenheten är beroende av. Att jämföra en delad cachenivå i det läget är lite väl långsökt då det inte är en jämförelse i liknelse med det vi talar om här.

En processor med HT ses som två processorer av OS'et trots att den inte har två kompletta kärnor. En Bulldozermodul ses som två processorer trots att den fortfarande inte består av två kompletta kärnor. En extra komplett kärna hade krävt 100% fler transistorer, medan designen i Bulldozer kräver 12%. Om man också ser på strukturen på FPU'n så är det 4st FPU'er och inte 8st, även om den kan dela på sig beroende på operation/instruktionstyp.

Lösningen är betydligt mer lik Hyperthreading än två processorkärnor, men fungerar tvärtemot varandra.

Jämförelsen med delad L2$ var ett motargument till att Bulldozer inte skulle räknas som två kärnor för att de inte presterar 200% när två trådar körs.

Bulldozer har delad fetch och decode men separata schedulers för båda int enheterna samt FPU. Det är sant att en kärna traditionellt sätt är en fetch, en decode, schedular(s), en int enhet och på senare år även en FPU. Så antingen har en 4 modul Bulldozer inga kärnor alls (då den inte har den uppdelningen), 4 kärnor (fetch och/eller decode) eller 8 kärnor(int). AMD själva har då valt att kalla sina int enheter för kärnor och då fått det till 8, har du ett bättre sätt att räkna kärnor skulle jag gärna höra det, säger inte att AMDs sätt är det rätta.

Hur något som är tvärtemot varandra samtidigt kan vara likt varandra förstår jag inte riktigt, ända som är likt mellan dom är att båda är till för att i slutändan få bättre (flertråds) prestanda, men det är det ända någonting i en CPU är till för.