AMD FX-9590 prissänks

2013-08-21 19:12

Medlem ★

Plats: Lidköping
Registrerad: Feb 2011

●

Skrivet av skruvis:

Standarden som beskriver vad som är en kärna, Jag skiter i hur många kärnor fysiska eller logiska som operativsystemet hittar.. Problemet är att det finns ingen standard så vi är utlämnade till vad tillverkaren definerar som kärna/kärnor!

Men ja om Intel definerar sin HT så & det finns 8st fysiska kärnor i arkitekturen, så absolut!
Men nu tror jag iofs. bara det är tidsfråga innan Intel har 8 kärniga med HT om dom inte redan har det dvs..

Gå till inlägget

Skrivet av Yoshman:

Det var just p.g.a. av att det inte finns någon standard som jag skrev från början att diskussionen om "riktiga"-kärnor är meningslös för det finns ingen definition för detta. Många verkar tycka att om man håller frekvensen är konstant och kör något som är "embarrassingly parallel" så är det "riktiga" kärnor om man skalar linjärt med antal trådar som används. Med en sådan definition blir både FX-8350 och i7-4770 4-kärniga. Även OS har i någon bemärkelse en sådan definition då de benhandlar två CPU-trådar på olika fysiska kärnor/moduler som "bättre" än två CPU-trådar på samma fysisk kärna/modul. Den "prestanda-fix" som gjorde för i Windows för Bulldozer var just att OSet skulle låta bli att behandla alla CPU-trådar som likvärdiga.

Om man i stället bara skriver hur många CPU-trådar som finns så kan ingen klaga, för den mer intresserade går det alltid att läsa om arkitekturen. Det enda som spelar någon roll i slutändan här hur snabbt chippet är på den last man är intresserad av.

BTW: Intel sedan ungefär 2 år tillbaka 10-kärniga CPUer (20 trådar), Nehalem baserade Xeon EX. För några veckor sedan lanserades även Ivy Bridge baserade Xeon E5 med 12 kärnor (24-trådar) och det är en 15-kärnig Ivy Bridge baserad Xeon E7 på gång.

Gå till inlägget

Standard? En kärna är bara ett annat ord för CPU egentligen, så vad mer behöver ni ha för standard? Hur det ses av operativsystemet spelar ingen roll eftersom det är den fysiska definitionen.

En "multi-core processor" består alltså av ett chip med fler än en fysisk CPU/beräkningsenhet.

Sen blir det ju lite förvirrande när vi samtidigt förenklar och kallar hela chipet för CPU såklart, men det är ju mer av lathet istället för att kalla det ett multi-CPU-chip.

Visa signatur

Shadows never sleep...
Specs: Ryzen 5600X, Powercolor Fighter RX 6700XT, ASUS B550-I ITX, 32GB 3600MHz DDR4, Bitfenix Phenom µ-ATX

Rapportera Redigera

Citera flera Citera

2013-08-21 19:31

Permalänk

Bael

Medlem ★

Plats: Lund
Registrerad: Jul 2001

●

Citat:

En Central Processing Unit (engelskt akronym CPU) eller centralprocessor är enheten som exekverar (utför) program i en dator genom att hämta maskininstruktioner och utföra begärda operationer som beräkningar och datahantering. Denna term har använts inom datorindustrin åtminstone sedan början av 1960-talet

http://sv.wikipedia.org/wiki/Central_Processing_Unit

Sen kan så som jag tolkar det kan denna cpu innehålla en (1) till fler/flera kärnor.. eller?

Visa signatur

Rapportera Redigera

Citera flera Citera

2013-08-22 08:35

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av Yoshman:

Skulle du göra detta har du, väldigt förenklat, få något som är väldigt nära Haswell-kärnan som just har 4 AGU + 4 ALU (väldigt asymmetriska, men ändock). Fördelen är bättre enkeltråd-prestanda förutsatt att man har tillräckligt stort "fönster" som man kan välja instruktioner ur för att hålla så många enheter sysselsatta.

Enda nackdelen med HT jämfört med moduler är att att faktiskt prestanda sett per tråd påverkas mer av att den andra CPU-tråden används. AMDs försvar till varför man valde moduler i stället för "HT" var att moduler ger en mer förutsägbar prestanda då påverkan på första tråden är mindre av att den andra tråden används. Det är helt sant, men det har ju visat sig att anledningen till den mindre påverkan beror ju på att man har mycket sämre enkeltråd-prestanda till att börja med... Jämför man i7 3770 och FX-8530 så har de ungefär samma prestanda per tråd när båda CPU-trådarna i en kärna/modul används, men i7-3770 har mycket bättre enkeltrådprestanda... Så i praktiken är ju HT vettigare och alla tillverkare utom AMD har ju gått på SMT spåret vilket kanske också säger en del.

Tanken med moduler var i grunden helt rätt i.m.h.o. Att två "kärnor" delar på en FPU är definitivt en vettig idé då ytterst få program är flyttalsintensiva (spel slutade vara flyttalsintensiva på CPU-delen när vi fick HW T&L, d.v.s för runt 10-15 år sedan) och även de som är väldigt flyttalsintensiva behöver ändå en hel del heltalsoperationer och minnesoperationer.

Problemet är att det i alla fall tog så många transistorer att göra en "modul" att man fick skala tillbaka ALU/AGU per tråd jämfört med Stars-arkitekturen (som hade 3 pipelines som kunde utföra allt). Varje modul har 33% mer resurser än en Stars-kärna, men varje CPU-tråd har bara 67% av resurserna av en Stars-kärna vilket gjorde IPC lidande. Att offra enkeltrådprestanda för högre total prestanda är OK för en server, men det är helt feldesignat för desktop. Tyvärr, för AMD, har det visat sig att HT är väldigt effektivt på många serverlaster där flaskhalsen är att working-set är så stort att det inte får plats i CPU-cache. HT blir i ett sådan läge i princip lika effektivt som två CPU-trådar i en modul då flaskhalsen är latens mot RAM och inte heltalskapacitet, HT kräver långt färre transistorer...

Gå till inlägget

Så det är inte mer komplicerat att bygga en 4 ALU + 4 AGU processor med HT än en modul med 2 kluster med 2 ALU och 2 AGU vardera som matas av samma decoder? Blir schedulern för komplicerad kanske?

Tycker det låter som att man kan säga att skalningen på 60-80% med modulerna inte kan beskrivas som att den tjänar mycket vid flertrådat, utan snarare tappar mycket vid enkeltrådat.

Rapportera Redigera

Citera flera Citera

2013-08-22 09:15

Permalänk

ronnylov

Medlem ★

Plats: Borås
Registrerad: Okt 2002

●

http://en.wikipedia.org/wiki/Steamroller_(microarchitecture)

Vad tror ni om påståendet att IPC ska förbättras 30% i steamroller, är det rimligt antagande?
Hur kommer den då att stå sig mot Haswell? Och vad har intel på gång?

Fattar inte ens hälften av diskussionen här men tycker det är kul med kunniga engagerade debattinlägg.

Rapportera Redigera

Citera flera Citera

2013-08-22 09:47

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av ronnylov:

http://en.wikipedia.org/wiki/Steamroller_(microarchitecture)

Vad tror ni om påståendet att IPC ska förbättras 30% i steamroller, är det rimligt antagande?
Hur kommer den då att stå sig mot Haswell? Och vad har intel på gång?

Fattar inte ens hälften av diskussionen här men tycker det är kul med kunniga engagerade debattinlägg.

Gå till inlägget

Jag tror väl definitivt att det ska gå. Finns mycket att förbättra. Och bara dubbleringen av decodern borde väl göra en del, och gör de det med L1 också så kommer nog de flesta kalla det äkta kärnor. Bara prefetch och FPU som delas.

Tycker personligen denna bilden är extremt intressant. Såpass intressant att jag tvivlar på dess äkthet, den antyder nämligen dubblering på mycket av både flyttals- och heltalsdelarna. Vilket AMD borde kommunicerat om det var fallet.
Man borde känt till om det var 4 ALU och 4 AGU och 2x256bit/4x128bit FPU.

Rapportera Redigera

Citera flera Citera

2013-08-22 20:46

Permalänk

lorgix

Medlem ★

Registrerad: Jul 2011

●

Skrivet av ronnylov:

http://www.hardwarecanucks.com/forum/hardware-canucks-reviews...

Är inte detta lite tvärtom mot påståendet i tråden att dessa genererar mindre värme vid samma klockfrekvens? High leakage borde väl betyda att den drar mera ström och alltså blir varmare? Nu är i och för sig effekt = spänning * ström så det kanske kompenseras av lägre Vcore. Men det kanske ändå är så att man får välja mellan att prioritera strömsnålhet eller möjlighet till hög klockfrekvens?

Tycker mig ha läst att FX-8350 också kan klockas uppåt 5 GHz med tillräcklig kylning. Men det kanske är just enstaka handplockade exemplar som klarar det och här har AMD själva gjort handplockningen.

Gå till inlägget

Så här har jag förstått det:

Chip med lågt läckage skalar dåligt med hög spänning men tar sig ist imponerande långt på låga spänningar. Prestanda per watt blir hög, absolut prestanda blir låg.
Chip med högt läckage skalar bra med hög spänning, men presterar antagligen mediokert på låga spänningar. Prestanda per watt blir låg, men absolut prestanda kan bli hög.

Rapportera Redigera

Citera flera Citera

2013-08-23 09:29

Permalänk

ronnylov

Medlem ★

Plats: Borås
Registrerad: Okt 2002

●

Skrivet av lorgix:

Så här har jag förstått det:

Chip med lågt läckage skalar dåligt med hög spänning men tar sig ist imponerande långt på låga spänningar. Prestanda per watt blir hög, absolut prestanda blir låg.
Chip med högt läckage skalar bra med hög spänning, men presterar antagligen mediokert på låga spänningar. Prestanda per watt blir låg, men absolut prestanda kan bli hög.

Gå till inlägget

Bra förklaring! Kan de medvetet påverka läckaget vid tillverkningen eller sorterar de bara ut de som råkar få högt respektive lågt läckage?

Rapportera Redigera

Citera flera Citera

2013-08-23 09:59

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av ronnylov:

Bra förklaring! Kan de medvetet påverka läckaget vid tillverkningen eller sorterar de bara ut de som råkar få högt respektive lågt läckage?

Gå till inlägget

De kan även medvetet påverka. Det finns low-power processer som de brukar välja till t.ex. ARM-processorer. GloFo har 28nm low power process igång för bärbart, men deras high performance process som ska användas i steamroller är inte helt klar vad jag förstått.

Rapportera Redigera

Citera flera Citera

AMD FX-9590 prissänks

Externa nyheter