Intel Haswell-E får åtta kärnor i 3,0 GHz

Permalänk
Datavetare
Skrivet av Aleshi:

Du som kan, vad hindrade AMD från att köra 4 ALU och 4 AGU i en och samma kärna istället för att sprida ut det om de ändå matas av samma front end?

Om de körde med totalt 4 ALU / 4 AGU på en modul och lät en tråd använda alla när den andra tråden vilar så hade man ju exakt implementerat HT, så visst hade man kunnat göra så.

Att man inte kan trycka in 2x 4 ALU / 4 AGU är ju en ren transistorbudgetfråga, det blir en för stor/dyr krets givet marknaden man riktar in sig mot.

Har skrivit det tidigare: all heder till AMD för att man försökte sig på något djärvt och nytt! Men man borde nog ändå inse att just CMT var ett totalt misslyckande och det är ingen slump att Intel x86 / SPARC / POWER / MIPS (och säkert andra) valt SMT spåret för CPUer som riktar sig mot server-lika laster.

Nu är ju Steamroller ett steg till mot att avveckla CMT och gå mot helt separerade CPU-kärnor för heltal, att dela FPU är en rätt bra sak och definitivt man kan behålla om det spar transistorer. Nästa steg är förhoppningsvis att man skapar FX-varianter med 2 eller möjligen 3 moduler fast med fler ALU / AGU per tråd, 4-6 starka trådar är mycket vettigt för desktop än 8 svagare.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Om de körde med totalt 4 ALU / 4 AGU på en modul och lät en tråd använda alla när den andra tråden vilar så hade man ju exakt implementerat HT, så visst hade man kunnat göra så.

Att man inte kan trycka in 2x 4 ALU / 4 AGU är ju en ren transistorbudgetfråga, det blir en för stor/dyr krets givet marknaden man riktar in sig mot.

Jo man jag söker en förklaring till varför AMD inte valde att ha 1 x (4*ALU + 4*AGU) med HT utan istället valde 2 * (2*ALU + 2*AGU). Det tidigare alternativet borde ju inte bara sparat transistorer, det borde gett samma flertrådsprestanda men mycket bättre enkeltrådsprestanda. Någon fördel måste det ju finnas med deras val.

Permalänk
Avstängd
Skrivet av Anitramane:

AMD-8350? c;

Jag tror nog att han menade 8 effektiva kärnor inte 8 apelsinkärnor.

Permalänk
Skrivet av Skuggan74:

Jag tror nog att han menade 8 effektiva kärnor inte 8 apelsinkärnor.

Processorer med Apelsinkärnor, Grafikchip med Melonkärnor och D? = A.M.D. XP

Visa signatur

Blegh <3 ^^

Permalänk
Datavetare
Skrivet av Aleshi:

Jo man jag söker en förklaring till varför AMD inte valde att ha 1 x (4*ALU + 4*AGU) med HT utan istället valde 2 * (2*ALU + 2*AGU). Det tidigare alternativet borde ju inte bara sparat transistorer, det borde gett samma flertrådsprestanda men mycket bättre enkeltrådsprestanda. Någon fördel måste det ju finnas med deras val.

AMD ansåg att SMT inte ger en deterministisk förbättring av prestanda. I sak har AMD helt rätt här, tittar man på Intels CPUer med HT så kan användning av HT ge allt från en liten minskning i prestanda (väldigt ovanligt idag) till nära nog en fördubbling av prestanda (en last som har extremt låg CPU-cache hit-rate skulle kunna få detta).

Hur mycket HT ger är väldigt svårt att förutse i genomsnitt verkar de ge ca 30% (om en tråd utför 100 arbete så utför utför båda 130 arbete). CMT verkar vara mycket mer stabil i detta, man får mellan 50-100%, men väldigt ofta ligger man på kring 65-70% vilket stämmer bra med att AMD hävdar runt 80% effektivitet med CMT (d.v.s prestanda per tråd är runt 80% av prestanda man har om bara en tråd per modul används).

Problemet med AMDs logik här är att visst är 70% > 30%, men problemet är att man har så mycket lägre enkeltrådprestanda så en ökning med 70% när båda CPU-trådarna används lyckas i de flesta fall ändå inte komma upp till den nivån som Intel får med en 30% ökning när båda HT används. Det riktigt stora hålet med logiken är att hög enkeltrådprestanda betyder att allt blir snabbt medan hög total prestanda över många kärnor är något som ytterst få skrivborsapplikationer kan dra nytta av. Även på serves finns många laster som kräver hög enkeltrådprestanda, men här finns i alla fall många fall som kan dra nytta av många CPU-kärnor.

Så lite intressant att så många är intresserad av en 8-kärnors Haswell-E. Undrar hur många som verkligen skulle ha någon nytta av en sådan CPU. Själv har jag svårt att se vad jag skulle göra där det skulle vara en fördel, men å andra sidan har jag tillgång till 2x 8-kärnors Xeons och även någon enstaka 4x 8-kärnors Xeon som jag kan använda som "workstation" på jobbet. Men då de typiskt har lägre frekvens än i7 2700/3770/4770 så är de flesta desktop-program långsammare på Xeon-maskinerna (som även har upp till 20M L2 cache) än på i7orna.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Så lite intressant att så många är intresserad av en 8-kärnors Haswell-E. Undrar hur många som verkligen skulle ha någon nytta av en sådan CPU. Själv har jag svårt att se vad jag skulle göra där det skulle vara en fördel, men å andra sidan har jag tillgång till 2x 8-kärnors Xeons och även någon enstaka 4x 8-kärnors Xeon som jag kan använda som "workstation" på jobbet.

Har inte alltid med logik att göra vad folk vill köpa och hur mycket de kan utnyttja det.

Det tar det lång tid innan vissa saker slår igenom på PC-marknaden. Om nu AMD och snart också Intel börjar producera 8-kärninga CPU som så småningom kryper ner i prisklasserna och blir vanligare så kommer också utnyttjandegraden att öka. Det har vi sett många gånger tidigare, t.ex. 2 till 4 kärnor som standard i desktop-CPU eller övergång till 64-bit operativ.

I andra ändan finns också ett motstånd i form av "diminishing returns" där fler och fler blir nöjda längre tid, så utvecklingen på desktop-PC kommer nog plana av medans den fortsätter att öka på andra marknader som den mobila. Där finns det fortfarande en hel del att vinna i prestanda (nån gång i framtiden ska det väl gå att få Android mjukt!) och även minskad strömförbrukning.

Permalänk
Medlem
Skrivet av Skuggan74:

Jag tror nog att han menade 8 effektiva kärnor inte 8 apelsinkärnor.

Skrivet av Anitramane:

Processorer med Apelsinkärnor, Grafikchip med Melonkärnor och D? = A.M.D. XP

Ta fram standarden för vad en riktig kärna är från något standardiserings organ! Jag tror iofs. inte ni kan det för inte ens virtual void kan det. ;)...

Visa signatur

XFX Radeon RX 7700 XT Speedster QICK 319 Black Edition | AMD Ryzen R7 5700X | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury Beast DDR4 3600MHz 4x8GB | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | LG 27GL83A | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair Void Elite Wireless

Permalänk
Medlem

Låter mumsigt. Har varit socket 939 -> 1366 -> 2011. Sålt mitt 2011 system med 680 Gtx sli till en polare för 5000 kr. Får bli ett socket "2014" med tre 780 ti (har nvidia släppt bättre då så givet det kortet) Har länge velat bygga ny dator.

Sitter med min iphone 4 och en slö notebook för 2000 kr idag. Nästa dator blir det inget snålande med.

Hösten 2014, kan jag sitta kvar med min acer notebook. Tiden går fort.

Skickades från m.sweclockers.com

Permalänk
Datavetare
Skrivet av Buio:

Har inte alltid med logik att göra vad folk vill köpa och hur mycket de kan utnyttja det.

Det tar det lång tid innan vissa saker slår igenom på PC-marknaden. Om nu AMD och snart också Intel börjar producera 8-kärninga CPU som så småningom kryper ner i prisklasserna och blir vanligare så kommer också utnyttjandegraden att öka. Det har vi sett många gånger tidigare, t.ex. 2 till 4 kärnor som standard i desktop-CPU eller övergång till 64-bit operativ.

I andra ändan finns också ett motstånd i form av "diminishing returns" där fler och fler blir nöjda längre tid, så utvecklingen på desktop-PC kommer nog plana av medans den fortsätter att öka på andra marknader som den mobila. Där finns det fortfarande en hel del att vinna i prestanda (nån gång i framtiden ska det väl gå att få Android mjukt!) och även minskad strömförbrukning.

Visst kommer vissa program kunna dra nytta av många CPU-kärnor och andelen sådana program kommer öka i framtiden. Men när ett program har prestandaproblem kan man i stort sätt dela in flaskhalsen i två klasser: endera är flaskhalsen kapacitet, d.v.s. hur mycket arbete man kan utföra, eller så är flaskhalsen latens. d.v.s. hur fort man kan slutföra en specifik uppgift.

Så länge man kunde öka enkeltrådprestanda med bättre IPC och/eller högre klockfrekvens så förbättrades båda dessa parametrar hela tiden. Även när man gick från en till två CPU-kärnor så förbättrades båda sakerna, även om förbättringen på den senare enbart kom från att latensdrivna program nu kunde slippa dela CPU-kärnan med bakgrundsprocesser.

Men att gå till fler än två CPU-kärnor förbättrar inte ens i teorin latensen och väldigt många saker man gör på en "vanlig" dator är mer känsliga för latens än för total beräkningskapacitet. Det omvända gäller för serves, där är det oftare att kapacitet är flaskhals än latens vilket är anledningen till att antalet kärnor fortsätter att stiga i ganska snabb takt där, 2008 var det 4 kärnor idag är 2x 8-kärnor rätt standard och det finns Xeons med upp till 15 CPU-kärnor 30 trådar.

Min undrar är därför vad folk tror sig kunna använda 8 kärnor 16 trådar till i en dator som är tänkt för skrivbordsapplikationer. Som jag skrev ovan så är det antalet CPU-trådar som till stor del som sätter svårigheten för programmeraren, 4 kärnor med HT är därför ur den synvinkeln lika komplicerat som att programmera mot en FX-8xxx. Att utnyttja 8 kärnor / 16 trådar fullt ut är rejält mycket svårare än att hantera 8 CPU-trådar, med undantag för programmet som är "embarrassingly parallel" (här finns saker som bl.a. ray-tracing och partikelsimuleringar).

Tycker denna artikel hos XbitLabs är ganska talande. Haswell har runt 10-15% bättre IPC än Ivy Bridge i genomsnitt, i denna artikel kör man rätt många program som kan använda många CPU-trådar långt bättre än det genomsnittliga programmet för skrivbordet, trots det är prestandaskillnaden mellan i7-4770 (4 HSW kärnor med HT) och i7-4960X (6 IVB kärnor med HT) extremt liten.

Den lilla ökningen i IPC som HSW har mot IVB är många gånger tillräcklig för att 4770 till och med ska vara snabbare än 4960X, trots att den senare har 50% mer teoretisk prestanda, nästan dubbelt så stor L3 cache samt dubbelt så hög minnesbandbredd.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Mycket intressant, men prislappen landar väl på ca. 4000+ om man känner Intel rätt?

Visa signatur

8700K 5GHz | GeForce GTX960 4GB WFOC | Corsair Vengeance LPX 16GB 3200MHz | Windows 11

Permalänk
Medlem
Skrivet av Yoshman:

Men att gå till fler än två CPU-kärnor förbättrar inte ens i teorin latensen och väldigt många saker man gör på en "vanlig" dator är mer känsliga för latens än för total beräkningskapacitet. Det omvända gäller för serves, där är det oftare att kapacitet är flaskhals än latens vilket är anledningen till att antalet kärnor fortsätter att stiga i ganska snabb takt där, 2008 var det 4 kärnor idag är 2x 8-kärnor rätt standard och det finns Xeons med upp till 15 CPU-kärnor 30 trådar.

Det har inte alls med latens eller kapacitet att göra utan handlar mycket enkelt om att server-CPU hanterar flera krävande processer i olika trådar, vilket man inte gör på en desktop-CPU. Om man inte kör vissa typer av rätt specifika applikationer eller rena testprogram som Prime95.

I övrigt mycket ordbajsande för att inte ens fortsätta på det du citerade, hade varit bättre att inte citera överhuvudtaget.

Permalänk
Datavetare
Skrivet av Buio:

Det har inte alls med latens eller kapacitet att göra utan handlar mycket enkelt om att server-CPU hanterar flera krävande processer i olika trådar, vilket man inte gör på en desktop-CPU. Om man inte kör vissa typer av rätt specifika applikationer eller rena testprogram som Prime95.

I övrigt mycket ordbajsande för att inte ens fortsätta på det du citerade, hade varit bättre att inte citera överhuvudtaget.

Alltid kul att diskutera med experter på området, kan man ju lära sig något!

Men säger inte det du precis skriver att många CPU-kärnor inte tillför något på desktop för man kör typiskt inte massor med program samtidigt?

Det som gör att man kan använda många CPU-kärnor på servers är att man typiskt hanterar många samtida klienter/anrop, var för sig är dessa oberoende och man kan därför enkelt köra dessa på olika CPU-kärnor. Latensmässigt ligger kravet på dessa i millisekundskala, något som man lätt klarar på en modern CPU. Men de saker man gör på desktop ligger ofta på µs-skala, något som blir ineffektivt att sprida mellan CPU-kärnor.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Men säger inte det du precis skriver att många CPU-kärnor inte tillför något på desktop för man kör typiskt inte massor med program samtidigt?

Intressant att du skriver så för när jag gick från en 960T till denna eminenta 8320 så fick jag enligt dessa fantastiska bänktestprogram bättre prestanda men i realiteten kan jag inte påstå att jag märker någon hårresande skillnad mer än att jag subjektivt tycker att det flyter på bättre när jag använder datorn, i spel? Spelar väldigt sällan, så kanske något bättre.

Däremot min grabb gick från en 955 till en 8320 & hans spontana reaktion var att spelen gick något märkbart bättre däremot slapp han stänga av diverse program när han skulle spela.. men som han sa högre fps. marginellt.. Fördelen var att han slapp stänga av diverse program som han uttryckte det.

Visa signatur

XFX Radeon RX 7700 XT Speedster QICK 319 Black Edition | AMD Ryzen R7 5700X | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury Beast DDR4 3600MHz 4x8GB | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | LG 27GL83A | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair Void Elite Wireless

Permalänk
Avstängd
Skrivet av Anitramane:

Processorer med Apelsinkärnor, Grafikchip med Melonkärnor och D? = A.M.D. XP

Haha.

Skrivet av skruvis:

Ta fram standarden för vad en riktig kärna är från något standardiserings organ! Jag tror iofs. inte ni kan det för inte ens virtual void kan det. ;)...

Apelsinerna själva tycker att dom enda riktiga kärnorna sitter inuti apelsiner, tyvärr har dom inte möjlighet att bevisa detta då wikipedia inte tillåter apelsiner att skriva inlägg.

ONT: Man kan inte relatera antalet kärnor till prestanda tyvärr, Intel har en arkitektur där varje kärna bara behöver ett steg för att kommunicera med en annan kärna eller cache. Hos AMD är det fortfarande på det gamla vanliga viset att ju fler kärnor desto längre väg har varje kärna för kommunikation mellan kärnor och till cache.

Permalänk
Medlem
Skrivet av Skuggan74:

Apelsinerna själva tycker att dom enda riktiga kärnorna sitter inuti apelsiner, tyvärr har dom inte möjlighet att bevisa detta då wikipedia inte tillåter apelsiner att skriva inlägg.

Men nötter tillåts tydligen!

Visa signatur

XFX Radeon RX 7700 XT Speedster QICK 319 Black Edition | AMD Ryzen R7 5700X | Noctua NH-D15 | Asus TUF Gaming B550-Plus | Kingston Fury Beast DDR4 3600MHz 4x8GB | Samsung 990 Pro 1TB | Corsair HX1000i | Fractal Design Define S | LG 27GL83A | Corsair K95 Platinum | Corsair Sabre RGB PRO Wireless | Corsair Void Elite Wireless

Permalänk
Medlem
Skrivet av Yoshman:

Alltid kul att diskutera med experter på området, kan man ju lära sig något!

Men säger inte det du precis skriver att många CPU-kärnor inte tillför något på desktop för man kör typiskt inte massor med program samtidigt?

Det som gör att man kan använda många CPU-kärnor på servers är att man typiskt hanterar många samtida klienter/anrop, var för sig är dessa oberoende och man kan därför enkelt köra dessa på olika CPU-kärnor. Latensmässigt ligger kravet på dessa i millisekundskala, något som man lätt klarar på en modern CPU. Men de saker man gör på desktop ligger ofta på µs-skala, något som blir ineffektivt att sprida mellan CPU-kärnor.

Ursäkta att jag kastade paj, det blev dåligt och inte min mening. Tänkte ge dig en gliring för att du skrev lite väl långa inlägg om något som kunde sammanfattas i ett stycke.

Men i alla fall, du började prata om att den största skillnaden mellan utnyttjande-grad av desktop-CPU och server-CPU beror på latenser och kapacitet vilket är väldigt svävande och inte alls i den största skillnaden.

Permalänk
Datavetare
Skrivet av Buio:

Ursäkta att jag kastade paj, det blev dåligt och inte min mening. Tänkte ge dig en gliring för att du skrev lite väl långa inlägg om något som kunde sammanfattas i ett stycke.

Men i alla fall, du började prata om att den största skillnaden mellan utnyttjande-grad av desktop-CPU och server-CPU beror på latenser och kapacitet vilket är väldigt svävande och inte alls i den största skillnaden.

Ingen fara, jag tar ytters sällan illa upp

Förstår däremot inte vad som är fel i att flaskhalsar i program verkligen kan delas upp i två klasser, latens-kritiska och "throughput"-kritiska.

När du jobbar interaktivt med systemet så vill du har omedelbar respons, d.v.s det enda du bryr dig om är låg latens. Detta skalar inte alls med CPU-kärnor utan skalar bara med enkeltrådprestanda.

När du har väldigt många individuella problem som helt eller nästan helt är oberoende av varandra, du vill beta av så många som möjligt per tidsenhet och det är OK om det tar ett par tiotals millisekunder per problem så har du ett problem som skalar extremt väl med CPU-kärnor (fast det skalar också med bättre enkeltrådprestanda).

Det jag säger är att desktop-program faller ofta i den första gruppen och servers i den andra (men det finns naturligtvis undantag), så desktop-system med massor med CPU-trådar är bara relevant för en extremt smal grupp och det kommer inte ändras under överskådlig tid, vi lär komma på helt andra sätt att skriva program i så fall och ingen vet ens i teorin hur det skulle se ut. Att kommunicera mellan CPU-kärnor är tyvärr extremt dyrt, relativt vad en CPU-kärna skulle kunna utföra på motsvarande tid.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av SwedenVirre:

Klart AMD har riktiga kärnor?

Bara för att du tycker att det inte skall vara åtta kärnor så får dom inte mindre fysiska kärnor för det!

Om du inte har någon koll så kan du ju sluta posta så slipper du skämma ut dig

Permalänk
Skrivet av Humper:

Om du inte har någon koll så kan du ju sluta posta så slipper du skämma ut dig

Skulle nog påstå att jag har rätt bra koll, ägt ett flertalet FX processorer de senaste åren så nog vet jag...

I en FX CPU(8350 t.ex) så finns där 8 fysika kärnor fördelat på 4 moduler. varje modul delar cache(L1,L2) AVX kodaren och FPU. 256 bitars FPUN kan delas på två 128 bits FPU ifall båda kärnorna används simultant. Nyttjas bara en kärna i modulen så får den tillgång till FPU, cache m.m

Vad gällande flyttal så är AMDn inte lika som intels diton då då där bara är en fysisk FPU

Tycker du skall sluta trolla

Visa signatur

12900K, 48GB DDR5, RTX 3070Ti

Permalänk
Medlem
Skrivet av SwedenVirre:

Skulle nog påstå att jag har rätt bra koll, ägt ett flertalet FX processorer de senaste åren så nog vet jag...

I en FX CPU(8350 t.ex) så finns där 8 fysika kärnor fördelat på 4 moduler. varje modul delar cache(L1,L2) AVX kodaren och FPU. 256 bitars FPUN kan delas på två 128 bits FPU ifall båda kärnorna används simultant. Nyttjas bara en kärna i modulen så får den tillgång till FPU, cache m.m

Vad gällande flyttal så är AMDn inte lika som intels diton då då där bara är en fysisk FPU

Tycker du skall sluta trolla

Trollar gör jag verkligen inte, var du som började att pusha "intel vs amd". Jag har inte ens en stationär dator. Och ja, kärnorna finns där jag sade inget annat men att säga 8 kärnor och att AMD har haft det sedan länge tillbaka känns ju bara dumt.

Då kan vi väl lika gärna börja kalla hyperthreading för mera kärnor också.

Permalänk
Skrivet av Humper:

Trollar gör jag verkligen inte, var du som började att pusha "intel vs amd". Jag har inte ens en stationär dator. Och ja, kärnorna finns där jag sade inget annat men att säga 8 kärnor och att AMD har haft det sedan länge tillbaka känns ju bara dumt.

Då kan vi väl lika gärna börja kalla hyperthreading för mera kärnor också.

Nämen då är vi två, har heller ingen stationär dator. Men det är skillnad på CMT som AMD använder och SMT som intel använder

Sen när började jag pusha Intel vs AMD? Jag av alla personer?

Visa signatur

12900K, 48GB DDR5, RTX 3070Ti