Intel går igenom nyheterna i Haswell

Permalänk
Avstängd

Jag håller med om att steget från gamla single core Pentium4 till idag är stort. Men jag pratar om nyligen. Jag skrev att Intel börjat släpa efter och latar sig. Det börjar nu bli svårt för x86 att öka prestandan radikalt. Att öka prestandan från single core är enkelt, det är bara att ösa på med kärnor. Men när du öst på med många kärnor, och har hög GHz, och har hög IPC - vad gör du då??? Det är där, Intel är nu. Intel har plockat lågt hängande frukt - det är lätt att gå från single core till 8 core, men sen tar det stopp. Vad kan Intel hitta på för något nu? Ja, om man tittar på de senaste generationerna cpu, så har Intel inte hittat på något nytt eftersom det är inte stora prestanda ökningar.

Haswell prioriterar grafik och att få ned strömförbrukningen. Prestandaökningen är inte alls stor jfrt med tidigare cpuer, i vanlig ordning.

Och varför är det orättvist att jämföra med SPARC? Du menar att då kan jag lika gärna prata om GPUer, varför då? Vi pratar och jämför CPUer. Varför blandar du in GPUer? Hur menar du?

Återigen: nu när Intel också har 8-core som alla andra, så finns inte så mycket nytt som Intel kan hitta på. Och det märks i liten prestandaökning från varje generation. Att tro att Intel är världsledande, bara för att Intel gått från single core till 8-core, är ju inget unikt. Alla tyngre Unix cpuer har ju gjort den resan för längesen. Bara för att Intel gör den resan nu, så är det inget "världsledande". Det svåra är att komma på något nytt idag.

Det är ungefär som att Windows börjar först nu bli hyfsat stabil, och tro "ja, Windows har blivit mycket stabilare idag, alltså är det stabilast i världen". Men du, alla Unix har länge varit stabila. Bara för att desktop Intel och desktop Windows gör samma resa som Unix gjort för längesen så betyder det inte att Intel eller MS är "världsledande".

Permalänk
Avstängd

http://www.xbitlabs.com/articles/cpu/display/haswell-uarch-id...

Ingenting nytt eller innovativt i Haswell:
"Nevertheless, in the light of nothing super-innovative in the desktop processor market, we are still very excited to see the new Haswell."

CPU prestandan kommer inte att prioriteras i Haswell, istället prioriteras få ned strömförbrukningen men ändå ge liknande prestanda, och att prioritera grafiken:
"However, most Intel’s efforts are targeting not the increase in the processors computational performance. The primary focus is on lowering the power consumption and speeding up the graphics core. In other words, the focus on the mobile segment is more than obvious. This isn’t such good news for the enthusiast desktop users. It means that we shouldn’t expect a substantial performance boost with the launch of the new Haswell processors. 10-20% in typical applications compared with the Ivy Bridge based systems working at the same frequency is most likely as good as it gets. Clock frequencies also shouldn’t increase dramatically: the production process is the same, and there will be no changes to the execution pipeline. So, the desktop Haswell will most likely look more like a regular evolutionary refresh of the old design"

Så för desktopanvändare som kör separat grafikkort, och är intresserade av cpu prestanda, så har vi inget att hämta hos Haswell förutom 10% snabbare (inte 40% snabbare som en del gissar) och lägre strömförbrukning. Men det är inte många som kommer att uppgradera för att få 10% snabbare cpu.

Intel släpar efter. 10% är inget att hänga i julgranen. Precis det jag sagt hela tiden.

Permalänk
Entusiast
Skrivet av saddam:

http://www.xbitlabs.com/articles/cpu/display/haswell-uarch-id...

Ingenting nytt eller innovativt i Haswell:
"Nevertheless, in the light of nothing super-innovative in the desktop processor market, we are still very excited to see the new Haswell."

CPU prestandan kommer inte att prioriteras i Haswell, istället prioriteras få ned strömförbrukningen men ändå ge liknande prestanda, och att prioritera grafiken:
"However, most Intel’s efforts are targeting not the increase in the processors computational performance. The primary focus is on lowering the power consumption and speeding up the graphics core. In other words, the focus on the mobile segment is more than obvious. This isn’t such good news for the enthusiast desktop users. It means that we shouldn’t expect a substantial performance boost with the launch of the new Haswell processors. 10-20% in typical applications compared with the Ivy Bridge based systems working at the same frequency is most likely as good as it gets. Clock frequencies also shouldn’t increase dramatically: the production process is the same, and there will be no changes to the execution pipeline. So, the desktop Haswell will most likely look more like a regular evolutionary refresh of the old design"

Så för desktopanvändare som kör separat grafikkort, och är intresserade av cpu prestanda, så har vi inget att hämta hos Haswell förutom 10% snabbare (inte 40% snabbare som en del gissar) och lägre strömförbrukning. Men det är inte många som kommer att uppgradera för att få 10% snabbare cpu.

Intel släpar efter. 10% är inget att hänga i julgranen. Precis det jag sagt hela tiden.

Nej men du igen. Sen att de flesta desktopanvändarna har betydligt mer nytta av lägre strömförbrukning än 40 % mer CPU-prestanda. Inga spel idag, eller inom överskådlig framtid har någon nytta av det. Mail, internet och så vidare? Nej inte där heller. Faktum är att de flesta desktopanvändarna klarar sig utmärkt med en tvåkärnig Pentium idag. Så då vore det betydligt mer intressant att få ner strömförbrukningen för då kan man bygga betydligt mindre datorer för det är högst relevant då folk har tröttnat på stora klumpiga datorer. Laptopar säljer som aldrig förr och där är strömförbrukningen högintressant. Du stirrar dig blind på helt fel saker.

Haswell kommer ge betydligt bättre GPU-prestanda, lägre strömförbrukning och potentiellt mycket bättre flertrådad prestanda. Så laptopar tjänar på det, stora servrar med tunga beräkningar tjänar på det och datorspelare behöver det inte. Så vad är problemet? Varför ska du ha mer än 10 % mer prestanda av ren princip? Vad gör du som kräver den extra prestandan? Eller tänker du blanda de helt irrelevanta Niagara igen?

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Medlem

Just det. glömde visst denna tråden.

Skrivet av saddam:

Jag håller med om att steget från gamla single core Pentium4 till idag är stort. Men jag pratar om nyligen. Jag skrev att Intel börjat släpa efter och latar sig. Det börjar nu bli svårt för x86 att öka prestandan radikalt. Att öka prestandan från single core är enkelt, det är bara att ösa på med kärnor. Men när du öst på med många kärnor, och har hög GHz, och har hög IPC - vad gör du då??? Det är där, Intel är nu. Intel har plockat lågt hängande frukt - det är lätt att gå från single core till 8 core, men sen tar det stopp. Vad kan Intel hitta på för något nu? Ja, om man tittar på de senaste generationerna cpu, så har Intel inte hittat på något nytt eftersom det är inte stora prestanda ökningar.

Steget från Core 2 till Nehalem var också stort, och steget från Nehalem till Sandy Bridge också. Ivy Bridge var ju bara en Tick men gav ju ändå 10%. Jag ser verkligen inte hur du kan få steget till Haswell att ge max 5%. Har du ens sett förbättringarna? De borgar för en del hel del bättre IPC på både heltal och flyttal. Den ökade energieffektiviteten kan nog översättas till högre frekvenspotential också. Och vadå göra när man "öst på med kärnor, GHz och IPC" det är ju det enda man kan göra och det enda man alltid gjort och det enda man kommer göra framöver! Idiotiskt argument från din sida med andra ord.

Skrivet av saddam:

Haswell prioriterar grafik och att få ned strömförbrukningen. Prestandaökningen är inte alls stor jfrt med tidigare cpuer, i vanlig ordning.

Belägg? Intels grafer i bildspelet visar på ganska stor IPC ökning, mer än dubbelt så stor som IBs 10%.
Kolla igenom presentationen i nyheten, slide 2-15 är bara om IPC förbättringar mer eller mindre. Kolla extra nog på 3 till 8. Väldigt mycket godis där, och en hel del stora saker.

Skrivet av saddam:

Och varför är det orättvist att jämföra med SPARC? Du menar att då kan jag lika gärna prata om GPUer, varför då? Vi pratar och jämför CPUer. Varför blandar du in GPUer? Hur menar du?

En modern GPU kan också tugga kod. Men den är bara bra på en del specifika saker. Precis som SPARC. SPARC skulle gå och dö av skam om du kompilerade ett modernt spel för SPARC, eller kompilerade om vanliga program för den delen. SPARC är jättebra på att göra sin grej, men de är ganska nischade och kan inte mäta sig med Intels processorer när det kommer till allsidighet. Att fläska på GPU-prestanda är lätt, för det är simpla beräkningsenheter som kör lätt parallellliserbar kod. Lite som med SPARC.

Skrivet av saddam:

Återigen: nu när Intel också har 8-core som alla andra, så finns inte så mycket nytt som Intel kan hitta på. Och det märks i liten prestandaökning från varje generation. Att tro att Intel är världsledande, bara för att Intel gått från single core till 8-core, är ju inget unikt. Alla tyngre Unix cpuer har ju gjort den resan för längesen. Bara för att Intel gör den resan nu, så är det inget "världsledande". Det svåra är att komma på något nytt idag.

Men snälla, jag har aldrig påstått något sådant. Att gå till 8-core är ingen konst för en CPU-tillverkare. Det Intel är världsledande på är allsidig råprestanda per tråd. Somsagt, kompilera ett spel för SPARC så får du se.

Skrivet av saddam:

Det är ungefär som att Windows börjar först nu bli hyfsat stabil, och tro "ja, Windows har blivit mycket stabilare idag, alltså är det stabilast i världen". Men du, alla Unix har länge varit stabila. Bara för att desktop Intel och desktop Windows gör samma resa som Unix gjort för längesen så betyder det inte att Intel eller MS är "världsledande".

Återigen. SPARC-kärnor är rätt simpla i jämförelse med Intelkärnor. Precis nyligen som de slutade vara In-order t.ex. På många håll ligger Sparc långt efter Intel. Du tittar verkligen bara på data-skyfflande.

Men du, ska vi göra så att vi sätter en påminnelse till sommaren och så går vi tillbaka hit och så ser vi vem som hade rätt. Du gissar på 5% bättre prestanda? Jag gissar på att en IB behöver minst 20% högre frekvens för att matcha en Haswell. Så ser vi vem som kommer närmast?

Skrivet av saddam:

http://www.xbitlabs.com/articles/cpu/display/haswell-uarch-id...

Ingenting nytt eller innovativt i Haswell:
"Nevertheless, in the light of nothing super-innovative in the desktop processor market, we are still very excited to see the new Haswell."

CPU prestandan kommer inte att prioriteras i Haswell, istället prioriteras få ned strömförbrukningen men ändå ge liknande prestanda, och att prioritera grafiken:
"However, most Intel’s efforts are targeting not the increase in the processors computational performance. The primary focus is on lowering the power consumption and speeding up the graphics core. In other words, the focus on the mobile segment is more than obvious. This isn’t such good news for the enthusiast desktop users. It means that we shouldn’t expect a substantial performance boost with the launch of the new Haswell processors. 10-20% in typical applications compared with the Ivy Bridge based systems working at the same frequency is most likely as good as it gets. Clock frequencies also shouldn’t increase dramatically: the production process is the same, and there will be no changes to the execution pipeline. So, the desktop Haswell will most likely look more like a regular evolutionary refresh of the old design"

Så för desktopanvändare som kör separat grafikkort, och är intresserade av cpu prestanda, så har vi inget att hämta hos Haswell förutom 10% snabbare (inte 40% snabbare som en del gissar) och lägre strömförbrukning. Men det är inte många som kommer att uppgradera för att få 10% snabbare cpu.

Intel släpar efter. 10% är inget att hänga i julgranen. Precis det jag sagt hela tiden.

Det är bara du som hittat på att det bara blir 10%, läs nyheten i tråden så ser du att 10% borde vara väldigt lågt räknat. Men du kanske baserar ditt uttalande på tidigare Ticks och Tocks som du också hittar på om?

Permalänk
Avstängd
Skrivet av Zotamedu:

Nej men du igen. Sen att de flesta desktopanvändarna har betydligt mer nytta av lägre strömförbrukning än 40 % mer CPU-prestanda. Inga spel idag, eller inom överskådlig framtid har någon nytta av det. Mail, internet och så vidare? Nej inte där heller. Faktum är att de flesta desktopanvändarna klarar sig utmärkt med en tvåkärnig Pentium idag. Så då vore det betydligt mer intressant att få ner strömförbrukningen för då kan man bygga betydligt mindre datorer för det är högst relevant då folk har tröttnat på stora klumpiga datorer. Laptopar säljer som aldrig förr och där är strömförbrukningen högintressant. Du stirrar dig blind på helt fel saker.

Haswell kommer ge betydligt bättre GPU-prestanda, lägre strömförbrukning och potentiellt mycket bättre flertrådad prestanda. Så laptopar tjänar på det, stora servrar med tunga beräkningar tjänar på det och datorspelare behöver det inte. Så vad är problemet? Varför ska du ha mer än 10 % mer prestanda av ren princip? Vad gör du som kräver den extra prestandan? Eller tänker du blanda de helt irrelevanta Niagara igen?

Du argumenterar för att vanliga användare har mer nytta av lägre strömförbrukning än en snabbare cpu, om jag förstått dig rätt. Och du menar att Haswell gör precis det: sänker strömförbrukningen och ökar GPU prestandan men cpun blir inte mycket snabbare. Och du undrar vad mitt problem är med det?

Mitt problem är följande: jag påstår att Haswell är inte mycket snabbare cpu mässigt än Ivy Bridge. Jag påstår att IvyBridge är marginellt snabbare än SandyBridge, typ 5%. Och att Haswell är typ 10% snabbare än Ivy Bridge. Mao, Intel ökar inte cpu prestandan vidare mycket nu för tiden. Om man jämför med t.ex. SPARC som ökar prestandan 100% vartannat år.

Aleshi menar att jag har fel. Att Intel ökar prestandan mer än alla andra cpu tillverkare. Jag försöker säga att Aleshi har fel.

Jag har inga problem med att Intel sänker strömförbrukningen och ökar gpu prestandan. Jag försöker tala om för Aleshi att Intel inte ökar cpu prestandan mycket längre. Han tror ju att Intel är världsledande när vi pratar prestanda.

Permalänk
Avstängd
Skrivet av Aleshi:

Steget från Core 2 till Nehalem var också stort, och steget från Nehalem till Sandy Bridge också. Ivy Bridge var ju bara en Tick men gav ju ändå 10%. Jag ser verkligen inte hur du kan få steget till Haswell att ge max 5%. Har du ens sett förbättringarna? De borgar för en del hel del bättre IPC på både heltal och flyttal. Den ökade energieffektiviteten kan nog översättas till högre frekvenspotential också. Och vadå göra när man "öst på med kärnor, GHz och IPC" det är ju det enda man kan göra och det enda man alltid gjort och det enda man kommer göra framöver! Idiotiskt argument från din sida med andra ord.

Om du inte vill få otrevliga svar tillbaka av folk, så föreslår jag att du vaktar din tunga och inte säger att de är idioter. Det kallas hyfs, och du bryter dessutom mot forumreglerna. Skulle du uppskatta om jag kallade dig idiot, efterbliven och andra förolämpningar? Tycker du det blir bra ton i inläggen om man förolämpar varandra?

Dina siffror med 5-10% eller så, är låga. SPARC pratar om 100% ökning vartannat år. Hur kan du påstå att Intel är världsledande i prestanda med så låga siffror och så klena benchmarks som x86 faktiskt gör?

"Haswell prioriterar grafik och att få ned strömförbrukningen. Prestandaökningen är inte alls stor jfrt med tidigare cpuer, i vanlig ordning."

Citat:

Belägg? Intels grafer i bildspelet visar på ganska stor IPC ökning, mer än dubbelt så stor som IBs 10%.
Kolla igenom presentationen i nyheten, slide 2-15 är bara om IPC förbättringar mer eller mindre. Kolla extra nog på 3 till 8. Väldigt mycket godis där, och en hel del stora saker.

Belägg? Jag citerade ju artikeln för farao! Läste du inte den? Jag citerar igen:
"However, most Intel’s efforts [on Haswell] are targeting not the increase in the processors computational performance. The primary focus is on lowering the power consumption and speeding up the graphics core."

Precis det jag säger! Läs citatet igen.

Citat:

En modern GPU kan också tugga kod. Men den är bara bra på en del specifika saker. Precis som SPARC. SPARC skulle gå och dö av skam om du kompilerade ett modernt spel för SPARC, eller kompilerade om vanliga program för den delen. SPARC är jättebra på att göra sin grej, men de är ganska nischade och kan inte mäta sig med Intels processorer när det kommer till allsidighet. Att fläska på GPU-prestanda är lätt, för det är simpla beräkningsenheter som kör lätt parallellliserbar kod. Lite som med SPARC.

Jag undrar hur du resonerar egentligen. Du kan för farao inte jämföra en GPU med en CPU, det är ju milsvid skillnad! Om du tror att SPARC är lika specialiserad som en GPU så är du helt okunnig om cpuer. Du kan ju försöka köra en databas eller ett affärssystem på en GPU lika bra som en cpu. Herregud.

Sen pratar du om att "man ska kompilera spel till SPARC". Man tar sig för pannan. Vadå, är det SPEL som bestämmer hur snabb en cpu är? "Men klarar superdatorn crysis eller?" - är faktiskt ett skämt! Du verkar tro att det är allvar. FYI, servrar är faktiskt inte till för spel, de har typiskt inte ens ett 3D-grafikkort! Tror du att Servrar kör Windows och har SLI Nvidia? Seriöst, skämtar du med mig? Varför pratar du om spel på tunga Unix servrar??? Låt mig vända på frågan "försök kompilera något servertungt med tusentals klienter till x86 så får vi se hur den skäms".

Sen visar du din okunnighet igen. Det är skillnad på SPARC och SPARC Niagara CMT. SPARC är precis som vanliga POWER, dvs har få starka trådar. SPARC CMT är specialiserad mot hög datagenomströmning, men den är även bra på vanliga saker. Du låter bara okunnig när du säger att SPARC har svaga trådar. Här är t.ex. en SPARC med 240 GFlops
http://en.wikipedia.org/wiki/SPARC64_VI#SPARC64_IXfx

Sen råkar ju x86 vara en föråldrar cpu arkitektur, buggig och eländig. Om du ska bygga en x86 cpu idag, så måste den stödja över 1000 asm instruktioner! Många som aldrig används, pga x86 härstammar ända från 1970-talet. T.om Intel själva tyckte ju x86 var skit och försökte lägga ned x86, till förmån för Itanium. Men sen kom AMD och blåste liv i x86 med 64bitar. Intel hade ju helst sett att x86 stannat vid 32 bitar, och alla gått över till 64bitar genom Itanium.

Citat:

Men snälla, jag har aldrig påstått något sådant. Att gå till 8-core är ingen konst för en CPU-tillverkare. Det Intel är världsledande på är allsidig råprestanda per tråd. Somsagt, kompilera ett spel för SPARC så får du se.

Vadå, är det du som bestämmer vad som är rätt? Det är "spel" som gäller? Som avgör om en cpu är bra? Inte t.ex. servertunga applikationer som servar tusentals klienter? Såna räknas inte i din värld, utan det är datorspel som gäller? Får jag fråga, går du i gymnasiet?

När du gång på gång säger att Intel är världsledande på allsidig råprestanda per tråd, vad sägs om att du slutar snacka skit, och visar lite benchmarks som bevisar precis det du säger? Visa lite t.ex. SPECint2006 benchmarks, eller LINPACK eller nåt annat. Om de benchmarks är bättre på x86, så har du ju faktiskt rätt, annars har du FEL, och i vilket fall så slipper vi argumentera. Om du påstår att x86 är världsledande så kan du visa världsrekord i benchmarks. Kan du inte det, så har du tokfel och isåfall har du svamlat precis hela tiden.

Citat:

Återigen. SPARC-kärnor är rätt simpla i jämförelse med Intelkärnor. Precis nyligen som de slutade vara In-order t.ex. På många håll ligger Sparc långt efter Intel. Du tittar verkligen bara på data-skyfflande.

Jag tittar bara på data-skyfflande? Och du då, du tittar bara på datorspel. Jag jobbar ju med dataskyfflande saker, och du spelar datorspel i ditt gymnasierum. Så vad ska vi titta på? Crysis på tunga Unix servrar, eller på serverprogram? Vad sägs om att det enklaste är vi bara tittar på lite benchmarks, så slipper vi diskutera. Visa mig benchmarks med rå cpu prestanda som du pratar om. Typexemplet är ju SPECint2006 och SPECfloat. Sätt igång och visa lite benchmarks, sluta snacka. Leverera.

Citat:

Men du, ska vi göra så att vi sätter en påminnelse till sommaren och så går vi tillbaka hit och så ser vi vem som hade rätt. Du gissar på 5% bättre prestanda? Jag gissar på att en IB behöver minst 20% högre frekvens för att matcha en Haswell. Så ser vi vem som kommer närmast?

Jag skiter i vilken siffra som är rätt, i båda fallen så har jag rätt och du har fel: Intel ökar inte sin prestanda vidare mycket. Det är endast fråga om några procent. SPARC ökar sin prestanda 100% vartannat år, och kommer göra det i många år framöver.

Citat:

Det är bara du som hittat på att det bara blir 10%, läs nyheten i tråden så ser du att 10% borde vara väldigt lågt räknat. Men du kanske baserar ditt uttalande på tidigare Ticks och Tocks som du också hittar på om?

I artikeln står det 10-20%, inget jag hittar på. Och de skriver att cpu prestandan kommer inte vara något att hänga i granen jfrt med Ivy Bridge.
"However, most Intel’s efforts are targeting not the increase in the processors computational performance."

Läs artikeln. Ta fram benchmarks. Så får vi se om du svamlat hela tiden. Eller om det är jag som svamlar.

Permalänk
Avstängd
Skrivet av jacozz:

Då ville jag bara passa på att ge lite cred till Virtual Void och Aleshi som ser till att höja nivån på trådarna, då dessa annars lätt brukar urarta i rena fanboikrig framförda utan faktisk sakkunskap.

Snälla. Hur kan du anse att outbildade gymnasister har "faktisk sakkunskap"? Lägg ned. Går alla i gymnasiet här eller?

Virtual Void är den som har mest sakkunskap här. Jämte mig. Vi är ju båda civilingenjörer.

Permalänk
Medlem

Jag har lite svårt att se vilken relevans Sparc skulle ha här? Det är en arkitektur för köra stora databaser med och inte för persondatorer. Även om du skulle kompilera om Windows 7 för att kunna köra den på T3 eller T4 så skulle den få stor pisk av en normal s1155/2011 då singeltråd prestandan inte är i närheten av vad en modern Intel processor är kapabel av idag.

Permalänk
Medlem
Skrivet av saddam:

Aleshi menar att jag har fel. Att Intel ökar prestandan mer än alla andra cpu tillverkare. Jag försöker säga att Aleshi har fel.

Jag har inga problem med att Intel sänker strömförbrukningen och ökar gpu prestandan. Jag försöker tala om för Aleshi att Intel inte ökar cpu prestandan mycket längre. Han tror ju att Intel är världsledande när vi pratar prestanda.

Antingen ljuger du eller så visar du prov på mycket dålig läsförståelse då du kraftigt vrider på det jag säger. Intel är världsledande på råstark prestanda per tråd. Det är mycket svårt att få upp den prestandan och SPARC och POWER har inte en chans mot intels processorer om du kompilerar om PC-program för att köra på deras processorer. De är bra på nummerskyfflande, men de är inte bra på samma saker som en intel-processor. Därför kan du inte jämföra SPARC/POWER med X86, de suger i jämförelse på de typer av beräkningar som Intel är bra på. Det är lättare att öka prestandan på deras kraftigt parallelliserbara laster. Så det är precis lika orättvist som att jämföra SPARC och POWER med X86 som att jämföra GPU med X86. Det ena är kraftigt parallelliserbart, det andra är det inte. Kul att du också räknar prestanda från extra kärnor/trådar när du räknar på SPARC, men inte när du räknar Intel.

Skrivet av saddam:

Om du inte vill få otrevliga svar tillbaka av folk, så föreslår jag att du vaktar din tunga och inte säger att de är idioter. Det kallas hyfs, och du bryter dessutom mot forumreglerna. Skulle du uppskatta om jag kallade dig idiot, efterbliven och andra förolämpningar? Tycker du det blir bra ton i inläggen om man förolämpar varandra?

Men argumentet att intel kört IPC/Hz och Kärnor tricken redan och att de inte har nya sätt att öka prestandan är idiotiskt! Det gäller ju alla processortillverkare till att börja med, och har dessutom alltid gällt! Det finns inget annat sätt att öka CPU-prestanda på! Eller tänker du försvara argumentet?

Skrivet av saddam:

Dina siffror med 5-10% eller så, är låga. SPARC pratar om 100% ökning vartannat år. Hur kan du påstå att Intel är världsledande i prestanda med så låga siffror och så klena benchmarks som x86 faktiskt gör?

Nu ljuger du igen, mina siffror är inte 5-10%. Ivy Bridge gav 10%, och det var bara en Tick. Sandy Bridge gav 20%. Nehalem gav ännu mer. Och detta per kärna. Nehalem över Core 2 är över 200% på flertrådat. Precis som Core 2 var över 200% än P4. Numera ökar man inte kärnor så mycket, men det är för att PC-program inte går att parallellisera upp så mycket att det är värt det. Men du tror ju att parallell beräkningsprestanda är allt och höjer primitiva nummerskyfflare till skyarna. Det finns en anledning till att Intel inte har massa FP-enheter per kärna, det är att det är otroligt svårt att få ett PC-program att utnyttja det. Det är inte svårt att få en serverapplikation att utnyttja det dock. Samma sak med 16 kärnor och massa trådar. Intel har däremot lagt otroligt mycket mer arbete på annat.

Skrivet av saddam:

"Haswell prioriterar grafik och att få ned strömförbrukningen. Prestandaökningen är inte alls stor jfrt med tidigare cpuer, i vanlig ordning."

Belägg? Jag citerade ju artikeln för farao! Läste du inte den? Jag citerar igen:
"However, most Intel’s efforts [on Haswell] are targeting not the increase in the processors computational performance. The primary focus is on lowering the power consumption and speeding up the graphics core."

Precis det jag säger! Läs citatet igen.

Ja just det, den killens åsikt väger tyngre än presentationen som till 80% handlar om IPC förbättringar? Så länge man inte slappnar av latenser och dylikt så går oftast lägre energiåtgång och IPC hand i hand.

Skrivet av saddam:

Jag undrar hur du resonerar egentligen. Du kan för farao inte jämföra en GPU med en CPU, det är ju milsvid skillnad! Om du tror att SPARC är lika specialiserad som en GPU så är du helt okunnig om cpuer. Du kan ju försöka köra en databas eller ett affärssystem på en GPU lika bra som en cpu. Herregud.

EXAKT MIN POÄNG! Det är milsvidd skillnad på X86 och SPARC. Du kan ju försöka köra ett PC-program på en SPARC lika bra som på en X86. Herregud.

Skrivet av saddam:

Sen pratar du om att "man ska kompilera spel till SPARC". Man tar sig för pannan. Vadå, är det SPEL som bestämmer hur snabb en cpu är? "Men klarar superdatorn crysis eller?" - är faktiskt ett skämt! Du verkar tro att det är allvar. FYI, servrar är faktiskt inte till för spel, de har typiskt inte ens ett 3D-grafikkort! Tror du att Servrar kör Windows och har SLI Nvidia? Seriöst, skämtar du med mig? Varför pratar du om spel på tunga Unix servrar??? Låt mig vända på frågan "försök kompilera något servertungt med tusentals klienter till x86 så får vi se hur den skäms".

Spelar du dum eller förstår du på allvar inte vad jag säger? Jag säger inte att man ska kompilera spel för att spela på SPARC, jag säger tydligt att det bara är att visa att SPARC är otroligt dåliga på den typ av prestanda som Intel-processorer har. Och du klagar på Intel över detta? Intel har sinnessjukt starka kärnor när det kommer till enkeltrådad prestanda. Att skyffla 16 FP-instruktioner i parallell är inte lika avancerat.

Skrivet av saddam:

Sen visar du din okunnighet igen. Det är skillnad på SPARC och SPARC Niagara CMT. SPARC är precis som vanliga POWER, dvs har få starka trådar. SPARC CMT är specialiserad mot hög datagenomströmning, men den är även bra på vanliga saker. Du låter bara okunnig när du säger att SPARC har svaga trådar. Här är t.ex. en SPARC med 240 GFlops
http://en.wikipedia.org/wiki/SPARC64_VI#SPARC64_IXfx

Ja stark som att den klarar jättemånga FP-beräkningar samtidigt. Hur bra skulle den hantera ett PC-program? Den skulle dö då. SPARC är gjorda för servrar, de är gjorda för en värld där allt är mycket mer parallelliserbart, enklare uppbyggda skyfflare är mycket bättre lämpade för det. Du kan inte jämföra hur lätt det är att öka prestandan på en sånt jämfört med hur lätt det är att få upp prestandan på PC-applikationer.

Skrivet av saddam:

Vadå, är det du som bestämmer vad som är rätt? Det är "spel" som gäller? Som avgör om en cpu är bra? Inte t.ex. servertunga applikationer som servar tusentals klienter? Såna räknas inte i din värld, utan det är datorspel som gäller? Får jag fråga, går du i gymnasiet?

Nej, jag försöker förklara för dig att det är olika saker. Du tycks inte förstå det. Du kan inte jämföra SPARC med X86 rätt av då de är bra på olika saker. En SPARC-kärna är primitiv i jämförelse med en Haswell. Men det är en fördel för den typen av applikationer där den kör. Då tjänar man betydligt mer på att få plats med fler kärnor och större FP-skyfflande. Precis som i GPU-världen, där tjänar man också mer på det.

Skrivet av saddam:

När du gång på gång säger att Intel är världsledande på allsidig råprestanda per tråd, vad sägs om att du slutar snacka skit, och visar lite benchmarks som bevisar precis det du säger? Visa lite t.ex. SPECint2006 benchmarks, eller LINPACK eller nåt annat. Om de benchmarks är bättre på x86, så har du ju faktiskt rätt, annars har du FEL, och i vilket fall så slipper vi argumentera. Om du påstår att x86 är världsledande så kan du visa världsrekord i benchmarks. Kan du inte det, så har du tokfel och isåfall har du svamlat precis hela tiden.

Det är som att begära att någon ska visa benchmarks som visar att CPU är snabbare än GPU. De enda tester som går på båda är gjorda för GPU. PC-program är inte ens kompilerade till SPARC av en anledning! SPECint är jättebra på att visa teoretiskt max, men visar inte alls hur en processor hanterar det mycket mer komplexa situationen med PC-program.

Skrivet av saddam:

Jag tittar bara på data-skyfflande? Och du då, du tittar bara på datorspel. Jag jobbar ju med dataskyfflande saker, och du spelar datorspel i ditt gymnasierum. Så vad ska vi titta på? Crysis på tunga Unix servrar, eller på serverprogram? Vad sägs om att det enklaste är vi bara tittar på lite benchmarks, så slipper vi diskutera. Visa mig benchmarks med rå cpu prestanda som du pratar om. Typexemplet är ju SPECint2006 och SPECfloat. Sätt igång och visa lite benchmarks, sluta snacka. Leverera.

Jag pratar inte bara spel. Jag säger att det krävs en helt annan arkitektur för att bara bra på t.ex. spel. DU däremot envisas med att jämföra med dataskyfflare i dataskyfflarbenches.

Skrivet av saddam:

Jag skiter i vilken siffra som är rätt, i båda fallen så har jag rätt och du har fel: Intel ökar inte sin prestanda vidare mycket. Det är endast fråga om några procent. SPARC ökar sin prestanda 100% vartannat år, och kommer göra det i många år framöver.

Och GPU-er ökar med mer än 100% vartannat år. Orättvis jämförelse? Jajamensan!
Och sedan så ljuger du konstant om hur mycket intel ökar, du nedvärderar deras ökningar per tråd och glömmer mängden trådar.

Skrivet av saddam:

I artikeln står det 10-20%, inget jag hittar på. Och de skriver att cpu prestandan kommer inte vara något att hänga i granen jfrt med Ivy Bridge.
"However, most Intel’s efforts are targeting not the increase in the processors computational performance."

Läs artikeln. Ta fram benchmarks. Så får vi se om du svamlat hela tiden. Eller om det är jag som svamlar.

Jag har läst artikeln. Prestandaökningen på grafiken överstiger den i processorn. Ja, men det är just för att parallelliserbara saker är lätta att biffa upp. IPC-ökningen per kärna kommer fortfarande vara stor. Men så klart kan den inte jämföras med den flertrådade prestandaökningen i % man kan få med nummerskyfflare. Men det är heller ingen konst att öka den i jämförelse.

Permalänk
Datavetare
Skrivet av saddam:

Du argumenterar för att vanliga användare har mer nytta av lägre strömförbrukning än en snabbare cpu, om jag förstått dig rätt. Och du menar att Haswell gör precis det: sänker strömförbrukningen och ökar GPU prestandan men cpun blir inte mycket snabbare. Och du undrar vad mitt problem är med det?

På desktop är detta helt sant, ytterst få "vanliga" användare har någon större nytta av fler CPU-kärnor. Ytterst få har någon större nytta av högre prestanda per tråd, men det ger i alla fall fördelen att svarstider sjunker och de få applikationer som är CPU-bundna kommer ju gå fortare.

Skrivet av saddam:

Mitt problem är följande: jag påstår att Haswell är inte mycket snabbare cpu mässigt än Ivy Bridge. Jag påstår att IvyBridge är marginellt snabbare än SandyBridge, typ 5%. Och att Haswell är typ 10% snabbare än Ivy Bridge. Mao, Intel ökar inte cpu prestandan vidare mycket nu för tiden. Om man jämför med t.ex. SPARC som ökar prestandan 100% vartannat år.

Som vanligt jämfört du äpplen (desktop CPU) och päron (server CPU) + hittar på "fakta" i tomma intet. Hur vet du att Haswell inte blir snabbare än Ivy Bridge?

Nehalem hade 5 exekveringsportar, Sandy/Ivy Bridge har 6 (vilket definitivt gav en boost i IPC) och Haswell kommer få 8 st exekveringsportar. Bara den förändringen kommer höja IPC åtminstone lika mycket som från Nehalem -> Sandy Bridge. Ovanpå detta har Haswell fått fördubblad bandbredd mot L1 cache, medan bandbredden endast skalats med något ökad klockfrekvense från Core2 -> Ivy Bridge. Den ENDA anledningen till att Ivy Bridge har något högre IPC än Sandy Bridge är att man ökade storleken på out-of-order fönstret något och i Haswell ökas detta ännu mer.

Och sist men inte minst får Haswell TSX, något som kommer öka prestanda på applikationer som faktiskt använder flera CPU-kärnor. Inga benchmarks finns kring detta ännu, men Intel har presentera lite information kring vad vi kan förvänta oss. Detta är den mest revolutionerande finess (främst för servers där man har långt fler CPU-kärnor) någon CPU-tillverkare presenterat de senaste 5 åren i alla fall.

Kommer Haswell dubbla IPC jämfört med Ivy Bridge? Nej, definitivt inte. Men det kommer vara en klart större förbättring jämfört med Sandy -> Ivy och det är inte alls omöjligt att prestanda / W kommer dubblas (till och med troligt).

Tittar vi på server CPU:er så ser det lite annorlunda ut. Westmere (32nm Nehalem) -> Sandy Bridge gav runt 40-60% högre prestanda i genomsnitt och laster som är extremt I/O intensiva har upp till dubbla prestandan här tack vare att DDIO (Data Direct I/O, PDF). Kolla in detta test som visar hur Sandy Bridge Xeon total krossar tidigare Xeon samt även Bulldozer varianten av Opteron.

Att SUN/Oracle kunnat öka prestanda mellan T1->T2->T3->T4 beror ju endast på att man startade men en rent ut sagt bedrövlig IPC. Men även T4:an är egentligen bara en "one trick pony", den är bara konkurrenskraftig i saker som har ett totalt slumpmässigt accessmönster ur ett väldigt stort data-set. Databaser är en av de få saker som passar in på detta, men det är något som Oracle bryr sig ganska mycket om
I alla andra typer av laster så blir SPARC totalt krossad av både POWER, Xeon och Opteron. Oracle vet om detta vilket är anledningen till att de använder endera Xeon eller Opteron på deras high-end servers i "Exa" serien.

Skrivet av saddam:

Aleshi menar att jag har fel. Att Intel ökar prestandan mer än alla andra cpu tillverkare. Jag försöker säga att Aleshi har fel.

Jag har inga problem med att Intel sänker strömförbrukningen och ökar gpu prestandan. Jag försöker tala om för Aleshi att Intel inte ökar cpu prestandan mycket längre. Han tror ju att Intel är världsledande när vi pratar prestanda.

Åter igen, titta på Westmere -> Sandy Bridge och även på tidigare uppgraderingar av Xeon, det är STORA förbättringar mellan varje version. Tror jag skrev det ovan, har pratat med två av arkitekterna bakom Niagara och även de säger att sedan man börjat fokusera på högre IPC så har bristen på L3 cache (jämfört med Xeon och POWER) blivit en klar nackdel. Men högre IPC har även gett andra problem, något som även Intel påpekat att Xeon EX (10 kärnors varianten) lider av: det GÅR INTE att få tag i RAM som är tillräckligt snabbat att mata speciellt mycket fler CPU-kärnor än vad man har nu. T5 kommer ha upp till 16 CPU-kärnor, men de var rätt säkra på att T6 inte kommer ha flera. I stället ska man nog lägga till specifika funktioner (likt de kryptoblock man nu har) och mer L3 cache, vilket är EXAKT samma slutsats som Intel och antagligen IBM kommit fram till. Visst kommer Oracle hitta någon benchmark där de kan hävda att T6 är dubbelt så snabb som T5, men det är trivialt att hitta mellan Westmere och Sandy Bridge också.

Edit: detta betyder inte nödvändigtvis att framtida servers inte kommer ha fler CPU-kärnor än idag. Men man kommer vara tvungen att skala genom att ha flera CPU-socklar per system i stället för att öka antalet kärnor i varje sockel. Anledningen borde vara uppenbar, bandbredd mot RAM ökar ju för varje sockel då varje CPU har sin egen RAM-kontroller. Nackdelen är att kommunikation mellan trådar körandes på olika CPU-socklar är MYCKET långsammare än kommunikation mellan trådar på samma sockel då det inte finns någon som är gemensam mellan socklar.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Datavetare
Skrivet av saddam:

Men att gå från jättedåligt till bara dåligt är enkelt och går snabbt att göra. I vilket fall som helst, så menar jag att x86 stannat av takten. När man gick från 1-socket system upp till 8-socket så var det stora förbättringar, men nu har det tagit stopp. x86 skalar inte mer än 8-sockets, typ.

Då får du förklara hur det kan finnas Xeon-baserade superdatorer med upp till 1024 socklar. De kör inte QPI (Intels inter-sockel bus), men varför skulle det spela någon roll om det är x86 vi pratar om?

Skrivet av saddam:

POWER7 är en gammal cpu som du jfr mot de senaste Xeon EX CPUerna. POWER7+ kommer nu i dagarna och kommer vara mycket snabbare än Xeon EX cpuerna, återigen. Men visst, jag håller med dig om att de är för dyra och drar för mycket ström. Men det var inte poängen. Poängen var att jag försökte förklara för Aleshi att POWER7 är snabbare än x86. Vi disktuerade inte priset, utan prestandan. Bra att vi är överens om att POWER7 är snabbare än x86. Då slipper jag försöka förklara för dig att POWER7 är snabbare, vilket alla som är insatta känner till.

POWER7+ är samma grundläggande design som POWER7, lite mer cache och eventuellt lite högre klockfrekvens. Det kommer alltså inte vara några stora skillnader. OM Intel bara tillät sina Xeons ha en TDP 250W så skulle de definitivt spöa POWER7 i prestanda per tråd då det är fullt möjligt att klocka en Sandy Bridge till >4.3GHz vilket är vad som krävs för att plocka in skillnaden i prestanda.

Skrivet av saddam:

Japp. Bra att du har koll, så slipper jag försöka förklara detta för dig. ORACLE har fokuserat på att skyffla mycket data snabbt. Företagen skyfflar ju mycket data hela tiden, det är viktigast för dem. Att tugga siffror är inte alls lika viktigt, och inget att fokusera på.

Och just på skyffla-data punken är Sandy Bridge i princip dubbelt så snabb som Westmere tack vare DDIO, så x86 tar definitivt in på SPARC här.

Skrivet av saddam:

Ingen säger att SPARC är perfekt. Men tror du att x86 är perfekt då? Finns det något sämre och rörigare än x86? Det härstammar från 1970(?) och har så mycket gammal barlast så det finns inte. Intel försökte döda skräpet och börja på ny kula med Itanium, men tyvärr lever fortfarande x86. Om vi började på ny kula så skulle vi få dubbla prestandan till halva strömförbrukningen, och mycket färre buggar.
http://www.anandtech.com/show/3593
-"The total number of x86 instructions is well above one thousand" !!!!!!!!!!!!!!!!
-"CPU dispatching ... makes the code bigger, and it is so costly in terms of development time and maintenance costs that it is almost never done in a way that adequately optimizes for all brands of CPUs."
-"the decoding of instructions can be a serious bottleneck, and it becomes worse the more complicated the instruction codes are"
-The costs of supporting obsolete instructions is not negligible. You need large execution units to support a large number of instructions. This means more silicon space, longer data paths, more power consumption, and slower execution.

Totala antalet instruktioner är över 1000st, men de flesta används inte och tar inte upp speciellt många transistorer då de har mikrokod i ROM. Detta gör då även den sista kommentaren helt fel (well, att köra en instruktion som är mikrokodad i ROM är väldigt långsamt, men dessa instruktioner används som sagt inte av moderna kompilatorer).

Kommentaren om CPU dispatching är ju totalt FEL. x86 (och vilket annat CISC instruktions-uppsättning som helst) är mer kompakt än RISC kod (mycket mer kompakt än "rena" RISC:ar som MIPS och SPARC). Något som lätt borde inses då x86:er intern översätter varje x86 instruktion till mellan 1 till 3 "RISC" instruktioner.

Och just på grund av detta så är avkodning en MINDRE flaskhals i x86 än i en RISC. Alla Intel CPUer sedan Core2 kan avkoda upp till 4 x86 instruktioner per klockcykel (kan i praktiken bli 5 då prefetchern slår ihop cmp/branch till en instruktion, s.k. macro-op fusion), en RISC lär då kunna avkoda ~8 instruktioner per cykel (om vi antar att varje x86 instruktion i genomsnitt blir 2 "RISC" instruktioner) för att matcha x86. SPARC T1-T5 kan avkoda maximal 2 SPARC instruktioner per cykel, POWER7 kan avkoda 6 instruktioner.
Nästa fördel för x86 här är att instruktions-cachen innehåller ju x86 instruktioner, så med en specifik storlek på cachen så kan en x86 cache:a mer information än en RISC.
Just denna setup är anledningen till att det faktiskt är vettigt att ha hela 8 exekveringsportar trots att avkodaren bara avkodar 4/5 instruktioner. Avkodaren jobbar med x86 instruktioner men det som körs är interna "RISC" instruktioner. Idag är bandbredd mot cache och RAM en av de absolut största flaskhalsarna, något som gjort x86 kompakta kodning av instruktioner till en STOR FÖRDEL.

Ovanpå detta så har multicore gjort sitt inträde och RISC har, per definition, inte stöd för load-op-store instruktioner men det har x86 vilket har lett till att implementation av atomära operationer som är ett krav för semaforer och mutex:ar blir mer effektiv på x86 än på RISC.

Skrivet av saddam:

Vi pratar två olika saker. Du sysslar med desktops och då får man ofta in all kod in i en liten cpu cache på 12MB. Men om du sysslar med tyngre server laster, där du ska betjäna 1000tals användare så kan du inte få in alla data in i cpu cachen. Det säger sig självt. Hur ska du få in Kernel, OS, Databasen, alla tusen klienters data, etc - in i 12MB? Det går inte, du skulle behöva GB om ens det räcker. Vid större serverlaster får du 50% cache missar.

Men på desktop när du kör t.ex. beräkningssnurror så räcker väl 6 MB cpu cache utmärkt och då får du inte mycket cache missar.

Vem säger att jag sysslar med desktop? Ja, på fritiden gör jag det, på jobbet sitter jag med PowerPC, MIPS och x86 system med allt från några enstaka CPU-kärnor upp till (just nu) 32 CPU-kärnor, finns tillgång till 80-kärnors x86 system inom företaget men de används till andra saker än vad jag jobbar med. Jag har bl.a. tillgång till ett par system som kör samma CPU-setup som de AnandTech testade (dubbla 8-kärnors Xeon E5or, Sandy Bridge).

E5orna har 2x20MB L3 cache, det räcker inte för databaser, men det räcker definitivt till väldigt många saker som man vill göra på en server och på alla dessa arbetslaster så krossar Xeon E5:an en T4.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Avstängd
Skrivet av m0rk:

Jag har lite svårt att se vilken relevans Sparc skulle ha här?

Relevansen är att vi diskuterar hur snabbt x86 ökar i prestanda nu för tiden. Jag påstår att x86 ökar inte alls mycket i prestanda nu för tiden. Om du vill ha kraftiga cpu ökningar så ska du inte titta på x86. De cpuer som ökar kraftigast i prestanda torde vara SPARC, eftersom ORACLE säger 100% ökning vartannat år. Det är mer än Intels futtiga 10% ökning.

Citat:

Det är en arkitektur för köra stora databaser med och inte för persondatorer. Även om du skulle kompilera om Windows 7 för att kunna köra den på T3 eller T4 så skulle den få stor pisk av en normal s1155/2011 då singeltråd prestandan inte är i närheten av vad en modern Intel processor är kapabel av idag.

Om Windows 7 på en T4 skulle få pisk, det beror på vilka workloads du kör. Kör du server workloads så har inte x86 en chans. Kör du Crysis så vinner x86.

Permalänk
Avstängd
Skrivet av Aleshi:

Antingen ljuger du eller så visar du prov på mycket dålig läsförståelse då du kraftigt vrider på det jag säger. Intel är världsledande på råstark prestanda per tråd. Det är mycket svårt att få upp den prestandan och SPARC och POWER har inte en chans mot intels processorer om du kompilerar om PC-program för att köra på deras processorer. De är bra på nummerskyfflande, men de är inte bra på samma saker som en intel-processor. Därför kan du inte jämföra SPARC/POWER med X86, de suger i jämförelse på de typer av beräkningar som Intel är bra på. Det är lättare att öka prestandan på deras kraftigt parallelliserbara laster. Så det är precis lika orättvist som att jämföra SPARC och POWER med X86 som att jämföra GPU med X86. Det ena är kraftigt parallelliserbart, det andra är det inte.

Du har tokfel. Tror du att SPARC/POWER är mera som GPU än en cpu? Du har ju inte en aning om cpuer eller gpuer. Hur kan du påstå att SPARC/POWER är mer som en cpu, än en gpu? Vad har du för belägg för detta befängda påstående? Hur i hela friden kan man tro att en SPARC/POWER är som en gpu? Jag menar, då har det slagit slint ordentligt i skallen. Vad har du för belägg? Vad har för bevis för detta? Kan du visa länkar, eller är det något du fantiserat ihop? (Hint: det är något du fantiserat ihop)

Sluta snacka, nu är det dags att du levererar. Visa länkar för de saker du påstår.

Citat:

Kul att du också räknar prestanda från extra kärnor/trådar när du räknar på SPARC, men inte när du räknar Intel

Jag fattar inte vad du menar här.

Citat:

Men argumentet att intel kört IPC/Hz och Kärnor tricken redan och att de inte har nya sätt att öka prestandan är idiotiskt! Det gäller ju alla processortillverkare till att börja med, och har dessutom alltid gällt! Det finns inget annat sätt att öka CPU-prestanda på! Eller tänker du försvara argumentet?

Du verkar inte läsa det jag skriver. Det finns andra sätt. T.ex använda många cores. T.ex. maska cachemissar såsom SPARC CMT Niagara gör. T.ex. att använda Transactional Memory. etc. IPC är inte allt.

Om du jämför en single core cpu på 3 GHz med extremt hög IPC, mot en 3GHz 16-core cpu med låg IPC och Transactional Memory och 128 trådar - vilken cpu tror du presterar bäst? Den med högst IPC? Återigen, det finns andra sätt att få höga prestanda än att satsa på hög IPC. IPC är inte allt. Fattar du inte det?

Citat:

Nu ljuger du igen, mina siffror är inte 5-10%. Ivy Bridge gav 10%, och det var bara en Tick. Sandy Bridge gav 20%. Nehalem gav ännu mer. Och detta per kärna. Nehalem över Core 2 är över 200% på flertrådat. Precis som Core 2 var över 200% än P4. Numera ökar man inte kärnor så mycket,

Vad är det för fel på dig? Jag har ju HELA TIDEN SAGT ATT NUMERA ÖKAR INTE INTELS CPUER SÅ MYCKET I PRESTANDA!!! Precis det du skriver här! "Numera ökar man inte kärnorna så mycket". Du säger EXAKT samma sak som jag påstått hela tiden. Det är ju det som vi debatterar, och det är det vi är oense om. Jag påstår att x86 gör inte stora förbättringar idagsläget, du säger nej det stämmer inte - samtidigt som du här påstår att "numera ökar man inte kärnorna så mycket". Så du ger mig rätt. Grattis. Ska vi lägga ned tråden nu?

Citat:

Ja just det, den killens åsikt väger tyngre än presentationen som till 80% handlar om IPC förbättringar? Så länge man inte slappnar av latenser och dylikt så går oftast lägre energiåtgång och IPC hand i hand.

Vad försöker du säga här? Jag citerar en kille som ger mig rätt, som säger att cpu prestandan knappt ökats i Haswell, istället satsas på grafik och strömförbrukning. Och som svar på citatet så svarar du ovanstående? Vad menar du? Att IPC

Citat:

EXAKT MIN POÄNG! Det är milsvidd skillnad på X86 och SPARC. Du kan ju försöka köra ett PC-program på en SPARC lika bra som på en X86. Herregud.

Vad är det för skillnad? Jag har läst kurser om cpuer på KTH. Vi skrev emulatorer för olika cpuer. Vad är det för "milsvid" skillnad som du pratar om? I en av kurserna gick vi igenom bl.a. x86 vs MIPS vs SPARC de var alla ganska lika, och vi tittade på deras olika lösningar för att få prestanda. Alla är general purpose cpuer. En del hade stor cache och hög klockfrekvens, andra var RISC, etc. Men sen att tro att SPARC är en GPU visar ju bara på enorm okunnighet.

Citat:

Spelar du dum eller förstår du på allvar inte vad jag säger? Jag säger inte att man ska kompilera spel för att spela på SPARC, jag säger tydligt att det bara är att visa att SPARC är otroligt dåliga på den typ av prestanda som Intel-processorer har. Och du klagar på Intel över detta? Intel har sinnessjukt starka kärnor när det kommer till enkeltrådad prestanda. Att skyffla 16 FP-instruktioner i parallell är inte lika avancerat.

Intel har "sinnesjukt starka kärnor"? Men jag visade ju precis en SPARC cpu med 256 GFlops, dvs sinnesjukt höga prestanda. Högre än Intel. Så SPARC har ju uppenbart starkare trådar än x86 om vi tittar på specs.

Vad sägs om att du slutar snacka skit och visar benchmarks istället? Leverera!

Citat:

Ja stark som att den klarar jättemånga FP-beräkningar samtidigt. Hur bra skulle den hantera ett PC-program? Den skulle dö då. SPARC är gjorda för servrar, de är gjorda för en värld där allt är mycket mer parallelliserbart, enklare uppbyggda skyfflare är mycket bättre lämpade för det. Du kan inte jämföra hur lätt det är att öka prestandan på en sånt jämfört med hur lätt det är att få upp prestandan på PC-applikationer.

På vad baserar du denna tro? Har du länkar eller är det något du fantiserat ihop?

Citat:

Nej, jag försöker förklara för dig att det är olika saker. Du tycks inte förstå det. Du kan inte jämföra SPARC med X86 rätt av då de är bra på olika saker. En SPARC-kärna är primitiv i jämförelse med en Haswell.

Bevisa detta påstående. Visa länkar. Sluta snacka skit.

SPARC är inte alls primitiv i jämförelse med Haswell. De är sofistikerade och har bl.a. 256GFlops cpuer.

Citat:

Det är som att begära att någon ska visa benchmarks som visar att CPU är snabbare än GPU. De enda tester som går på båda är gjorda för GPU. PC-program är inte ens kompilerade till SPARC av en anledning! SPECint är jättebra på att visa teoretiskt max, men visar inte alls hur en processor hanterar det mycket mer komplexa situationen med PC-program.

Men snälla. En SPARC/POWER är inte som en GPU. De har mycket mer gemensamt med en x86, än en GPU.
SPARC/POWER mot en x86, är typ som en svensk mot en japan - de är båda människor. Lite olika. Men att jfra SPARC/POWER mot en GPU, det är typ som att jämföra en svensk mot en leopard - totalt olika saker.

Om du inte vill visa SPECint 2006 benchmarks (som x86 förlorar stort) så kanske du kan visa Linpack becnhmarks eller nåt annat? Typ, hur många GFlops har en x86. Eller MIPS. Eller va fan som helst. Bara du visar nånting. Och när du börjar googla och jämföra mellan x86 mot POWER och SPARC, och när du ser att x86 förlorar i allting, så kanske du äntligen fattar att x86 inte är så jävla snabba som du tror.

Citat:

Jag pratar inte bara spel. Jag säger att det krävs en helt annan arkitektur för att bara bra på t.ex. spel. DU däremot envisas med att jämföra med dataskyfflare i dataskyfflarbenches.

POWER överträffar x86 i allt, när vi pratar starka trådar. PRatar vi starka trådar så är det POWER som man ska använda. Är det hög genomströmning så är det SPARC man ska välja.

Citat:

Och GPU-er ökar med mer än 100% vartannat år. Orättvis jämförelse? Jajamensan!

Men återigen, en GPU kan inte jämföras mot en cpu! Du har helt käpprakt fel om du tror det. Varför tror du att en GPU kan ersätta en SPARC/POWER? Tror du man kan köra ett OS på en gpu?

Citat:

Och sedan så ljuger du konstant om hur mycket intel ökar, du nedvärderar deras ökningar per tråd och glömmer mängden trådar.

Vad har Intels trådar med saken att göra? Jag skiter i hur många trådar Intel har, eller hur många GHz Intel har. Det viktiga, det som vi diskuterar, är hur mycket ökar Intels cpuer i prestanda varje år! Jag säger 10% eller så. Om nu Intel fördubblar antalet trådar i Haswell - och samtidigt så ökar HW 10% i prestanda - så vad har trådarna med saken att göra? Om HW ökar till 10 GHz, 100 cores och 10000 trådar, men samtidigt så ökar 10% i prestanda - så är prestanda ökningen det enda viktiga. Det är det vi diskuterar. Jag har inte pratat om hur många trådar som SPARC har, eller hur?

Citat:

Jag har läst artikeln. Prestandaökningen på grafiken överstiger den i processorn. Ja, men det är just för att parallelliserbara saker är lätta att biffa upp. IPC-ökningen per kärna kommer fortfarande vara stor. Men så klart kan den inte jämföras med den flertrådade prestandaökningen i % man kan få med nummerskyfflare. Men det är heller ingen konst att öka den i jämförelse.

Men vad spelar det för roll hur mycket IPC ökar, om HW bara ökar 10% i prestanda jämfört med IvyBridge? Vad spelar det för roll hur många trådar HW har? Det vi diskuterar är inte antal trådar. Det är prestandan. Och jag säger att 10% prestanda ökning är inte mycket att ha.

Jag har några frågor till dig
1) Rekommenderar du folk att uppgradera från SandyBridge till IvyBridge? Tycker du att prestandaökningen är så pass stor att det är värt att uppgradera?

2) Var är alla dina benchmarks? Du påstår att Intel har starkast trådar, men då får du bevisa det. Var är dina benchmarks? Det är enda sättet (tror jag) att få dig att inse att x86 förlorar i alla benchmarks. Och då kanske du fattar att x86 inte är snabbast. Det enklaste är att du visar benchmarks, eftersom jag inte lyckas övertyga dig, så kanske benchmarksen övertygar dig.

3) Var har du inhämtat din "kunskap" om cpuer? Går du gymnasiet?

Permalänk
Avstängd
Skrivet av Yoshman:

På desktop är detta helt sant, ytterst få "vanliga" användare har någon större nytta av fler CPU-kärnor. Ytterst få har någon större nytta av högre prestanda per tråd, men det ger i alla fall fördelen att svarstider sjunker och de få applikationer som är CPU-bundna kommer ju gå fortare.

Jag har inga problem med detta. Jag fattar inte riktigt om jag är oklar?
Det jag och Aleshi är oense om, är huruvida Intel ökar prestandan mest i sina cpuer i dagsläget, eller inte. Jag påstår att Haswell ökar inte cpu prestandan vidare mycket, och istället satsar Intel på grafiken och strömförbrukningen. Aleshi håller inte med, han påstår att Intel ökar prestandan mer än t.ex SPARC eller POWER, för varje generation. Som svar på detta vill jag se benchmarks, men Aleshi vägrar visa benchmarks (för då kan alla se att han är slagen). Jag har visat några benchmarks, som Aleshi vägrar godkänna.

Det är detta vi diskuterar. Vad har du för problem med våran diskussion? Vad är det som du inte håller med om, eller håller med om?

Citat:

Som vanligt jämfört du äpplen (desktop CPU) och päron (server CPU) + hittar på "fakta" i tomma intet. Hur vet du att Haswell inte blir snabbare än Ivy Bridge?

Var fick du detta ifrån? Jag påstår inte att Haswell inte är snabbare än Ivy Bridge. Jag påstår inte att Haswell är lika snabb som IvyBridge. Det är väl du som hittar på fakta i tomma intet.

Jag påstår att Haswell inte kommer öka prestandan mycket, kanske 10% eller så. Precis det som artikeln också säger. Jag påstår att de senaste generationerna så har inte Intel ökar prestandan så mycket. Men för längesen ökade Intel prestandan mycket. T.ex när intel gick från single core till quad core, så var det stora prestanda ökningar. Men idagsläget så ökar inte prestandan mycket.

Citat:

Nehalem hade 5 exekveringsportar, Sandy/Ivy Bridge har 6 (vilket definitivt gav en boost i IPC) och Haswell kommer få 8 st exekveringsportar. Bara den förändringen kommer höja IPC åtminstone lika mycket som från Nehalem -> Sandy Bridge. Ovanpå detta har Haswell fått fördubblad bandbredd mot L1 cache, medan bandbredden endast skalats med något ökad klockfrekvense från Core2 -> Ivy Bridge. Den ENDA anledningen till att Ivy Bridge har något högre IPC än Sandy Bridge är att man ökade storleken på out-of-order fönstret något och i Haswell ökas detta ännu mer.

Återigen, IPC är inte det enda sättet att få ut höga prestanda. Vad spelar det för roll hur mycket IPC Haswell kommer få, när prestanda ökningen jämfört med IvyBridge endast är kanske 10% som artikeln skriver? Du får babbla på om IPC hur mycket du vill (och Aleshi får babbla på om hur många trådar han vill), men i slutändan är det real life work loads som räknas. Det är skillnad på teori och praktik.

Citat:

Och sist men inte minst får Haswell TSX, något som kommer öka prestanda på applikationer som faktiskt använder flera CPU-kärnor. Inga benchmarks finns kring detta ännu, men Intel har presentera lite information kring vad vi kan förvänta oss. Detta är den mest revolutionerande finess (främst för servers där man har långt fler CPU-kärnor) någon CPU-tillverkare presenterat de senaste 5 åren i alla fall.

Fel igen. Som jag förklarade högre upp, redan för längesen höll SUN på att forska på Transactional Memory. Här är en artikel från 2008 som säger att SUN snart släpper sin ROCK cpu med TM. SUN lade ned sin ROCK cpu.
http://www.theregister.co.uk/2008/07/28/sun_dziuba_tm/
"It’s very possible that Sun Microsystems has their shit together as they engineer the new Rock processor. Due out in 2009, it will be the first mainstream CPU to support transactional memory."

Så Intel är inte först med TM. Detta år kommer SPARC T5 släppas, som har tagit TM från ROCK cpun. Så Haswell kommer inte att vara först med TM.

Citat:

Kommer Haswell dubbla IPC jämfört med Ivy Bridge? Nej, definitivt inte. Men det kommer vara en klart större förbättring jämfört med Sandy -> Ivy och det är inte alls omöjligt att prestanda / W kommer dubblas (till och med troligt).

Återigen, IPC är inte allt.

Citat:

Att SUN/Oracle kunnat öka prestanda mellan T1->T2->T3->T4 beror ju endast på att man startade men en rent ut sagt bedrövlig IPC.

Återigen, IPC är inte allt. Kanske hade t.ex. T2 bedrövlig IPC, men samtidigt var den 50x snabbare än x86 i vissa workloads i praktiska tester. Hur går det ihop att företag berättar att de fått 50x mer prestanda i "rätt" workloads, om nu x86 har så mycket högre IPC? Slutsatsen kan bara vara att IPC inte är allt.

Citat:

Men även T4:an är egentligen bara en "one trick pony", den är bara konkurrenskraftig i saker som har ett totalt slumpmässigt accessmönster ur ett väldigt stort data-set.

"Den är bara konkurrenskraftig" i såna här scenarion? Du vet väl att ALLA server workloads ser ut på detta sätt? Det är ett väldigt stort dataset och 1000 tals klienter accessar data slumpmässigt ur datasetet. Du har precis sagt att T4 är en överlägsen server cpu. Det är ett erkännande från din sida, att ORACLE lyckats med sin T4.

Det är ungefär som att jag säger "SPARC är bara konkurrenskraftig på allting som har med tunga beräkningar och tunga workloads att göra - vad ska man med sånt till?". Jag menar, det är allt som räknas.

Citat:

Databaser är en av de få saker som passar in på detta, men det är något som Oracle bryr sig ganska mycket om

Ja, det är ORACLEs grej. Hjärtat i ett företag, är databasen. Utan databasen stannar allting. Så det är bra för företag att somliga cpuer är bra på just detta då.

Citat:

I alla andra typer av laster så blir SPARC totalt krossad av både POWER, Xeon och Opteron. Oracle vet om detta vilket är anledningen till att de använder endera Xeon eller Opteron på deras high-end servers i "Exa" serien.

Vad har du för belägg för detta märkliga påstående? Att byta ut hårdvaran i såna stora Exa servrar, görs inte i en handvändning. Och dessutom så sysslar dessa Exa servrar mycket med databaser - och vilken cpu är bäst för databaser? Jo, enligt "Virtual Void" så bör man använda SPARC till såna arbetslaster.

Permalänk
Avstängd
Skrivet av Yoshman:

Då får du förklara hur det kan finnas Xeon-baserade superdatorer med upp till 1024 socklar. De kör inte QPI (Intels inter-sockel bus), men varför skulle det spela någon roll om det är x86 vi pratar om?

Dessa Xeon baserade superdatorer med 1024 socklar är ju ett kluster. Ett gäng PC som sitter på en snabb switch. Typ. Det är inte en SMP server som SPARC/POWER. Utan istället är det HPC servrar, dvs ett kluster.

Detta är skälet att den största x86 servern som finns på marknaden har 8-sockets. Inte större. Den största SMP servern om vi pratar x86, är 8-socket. Det är ju ingenting.

Citat:

POWER7+ är samma grundläggande design som POWER7, lite mer cache och eventuellt lite högre klockfrekvens. Det kommer alltså inte vara några stora skillnader. OM Intel bara tillät sina Xeons ha en TDP 250W så skulle de definitivt spöa POWER7 i prestanda per tråd då det är fullt möjligt att klocka en Sandy Bridge till >4.3GHz vilket är vad som krävs för att plocka in skillnaden i prestanda.

Hmmm... Jag trodde du var insatt i tyngre Unix cpuer, men du kanske inte är det då. Den stora fördelen med POWER7+ är att man kan stoppa in två cpuer i samma socket, dvs få dubbla antalet (16) cores i en socket. Då ökar prestandan ordentligt.

Citat:

Och just på skyffla-data punken är Sandy Bridge i princip dubbelt så snabb som Westmere tack vare DDIO, så x86 tar definitivt in på SPARC här.

Visst är det så att x86 tar in på de tyngre Unix cpuerna, men det går snabbt att öka prestandan fram till en viss punkt. Sen tar det stopp och det går trögt att öka prestandan. Det är inte helt lätt, när man gjort alla tricks i boken: många cores, hög Hz, stor cache. Då måste man börja tänka utanför ramarna: t.ex. Transactional Memory, maska cachemissar med många trådar, etc.

Men den STÖRSTA skillnaden mellan x86 cpuer och SPARC/POWER är ju inte prestandan. Den stora POÄNGEN att köra SPARC/POWER, är ju RAS. Det är pga RAS som företagen väljer SPARC/POWER. T.ex. kan vissa SPARC cpuer backa och spela om transaktioner om något gick fel, det kan även Mainframes göra. En x86 kan inte sånt här.

För Enterprise företagen är det viktigare att ha en pålitlig cpu som är tillräckligt snabb, än en hysteriskt snabb cpu som man inte kan lita på. Vad föredrar du, en jättesnabb cpu som räknar fel 0.001% av alla fall, eller en långsammare cpu, men som räknar rätt? Det vore inte så bra om en bank räknade lite fel då och då, men att det gick snabbare än en annan bank som tar längre tid på sig, men levererar rätt resultat?

Och det som verkligen kostar pengar, och som är svårt, är ju faktiskt RAS. Prestanda är hyfsat enkelt att få, du kan vända dig till nästan vilken cpu som helst. Men fråga efter en server som har tre olika cpuer som jämför alla beräkningar och ifall en cpu räknar fel så kopplas den bort och skickar larm - ja, vad tror du en sån server kostar? Tror du att du kan hitta en sån server i x86 världen? Nej, det är helt kört. x86 är ju buggigt och ett härke, och erbjuder ingen RAS, x86 är notoriskt opålitliga. Det finns många sysadmins som vägrar släppa in x86 i sina serverhallar. De tillåter bara Mainframes, OpenVMS, och RISC cpuer.

Så visst har x86 gjort stora framsteg i prestanda. Fram till en viss punkt. Och sen tar det stopp. Nya x86 cpuer ger inte stora prestanda ökningar, Intel inser det och har istället börjat jobba med helt andra saker, t.ex. grafikprestandan, ström, etc. Och om vi ska prata om seriösa Enterprise servrar, så existerar inte x86 i den världen. De är för opålitliga, och har ingen RAS att prata om. Även om prestandan börjar arta sig. "Snabbt vinglande skadeskjuten fågel" som inte klarar av stora server laster, istället klarar den bara få trådar. Typiskt desktop saker.

Citat:

Totala antalet instruktioner är över 1000st, men de flesta används inte och tar inte upp speciellt många transistorer då de har mikrokod i ROM. Detta gör då även den sista kommentaren helt fel (well, att köra en instruktion som är mikrokodad i ROM är väldigt långsamt, men dessa instruktioner används som sagt inte av moderna kompilatorer).
.,....
Ovanpå detta så har multicore gjort sitt inträde och RISC har, per definition, inte stöd för load-op-store instruktioner men det har x86 vilket har lett till att implementation av atomära operationer som är ett krav för semaforer och mutex:ar blir mer effektiv på x86 än på RISC.

Så vad försöker du säga? Att x86 inte alls är buggigt och härstammar inte alls från 8-bit cpuer från 1970 talet?

Det var nån som sade nåt i stil med: det tar 20 miljoner transistorer att lista ut var en x86 instruktion tog slut och nästa börjar, 10 miljoner transistorer för att dekoda instruktionen, 20 miljoner transistorer för att supporta gamla instruktioner som ingen använder längre, etc - medan du kan bygga en hel SPARC cpu på totalt 20 miljoner transistorer.

Det säger sig själv att ju flera transistorer desto mer bloat. Så nej, SPARC är inte perfekt. Men x86 är ju värst.

Citat:

Vem säger att jag sysslar med desktop? Ja, på fritiden gör jag det, på jobbet sitter jag med PowerPC, MIPS och x86 system med allt från några enstaka CPU-kärnor upp till (just nu) 32 CPU-kärnor, finns tillgång till 80-kärnors x86 system inom företaget men de används till andra saker än vad jag jobbar med. Jag har bl.a. tillgång till ett par system som kör samma CPU-setup som de AnandTech testade (dubbla 8-kärnors Xeon E5or, Sandy Bridge).

E5orna har 2x20MB L3 cache, det räcker inte för databaser, men det räcker definitivt till väldigt många saker som man vill göra på en server och på alla dessa arbetslaster så krossar Xeon E5:an en T4.

Det finns Unix sysadmins som räknar den hårdvara du räknar upp, till desktop arbetsgöra. De räknar om 32 socket eller 64 socket med flera TB RAM till riktiga servrar. Allt med 2 sockets, som du pratar om, är ju något man använder till desktops. Så somliga skulle säga att du sysslar med desktops. Det var precis det jag menade.

Så undrar hur bra en Xeon E5 krossar på seriösa server workloads jämfört med flera TB RAM och 10.000 tals klienter och 64 socket servrar.

Permalänk
Medlem

Jag är ganska säker på att Intel Xeon E7xxx serien har RAS sedan 2-3 år tillbaka (Nehalem-EX.. även äldre cpu:er har haft visst antal begränsade funktioner).

En lite rolig notis från IDC btw...

Citat:

The market for non-x86 servers, including servers based on RISC, EPIC (Itanium-based), and CISC processors, declined 16.1% year over year to $3.4 billion in 1Q12. This is the third consecutive quarter in which non-x86 servers have exhibited a revenue decline. Non-x86 based systems now comprise 28.5% of the server market, the lowest level ever reported in IDC's quarterly server tracker.
"The Unix server refresh has largely ended as the Unix server market is in decline again, driven by workload consolidation and migration to competing platforms," said Kuba Stolarski, research manager, Enterprise Servers at IDC. "Recent heightened awareness of the future of Itanium is also pressing down on customer demand for non-x86 servers and price competition is helping to drive down revenues in this segment. IDC expects the Unix server market to stabilize over the next few years and remain a smaller, specialized segment of the overall server market."

Källa_ http://www.idc.com/getdoc.jsp?containerId=prUS23513412

Måste förresten passa på att fråga va det är för människor du jobbar med. Den absolut vanligaste förekommande mängden socklar på servrar idag (och sedan typ 6-10 år) är dual socket enligt både IBM, HP, Fujistsu och Dell.

Permalänk
Medlem
Skrivet av zhrooms:

Deprimerande, jag rör inte en Haswell förens den har 6 kärnor. Antar att det kommer hösten 2013 isåfall, Haswell-E.

1 år till med Core i7 920, då har jag haft den i 5 år, bokstavligen. Kört den i 50% OC på 1.4v i ~1400 dagar nu. Går som en klocka, enda anledningen till att jag vill byta är pga 6 kärnor + HT = 12 Threads för rendering. Annars finns det absolut ingen anledning att byta CPU.

Håller med, har aldrig varit med om att jag inte vill ha en snabbare CPU efter 4+ år!
Före 2008 så bytte jag nog närmare vartannat år.

Visa signatur

i7 920@4.4 HT On, 12GB RAM, DCII GTX 680@1220core,3575mem.