IBM avslöjar rekordsnabb processor

Permalänk
Kontot avslutas

Saddam, ge upp nu va.

Det spelar ingen roll hur mycket du tjôtar om att mainframes är långsamma jämfört med x86-burkar, det stämmer inte.

Du kan ju testa att koppla en Bugatti Veyron till ett 60-tons långtradarsläp med timmer och sedan se hur långt du kommer, eller hur fort det går. Varför kör inte fraktföretagen med 1000-hästars sportbilar som dragbil? Svar, de pallar inte trycket.

Samma sak med en PC. Att den har högre beräkningsprestanda spelar i sammanhanget ingen roll, den pallar ändå inte att utföra de arbetsuppgifter en mainframe gör. Och om den skulle göra det så har den inte tillförlitligheten som krävs. Anta att du sular plattan i botten på din Veyron och tuffar i 60-70 knyck med ditt timmer uppför Hallandsåsen - som genom ett mirakel. Problemet är bara att du kommer att ha kört slut på hela drivlinan innan du når toppen av åsen...för att inte tala om tömt hela bränsletanken också. Det blir till att helrenovera allting innan du kan fortsätta.

En PC-processor har inte den feltolerans som krävs. Nehalem-EX är ett steg på vägen, men den är inte där än. x86 har inte den säkerhet och råkraft som krävs för att hantera tiotusentals databasåtkomster per sekund från bankvärlden, aktsiemarknader och övriga finansiella institiutioner. Varför annars skulle dessa använda superdyra mainframes och inte vilka billiga PC-burkar som helst från HP eller Dell, typ. Tror du deras sysadmins helt enkelt är dumma i huvet och att du är så mycket smartare än dem eller?

Visa signatur

Es ist verboten Pajas zu spielen!
Min dator Uggla

Permalänk
Medlem

Synd att en tråd som kunde varit intressant har pissats sönder av någon som inte inser att "rekordsnabb" är en hänvisning en sensationshungrig skribent valt istället för att skriva "den officiellt högsta klockfrekvensen för en massproducerad CPU"

B!

Visa signatur

Allting jag skriver är om inget annat uttrycks, min åsikt! Ingenting måste vara dagens sanning enligt din åsikt, och gör du antaganden baserade på mina åsikter hoppas jag att du övervägt mer än bara just min åsikt.

Permalänk
Avstängd
Skrivet av -=Mr_B=-:

Synd att en tråd som kunde varit intressant har pissats sönder av någon som inte inser att "rekordsnabb" är en hänvisning en sensationshungrig skribent valt istället för att skriva "den officiellt högsta klockfrekvensen för en massproducerad CPU"

Om artikeln och tråden handlar om hur snabb denna CPU är, så är det självklart att man anmärker på det eftersom det inte stämmer, eller hur? Om det finns en artikel om hur PS3 har en x86 cpu, och alla instämmer, så är det självklart att man säger att det är fel, eller hur? PS3 har en CELL cpu, inte x86. Ska man hålla tyst om alla tror att det är fel, eller? Ska man låta alla tro att PS3 har en x86 cpu?

POWER6 får dåligt på benchmarks, det är bara att kolla själv. Denna cpu bygger vidare på POWER6. Tror du att denna CPU är supersnabb, samtidigt som POWER6 är bevisat långsam? Vad tänker du med? Vill du att alla ska tro att PS3 har en x86 CPU, och att denna CPU får skithögt på SPECint_2006? Att alla ska tro denna cpu är bra för vetenskapliga beräkningar? Nej, det stämmer inte alls. Jag tror att artikelförfattaren seriöst tror att denna CPU är en av de snabbaste i världen. Inte att han formulerat sig dåligt. Han har blivit lurad av IBM, helt enkelt.

Skrivet av LennyV:

Saddam, ge upp nu va.

Det spelar ingen roll hur mycket du tjôtar om att mainframes är långsamma jämfört med x86-burkar, det stämmer inte.

Du kan ju testa att koppla en Bugatti Veyron till ett 60-tons långtradarsläp med timmer och sedan se hur långt du kommer, eller hur fort det går. Varför kör inte fraktföretagen med 1000-hästars sportbilar som dragbil? Svar, de pallar inte trycket.

En CPU har inte vridmoment eller något som liknar "tryck". Din liknelse stämmer inte.

Citat:

Samma sak med en PC. Att den har högre beräkningsprestanda spelar i sammanhanget ingen roll,

En modern x86 cpu har mycket högre råprestanda än en z196 cpu. Det är bara att kolla benchmarks, jag tror dock det inte släppts några SPECint_2006 benchmarks eller om det någonsin kommer att släppas jämförande benchmarks. IBM vägrar släppa såna benchmarks för sina Mainframes. Varför vägrar IBM släppa jämförande benchmarks om nu Mainframe cpuer är så himla snabba? Är det inte något lurt med det?

Citat:

den pallar ändå inte att utföra de arbetsuppgifter en mainframe gör.

Jag har sagt det flera ggr, att en PC har inte den I/O som en Mainframe har. En PC kan inte ersätta en Mainframe, den har för klen I/O. Men, om vi pratar ren cpu-prestanda, så är en PC mycket snabbare än en Mainframe. Skulle vi sätta en Mainframe och en Nehalem-EX server på att göra galaxsimuleringar, eller protein folding, eller SETI, eller SPECint_2006, så skulle Nehalem burken fullständigt krossa varje IBM Mainframe. Det skulle bli pinsamt att se.

En PC kan inte ersätta en Mainframe, det är inte det jag säger. Jag säger att en x86 cpu krossar Mainframe cpuer om det gäller, typ specint_2006 eller Folding eller nåt sånt.

Citat:

En PC-processor har inte den feltolerans som krävs. Nehalem-EX är ett steg på vägen, men den är inte där än. x86 har inte den säkerhet och råkraft som krävs för att hantera tiotusentals databasåtkomster per sekund från bankvärlden, aktsiemarknader och övriga finansiella institiutioner.

Har du hört talas om NASDAQ? Deras aktiesystem är utvecklat i Java, och körs på Linux på... x86. Och New Yorks aktiebörs (typ världens största) kör också på x86. Så, nej, det du tror stämmer inte.

Citat:

Varför annars skulle dessa använda superdyra mainframes och inte vilka billiga PC-burkar som helst från HP eller Dell, typ. Tror du deras sysadmins helt enkelt är dumma i huvet och att du är så mycket smartare än dem eller?

Men det är precis vad NASDAQ och andra aktiebörserna använder: vanliga x86 servrar från typ Dell och liknande märken! Om du jobbade i finansbranschen så skulle du förstå att jag har rätt.

Mainframes används i bankvärlden, inte i finansbranschen. I bankvärlden skickar man pengar fram och tillbaka och uppdaterar konton med några procent, sätter in lönen och tar ut pengar etc. Man gör mycket batch grejer över natten, samlar ihop massa jobb som körs på hög under natten, sätter in lönen under natten, etc. Det är inte så viktigt att det sker omedelbart, dvs nu nu nu. Det kan ofta vänta lite.

I finansbranschen så gör man aktieaffärer på bråkdelar av en millisekund och trycker igenom ordrar i fruktansvärt tempo och snabbt ska det gå! Är man först, så kniper man aktierna som är till försäljning till det bästa priset och de andra som kommer efter, missar köpet och tjänar inget. Snabbt ska det gå.

Mainframes används i bankvärlden. I finansbranschen används Unix/Linux. Ofta på x86. Där behövs högt tempo och höga prestanda. Mainframes har fruktansvärt klena cpuer. Kolla upp länkarna jag bifogat och tänk efter själv lite? Gå inte på IBMs lögner. Använd hjärnan själv. "Kan detta stämma? Är det rimligt?".

Permalänk
Relik 📜
Skrivet av -=Mr_B=-:

Synd att en tråd som kunde varit intressant har pissats sönder av någon som inte inser att "rekordsnabb" är en hänvisning en sensationshungrig skribent valt istället för att skriva "den officiellt högsta klockfrekvensen för en massproducerad CPU"

B!

"Sensationshungrig" är väl att ta i, att få till en rubrik som inte är fyra kilometer lång är inte alltid helt lätt. Ibland blir de mindre bra, något som tydligen gäller i detta fallet enligt vissa.

Skrivet av saddam:

Jag tror att artikelförfattaren seriöst tror att denna CPU är en av de snabbaste i världen. Inte att han formulerat sig dåligt. Han har blivit lurad av IBM, helt enkelt.

Då tror du fel.

Visa signatur

För övrigt anser jag att Karthago bör förstöras.
▪ Nöje #1 -> i5-11400F - B560M-ITX/ac - RTX 3070 - 16 GB DDR4
▪ Nöje #2 -> R5 5600 - Prime B450-Plus - RX 6750 XT - 16 GB DDR4
▪ Mobilt -> HP Pavilion Aero - R5 5625U - 16 GB DDR4
▪ Konsol -> Steam Deck, Xbox Series S

Permalänk
Medlem
Skrivet av saddam:

Om artikeln och tråden handlar om hur snabb denna CPU är, så är det självklart att man anmärker på det eftersom det inte stämmer, eller hur? Om det finns en artikel om hur PS3 har en x86 cpu, och alla instämmer, så är det självklart att man säger att det är fel, eller hur? PS3 har en CELL cpu, inte x86. Ska man hålla tyst om alla tror att det är fel, eller? Ska man låta alla tro att PS3 har en x86 cpu?

Och du baserar hela din argumentation på prestanda, medan faktum är att för alla som använder huvudet är det fullständigt uppenbart att referensen "snabbast" är till högsta massproducerade klockfrekvensen. Du har läst något, ett påstående, konstaterat att det går att tolka på flera sätt, och valt ett som är felaktigt, för att sen argumentera att hela artikeln är felaktig. Ta din käpphäst, och rid hem.

Skrivet av saddam:

En CPU har inte vridmoment eller något som liknar "tryck". Din liknelse stämmer inte.

Nu får du väll i alla fall erkänna en brist i ditt resonemang. En CPU har definitivt en motsvarighet till vridmoment. Det är precis därför du får olika prestanda på olika arkitekturer, vid en given klockfrekvens. Hade inte CPU'erna levererat olika prestanda vid samma frekvens hade resten av ditt resonemang varit helt värdelöst, eftersom den CPU det talas om är den högst klockade serieproducerade CPU'n.

Dina inpass i den här tråden är präglade av en vilja att försöka lyfta fram dig som en auktoritet på området, och sen slänger du fram fullständigt vansinniga påståenden. Grattis.

Skrivet av Lezziter:

"Sensationshungrig" är väl att ta i, att få till en rubrik som inte är fyra kilometer lång är inte alltid helt lätt. Ibland blir de mindre bra, något som tydligen gäller i detta fallet enligt vissa.

Jag måste säga att jag tyckte rubriken var rätt bra. Mitt mångordiga exempel var valt just för att visa att det krävdes en löjlig massa text för att på ett annat sätt säga samma sak. Jag skulle rent av vilja gå så långt att jag säger att efter att ha läst artikeln måste man avsiktligt missförstå, för att inte fatta referensen. Alltså, man har avsiktligt pissat revir i den här tråden, och förstört den för de som eventuellt velat föra en vettig diskussion runt CPU'n. Kul. Tack Saddam.
B!

Visa signatur

Allting jag skriver är om inget annat uttrycks, min åsikt! Ingenting måste vara dagens sanning enligt din åsikt, och gör du antaganden baserade på mina åsikter hoppas jag att du övervägt mer än bara just min åsikt.

Permalänk
Medlem

IBM Power

Det är svårt att jämföra processorer över olika arkitekturer och prestanda handlar mycket om implementering och ändamål.

Teoretiskt max i beräkningskraft.

Nehalem på 3.33Ghz har 12-14 Gflops per core

Power6 från 2008 har på 18-19 Gflops per core

Power7 från 2010 har 33 Gflops per core

Real-world prestanda går att läsa ut i Linpack, där resultaten är likvärdiga.

Visa signatur

Mobile Work - MacBook Pro 16 M1 Max 64GB

Permalänk
Avstängd
Skrivet av Lezziter:

"Sensationshungrig" är väl att ta i, att få till en rubrik som inte är fyra kilometer lång är inte alltid helt lätt. Ibland blir de mindre bra, något som tydligen gäller i detta fallet enligt vissa.

Då tror du fel.

Jag håller med om att det är svårt att få till en passande rubrik, och jag har full förståelse att det inte alltid blir rätt. Men jag syftar t.ex. på denna textrad, inte på rubriken:
"Vad system med IBM:s värstingprocessor kommer att kosta och när de finns tillgängliga för slutkunder är ännu okänt"

Artikeln pratar om att IBM bara sysslar med serversystem. Om man pratar om VÄRSTINGPROCESSOR bland high end serversystem, så låter det som att det är en av de snabbaste processorerna. Visst kan man tolka det på olika sätt, men det är en rimlig tolkning tycker jag. Det är en annan sak om man pratar om värstingcpuer i Mobiltelefon sammanhang. Då skulle ingen tro att det är en av de snabbaste cpuerna som existerar, möjligen en av de snabbaste cpuerna som används bland mobiler. Men pratar man om värstingcpuer bland highend servrar, så är förleds man ju tro att det är en av de snabbaste i världen. Vilket inte alls stämmer. Text som denna, i kombination med rubriken blir ju lite tvetydig att tolka då?

Skrivet av deadleus:

Det är svårt att jämföra processorer över olika arkitekturer och prestanda handlar mycket om implementering och ändamål.

Teoretiskt max i beräkningskraft.

Nehalem på 3.33Ghz har 12-14 Gflops per core

Power6 från 2008 har på 18-19 Gflops per core

Power7 från 2010 har 33 Gflops per core

Real-world prestanda går att läsa ut i Linpack, där resultaten är likvärdiga.

Ja, IBM har släppt benchmarks för sina POWER cpuer. Det är absolut inga som helst problem att släppa såna benches. Men IBM vägrar släppa benchmarks för sina Mainframe cpuer. IBM använder annorlunda prestandamått för sina Mainframes som ingen annan använder. Allt i syfte att man inte ska förstå hur kassa CPUerna är. Varför kan inte IBM bara kompilera om SPECint_2006 eller FOLDING etc för Mainframes och publicera resultaten? Nej, "det är för svårt att jämföra mellan olika arkitekturer, etc" - skitsnack. Hur svårt är det att bara att kompilera om benchmarks på en Mainframe??? Mainframes har COBOL, Java, och C kompilatorer, C++ etc. Det är inte för svårt att kompilera om benchmarks som är plattformsoberoende. Men IBM vägrar. Och ingen funderar på varför det är så?

När det gäller siffrorna på POWER6 core och 18-19 Gflops, så tror jag nog säkert det stämmer. Men det är känt att POWER6 fick långt ifrån sina teoretiska resultat. I praktiken uppnåddes typ hälften av POWER6 teoretiska resultat. Det kan man se på t.ex. Linpack, som du nämner.

Ibm power7 details emerge - The Inquirer
"Yes, POWER6 was inefficient in Linpack and similar benchmarks for HPC - roughly 60 per cent achievable out of theoretical peak is really bad for a modern CPU"

IBM Power 7 @ HotChips - Beyond3D Forum
"Also IBM really needs POWER7 to be very good. POWER6 is not very impressive despite its crazy specifications. For example, a 4 CPU POWER6 4.2GHz machine... performs similar to a 2 CPU Nehalem 2.93GHz machine ... in TPC-C. Although POWER6 is older but Intel is closing very fast and that really worries IBM."

På SAP benchmarks ser vi att AMD Opterons är snabbare än 5GHz POWER6
http://www.hpcwire.com/offthewire/Sun-Microsystems-Sets-Recor... ew-x64-Server-78779357.html
Åtta st AMD Opterons borde vara 2x snabbare än fyra POWER6 om båda cpuerna är lika snabba. Men nej, Opterons är nästan 3x snabbare än fyra POWER6, mao Opterons är snabbare än POWER6.

Som jag sagt tidigare i tråden: visst har POWER6 fina siffror i teorin, men i praktiken så blir det pannkaka. Det beror på bl.a. dess djupa pipeline. Alla högt klockade cpuer har djup pipeline, som t.ex. Pentium 4.

En serverCPU kör massa olika program, och alla dessa program kan inte få plats i cachen. Inte heller kan man cacha alla hundratals klienters data och trådar. Så cachen kommer att swappa ut och in massa data hela tiden. Om du gör det, på en djup pipeline så blir cpun straffad extra hårt. Den får vänta på data hela tiden från RAM. "Cachen thrashar". Och eftersom pipen är djup så tar det extra lång tid innan cpun kan börja jobba med datat från RAM.

Det visar sig i studier från Intel, att en x86 server väntar ca 50-60% av tiden på data från RAM - under full load. Under max load, så väntar en typisk x86 server på data ca 50-60% av tiden. En x86 server idlar 50-60% av tiden, när man belastar den till 100%.

Varför händer detta? Jo, cpuerna är skitsnabba medan RAM inte är lika snabbt. Skillnaden mellan RAM och CPU är skitstor. RAM hinner inte med CPUn, så CPUn får vänta på data väldigt mycket. En 2-3GHz CPU som paras ihop med 1 GHz RAM är ingen bra kombination. CPUn väntar hela tiden, ca 50% av tiden under full load - säger Intel. Vad tror du händer om man är så dum att man parar ihop 5GHz CPU med 1GHz RAM? Jo, då väntar CPUn kanske 70-80% av tiden!

Ju högre klockad CPU, desto mer får den vänta på RAM vid cachemiss. En POWER6 som ligger på kring 5GHz idlar antagligen 75% av tiden - under max load. En x86 på 2GHz idlar 50%, så det är rimligt att en 5GHz cpu idlar 75%. Visst får du jättebra prestanda om all data ligger i cache så man slipper vänta på långsamt RAM, men det händer aldrig i praktiken. Det händer bara i teorin.

Sen får vi inte glömma att Nehalem har upp till 8 cores. POWER6 har 2 cores - som aldrig ligger nära teoretisk max pga POWER6 är för högt klockad. Skillnaden mellan RAM och CPU är för stor. En 2GHz x86 har inte så stor skillnad mellan RAM och CPU, så det är en bättre kombo - den idlar mindre.

En 2GHz x86 som idlar 50% gör bara arbete under 1GHz av tiden. Så en x86 på 2GHz motsvarar egentligen en 1GHz cpu som aldrig idlar. En POWER6 på 5GHz som idlar 75% av tiden motsvarar egentligen en 1.25GHz cpu som aldrig idlar.

Det säger sig självt att det är korkat att para ihop en extremt klockad cpu med långsamt minne. Det är bara att tänka efter lite.

Detta är skälet till att en POWER6 aldrig kommer nära dess teoretiska prestanda i praktiken. Det är för stor skillnad mellan RAM och CPU, vilket syns i t.ex. Linpack.

Att cpuer idlar 50% eller mer under full load, är ett känt problem som det talas tyst om bland cpu tillverkare. Därför har man stora cache minnen, och komplex prefetch logik för att all data ska ligga i cachen och man ska slippa gå ut i RAM. Enda sättet att slippa cachemissar helt, är om processorn är synsk. Det GÅR inte att undvika cachemissar. Det kommer alltid att hända. Ingen cpu tillverkare har lyckats lösa detta gamla problem. Förutom SUN.

SUNs nya revolutionerande Niagara cpu idlar kanske 5-10% under full load. Detta är otroligt bra och ingen har kommit nära detta resultat tidigare. Knepet SUN använder är följande: SUN försöker inte undvika cachemissar. De kommer alltid att inträffa. Så varför ens försöka undvika dem? Istället har Niagara massa kärnor, just nu har den 8 kärnor (vilket var helt galet många förr i tiden, då hade alla max dual cores och ingen körde med så många som 8 kärnor). Och varje kärna har 8 trådar. Så fort det blir en cachemiss på en tråd, så switchar Niagara tråd och jobbar vidare med annan tråd. Att switcha tråd tar en klockcykel. Detta är unikt. När andra cpuer ska switcha tråd så tar det grymt lång tid. Så Niagara väntar aldrig på data, den jobbar alltid för fullt.

Därför kan en 1.4GHz Niagara enkelt knäcka Nehalem-EX eller POWER6 eller whatever, på just sin nisch: köra många lätta trådar. Niagara suger på enkeltrådade saker. Varje tråd är klen. Niagara har inte heller stor cache eller komplex prefetch logik, den skiter i att försöka undvika cachemissar. Därför är Niagara liten strömsnål cpu. SUN försökte för längesen designa en sval strömsnål cpu med grymma prestanda. De lyckades: Niagara.

Niagara är som en långsam buss som tar 100 passagerare. En IBM POWER6 eller Nehalem är som en snabb porsche som tar 2 passagerare. Om du ska transportera 10000 passagerare, vem blir klar först? Niagara knäcker på stora workloads.

Nu har alla börjat ta efter Niagara, 8 kärnor och t.om. flera. Förr i tiden var det ingen som gjorde så. Det var helt galet av SUN. T.ex. IBM bashade SUNs Niagara och hånade den "Niagara har för liten cache, den har för långsamma cores, framtiden är att köra få snabba cores som POWER6 dual core på 5GHz därför att om du kör tung last så behöver du snabba cores. Muahahahaha". Och nu kommer IBM med sina nya cpuer, med många kärnor och många trådar. Fast nu är det förstås det bästa som finns i världen och IBM har kommit på något revolutionerande: använd många kärnor som är lite lägre klockade för att få ned strömförbrukningen. Oj! Stoppa pressarna. IBM har kommit på något nytt och unikt!

För några år sen släppte SUN en produkt: en container full med datorer. De tänkte: alla gör så små datorer som möjligt. Vi tänker tvärtom. Vilken är den största dator man kan göra? Jo, Black Box. Nu har IBM släppt något nytt och revolutionerande: en container full med datorer! Tadaa!

För några år sen släppte SUN en produkt där man kan köra massa olika x86, Niagara, SPARC racks och köra Solaris för att styra alla. Nyligen har IBM släppt något liknande för sin Mainframe: den kontrollerar racks med POWER AIX, Linux, etc - detta är helt revolutionerande säger IBM. SUN har gjort det många år. Skillnaden är att SUN använder Solaris för att styra alla, och IBM använder massa olika OS.

Nu kommer Niagara T3 snart. Den kommer ha 16 kärnor och 8 trådar, dvs 128 trådar. Senare kommer en Niagara med 256 trådar. Oracle som köpt SUN, kommer släppa en Solaris maskin med 16.384 trådar och 64TB RAM. Detta låter som sjukt många trådar, men alla kommer snart ha lika många trådar. Det lät sjukt när Niagara kom, med 8 kärnor och 8 trådar = 64 trådar. Men snart har alla det. Oracle har länge haft sin SunT5440 med 256 trådar. Nu släpper snart IBM sina nya unix servrar med upp... till 256 eller är det 512 trådar. Lite löjligt hur IBM kopierar SUN. Precis som Apple kopierar MS.

Skrivet av -=Mr_B=-:

Och du baserar hela din argumentation på prestanda, medan faktum är att för alla som använder huvudet är det fullständigt uppenbart att referensen "snabbast" är till högsta massproducerade klockfrekvensen.

Se ovan. Vi har olika tolkningar. Jag anser min tolkning vara lika relevant som din tolkning. Eller är det bara din tolkning som räknas?

Citat:

Nu får du väll i alla fall erkänna en brist i ditt resonemang. En CPU har definitivt en motsvarighet till vridmoment. Det är precis därför du får olika prestanda på olika arkitekturer, vid en given klockfrekvens. Hade inte CPU'erna levererat olika prestanda vid samma frekvens hade resten av ditt resonemang varit helt värdelöst, eftersom den CPU det talas om är den högst klockade serieproducerade CPU'n.

Kan du utveckla? Hur menar du? Jag har läst kurser i sånt här på KTH. Jag har skrivit emulatorer för olika cpuer. Ge mig detaljer, du behöver inte vara rädd för att bli för teknisk. Exakt vad är det som motsvarar "vridmoment" och på vilket sätt?

Citat:

Dina inpass i den här tråden är präglade av en vilja att försöka lyfta fram dig som en auktoritet på området, och sen slänger du fram fullständigt vansinniga påståenden. Grattis.

Tackar. Men som sagt, jag är hyfsat påläst när det gäller CPUer. Jag säger inte att jag är en auktoritet, men jag tror jag har djupare kunskaper i cpuer än flera personer här. Det är ju bara att tänka efter själv?

Denna Z196 cpu ger 650 MIPS. En Nehalem-EX ger 400 MIPS när du kör mjukvaruemulering. Emulering är ju 5-10ggr långsammare. Vilken CPU är snabbast? Är jag helt ute och cyklar, menar du? "vansinniga påståenden"?

Citat:

Jag måste säga att jag tyckte rubriken var rätt bra. Mitt mångordiga exempel var valt just för att visa att det krävdes en löjlig massa text för att på ett annat sätt säga samma sak. Jag skulle rent av vilja gå så långt att jag säger att efter att ha läst artikeln måste man avsiktligt missförstå, för att inte fatta referensen.

Återigen, jag anser inte att du har tolkningsföreträde. Min tolkning är inte helt fel, tycker jag.

Citat:

Alltså, man har avsiktligt pissat revir i den här tråden, och förstört den för de som eventuellt velat föra en vettig diskussion runt CPU'n. Kul. Tack Saddam.
B!

Varsågod.

Om du har några TEKNISKA invändningar mot det jag säger, så får du gärna komma med dem. Visst får du tycka att jag är tråkig som drar massa beräkningar som visar att detta strömslukande härke är långsamt, men om du har några sakliga eller tekniska invändningar så är du välkommen att presentera dem. Du får tycka vad du vill om min tekniska sakframställan "tråkig", "vansinniga påståenden", whatever. Men om du inte har något tekniskt att tillföra så är det mest bara åsikter om min framställan, som du luftar?

Permalänk
Medlem
Skrivet av saddam:

Tänkte bara flika in lite om vad som till exempel kan göra att denna cpu är klart bättre än vissa andra maskiner för just cache-missar och latancy mot ram. Som du tagit upp tidigare är maskinen baserad på en cpu som hade vissa problem med cache, och detta är säkerligen något IBM vet om.

"A 4-node system is equipped with 19.5MB of SRAM for L1 private cache, 144 MB for L2 private cache, 576MB of eDRAM for L3 cache, and massive 768MB of eDRAM for a level-4 cache."
IBM Describes Fastest Microprocessor Ever - Yahoo! News

Permalänk
Medlem

Från top500.org

linpack infiniband Nehalem-EP X5560 2,93Ghz 11,2 Gflops Rmax 11,7 Gflops Rpeak per core

linpack infiniband Power6 4.7Ghz 13,9 Gflops Rmax 18.8 Gflops Rpeak per core

Linpack är en måttstock för datorer/kluster, men en tillämpning är mycket mer än enbart rå beräkningsprestanda, linpack pressar inte systemet i övrigt. Idag går det lika bra och bättre att använda ett grafikkort för extrema beräkningar. Köra heltal klarar i princip alla processorer rätt bra och det är svårt och nästintill meningslöst att jämföra MIPS över olika arkitekturer.

Visa signatur

Mobile Work - MacBook Pro 16 M1 Max 64GB

Permalänk
Medlem
Skrivet av saddam:

Se ovan. Vi har olika tolkningar. Jag anser min tolkning vara lika relevant som din tolkning. Eller är det bara din tolkning som räknas?

Din tolkning, min tolkning. Ointressant. Hela din argumentation bygger på att du inte är överens med rubriken om vad snabbast egentligen innebär. Du drar fram en massa skåpmat avsedd att imponera på övriga läsare som bara konstaterar att du är tröttsam, och skräpar ned i tråden. Du vägrar erkänna att i den kontext författaren avsåg är uttalandet högst korrekt.

Skrivet av saddam:

Kan du utveckla? Hur menar du? Jag har läst kurser i sånt här på KTH. Jag har skrivit emulatorer för olika cpuer. Ge mig detaljer, du behöver inte vara rädd för att bli för teknisk. Exakt vad är det som motsvarar "vridmoment" och på vilket sätt?

Hade du varit det minsta ärlig hade du konstaterat att ja, CPU'er har en förmåga att utföra olika mängd arbete vid given arbetsfrekvens. Frekvensen motsvarar varvtal, och arbetskapaciteten är vridmoment. Det är en spikrak överföring till en motor, och i den mån en bil analogi någonsin kan kallas korrekt, är den här det. Att tramsa runt med att den ska motiveras med tekniskt skitsnack, och försöka skrämma bort folk med att du minsann är KTH utbildad emulator-programmerare låter snarare påskina att du vet att du har fel, och att du vill försöka dribbla bort bollen snarare än att ta det som en man.

Jag tänker se dig som ett troll, och lägga ner diskussionen, eftersom det bör stå rimligt klart för alla som läser tråden att du är anal av egna anledningar snarare än att artikeln är felaktig.
B!

Visa signatur

Allting jag skriver är om inget annat uttrycks, min åsikt! Ingenting måste vara dagens sanning enligt din åsikt, och gör du antaganden baserade på mina åsikter hoppas jag att du övervägt mer än bara just min åsikt.

Permalänk
Avstängd
Skrivet av Sidde:

Tänkte bara flika in lite om vad som till exempel kan göra att denna cpu är klart bättre än vissa andra maskiner för just cache-missar och latancy mot ram. Som du tagit upp tidigare är maskinen baserad på en cpu som hade vissa problem med cache, och detta är säkerligen något IBM vet om.

"A 4-node system is equipped with 19.5MB of SRAM for L1 private cache, 144 MB for L2 private cache, 576MB of eDRAM for L3 cache, and massive 768MB of eDRAM for a level-4 cache."
IBM Describes Fastest Microprocessor Ever - Yahoo! News

Om du har en tung Unix server som servar flera hundra klienter och du kör flera olika program samtidigt, så försöker CPU få in i sin cache: flera hundra klienters arbetsdata, alla olika program, kernelgrejer - drivrutiner skrivare, etc etc etc. Det säger sig själv att det blir tight att få in allting i cachen. Detta är skälet till att man har stor cache.

Men det är faktiskt löjligt att ha 376 MB RAM som cache till en enda CPU. Det tyder ju på TOK FAIL i designen. Det är faktiskt riktigt riktigt riktigt riktigt illa ur ingenjörsmässig synpunkt och tokslöseri på resurser och transistorer. Jag menar, när har man sett en cpu som har nästan en halv GB som cache? Jag trodde inte ens det fanns såna missfoster. Jag blev lite chockad faktiskt när jag läste ditt inlägg.

SUNs Niagara har 192KB L1 cache och 4MB L2 cache och inget L3 cache alls. Dessa totalt 4,2MB cache är mycket mindre cache än de flesta (alla?) servercpuer har. Det går åt få transistorer för detta. Man håller cpun strömsnål och sval. Det är en sund och snygg design. Man måste tänka till ordentligt för att få ut grymma prestanda om du måste göra en strömsnål och snabb cpu.

Min lektor på KTH sade för längesen om IBM (jag förstod inte då varför han sade så, men nu förstår jag): "Om IBM inte får ut tillräckligt med prestanda, så hänger de på ytterligare en ångmaskin". De tänker inte efter för fem öre. Skruvar upp klockfrekvensen till löjliga nivåer (vilket är korkat för RAM hinner inte med) och hänger på nästan en HALV GB CACHE på varje CPU, drar hysteriskt mycket ström plus säkert massa andra korkade saker. Kanske är CPUerna vattenkylda? 7000 Watt kräver sin kylning, eller vad säger ni som överklockar mycket? Krävs det helium? Och en del säger att Windows är bloatat och har dålig design? Se på IBMs produkter säger jag bara. Det kryper i min ingenjörssjäl när jag tänker på detta missfoster. Typ, som en kalkon, den flaxar och flaxar men lyfter aldrig från marken.

Men visst, med nästan en halv GB cache så kanske den kan äntligen slippa gå ut till det långsamma RAMet. Då kanske den får upp prestandan faktiskt? Tja, den här är ju faktiskt 50% snabbare än den tidigare långsamma z10 cpun som ger 437MIPS per cpu. Så denna ger hela 650 MIPS! Katastrof. Seriöst, jag blir nästan upprörd hur dåliga ingenjörerna får vara. Hur kan IBM misslyckas så katastrofalt med sin transistorbudget? 5GHz CPU och en halv GB RAM som cache och slukar ström - och ändå ger denna bara 650 MIPS och en Nehalem-EX ger 400MIPS under mjukvaruemulering!

Jag skulle seriöst sparkat alla ingenjörer på IBM om de presenterat en så dålig lösning som denna. Jag skulle blivit högröd i ansiktet och skrikit på dem. "Va fan, driver ni med mig??? En halv GB som cache??? Gör om, gör rätt! Intel gör mycket snabbare CPUer än så med en tiondel av cachen och halva frekvensen! J-vla amatörer!" Kastat saker på dem och så. Jag skulle blivit utskämd. Ingenjörerna på Intel skulle skrattat åt mig. Jag skulle blivit känd som värsta idioten bland de som kan något om cpuer. Herregud. Vad skulle hänt om man klockat ned denna CPU ned till 2GHz? Den skulle inte uträttat nånting. Sjukt att man måste få upp den till 5GHz och hänga på en halv GB cache, för att den ska ge endast 50% mer prestanda än en långsam z10 cpu. Hela designen får det att krypa i mig. Precis som Pentium 4. Misslyckad den med.

Skrivet av deadleus:

Från top500.org

linpack infiniband Nehalem-EP X5560 2,93Ghz 11,2 Gflops Rmax 11,7 Gflops Rpeak per core

linpack infiniband Power6 4.7Ghz 13,9 Gflops Rmax 18.8 Gflops Rpeak per core

Det här är ju ok peak värden. Men tänk på att en 5GHz POWER6 har 2 stora snabba cores. En 2.93GHz Nehalem har flera små cores, så en Nehalem är snabbare.

Skrivet av -=Mr_B=-:

Din tolkning, min tolkning. Ointressant. Hela din argumentation bygger på att du inte är överens med rubriken om vad snabbast egentligen innebär.

"IBM avslöjar rekordsnabb processor" - hur ska man tolka denna rubrik tycker du? Så min tolkning är fel?

Citat:

Du drar fram en massa skåpmat avsedd att imponera på övriga läsare som bara konstaterar att du är tröttsam, och skräpar ned i tråden. Du vägrar erkänna att i den kontext författaren avsåg är uttalandet högst korrekt.

Nej, jag säger bara att hans uttalande är tvetydigt. Jag säger att man kan tolka det på olika sätt. T.ex. såsom jag tolkar det.

Citat:

Hade du varit det minsta ärlig hade du konstaterat att ja, CPU'er har en förmåga att utföra olika mängd arbete vid given arbetsfrekvens. Frekvensen motsvarar varvtal, och arbetskapaciteten är vridmoment. Det är en spikrak överföring till en motor, och i den mån en bil analogi någonsin kan kallas korrekt, är den här det.

Definiera "arbetskapacitet". Vadå "spikrak överföring"? Jag är helt ställd och ser inte alls mappningen mellan motorer och cpuer. Du kanske kan något om bilar, men din analogi med cpuer kräver närmre förklaring.

Din mappning som är så tydlig för dig, är inte alls tydlig för mig. Om man börjar gräva i det, så tror jag vilken mappning som helst som du presenterar, inte är en bra mappning. Jag tror inte ens det går att göra en bra mappning mellan motorer och cpuer. Vad är en ALU i motorsammanhang? Vad är registren? CISC? RISC? Prefetch? Cache? Out of order execution? etc etc etc. Jag ser inte någon "spikrak överföring".

Citat:

Att tramsa runt med att den ska motiveras med tekniskt skitsnack, och försöka skrämma bort folk med att du minsann är KTH utbildad emulator-programmerare låter snarare påskina att du vet att du har fel, och att du vill försöka dribbla bort bollen snarare än att ta det som en man.

Vad ska jag ta som en man? Att en z196 ger 650MIPS och en Nehalem-EX ger nästan lika mycket MIPS under mjukvaruemulering? För vem som helst (förutom dig) är det uppenbart att Nehalem-EX är grymt mycket snabbare än en z196. Och när jag säger det, så "ska jag ta det som en man" och jag kommer med "vansinniga påståenden"? Samtidigt säger en snubbe som jobbat med IBM Mainframes i över tio år, att de cpuerna är inte snabba och att "jag har rätt". Men det är klart, varför skulle jag eller Mainframe folk ha rätt? Vi är väl allihopa vansinniga och vi borde ta "det" som en man. Vad är "det" egentligen? Sanningen?

Citat:

Jag tänker se dig som ett troll, och lägga ner diskussionen, eftersom det bör stå rimligt klart för alla som läser tråden att du är anal av egna anledningar snarare än att artikeln är felaktig.

Återigen, när artikeln påstår att det är en "rekordsnabb processor" så är det fel. Du får tycka jag är anal som påpekar det om du vill. Men om du har några TEKNISKA invändningar till varför jag har fel (och inte bara lite subjektiva tyckanden om att jag är vansinnig - om det nu var du som tyckte att jag var vansinnig?) så är jag villig att lyssna. Och jag är villig att omvärdera denna CPU, om du presenterar tekniska detaljer till varför 650 MIPS är snabbt. Men lite tyckanden går inte hem hos mig.

Permalänk
Medlem

saddam, varför hänger du upp dig på MIPS? Vem bryr sig om MIPS cross-plattform?

En z10 processor är inte en midrange server processor.
Sun Niagra är inte en general-purpose cpu.
Nehalem är inte en stordatorprocessor.

Visa signatur

Mobile Work - MacBook Pro 16 M1 Max 64GB

Permalänk
Medlem
Skrivet av saddam:

Men det är faktiskt löjligt att ha 376 MB RAM som cache till en enda CPU. Det tyder ju på TOK FAIL i designen. Det är faktiskt riktigt riktigt riktigt riktigt illa ur ingenjörsmässig synpunkt och tokslöseri på resurser och transistorer. Jag menar, när har man sett en cpu som har nästan en halv GB som cache? Jag trodde inte ens det fanns såna missfoster. Jag blev lite chockad faktiskt när jag läste ditt inlägg.

Jag är inte säker men den stora cachen kan ha att göra med att möta de olika Lpar (lågiska maskiner) som det kan finnas i en z196. Om du delar ut 376 MB till alla Lpar så blir det nästan 6 MB / Lpar vilket kanske är lite mer rimligt.

Skrivet av saddam:

Min lektor på KTH sade för längesen om IBM (jag förstod inte då varför han sade så, men nu förstår jag): "Om IBM inte får ut tillräckligt med prestanda, så hänger de på ytterligare en ångmaskin". De tänker inte efter för fem öre. Skruvar upp klockfrekvensen till löjliga nivåer (vilket är korkat för RAM hinner inte med) och hänger på nästan en HALV GB CACHE på varje CPU, drar hysteriskt mycket ström plus säkert massa andra korkade saker. Kanske är CPUerna vattenkylda? 7000 Watt kräver sin kylning, eller vad säger ni som överklockar mycket? Krävs det helium? Och en del säger att Windows är bloatat och har dålig design? Se på IBMs produkter säger jag bara. Det kryper i min ingenjörssjäl när jag tänker på detta missfoster. Typ, som en kalkon, den flaxar och flaxar men lyfter aldrig från marken.

7000 W delat på 400 000 användare är 0,0175 W vilket inte är så mycket... Har du set en z196? tror inte det (de kommer ut på marknaden om några månader) men z10 är stor som två garderober och luft kyld.

Skrivet av saddam:

Men visst, med nästan en halv GB cache så kanske den kan äntligen slippa gå ut till det långsamma RAMet. Då kanske den får upp prestandan faktiskt? Tja, den här är ju faktiskt 50% snabbare än den tidigare långsamma z10 cpun som ger 437MIPS per cpu. Så denna ger hela 650 MIPS! Katastrof. Seriöst, jag blir nästan upprörd hur dåliga ingenjörerna får vara. Hur kan IBM misslyckas så katastrofalt med sin transistorbudget? 5GHz CPU och en halv GB RAM som cache och slukar ström - och ändå ger denna bara 650 MIPS och en Nehalem-EX ger 400MIPS under mjukvaruemulering!

Hur mycket förlorar Nehalem-EX under mjukvaruemulering .Det hela är lite löjligt eller hur. Det är jättesvårt att förklara hur z plattformen fungerar. Men du kör alltid "emulerat" på z/OS. Så det går kanske att jämföra och då är z196 snabbare...
Men skulle jag sätta igång och göra krocktester eller andra tunga matematiska beräkningar på en z. Svaret är nej, men det är en licens kostads fråga och inte en Hårdvaru fråga.

Skrivet av saddam:

Jag skulle seriöst sparkat alla ingenjörer på IBM om de presenterat en så dålig lösning som denna. Jag skulle blivit högröd i ansiktet och skrikit på dem. "Va fan, driver ni med mig??? En halv GB som cache??? Gör om, gör rätt! Intel gör mycket snabbare CPUer än så med en tiondel av cachen och halva frekvensen! J-vla amatörer!" Kastat saker på dem och så. Jag skulle blivit utskämd. Ingenjörerna på Intel skulle skrattat åt mig. Jag skulle blivit känd som värsta idioten bland de som kan något om cpuer. Herregud. Vad skulle hänt om man klockat ned denna CPU ned till 2GHz? Den skulle inte uträttat nånting. Sjukt att man måste få upp den till 5GHz och hänga på en halv GB cache, för att den ska ge endast 50% mer prestanda än en långsam z10 cpu. Hela designen får det att krypa i mig. Precis som Pentium 4. Misslyckad den med.

z10 CPU smurrar på 4,4 Ghz och om man ökar 0,6Ghz så ökar prestandan med 50%. Och du tycker att det är ett misslyckande? snacka om höga krav.

Nä nu skall jag såva... god natt pojkar

Permalänk
Avstängd
Skrivet av deadleus:

saddam, varför hänger du upp dig på MIPS? Vem bryr sig om MIPS cross-plattform?

Det är inte jag som hänger upp mig på MIPS. Det är IBM som gör det. IBM vägrar prata SPECint_2006 eller några andra benchmarks som alla andra olika cpuer använder - cross platform. Om IBM använde något som alla andra olika cpuer använder, t.ex. SPECint_2006 så skulle jag "hänga upp mig" på det istället. Saken är den att IBM släpper inga andra benchmarks än MIPS. Då får jag väl prata MIPS? Jag förstår inte hur jag kan prata FPS i crysis när det inte finns såna benchmarks från IBM. Eller SPECint_2006 när det inte finns såna benchmarks från IBM. etc.

Man kan ju fråga sig varför det inte finns såna IBM benchmarks? När IBM har något bra, så skryter de hej vilt utan uppehåll. Slår på stora trumman och släpper massor av missvisande och felaktiga benchmarks. Men detta sker aldrig med sina Mainframes. IBM försöker döda Hercules och TurboHercules. Varför skulle IBM lägga så mycket energi på att döda mjukvaruemulatorer om de var så kassa? Nej, mjukvaruemulatorer kan faktiskt ersätta mainframes för lättare laster. De är faktiskt ett riktigt hot. TurboHercules säger att när Mainframes kraschar så kan man köra vidare på en PC. Det är hela syftet med TurboHercules, en till Mainframe är för dyr. Och kunderna älskar denna billiga lösning och köper den. IBM förlorar pengar eftersom man hellre köper en billig PC. Därför försöker IBM döda mjukvaruemulatorer och hota med stämning och advokater - trots att IBM lovat att inte stämma de som använder de patenten som IBM släppt fria.

Varför försöker IBM försvåra och dölja benchmarks med sina Mainframes?

Skrivet av deadleus:

En z10 processor är inte en midrange server processor.
Sun Niagra är inte en general-purpose cpu.
Nehalem är inte en stordatorprocessor.

En Nehalem är inte en stordatorcpu, nej. Bl.a. kan inte en Nehalem backa tillbaka och spela om instruktioner om något gick snett, men det kan Mainframe cpuer och vissa SPARC göra. Jag har aldrig påstått att en Nehalem har samma RAS som en Mainframe cpu. Jag har aldrig påstått att en PC kan ersätta en Mainframe fullt ut, pga PC har för låg I/O. Jag har hört att de största IBM Mainframes har ~ 296.000 I/O kanaler, det blir ganska mycket I/O det!

Det jag påstår, är att Mainframe cpuer är himla långsamma när vi pratar ren cpu prestanda. Det är alltså fel att benämna dem som "rekordsnabba".

Skrivet av leonad:

Jag är inte säker men den stora cachen kan ha att göra med att möta de olika Lpar (lågiska maskiner) som det kan finnas i en z196. Om du delar ut 376 MB till alla Lpar så blir det nästan 6 MB / Lpar vilket kanske är lite mer rimligt.

Men du allokerar väl inte LPARs till RAM i cachen??? Det vore ju befängt. LPAR tar vanligt RAM minne. Det är därför Mainframes kan ha så mycket RAM, flera TB.

Citat:

7000 W delat på 400 000 användare är 0,0175 W vilket inte är så mycket... Har du set en z196? tror inte det (de kommer ut på marknaden om några månader) men z10 är stor som två garderober och luft kyld.

Jag skulle inte bli förvånad om de flesta av 400.000 användare idlar. Precis som när IBM påstår att en större Mainframe virtualiserar 1500 st x86 servrar (alla idlar).

Och om mitt ingenjörsteam rättfärdigade den misslyckade designen som du gör, skulle jag bli ännu rödare i ansiktet och skrika mera "tror ni jag är dum eller? Jag går inte på sånt där, jag pratar ren teknik, inte falsk marknadsföring. Ur teknisk synvinkel har ni misslyckats gravt och det vet ni, vilken exjobbare som helst skulle göra bättre! Gör om gör rätt! Visa er inte förrän ni gjort något VETTIGT och inte en amatör lösning, t.ex. skruvar upp till 6-7GHz och hänger på 1GB cache minne - det är INTE acceptabelt!"

Citat:

Hur mycket förlorar Nehalem-EX under mjukvaruemulering .Det hela är lite löjligt eller hur. Det är jättesvårt att förklara hur z plattformen fungerar. Men du kör alltid "emulerat" på z/OS. Så det går kanske att jämföra och då är z196 snabbare...

Ja, det är extremt löjligt att det ens finns såna här CPUer. Och folk som inte är ingenjörer, tycker såna här missfoster är under av ingenjörskonst och de måste vara rekordsnabba. Jisses.

Angående att man alltid kör emulerat på z/OS så kanske det förklarar varför Mainframes är så långsamma. Det låter så korkat så det låter orimligt. Har du mer info om detta? Jag är skeptisk till detta. Det låter extremt korkat. Mainframes kör ju mjukvara som är utvecklad i assembler från 1960 talet än idag. Emulerar man en hel virtuell Mainframe som kör assembler direkt? (Fast iofs, när det gäller IBM så ska man inte bli förvånad över korkade lösningar, som min professor på KTH sa)

Men samtidigt så bygger denna CPU vidare på 5GHz POWER6 - som är bevisat långsam (vilken modern x86 som helst utklassar POWER6). Så jag tvivlar på att z196 är så mycket snabbare än POWER6. Den kanske är... 50% snabbare? Oj, jo den är ju 50% snabbare.

Men däremot, nästa generation Mainframe CPUer som antagligen kommer att bygga vidare på POWER7 kommer nog vara rejält snabba. POWER7 är en snabb CPU, antagligen snabbast idag. Det skulle inte förvåna mig alls, om IBM börjar släppa vanliga benchmarks med nya POWER7 baserade Mainframe CPUer. Det är något typiskt IBM skulle göra.

Men om IBM släpper POWER7 baserade Mainframe cpuer, så kommer jag hålla käften när IBM säger att de är snabba. För POWER7 ÄR snabba. Det är ju sant. Men att påstå det för POWER6 och alla dess derivat, snälla lägg ned. Det är inte sant.

Citat:

Men skulle jag sätta igång och göra krocktester eller andra tunga matematiska beräkningar på en z. Svaret är nej, men det är en licens kostads fråga och inte en Hårdvaru fråga.

Vadå licenskostnadsfråga? Det är ju bara att kompilera om gratis mjukvaran till open source och köra på. Det kan inte kosta nånting.

Men samtidigt har jag hört rykten att IBM tar betalt för varje beräkning som görs. Du betalar för varje MIPS som utförs. Och isåfall så förstår jag att det är en licenskostnad. Samtidigt, om det är så att Mainframe cpuer är så j-vla snabba som IBM försöker lura i folk, antag de är 5 ggr snabbare än den snabbaste CPUn idag så kan det faktiskt löna sig att köra beräkningar på Mainframes ändå. Det finns finansföretag som betalar vad som helst, för att få fram sina beräkningar snabbt.

Det finns Intel CPUer som drar jävla massa ström, men de är så snabba så att när de räknat klart så har de spenderat mindre ström än de strömsnåla cpuerna. Det är samma sak här; om nu Mainframes är så snabba som IBM påstår, så spelar det ingen roll att de är svindyra att använda - om de kan få fram resultaten snabbt. Kostnaden och tiden du väntar, kan bli mindre ändå. Men Mainframes är inte så snabba som IBM försöker lura i folk, de är bara svindyra.

Det är bara att tänka själv lite. En Linux expert påstod att 1 MIPS motsvarar 4MHz x86. Denna IBM z196 cpu ger 650 MIPS. En Nehalem-EX med 8 kärnor ger totalt 16GHz = 4.000MIPS. Antag att man emulerar med en Nehalem-EX, då blir den 5-10ggr långsammare. Då skulle den ge inte ge 4.000 MIPS, utan istället skulle den ge 400 MIPS. Vilket den också gör! VSB.

Citat:

z10 CPU smurrar på 4,4 Ghz och om man ökar 0,6Ghz så ökar prestandan med 50%. Och du tycker att det är ett misslyckande? snacka om höga krav.

Men så enkelt är det inte. Det är även nästan en halv GB cache per CPU. Det ger mycket till. En POWER6 är snabb om allt hålls i cachen, om den måste ut i RAM så förlorar den kraftigt i prestanda. Så denna 64 st server CPUer försöker hålla 400.000 användares data i cachen, och alla dessa trådar, och alla olika program som samtidigt körs, och kernel grejer och sånt och dessutom ska den utföra beräkningar och behöver minne till det - det blir tight i cachen även fast du har totalt 24 GB i cache för dessa 64 cpuer. 24GB cache räcker inte jättelångt för att cacha en halv miljon användare och deras data och all olika mjukvara och kompilatorer som körs och kernelgrejer och sånt?

Kort sagt, denna cpu är ett riktigt misslyckande och ett missfoster. Den borde dödats och aldrig släppts ut ur labbet. Man borde inte ens fundera i dessa banor. Men POWER7 är snabb, bygg vidare på den istället. Då skulle Mainframes sparka rumpa!

Permalänk

Lite sen i starten

Jag vill opponera mig mot ett av de fösta inläggen här som säger att IO är ett problem för x86-baserade system. Det kan vara ett problem om applikationerna som körs producerar mycket omfångsrikt data som ska skickas. Detta sker som bekant vid användning av XML/SOAP (haha skojade bara, få NET-utvecklare verkar känna till att SOAP är oerhört IO-krävande). XML/SOAP är också oerhört CPU-krävande och då främst vid avtolkning av SOAP-strängen, mindre vid skapandet av strängen.

Dagens serverapplikationer lider av samma problem som så gott som alla serverapplikationer alltid gjort: det läggs för mycket funktionalitet på servern (eftersom det är mer komplicerat att lägga det i klienten) som därmed tappar en stor del av sin förmåga. Varför skicka en fråga i SOAP-format om det är mycket krävande att fastställa vad det är som klienten egentligen vill ha gjort? Har man inte så bråttom kan man konstruera binärfrågor som säger anropa funktionen vars numeriska värde finns i den binära frågans byte 2 (eller 5 eller någon annanstans). Hur mycket jobb är det? För mycket uppenbarligen.

Låt också bli att ställa komplicerade SQL-frågor där femtisjutton tabeller blir indragna för att ett "rent" svar ska kunna levereras sorterat till klienten. Skicka allt och låt klienten sålla bort ovidkommande för att sedan sortera.

Centrala resurser som servrar har inte tid att göra jobb som lokala resureser lika gärna kan utföra.

IO är inte probemet, utvecklarna är det.

Permalänk
Medlem

Rekordsnabb är den inte, med tanke på att AMD Bulldozer kommer upp utan överklockning i strax under den klockningen,
och att IBMs grafén processor går upp över 100GHz (0,1THz).

Kraftfull är den dock, 96 kärnor.
Slår Intels 48 Kärniga processor med hästlängder.