Intel tar hjälp av TSMC för att möta kapacitetsbrist på 14 nanometer

Permalänk
Medlem
Skrivet av Paddanx:

Finns ingen info om Intel 22nm att jämföra med.
Men tack för försöket, det ger en hel del info om 10nm och liknande iaf.

Nä, det var mer för att visa hur grovhugget det är att säga "10nm" eller något annat när det är fler faktorer som spelar. Så många olika, t.o.m. ... Lite som att säga 320cm-bil och 400cm-bil.

Visa signatur

Hur många datorer är för många?

Permalänk
Datavetare
Skrivet av Paddanx:

Enkelt.
För det var min åsikt om det du svara på, som jag även hade en vettig källa på.
Och jag antar att i din värld är ledare och förlorare samma?

Leda innebär att man är först... på allt.
Inte att man i vissa mått sett är före, och vi vissa inte är.

Med den definitionen undrar jag om Intel, eller någon annan, varit ledare i något läge under hela historien på kretstillverkning... Så en rätt värdelös definition i så fall, eller?

Bl.a. då Intel rätt sällan har varit ledare i disciplinen högsta möjliga densitet. Man har inte heller varit först att infört saker som SOI (var IBM, som förövrigt varit först med rätt många saker i även denna disciplin), men finns självklart saker Intel varit först med, som FinFET och tror man var först med "strained silicon" på 90 nm.

Så endera har det inte funnits en ledare inom kretsteknik, eller så behövs lite mer kontext.

Intel har aldrig varit ledande på att tillverka systemkretsar eller mikrokontrollers, man har ändå gjort rätt ordentliga försök på båda. Eventuell ledning var uppenbarligen inte så stor att det räckte med att ställa ut skridskorna på isen och förvänta sig att matchen var vunnen, det slutade med rätt många mål i baken...

Däremot svårt att se hur man inte skulle kalla dem odiskutabla ledare när det kommer till laptops, desktop och servers CPUer de senaste tio åren. Det är i.o.f.s en kombination av tillverkningsprocessen och mikroarkitekturen, men även om man bara tittar på tillverkningsprocess i kontext för att tillverka just laptop-, desktop- och server-CPUer så ser jag ingen annan som haft en bättre tillverkningsprocess för ändamålet.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Med den definitionen undrar jag om Intel, eller någon annan, varit ledare i något läge under hela historien på kretstillverkning... Så en rätt värdelös definition i så fall, eller?

Bl.a. då Intel rätt sällan har varit ledare i disciplinen högsta möjliga densitet. Man har inte heller varit först att infört saker som SOI (var IBM, som förövrigt varit först med rätt många saker i även denna disciplin), men finns självklart saker Intel varit först med, som FinFET och tror man var först med "strained silicon" på 90 nm.

Deras noder har legat 2-3 generationer före rätt länge faktiskt. Kanske inte på 100% alla punkter, men som sagt, flesta punkter. Tider ändras dock.

Är lite som Samsungs NAND. När det kom i 2D versionen var det utan tvekan snabbast, och de hade ledande roll väldigt länge. När dock TLC diskarna blev vanliga, tappade de imho ledningen, där Toshiba/Sandisks 15nm TLC NAND tog över facklan.

De tog tillbaka den sen igen med sitt 3D NAND och har haft den facklan tills nu iaf, när 64-lager kom. Idag är det rätt likt där. Toshiba har utan tvekan en av, om inte det bästa NANDet sett till framtidsskalning. Och du kan se motsvarande "FinFet geniala drag" och lite andra förfinande tekniker där med, i deras design. Samsungs NAND är utan tvekan en av de mest komplexa att göra, men det är inte garanti för att det är bäst när alla andra kan ge motsvarande nivå av prestanda. Så idag är det samma här... beror på vad man mäter, då inga tydliga ledare finns.

Det jag dock stör mig på är de som älskar hävda att något är bättre, för det passar "deras behov". Man behöver se det lite objektivt i synen till vad det är som sker. Om intels ena mått är bättre, är faktiskt totalt irrelevant, om jag inte kan ha den i användning. Ett NAND som Sk Hynix skryter med 72-96 osv lager, eller 1M IOPS Optane är imho bara trams.

AMD har levererat en extremt prisvärd CPU, i flera klasser, på endast 2 år. De har inte ens 2 arkitekturer, utan allt är en enda, än. Intel har en otroligt bra 14nm++ nod, som verkligen kan leverera till konsumenternas GHz krav, men ändå anser jag 5775c var den bästa spel CPUn som gjorts hittills, då jag inte behöver 5Ghz och 6-core för att kunna spela.

Intels bruteforce sätt är imho döende, då de är 100% beroende på en kanonbra nod för att den ska fungera. Om du vill göra en uppskattning, hur länge tror du det tar tills 10nm når 5Ghz från nuvarande? Jag tror du får vänta 2020+ lätt. Intel själva hade ju målet med IceLake att göra 8-core 10nm, med "sämre prestanda än tidigare". Det var deras "mål". Och uppenbarligen kunde de inte ens nå det.

Tittar man på den länken vi båda sett innan om 10nm från 2017, var det 10nm+ "ingen förbättring". Så.. man utvecklar minst 1 års jobb, för inget? Och sen på 10nm++ når "15% bättre prestanda" än 10... inte 10+? Det syns väldigt tydligt att hela den noden är låååångt efter. De är på förbättringsnivåerna som 14+ eller 22-refresh var på, 1 år efter initiala noden, och detta 1+ år efter förväntat lansering.

Så Intel har tvingats ta in alla fördelar för att kunna sälja sina CPUer.
- 5Ghz
- 8-core med HT
- Fast-lödd IHS.
- Lappad 270-chipset, som släpptes Q1, 2017.
- All hype man kan få från PR...

För att tävla mot AMDs 2st ihoplimmande första Ryzen arkitektur, på GloFo low-power nod.
Är som att plocka fram en €1,5M bil, som man sedan trimmar för att tävla mot en budget trimmad Volvo, och sen säga... de vinner, med en 50-100% så dyr CPU.

Vad vinner de? Egentligen...

Skrivet av Yoshman:

Så endera har det inte funnits en ledare inom kretsteknik, eller så behövs lite mer kontext.

Intel har aldrig varit ledande på att tillverka systemkretsar eller mikrokontrollers, man har ändå gjort rätt ordentliga försök på båda. Eventuell ledning var uppenbarligen inte så stor att det räckte med att ställa ut skridskorna på isen och förvänta sig att matchen var vunnen, det slutade med rätt många mål i baken...

IBM har ju utan tvekan gjort sitt, men jag anser att PowerPC dog när Mac övergav den för X86. De kunde ju inte leverera en konkurrenskraftig produkt längre. Förstår att du vill nu mäta allt och alla, men jag sa vinner mest och flest, och att vara den mest använda arkitekturen i världen är... rätt bra vinst. Även den tronen tog dock AMD med x86-64 tilläggen imho. Sen självklart har SSE utan tvekan vunnit över AMDs motsvarande, så det är inte enkelt val där heller.

Skrivet av Yoshman:

Däremot svårt att se hur man inte skulle kalla dem odiskutabla ledare när det kommer till laptops, desktop och servers CPUer de senaste tio åren. Det är i.o.f.s en kombination av tillverkningsprocessen och mikroarkitekturen, men även om man bara tittar på tillverkningsprocess i kontext för att tillverka just laptop-, desktop- och server-CPUer så ser jag ingen annan som haft en bättre tillverkningsprocess för ändamålet.

10 åren, nja. AMD hade rätt bra prestanda för 10 år sedan också, och jag tror det var mer att Intel gjorde med Core2Duo som AMD gjort med Ryzen nu... allt är överklockbart, så det känns som det var bättre, precis som Ryzen känns mer öppet idag. Det som har ändrats sedan dess är ju Turbo/XFR tekniker, som redan ur lådan pressar CPUerna rätt bra.

Men 5 åren 2012-2017, utan tvekan, 2018... njae... skulle säga att det var brytpunkten, när 10nm inte lanserades.
Problemet är, du hänger upp dig på "förr", som om att jag har argumenterat mot dig här... det har jag inte. Tvärt om, jag sa även att hade du frågat mig detta för 3 år sedan, hade svaret varit Intel. Så... läser du ens det man säger?

Permalänk
Medlem
Skrivet av kelthar:

Nä, det var mer för att visa hur grovhugget det är att säga "10nm" eller något annat när det är fler faktorer som spelar. Så många olika, t.o.m. ... Lite som att säga 320cm-bil och 400cm-bil.

Tack den biten har jag vetat om i rätt många år nu, och förstått.
Jag ville faktiskt försöka jämföra dem på mer direkt info, för att just kunna göra en uppskattning om det man påstår i artikeln var en vettig väg att gå.

Permalänk
Medlem
Skrivet av Paddanx:

Tack den biten har jag vetat om i rätt många år nu, och förstått.
Jag ville faktiskt försöka jämföra dem på mer direkt info, för att just kunna göra en uppskattning om det man påstår i artikeln var en vettig väg att gå.

"TSMC is currently in production with a 16nm process that has a standard node value of 18.3nm." var något jag hittade. Det kanske säger lite om det jämför med Intels 22nm. Något bättre, kanske.

Om du kollar på artiklar som kommer från "Scotten Jones" som har skrivit artiklen så kan du garanterat hitta information. Jag gick tillbaka några år och tittade lite snabbt genom artiklarna. Men det kommer nog ta lite tid ... Hör av dig när du har hittat det

Visa signatur

Hur många datorer är för många?

Permalänk
Medlem
Skrivet av kelthar:

"TSMC is currently in production with a 16nm process that has a standard node value of 18.3nm." var något jag hittade. Det kanske säger lite om det jämför med Intels 22nm. Något bättre, kanske.

Om du kollar på artiklar som kommer från "Scotten Jones" som har skrivit artiklen så kan du garanterat hitta information. Jag gick tillbaka några år och tittade lite snabbt genom artiklarna. Men det kommer nog ta lite tid ... Hör av dig när du har hittat det


Kul med en som levererar fakta.

Tror jag fick mitt svar en bit bak dock, tillräckligt för min nivå av intresse iaf.
Jag undrade ju varför Intel sa blankt nej till att man skulle ta H310 tillbaka till 22nm, och sedan nu valde detta, då precis som vi båda vet... är bara ett namn. Det måste ju kosta att outsource:a tillverkningen, och H310 är inte direkt stor marginal på, så det måste ju vara någon "fördel", annars är det ju konstigt.

Skulle tro att pga 10nm, har de enorm press på 14nm, och pga detta även fortsatt press på 22nm, så de har helt enkelt inte kapacitet öht. (Lite gissning, men logiskt), vilket kan göra detta val ovan fullständigt logiskt, då det blir till OEM eller low-end ändå.

Permalänk
Datavetare
Skrivet av Paddanx:

Deras noder har legat 2-3 generationer före rätt länge faktiskt. Kanske inte på 100% alla punkter, men som sagt, flesta punkter. Tider ändras dock.

Skulle med spänning vilja höra med vilken definition Intel har legat 2-3 generationer före och när detta ska ha inträffat.

Sett till teoretiska mått som CPP, MMP och maximal täthet på SRAM-celler har Intel som mest legat en full generation före, det under ca ett år efter man gick till 14 nm. Men skulle säga att man i det läget rent praktiskt låg två generationer före under perioden, då det stod mot 20 nm "planar" mot 14 nm FinFET.

När TSMC och Samsung (GloFo kör ju Samsungs 14 nm FinFET) nåde 14/16 nmFF låg man fortfarande efter Intel, men i det läget var man sett till teoretiska siffror mindre än en full nod efter (man låg mellan Intels 22 nm och 14 nm sett till CPP, MMP och täthet).

TSMC och Samsung fick båda igång sina "10 nm" processer under 2017. Mätt med CPP, MMP och täthet var Intel passerad redan där, även om det inte var med någon större marginal.

Men här borde det ändå börja bli rätt så uppenbart att de teoretiska siffrorna rätt mycket spelat ut sin roll, De flesta skippade 10 nm. Visst gav dessa mindre kretsar, men på mer relevanta saker som prestanda och pris så ansåg de flesta att TSMC/Samsungs 16/14 nmFF vara bättre val även fortsättningsvis.

Så åter igen: med vilket definition låg Intel 2-3 generationer före och när hände detta?
Lägger man till kontext i form av "ligga före på laptop/desktop CPU" eller liknade så ser jag hur man kan dra den slutsatsen. Men då skulle jag också hävda att Intel fortfarande leder och osannolikt att de tappar ledningen ens när AMD är på TSMC 7 nm och Intel kvar på 14 nm++. D.v.s. om "ligga före" definieras som vem kan producera de bäst presterande CPU-modellerna.

Skrivet av Paddanx:

Det jag dock stör mig på är de som älskar hävda att något är bättre, för det passar "deras behov". Man behöver se det lite objektivt i synen till vad det är som sker. Om intels ena mått är bättre, är faktiskt totalt irrelevant, om jag inte kan ha den i användning. Ett NAND som Sk Hynix skryter med 72-96 osv lager, eller 1M IOPS Optane är imho bara trams.

???
Om jag bygger en högpresterande serverlösning och primär flaskhals är relationsdatabasen så kan jag säga att 1 M IOPS Optane är allt annat än trams, det är värt i princip hur mycket som helst. Sitter du däremot och surfar eller kör Cinebench hela dagarna är självklart Optane totalt värdelöst.

Utan kontext blir alla uttalanden i stil med "A är bättre än B" helt meningslösa.

Skrivet av Paddanx:

Intels bruteforce sätt är imho döende, då de är 100% beroende på en kanonbra nod för att den ska fungera. Om du vill göra en uppskattning, hur länge tror du det tar tills 10nm når 5Ghz från nuvarande? Jag tror du får vänta 2020+ lätt. Intel själva hade ju målet med IceLake att göra 8-core 10nm, med "sämre prestanda än tidigare". Det var deras "mål". Och uppenbarligen kunde de inte ens nå det.

Du sitter uppenbarligen på källor jag saknar, för har aldrig hör några mål att IceLake skulle få lägre prestanda per kärna.

Däremot är det högst osannolikt att de kan klocka IceLake i nivå med 9000-serien. Når de ens i7-8700K nivåer vore det förvånande bra, är nog någonstans där man måste hamna för att behålla samma prestanda per kärna då rimlig generell IPC förbättring kanske hamnar på ~5 %.

Du går gärna förklara hur Intels metod är "bruteforce". Antar att det är i relation till konkurrensen, som då i praktiken är AMDs Zen.

Skylake har högre IPC, går att klocka högre, tar mindre kretsyta och SweC effektmätning]drar mindre ström (det även om du jämför i7-8700K mot R5-2600X så det är samma antal kärnor). Inte riktigt de egenskaperna jag brukar förknippa med "bruteforce"...

Zen har en teoretiskt sett "bredare" back-end jämfört med Skylake, dubbelt så stor L1i$ och L2$. Det är då inte "bruteforce"? Skylake har i.o.f.s. dubbel bitbredd i sina SIMD enheter, vilket är orsaken till "AVX offset" i frekvens.

Vad som däremot utan tvekan är "bruteforce" och vad som kommer bli fallet för x86 är "front-end" på både Zen och Skylake. Skulle inte förvåna mig om dessa två designer spenderar fler transistorer bara på sin avkodare+mikro-op-cache än vad Apple och ARM spenderar på hela sina CPU-designer, L1$-L3$ exkluderat.

I Apples fall når man ändå högre front-end kapacitet (och även högre IPC). Aarch64 kommer bara fortsätta dra ifrån x86_64 i iPC, när man kommer tillräckligt nära i frekvens är tiden för x86 förbi som bäst presterande desktop CPU.

Ändå svårt att se Skylake vara mer (eller mindre för den delen) bruteforce än Zen här. De har ju extremt snarlika front-end lösningar med väldigt snarlik kapacitet. Båda tar upp till 4 x86 instruktioner, Skylake har vissa specialfall där den i praktiken kan fixa 5 x86 instruktioner. Zen har mindre restriktioner kring hur mixen av instruktioner för att nå maxkapacitet, så på det stora hela är det nog väldigt snarlik teoretisk kapacitet. Sett över hela designen har de också väldigt snarlik teoretisk kapacitet, undantaget SIMD där Intel är väsentligt starkare.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Datavetare
Skrivet av kelthar:

"TSMC is currently in production with a 16nm process that has a standard node value of 18.3nm." var något jag hittade. Det kanske säger lite om det jämför med Intels 22nm. Något bättre, kanske.

Om du kollar på artiklar som kommer från "Scotten Jones" som har skrivit artiklen så kan du garanterat hitta information. Jag gick tillbaka några år och tittade lite snabbt genom artiklarna. Men det kommer nog ta lite tid ... Hör av dig när du har hittat det

Från din länk (som är från mars 2016)

"From the first table we can see that at a given "node" Intel is the consistent leader, however when we look at density versus year, TSMC and Samsung should both pass Intel this year with their "10nm" node processes and TSMC and Global Foundries should both lead in 2017 with their 7nm processes. Samsung is making a big bet on EUV for 7nm and will be trying to rely on their 10nm process longer than TSMC. If Samsung succeeds in introducing EUV before their competitors it could give them a cost advantage and set them up for a smoother transition to 5nm."

Så det här med att Intel är ensamma om att inte riktig följa planeringen var ju rätt fel om ovan stämmer.

Enligt den planen skulle TSMC vara igång med 10 nm slutet av 2016, hände mitten 2017. Man skulle komma igång sin 7 nm 2017 (i slutet får man anta), det blev i stället hösten 2018. Slutligen skulle 5 nm rulla igång 2019.

Samsung skulle även de vara igång med 10 nm under 2016, hände också mitten 2017. 7 nm skulle starta 2019, men det blir nu i stället 8 nm då EUV-utrullningen inte gått som planerat.

Alla är försenande, dock är ingen lika mycket försenad som Intel är med sin 10 nm!
Om nu fixen för Intel är att ändra MMP från 36 nm till 40 nm har man ändå en "riktig" 10 nm enligt definitionen i artikeln

"Standard node" med 36 nm MMP: 8,8 nm
"Standard node" med 40 nm MMP: 9,5 nm

EUV känns lite som sista rycket för kisel, hoppas det rullar igång snart så man får se om det finns några relevanta steg kvar att plocka.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Från din länk (som är från mars 2016)

"From the first table we can see that at a given "node" Intel is the consistent leader, however when we look at density versus year, TSMC and Samsung should both pass Intel this year with their "10nm" node processes and TSMC and Global Foundries should both lead in 2017 with their 7nm processes. Samsung is making a big bet on EUV for 7nm and will be trying to rely on their 10nm process longer than TSMC. If Samsung succeeds in introducing EUV before their competitors it could give them a cost advantage and set them up for a smoother transition to 5nm."

Så det här med att Intel är ensamma om att inte riktig följa planeringen var ju rätt fel om ovan stämmer.

Enligt den planen skulle TSMC vara igång med 10 nm slutet av 2016, hände mitten 2017. Man skulle komma igång sin 7 nm 2017 (i slutet får man anta), det blev i stället hösten 2018. Slutligen skulle 5 nm rulla igång 2019.

Samsung skulle även de vara igång med 10 nm under 2016, hände också mitten 2017. 7 nm skulle starta 2019, men det blir nu i stället 8 nm då EUV-utrullningen inte gått som planerat.

Alla är försenande, dock är ingen lika mycket försenad som Intel är med sin 10 nm!
Om nu fixen för Intel är att ändra MMP från 36 nm till 40 nm har man ändå en "riktig" 10 nm enligt definitionen i artikeln

"Standard node" med 36 nm MMP: 8,8 nm
"Standard node" med 40 nm MMP: 9,5 nm

EUV känns lite som sista rycket för kisel, hoppas det rullar igång snart så man får se om det finns några relevanta steg kvar att plocka.

Jag tror detta är en trend som kommer att hålla i sig. Förseningar som blir värre och värre för varje nodkrympning.

Jag undrar vad och om vi faktiskt kommer att revolutionera logik-/beräkningsteknologin. Just nu är det bara inkrementella förbättringar, inga revolutioner. Vissa säger kvantdatorer, men de kommer väl inte ge en så många fler FPS eller ett snabbare excel? De är väl till för helt andra sorts beräkningar.

Visa signatur

Hur många datorer är för många?

Permalänk
Skrivet av Yoshman:

Tänkte skriva att mina pengar är på Intel, men kom på att jag faktiskt sålt INTC och har kvar en del AMD (plockat hem det mesta, tycker värdering är orimligt just nu). Så pengar är egentligen på AMD.

Ok, åtminstone du bekräftar vad jag försökte undersöka. AMD:s aktie är uppblåst just nu och kommer att korrigeras.
Men hur länge? Den är på steroider just nu. Toppar många listor över bästa aktier just nu. Det blir som som med Bitcoin. De kloka kommer att förstå att sälja nu. Och plötsligt faller domino-brickorna.

En ny dominobricka som kom igår var Jim-Cramer....så klart har han investerar i aktien, gjort reklam för detta och har säkert cashat in vinsten redan. Inte illa 10% på en dag.
Jim Cramer discusses Advanced Micro Devices' meteoric rise with the executive that made it happen, Dr. Lisa Su

Permalänk
Medlem
Skrivet av Yoshman:

Skulle med spänning vilja höra med vilken definition Intel har legat 2-3 generationer före och när detta ska ha inträffat.

Sett till teoretiska mått som CPP, MMP och maximal täthet på SRAM-celler har Intel som mest legat en full generation före, det under ca ett år efter man gick till 14 nm. Men skulle säga att man i det läget rent praktiskt låg två generationer före under perioden, då det stod mot 20 nm "planar" mot 14 nm FinFET.

När TSMC och Samsung (GloFo kör ju Samsungs 14 nm FinFET) nåde 14/16 nmFF låg man fortfarande efter Intel, men i det läget var man sett till teoretiska siffror mindre än en full nod efter (man låg mellan Intels 22 nm och 14 nm sett till CPP, MMP och täthet).

TSMC och Samsung fick båda igång sina "10 nm" processer under 2017. Mätt med CPP, MMP och täthet var Intel passerad redan där, även om det inte var med någon större marginal.

Men här borde det ändå börja bli rätt så uppenbart att de teoretiska siffrorna rätt mycket spelat ut sin roll, De flesta skippade 10 nm. Visst gav dessa mindre kretsar, men på mer relevanta saker som prestanda och pris så ansåg de flesta att TSMC/Samsungs 16/14 nmFF vara bättre val även fortsättningsvis.

Så åter igen: med vilket definition låg Intel 2-3 generationer före och när hände detta?
Lägger man till kontext i form av "ligga före på laptop/desktop CPU" eller liknade så ser jag hur man kan dra den slutsatsen. Men då skulle jag också hävda att Intel fortfarande leder och osannolikt att de tappar ledningen ens när AMD är på TSMC 7 nm och Intel kvar på 14 nm++. D.v.s. om "ligga före" definieras som vem kan producera de bäst presterande CPU-modellerna.

Okej, bra poäng. Jag kan rätta mig till 1-2 generationer. Men... 1-2 eller 2-3 före, är ändå ledande och före, eller hur?

Skrivet av Yoshman:

???
Om jag bygger en högpresterande serverlösning och primär flaskhals är relationsdatabasen så kan jag säga att 1 M IOPS Optane är allt annat än trams, det är värt i princip hur mycket som helst. Sitter du däremot och surfar eller kör Cinebench hela dagarna är självklart Optane totalt värdelöst.

Utan kontext blir alla uttalanden i stil med "A är bättre än B" helt meningslösa.

Och på den 1 maskin du bygger, byggs 1000-tals enklare maskiner. Så vi är tillbaka till 1,5M utrustningen vs billigare hemmatrimmade. Och ärligt... vad du kan, eller gör i din nish produkt, i could not care less. Varför? Pengar.
Den dagen du ska ta pengar o bygga detta 1M IOPS ur egen ficka, till de 1000 personerna, så kan vi prata lika nivå här. Men vad du fantiserar om, och någon annan betalar... hjälper inte någon annan här, eller hur? Så... trams.

Det är skryt från produkter du som slut konsument aldrig ser, för det "är bäst" på en nivå du mätt, som ingen annan har nytta av. Och optane missade sina mål med typ en faktor, så det var inte mer än varmluft. Sen ja... det är bättre för server i alternativet, och entusiaster kommer köpa nån, men få kommer ha nytta av den, sett till tex antal vanliga SSDer vs en HDD tex.

Så det är som att skryta om 1500HK värsting bilen... som ingen ändå har råd med.

Skrivet av Yoshman:

Du sitter uppenbarligen på källor jag saknar, för har aldrig hör några mål att IceLake skulle få lägre prestanda per kärna.

Nu frågar jag dig allvarlig här, är du läskunnig?
Var någonstans har jag påstår "lägre per kärna" - sett till IPC?

Prestanda = Frekvens x IPC.
Samma IPC med lägre frekvens = lägre prestanda.
Och källan... testa läs Sweclockers nyheter. Men å andra sidan sett, känns det som det mesta som kommer ur Intels PR avdelningen är fake news ändå, eftersom "Cannon Lake håller schemat – Ice Lake har färdigställts" enligt intel 2017. Så du kan väl tolka det precis som du vill. Jag kan dock sätta månadslönen på att ingen 10nm 5Ghz CPUer kommer detta år... och troligen inte 2019 heller. Det kommer komma nån processor, ja.. men vad?

Tror dock du är den enda som än tror på IPC förbättring än... något vi inte sett på länge. AMD dock... har rätt stor chans att göra förbättringar på sin helt nya arkitektur.

Skrivet av Yoshman:

Du går gärna förklara hur Intels metod är "bruteforce". Antar att det är i relation till konkurrensen, som då i praktiken är AMDs Zen.

Kort sagt. Bruteforce är vad som skiljer en kärnas prestanda mellan Kaby Lake och alla refrehsh... dvs frekvens. Att nå de frekvenser de når idag, kan de inte räkna med att nå igen, på rätt lång tid, om ens någonsin, precis som du säger själv:

Skrivet av Yoshman:

"Däremot är det högst osannolikt att de kan klocka IceLake i nivå med 9000-serien. Når de ens i7-8700K nivåer vore det förvånande bra,..."

Så vi är rätt överens på den punkten, även om du inte begrep den, vilket förvånar mig mer än något, då just det du citerade har just frekvensen som jag tog upp. Inte ens sagt något om IPC... det var något du kokade upp. Jag är allvarligt konfunderad om du medvetet misstolkar mig, eller vad som pågår.

PS. Titta 7nm är lanserat

Permalänk
Datavetare
Skrivet av Paddanx:

Nu frågar jag dig allvarlig här, är du läskunnig?
Var någonstans har jag påstår "lägre per kärna" - sett till IPC?

Prestanda = Frekvens x IPC.
Samma IPC med lägre frekvens = lägre prestanda.

Ser precis vad du skriver, tycker det är mest du som försöker missförstå mig.

Prestanda per kärna: IPC * frekvens.

D.v.s. du lyckas skiva exakt samma sak själv och ändå missförstå du vad jag skriver

Tror inte man når 14 nm++ i frekvens, på 10 nm. Grejen är att man i praktiken redan skrotat 10 nm då det är vad som används i de enstaka modeller som är ute nu.

10 nm+ (vilket är vad Ice Lake kommer använda) lär nog inte heller matcha 14 nm++, här är ändå frågan hur nära man kommer. Tror som sagt det är osannolikt att man når 4,7 GHz (d.v.s. matchar i7-8700K), men det är nog inte omöjligt och i det läget är det mest en fråga om hur mycket pengar man vill kasta på problemet i form av: det kommer gå att nå den frekvensen, fast man få kanske "binna" så hårt att endera priset drar iväg eller att lönsamheten dyker.

Och spelar ingen roll att man inte lyckats öka IPC sedan Skylake (är bara GPU-delen som förändrades i Kaby Lake), ser ändå inte hur det är "bruteforce" då ingen annan x86-design matchar vare sig energieffektivtet, IPC eller maxfrekvens av Coffe Lake. IPC har varit konstant, men det har inte energieffektivitet eller maxfrekvens så man har inte stått still.

Skrivet av Paddanx:

Tror dock du är den enda som än tror på IPC förbättring än... något vi inte sett på länge. AMD dock... har rätt stor chans att göra förbättringar på sin helt nya arkitektur.

Ice Lake är en ny mikroarkitektur, vi lär med 100 % sannolikhet se högre IPC som vi gjort i alla mikroarkitekturuppdateringar av Core-serien sedan dess introduktion.

Frågan är hur stora förbättringarna blir för generell heltalskod, det är vad som spelar roll för >9 av 10 användare. Är redan klart att SIMD kommer se 50-70 % IPC-förbättring för t.ex. maskininlärning och vetenskapliga program som t.ex. Matlab då redan Cannon Lake fått AVX512, men det är nischer.

Har gjort en verklig IPC mätning (d.v.s har verkligen mätt genomsnittligt antal x86 instruktioner som når "retire" per cykel -> felspekulerade instruktioner räknas inte) på en del fall som är högst relevanta för mig personligen här. Skylake har trots allt 1-13 % högre IPC jämfört med Haswell och alla dessa fall är rena heltalsfall, man ser att på just dessa fall har AMD lite att jobba på med framtida Zen-designer.

Fullt rimligt att förutsätta att Ice Lake kommer ha motsvarande IPC vinst mot Skylake som Skylake har mot Haswell, däremot totalt orimligt att förvänta sig några >30 % på något annat än väldigt speciella områden. Så trots liten IPC-vinst tror jag ändå den blir tillräckligt hög för att Ice Lake i alla fall ska matcha i9-9900K i prestanda per kärna i genomsnitt.

x86 kräver "bruteforce" i front-end p.g.a. sin horribla design, men det är inget vare sig Intel eller AMD kan fixa med mindre än att bryta bakåtkompatibilitet. Bortsett från det är Skylake, trots lansering 2015, den mest välputsade x86 mikroarkitekturen som existerar just nu.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

Ser precis vad du skriver, tycker det är mest du som försöker missförstå mig.

Prestanda per kärna: IPC * frekvens.

D.v.s. du lyckas skiva exakt samma sak själv och ändå missförstå du vad jag skriver

Jag missförstår dig inte, jag väljer att inte diskutera saker som jag inte anser relevant.
Problemet är, du älskar att dra upp allt från 10+ år tillbaka, FinFet och alla möjliga saker för att visa något som inte ens har med verken artikeln eller nuvarande sits att göra. Blir väldigt tröttsamt att behöva höra om babblande som inte spelar någon roll.

Och här, just nu, i hela det jag har argumenterat, diskuterat, och säger, spelar IPC ingen roll ÖHT. Det är vad du gör på noden... inte noden i sig. Ta det till en AMD vs Intel kanal, jag ser detta som en TSMC vs Intel diskussion. Så snälla sluta gå mer off topic. Jag kommer svara på dessa, men i fortsättningen klipper jag bara bort detta ur ev framtida svar.

Skrivet av Yoshman:

Tror inte man når 14 nm++ i frekvens, på 10 nm. Grejen är att man i praktiken redan skrotat 10 nm då det är vad som används i de enstaka modeller som är ute nu.

10 nm+ (vilket är vad Ice Lake kommer använda) lär nog inte heller matcha 14 nm++, här är ändå frågan hur nära man kommer. Tror som sagt det är osannolikt att man når 4,7 GHz (d.v.s. matchar i7-8700K), men det är nog inte omöjligt och i det läget är det mest en fråga om hur mycket pengar man vill kasta på problemet i form av: det kommer gå att nå den frekvensen, fast man få kanske "binna" så hårt att endera priset drar iväg eller att lönsamheten dyker.

Om man ska läsa källorna som finns länkade i tråden är vi redan på 10nm++ idag. Och det verkar vara som detta inte höll måttet. Detta kan du se i första inlägget du citerade av mig. Denna nu 2x förbättrade noden, hade 2017, när den artikeln skrevs, förväntad ca 15% förbättring över ursprungliga 10nm.

Så vi pratar inte 10nm... ursprungliga. Vi pratar 10nm++ vs 14nm++ eller nya 7nm noden som Apple släppte igår. Jag står fast vid mitt påstående att Intel inte har marknadsledningen i krympning av noder längre, då det har nu lämnats över. De leder än utan tvekan i högst frekvens... på sin CPU. Men hur länge?

Deras egen efterföljare har inte en chans i H att matcha detta heller. Så det blir en fråga... whats next? Och i den biten finns inget annat än gissningar. Enda jag kan lova dig, är att detta är början till slutet på "hur det varit" sett till denna utveckling.

Och ja, du kan säkert binna bort problemet, men då är vi åter där med 1,5M kr alt vs hemmafixaren, och AMD har inget problem med sin modulära design, att hantera både sämre yield och lägre binning. Så är de ens i närheten av samma frekvens, och kan få upp sin IPC (som trots allt har rätt god chans att göra bra optimering), är det rätt grundat för problem för Intel. Vi har pratat om detta förr, och jag står fast vid denna åsikt, då desto mer man ser från dessa företag, ser man att så verkar också vara fallet.

Vet... gör ju ingen förrän produkterna finns på marknaden dock. Intel kan mycket väl bita i kulan och gå med förlust ett tag i hopp om att få ordning på nästa nod. Tror dock ärligt att en sak som diskuteras i dessa nivåer är EUV. Detta är nästa "finFet" eller stora steg. Det är som 3D NAND för SSDn, men för CPUer/GPUer. Den som kan klara den kulan bäst, vinner rätt många nivåer fram, då det är helt nya regler som gäller om jag förstått det rätt.

Skrivet av Yoshman:

Och spelar ingen roll att man inte lyckats öka IPC sedan Skylake (är bara GPU-delen som förändrades i Kaby Lake), ser ändå inte hur det är "bruteforce" då ingen annan x86-design matchar vare sig energieffektivtet, IPC eller maxfrekvens av Coffe Lake. IPC har varit konstant, men det har inte energieffektivitet eller maxfrekvens så man har inte stått still.

Vad är det annars?
Du tvingar upp prestandan, med tvång... genom att pressa frekvenser till maximala du kan, varje generation. Sedan Kaby, har det stått still dock. Skylake till Kaby gjordes förbättringar, men jag har inte tagit Skylake som jämförelse, du har. Kaby är på samma 14++ nod som denna 9000 serie är, med uppskruvade frekvenser och fler kärnor (som du själv säger inte hjälper alla en-trådade ändå).

Ingen tvekan att man gjort tweak och optimering, men alla dessa finns i 7700k precis som i nyare.
Enda skillnaden mellan dessa är Meltdown/Spectre fixen, men då man hittat nya roliga hål, är det lite tidigt att säga att båten inte sjunker, för man har pluggat 2 hål när man inte vet hur många som finns.

Skrivet av Yoshman:

Ice Lake är en ny mikroarkitektur, vi lär med 100 % sannolikhet se högre IPC som vi gjort i alla mikroarkitekturuppdateringar av Core-serien sedan dess introduktion.

Frågan är hur stora förbättringarna blir för generell heltalskod, det är vad som spelar roll för >9 av 10 användare. Är redan klart att SIMD kommer se 50-70 % IPC-förbättring för t.ex. maskininlärning och vetenskapliga program som t.ex. Matlab då redan Cannon Lake fått AVX512, men det är nischer.

Har gjort en verklig IPC mätning (d.v.s har verkligen mätt genomsnittligt antal x86 instruktioner som når "retire" per cykel -> felspekulerade instruktioner räknas inte) på en del fall som är högst relevanta för mig personligen här. Skylake har trots allt 1-13 % högre IPC jämfört med Haswell och alla dessa fall är rena heltalsfall, man ser att på just dessa fall har AMD lite att jobba på med framtida Zen-designer.

Fullt rimligt att förutsätta att Ice Lake kommer ha motsvarande IPC vinst mot Skylake som Skylake har mot Haswell, däremot totalt orimligt att förvänta sig några >30 % på något annat än väldigt speciella områden. Så trots liten IPC-vinst tror jag ändå den blir tillräckligt hög för att Ice Lake i alla fall ska matcha i9-9900K i prestanda per kärna i genomsnitt.

Jaså, var är din källa till detta?
Då processorerna är på ritbordet än, känns detta lika garanterat att säga som att Intels GPU kommer spöa alla... "då de gör alltid det".

Skylake har otroligt marginell förbättring vs Haswell, och ännu mindre vs Broadwell.
Och även om vi säger 5%.... 5% på 5Ghz, är 250Mhz. Så för att ens "matcha" prestandan av 9000 serien, i stock, utan att ens räkna folks överklock som är något alla förväntar sig på Intel trots allt, så behöver du runt 4,75Ghz på 10nm+++. Good luck, när 10nm++ inte ens kan matcha laptops 14nm++. Och notera, 8700k, som var den sista planerade CPUn på 14nm++ var just 4,7Ghz.

Så även med den orealistiska nivån du själv hade blivit förvånad över, och en IPC långt över alla andras förväntningar (som Intel ansett inte varit värt att göra än tydligen), som ger dig 5% bättre... förlorar du ändå med 50Mhz. Därför Intel gick ut och sa just att man får förvänta sig detta. Vi skulle dock få 8 kärnor istället för 6... vilket vi nu lär behöva 10+ för att kompensera. Blir kul o se hur de ska gräva sig ur det hålet. (Då precis som du själv säger, fler kärnor inte lär lösa dessa problem).

Det är dags att plocka huvudet ur sanden och inse verklighetens gränser här. Du jobbar inte för Intels PR, du behöver inte skyffla skitsnack... Vill du hoppas och drömma lite till dock, gör det. Men många börjar nog inse att rök, speglar och ridåer inte är lösningen här. Att mäta IPC vinst i just "ditt ändamål" är inte något som ger andra en vinst.

Skrivet av Yoshman:

x86 kräver "bruteforce" i front-end p.g.a. sin horribla design, men det är inget vare sig Intel eller AMD kan fixa med mindre än att bryta bakåtkompatibilitet. Bortsett från det är Skylake, trots lansering 2015, den mest välputsade x86 mikroarkitekturen som existerar just nu.

Yep...
Och därför sa jag för flera trådar sedan att vi måste börja om.
För "bruteforce" går inte längre. AMD kan dock komma nära Intels nivå, eller i kapp... vilket ju Intel inte vill.

Permalänk
Datavetare
Skrivet av Paddanx:

Vet... gör ju ingen förrän produkterna finns på marknaden dock. Intel kan mycket väl bita i kulan och gå med förlust ett tag i hopp om att få ordning på nästa nod. Tror dock ärligt att en sak som diskuteras i dessa nivåer är EUV. Detta är nästa "finFet" eller stora steg. Det är som 3D NAND för SSDn, men för CPUer/GPUer. Den som kan klara den kulan bäst, vinner rätt många nivåer fram, då det är helt nya regler som gäller om jag förstått det rätt.

En sak som havererar utbyte nu är att fysiken sätter rätt hårda gränser för hur små "features" man kan "rita" med nuvarande våglängd på litografimaskineriet (man kör något strax under 200 nm våglängd). Sättet runt är multipla pass (multi-patterning), varje pass riskerar ha sönder kretsar och i värsta fall kan två pass få fel "offset" mot varandra -> hela kiselplattan i drickat.

Är ju här som Intels 10 nm och TSMC 7 nm skiljer sig, 40 nm MMP är möjligt med "double-patterning", 36 nm MMP kräver "quad-patterning". TSMC gick för 40 nm, Intel och Samsung gick för 36 nm. Samsung satsade på att EUV skulle fungera, Intel satsade på att "quad-patterning" skulle gå att göra "tillräckligt bra". Samsung har redan backat, helt övertygad om att det är ju här Intel "lagat" sin 10 nm genom att backa till 40 nm.

EUV gör det möjligt att gå tillbaka till ett "rit-pass" igen.

Skrivet av Paddanx:

Vad är det annars?
Du tvingar upp prestandan, med tvång... genom att pressa frekvenser till maximala du kan, varje generation. Sedan Kaby, har det stått still dock. Skylake till Kaby gjordes förbättringar, men jag har inte tagit Skylake som jämförelse, du har. Kaby är på samma 14++ nod som denna 9000 serie är, med uppskruvade frekvenser och fler kärnor (som du själv säger inte hjälper alla en-trådade ändå).

Tja, t.ex. så har man optimera tillverkningen så att man kretsarna drar mindre ström vid fixerad frekvens alt. går att klocka högre. Vänta, brukar man inte höra det som fördel någon annanstans?

Har redan skrivit det: Intel behöver sin 10nm väldigt snart, men det är primärt för att kunna bygga ännu fetare server-kretsar samt för att man inte hade en reservplan kring att bli fast på 14 nm så man kan t.ex. inte släppa Ice Lake innan man når 10 nm.

En av Intels chefer för kretstillverkning, Dr. Venkata (Murthy) Renduchintala, har redan sagt att tick/tock är helt död och man i framtiden ska pressa ur långt mer ur varje nod: d.v.s. vi kommer få se långt fler än en mikroarkitekturuppdatering på 10 nm.

Skrivet av Paddanx:

Ingen tvekan att man gjort tweak och optimering, men alla dessa finns i 7700k precis som i nyare.
Enda skillnaden mellan dessa är Meltdown/Spectre fixen, men då man hittat nya roliga hål, är det lite tidigt att säga att båten inte sjunker, för man har pluggat 2 hål när man inte vet hur många som finns.

Hål som i två av tre fall (om vi håller oss till den ursprungliga rapporten) drabbade varenda "out-of-order" design som existerar. Meltdown var den lättaste att laga i HW (och Meltdown drabbade även POWER och någon enstaka ARM, bl.a. Apples).

Ser inte riktigt hur Intel är ensam om att stå att skyffla vatten ur båten just nu...

Skrivet av Paddanx:

Jaså, var är din källa till detta?
Då processorerna är på ritbordet än, känns detta lika garanterat att säga som att Intels GPU kommer spöa alla... "då de gör alltid det".

Skrev ju att Cannon Lake är ute, redan där finns AVX512. Tror gissningen att man inte tar bort det i Ice Lake inte är allt för vågad. Inte heller gissningen att generell IPC kommer vara högre, vad vore poängen att överhuvudtaget ta fram designen vara annars?

Skrivet av Paddanx:

Skylake har otroligt marginell förbättring vs Haswell, och ännu mindre vs Broadwell.
Och även om vi säger 5%.... 5% på 5Ghz, är 250Mhz. Så för att ens "matcha" prestandan av 9000 serien, i stock, utan att ens räkna folks överklock som är något alla förväntar sig på Intel trots allt, så behöver du runt 4,75Ghz på 10nm+++. Good luck, när 10nm++ inte ens kan matcha laptops 14nm++. Och notera, 8700k, som var den sista planerade CPUn på 14nm++ var just 4,7Ghz.

Haswell och Broadwell är identisk så när som på en enda sak när det kommer till generell heltalskod: ADX (snabbar upp beräkningen med väldigt stora heltal, så viktigt för asymmetriska krypto t.ex.).

Har inte kunna hittat att man ändrade storleken på "out-of-order" fönstret eller ändrade andra saker som kan öka IPC rent generellt mellan Haswell och Broadwell, det var ju ett "tick". D.v.s. i stort sätt samma mikroarkitektur på en ny nod.

Finns lite småoptimeringar som påverkar skalära flyttal i Broadwell, vilket borde ge någon procent boost i t.ex. Cinebench.

Skrivet av Paddanx:

Så även med den orealistiska nivån du själv hade blivit förvånad över, och en IPC långt över alla andras förväntningar (som Intel ansett inte varit värt att göra än tydligen), som ger dig 5% bättre... förlorar du ändå med 50Mhz. Därför Intel gick ut och sa just att man får förvänta sig detta. Vi skulle dock få 8 kärnor istället för 6... vilket vi nu lär behöva 10+ för att kompensera. Blir kul o se hur de ska gräva sig ur det hålet. (Då precis som du själv säger, fler kärnor inte lär lösa dessa problem).

5 % högre generell prestanda motsvarar ~235 MHz i de frekvenser vi pratar om här.

Ser inte hur 5 % är orealistiskt, det är rätt lite givet att vi ändå fick "upp till 5 %" (enligt Intel) mellan Haswell och Broadwell, det trots att det finns noll saker som påverkar generell heltalsprestanda utan bara sådan som påverkar flyttalsprestanda och heltalsprestanda i ett väldigt specifikt fall (där blir dock vinsten tiotal procent).

Intels huvudvärk är att ARM-nissarna börjar nu ta sig förbi och de förväntar sig fortfarande ett par uppdateringar till med >10 % bättre IPC. Tror i.o.f.s. det kommer plana av vid ~30 % högre IPC över samtida x86 Intel. Det är vad en långt bättre ISA realistiskt kan ge om vi antar att Intel redan har en väldigt nära optimal mikroarkitektur (att Apple planat ut tyder på att inte heller de kan riktigt komma förbi Intels IPC om man drar bort Aarch64 bonusen).

Problemet är att 30 % med dagens takt motsvarar rätt många års försprång!

Skrivet av Paddanx:

Det är dags att plocka huvudet ur sanden och inse verklighetens gränser här. Du jobbar inte för Intels PR, du behöver inte skyffla skitsnack... Vill du hoppas och drömma lite till dock, gör det. Men många börjar nog inse att rök, speglar och ridåer inte är lösningen här. Att mäta IPC vinst i just "ditt ändamål" är inte något som ger andra en vinst.

Om du skulle titta lite på flaskhalsar i moderna program skulle rätt snabbt inse att likheterna är långt större än skillnaderna så länge man jämför saker där flaskhalsarna är att köra skalär heltalskod. Vilket gäller en förkrossande majoritet av alla program.

Cinebench, Matlab och liknande är uddafåglarna då de inte har skalära heltal som flaskhals. Tyvärr testas dessa udda fall ofta långt mer än de generella fallen, tur det alltid finns spel i 1280x720 för de har relativt god överensstämmelse med prestanda för kompilering, MS Office, webläsare etc då flaskhalsen i alla lägen är skalära heltal.

Tycker du någon som anser att "ju snabbare x86 förlorar mark mot ARM och RISC-V, desto bättre" är en bra PR-man för Intel? Borde ändå framgå att det är min primära åsikt för CPUer, men just här diskuterar vi x86-sandlådan.

Skrivet av Paddanx:

Yep...
Och därför sa jag för flera trådar sedan att vi måste börja om.
För "bruteforce" går inte längre. AMD kan dock komma nära Intels nivå, eller i kapp... vilket ju Intel inte vill.

Varför skulle man börja om?

Det har aldrig slagit dig att det finns ett teoretisk max för IPC, ett tak man inte kommer igenom om man så startar om från scratch oändligt antal gånger. Självklart inte något garanti att Intel hittat det optimala receptet, men är ju inte någon annan som ens lyckats matcha där man är redan nu med Skylake (på x86).

AMD har gjort ett ganska kritiskt designval i Zen som gör det extremt svårt för dem att matcha Intels IPC: distribuerad schemaläggning av heltals- och minnesinstruktioner. Nästan alla förutom Intel kör med det, på t.ex. 64-bitars ARM kan man komma runt nackdelarna genom att skapa en extremt bred front-end.

Intel använder en distribuerad schemalägga i Atom (som man nu på slutet faktiskt ökat IPC rätt rejält på).

Vid en given teoretisk maxkapacitet gäller alltid att en central schemaläggning av instruktioner kommer ge lika eller högre IPC som en distribuerad schemaläggning om allt annat är lika. Central schemaläggning är mer komplicerad och kostar därför fler transistorer, det är nackdelen.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Yoshman:

En sak som havererar utbyte nu är att fysiken sätter rätt hårda gränser för hur små "features" man kan "rita" med nuvarande våglängd på litografimaskineriet (man kör något strax under 200 nm våglängd). Sättet runt är multipla pass (multi-patterning), varje pass riskerar ha sönder kretsar och i värsta fall kan två pass få fel "offset" mot varandra -> hela kiselplattan i drickat.

Är ju här som Intels 10 nm och TSMC 7 nm skiljer sig, 40 nm MMP är möjligt med "double-patterning", 36 nm MMP kräver "quad-patterning". TSMC gick för 40 nm, Intel och Samsung gick för 36 nm. Samsung satsade på att EUV skulle fungera, Intel satsade på att "quad-patterning" skulle gå att göra "tillräckligt bra". Samsung har redan backat, helt övertygad om att det är ju här Intel "lagat" sin 10 nm genom att backa till 40 nm.

EUV gör det möjligt att gå tillbaka till ett "rit-pass" igen.

EUV kommer ju dock precis som 3D NAND inte lösa problemet dock, bara flytta "fysiska väggen" lite framåt. Det kan dock köpa rätt många noder till med liknande tekniker som nu.

Det låter dock troligt att Intel kommer tvingas modifiera (till sämre eller bättre) för att kunna klara av sin tillverkning av 10nm. Frågan är dock vad denna får för konsekvenser vs andra noder.

Skrivet av Yoshman:

Tja, t.ex. så har man optimera tillverkningen så att man kretsarna drar mindre ström vid fixerad frekvens alt. går att klocka högre. Vänta, brukar man inte höra det som fördel någon annanstans?

Har redan skrivit det: Intel behöver sin 10nm väldigt snart, men det är primärt för att kunna bygga ännu fetare server-kretsar samt för att man inte hade en reservplan kring att bli fast på 14 nm så man kan t.ex. inte släppa Ice Lake innan man når 10 nm.

En av Intels chefer för kretstillverkning, Dr. Venkata (Murthy) Renduchintala, har redan sagt att tick/tock är helt död och man i framtiden ska pressa ur långt mer ur varje nod: d.v.s. vi kommer få se långt fler än en mikroarkitekturuppdatering på 10 nm.

Vet inte var det sagts som fördel.. har hört det från Intel sedan 22nm iaf när man gick till Ivy/haswell och inte kunde nå samma nivå som Sandy längre. Skulle inte förvåna mig om fler har gjort samma dock, då det är enklast att fixa.

Sen är ju frågan... är det nog för att fixa det? (alltså hoppet mellan noders ökad komplexitet)

Skulle säga att de behöver 10nm för många andra anledningar också. Hela deras tillverkningsschema har ju gått åt pipan nu, därav de går till TSMC tom, men även de har ju inte kapacitet att bara ta in allt och alla. Sen är det ju en kostsam process att behöva designa om befintliga kretsar och outsourca det...

Och ärligt har jag inget emot fler uppdateringar på en nod. Men du kan inte förvänta dig att uppfinna hjulen vid varje generation då. Det blir inte lönt att köpa nytt, om det inte är en uppgradering som gynnar alla över det gamla. Då blir det istället en "det är 1% bättre för mig" mätning som vi har argumenterat ett bra tag om, och dessa är extremt specifika, och ofta långt från ekonomiskt vettiga för alla utom "pappa/företaget betalar".

Skrivet av Yoshman:

Hål som i två av tre fall (om vi håller oss till den ursprungliga rapporten) drabbade varenda "out-of-order" design som existerar. Meltdown var den lättaste att laga i HW (och Meltdown drabbade även POWER och någon enstaka ARM, bl.a. Apples).

Ser inte riktigt hur Intel är ensam om att stå att skyffla vatten ur båten just nu...

Har inte påstått att de är de enda som skyfflar vatten... alla gör det. Skillnaden är att de andra kan fortfarande göra rätt stora förbättringar då de inte har nått teoretiska max av potentialen på sina kretsar. Intel nådde den för ett tag sedan imho, och nu handlar det mer om att polera med 10000 sandpapper i hopp om att man får lite mer glans.

Så enda som förlorar här är ju Intel, då när kunderna "tvingas" köpa nytt för att få bort allas buggar (om det nu är en faktor) så tittar man ju också på alternativ. För buggarna och deras fix kan ofta riskera ta samma vinst som du nyss fick från senaste generationens design. Så det är 1 steg fram, 1 steg bakåt, tills hålen är fixade, och då menar jag alla (vilket du troligen kan komma överens med, lär aldrig ske).

Och problemet är ju att alla... är i riskzonen för fler.
https://www.wired.com/story/speculative-store-bypass-spectre-...
https://www.sweclockers.com/nyhet/25439-nytt-sakerhetshal-upp...

Och överdriv inte nu. Säger inte att "Intel är skit.... de har ett hål till." (något du verkar besatt av att anta jag säger, när jag inte säger något specifikt)
Utan att vi vet verkligen inte hur många hål som finns, eller vem som har dem, vi vet bara att då alla letar efter dem, lär fler hål och mer vatten komma. Så att köpa en CPU idag "för den ska vara okej i 5 år"... kan vara ett problem. Vi vet inte än.

Skrivet av Yoshman:

Skrev ju att Cannon Lake är ute, redan där finns AVX512. Tror gissningen att man inte tar bort det i Ice Lake inte är allt för vågad. Inte heller gissningen att generell IPC kommer vara högre, vad vore poängen att överhuvudtaget ta fram designen vara annars?

Haswell och Broadwell är identisk så när som på en enda sak när det kommer till generell heltalskod: ADX (snabbar upp beräkningen med väldigt stora heltal, så viktigt för asymmetriska krypto t.ex.).

Har inte kunna hittat att man ändrade storleken på "out-of-order" fönstret eller ändrade andra saker som kan öka IPC rent generellt mellan Haswell och Broadwell, det var ju ett "tick". D.v.s. i stort sätt samma mikroarkitektur på en ny nod.

Finns lite småoptimeringar som påverkar skalära flyttal i Broadwell, vilket borde ge någon procent boost i t.ex. Cinebench.

5 % högre generell prestanda motsvarar ~235 MHz i de frekvenser vi pratar om här.

Ser inte hur 5 % är orealistiskt, det är rätt lite givet att vi ändå fick "upp till 5 %" (enligt Intel) mellan Haswell och Broadwell, det trots att det finns noll saker som påverkar generell heltalsprestanda utan bara sådan som påverkar flyttalsprestanda och heltalsprestanda i ett väldigt specifikt fall (där blir dock vinsten tiotal procent).

Vilket ändå gör det jag säger... man polerar med extremt fint sandpapper här, och i vissa kanter (eller situationer/instruktioner) kan du säkert vinna %. Men inget kommer ge dig 10 FPS till. Inget kommer göra att Windows startar snabbare. Eller göra att WU blir mindre störigt.

Så frekvensen är den enda saken som verkligen gör denna påverkning än, även om den så är 100Mhz mer, gör den enormt mer skillnad än alla dina special fall för majoriteten av användare.

Så fortsätt du polera... jag är inte imponerad, då jag vet att det är lika idiotiskt som Intel PR.
Så snälla sluta sälj Skylake som någon 5% förbättring, då det i många fall pga andra faktorer (RAM, BUSS osv) är sämre prestanda för det som spelar roll. Du kan säkert hitta fall där AMD/ARM är snabbare också, men jag ser bara relevansen om jag ser något jag vinner på det. Och Skylake var en ren förlust på rätt många sätt.

Skrivet av Yoshman:

Intels huvudvärk är att ARM-nissarna börjar nu ta sig förbi och de förväntar sig fortfarande ett par uppdateringar till med >10 % bättre IPC. Tror i.o.f.s. det kommer plana av vid ~30 % högre IPC över samtida x86 Intel. Det är vad en långt bättre ISA realistiskt kan ge om vi antar att Intel redan har en väldigt nära optimal mikroarkitektur (att Apple planat ut tyder på att inte heller de kan riktigt komma förbi Intels IPC om man drar bort Aarch64 bonusen).

Problemet är att 30 % med dagens takt motsvarar rätt många års försprång!

Vilket är exakt vad jag försökt säga i antal inlägg nu med Intels nod och utveckling. Det andra kommer i kapp förr eller senare. I vissa situationer helt klart snabbare, då de inte alltid är x86 beroende. (Vi skulle dock inte diskutera individuella CPUer i en tråd om noder)

Skrivet av Yoshman:

Om du skulle titta lite på flaskhalsar i moderna program skulle rätt snabbt inse att likheterna är långt större än skillnaderna så länge man jämför saker där flaskhalsarna är att köra skalär heltalskod. Vilket gäller en förkrossande majoritet av alla program.

Cinebench, Matlab och liknande är uddafåglarna då de inte har skalära heltal som flaskhals. Tyvärr testas dessa udda fall ofta långt mer än de generella fallen, tur det alltid finns spel i 1280x720 för de har relativt god överensstämmelse med prestanda för kompilering, MS Office, webläsare etc då flaskhalsen i alla lägen är skalära heltal.

Och då är vi där...
Början på slutet, där vi inte kan få mer prestanda. Önskar bara du kunde skriva det mer kortfattat...

Skrivet av Yoshman:

Tycker du någon som anser att "ju snabbare x86 förlorar mark mot ARM och RISC-V, desto bättre" är en bra PR-man för Intel? Borde ändå framgå att det är min primära åsikt för CPUer, men just här diskuterar vi x86-sandlådan.

Varför skulle man börja om?

Du har svarat bra på din egen fråga. Läs din egen text.
x86 som den är idag, har snart nått vad den kan. Och med konkurrenter närmande, så är det väl en fråga om vi kanske behöver slänga gamla 16/32 bitars grunden och göra det Intel ville från början... IA64. Det skulle ju dock göra att Intel tappar sin kontroll över vem som tillverkar... och de vill de ju inte. Så de lär väl pressa på x86 tills det är ikapp/omkört av annat.

Skrivet av Yoshman:

Det har aldrig slagit dig att det finns ett teoretisk max för IPC, ett tak man inte kommer igenom om man så startar om från scratch oändligt antal gånger. Självklart inte något garanti att Intel hittat det optimala receptet, men är ju inte någon annan som ens lyckats matcha där man är redan nu med Skylake (på x86).

Det har aldrig slagit dig att jag redan insett detta och skriver som jag gör pga det?
Det är som sagt inte jag som hoppas och hävdar 5% bara för att. Det är inte jag som hävdat att det ska bli förbättringar.

Skrivet av Yoshman:

AMD har gjort ett ganska kritiskt designval i Zen som gör det extremt svårt för dem att matcha Intels IPC: distribuerad schemaläggning av heltals- och minnesinstruktioner. Nästan alla förutom Intel kör med det, på t.ex. 64-bitars ARM kan man komma runt nackdelarna genom att skapa en extremt bred front-end.

Intel använder en distribuerad schemalägga i Atom (som man nu på slutet faktiskt ökat IPC rätt rejält på).

Vid en given teoretisk maxkapacitet gäller alltid att en central schemaläggning av instruktioner kommer ge lika eller högre IPC som en distribuerad schemaläggning om allt annat är lika. Central schemaläggning är mer komplicerad och kostar därför fler transistorer, det är nackdelen.

Tror inte de behöver matcha den heller. De behöver bara komma nära nog, för Intel kan inte heller göra mycket

AMD kan dock tillverka likadana kärnor för hela sin range, i mindre paket. Och då kostnaderna är idag 10x mer viktiga än någonsin i tillverkning, ser jag ändå Intel som förloraren här. Men snälla... inte AMD vs Intel tråd. Håll dig till topic.

Permalänk
Medlem

@SeF.Typh00n: Läste du mitt inlägg? Hur hade du tänkt att intel ska konkurrera med AMD de närmaste åren? Berätta gärna.

Permalänk
Avstängd
Skrivet av DGS:

@SeF.Typh00n: Läste du mitt inlägg? Hur hade du tänkt att intel ska konkurrera med AMD de närmaste åren? Berätta gärna.

Ja, men det är inte det som är relevant. Intel står inte och faller på att dom fortsätter på 14nm.

AMD har nu gjort flera bra produkter men har knappast en lösning för alla problem och situationer vilket Intel har. Styrkan av själva varumärket Intel har jag redan nämnt (vilket i sig är enormt påverkande). Men utöver det är detta ett par delar AMD inte kan möta Intel på:

  • Intel har supporten och helhetslösningar

  • Intel har FPGA-integrationer

  • Intel har möjligheten att deala fram enorma volymbeställningar av sina processorer

  • Intel har stora licenskostnadsfördelar.

  • Intel har superspecialiserade SKUer

  • Xeon Platinum står änsålänge utan någon konkurrens

AMD har en styrka i HPC och typ VDI. Eventuellt kanske dom dyker upp mer i Azure, Google Cloud, AWS och liknande men det kommer ta enorm tid och där ARM kommer bli och egentligen är redan en oerhört kraftig konkurrent. De stora molnföretagen som Facebook och Ebay bygger redan custom SoCs och kompletta lösningar så där finns det ingen marknad att ta.

Alla andra segment inom enterprise har Intel ett väldigt starkt grepp om. Byta ut miljöer är heller inte genomfört i en handvändning vilket jag nämnt innan. Du kan inte bara börja peta in Epyc-servrar och förvänta dig att kunna flytta maskiner bara sådär.

Och om vi sen tar en snabbkik på konsumentmarknaden:

  • Intels ULV är utan konkurrens. Inget händer där förrän Ryzen klarar höga temperaturer

  • Intel lanserar fortfarande de "snabbaste" processorerna i de mängdsäljande sortimenten. Dvs där en/fåkärnig prestanda regerar.

  • Intels starka närvaro kommer återigen fram. Exklusiva affärer och standard Intelpraxis som vi alla vet om.

Eftersom där finns så lite konkret och bekräftat info om Zen 2 så är det svårt att säga vad som kommer hända efter det. Men om vi nu säger att det blir en klockren produkt och klart bättre än Intel kommer det fortfarande vara extremt svårt att ta över avtalen eller att klämma in sig hos företagen. Det märks ju redan idag att Ryzen och Epyc är knappt representerade i produktalternativen.

Dell Optiplex med Ryzen? Nope.
HP Elitedesk med Ryzen? Ett par A-processorer i low-end segmentet.
Lenovo ThinkCentre? Nope. En av fyra SFF modeller!

Min poäng är att AMD fortfarande är väldigt nischat. Dom har inte ett utvecklat och integrerat helhetssystem som vPro exempelvis är.

Jag har själv beställt ett par Epyc-servrar, men även där finns det inte kompletta ersättare till motsvarande Intel-system. Det saknas ofta en hel del med komponentalternativ.

Förstå mig rätt, om Zen 2 blir bra tror jag många entusiaster kommer byta. Jag har själv siktat in mig på att köpa den generationen för att byta ut min åldrande 5960X. Intel kommer få mer konkurrens än innan, men dom sitter idagsläget med bland annat 99% av servermarknaden för sig själva. Bara det säger att det kommer ta lång tid innan den kurvan kommer vända neråt och bli ett problem. Samma princip med desktop.

Visa signatur

R7 3700X | X570 Aorus Master | 32GB | EVGA 1080 Ti FTW3 | Noctua NH-D15S | FD Meshify C Copper
R7 1700 | X370 Gaming-ITX | 16GB | RX Vega 64 LE | Noctua U12S | Node 304
2 x HPE ProLiant Microserver Gen 8 | 1265L V2 | 16GB | 20TB