Skrivet av Mooter:
Nej det stämmer helt enkelt inte, du får tänka såhär: hur kan man skapa någonting som gör det möjligt att fortsätta höja throughput på servermodeller? Desktop får hänga med tyvärr, mer resurser än så finns inte, och k10 arkitekturen var väldigt maxad redan med 12-core magny-cours, tvivlar på att 32nm hade räckt för att kunna klämma ur tillräckligt mycket ur denna arkitektur. Speciellt inte som 32nm yielden ser ut.. Sen kvarstår frågan, vad man ska göra med k10 efter den är krympt till 32nm, K10 har hängt med mycket länge och är tweakad till max.
Så FX är inte allt man hoppats på nu, men det är åtminstone en väg framåt. (jag säger FX för vi vet fortfarande inte hur Valencia och Interlagos presterar)
En nodövergång har inget att göra med hur maxad en arkitektur är, en nodövergång sänker värmeutveckling och kostnader samt ökar frekvenstak. Phenom II kan utan problem ta till vara på detta. Och en arkitektur blir inte bara maxad så där utan vidare om den inte är väldigt felbyggd från början. Titta på Core i7 som är byggd på gamla Pentium Pro. Man kan byta ut olika delar av processorn vid varje förbättring löpande, vissa gånger med större ingrepp än andra såklart, så en bestämd arkitektur behöver inte ta stopp sådär. Allra helst inte som Phenom II är en väldigt "otweakad" arkitektur jämfört med konkurrensen. De har bara gjort småtweak och aldrig ändrat något övergripande. Samma ALU:er och FPU:er som i K7 från 1999. De har ökat bitbredden och pillat på prefetchers och lagt till stöd för fler instruktioner men det är nästan allt de gjort i kärnan. Integrerat minneskontroller och byggt på L3 utanpå det. Inte alls de förändringar de skulle kunna göra. Under samma tid har Intel gjort väldigt stora förändringar och gått upp till 4-issue från 3-issue på samma grundarkitektur. Så att det skulle ta stopp sådär stämmer inte alls. Bulldozers FPU:er och ALU:er är fortfarande rätt lika Phenom II.
Dessutom så påstår AMD att de haft Bulldozer klart ursprungligen redan till 45nm men att de valde att vänta till 32nm för att tweaka den ytterligare. De borde alltså sett i god tid att deras arkitektur inte ens har hälften av prestandan per mm² eller per transistor jämfört med Phenom II. Även om de fördubblar prestandan så är de inte mer än ikapp Phenom II i effektivitet. För att inte nämna prestanda per watt. Bulldozer har tydliga kännetecken från en trasig arkitektur, det är inget man tweakar bort. Intel försökte med P4 men fick ge upp och gick tillbaka till föregångaren igen, och då hade P4 ändå bättre grundförutsättningar än vad Bulldozer har.
Phenom II behövde snabbare cachearkitektur, större issue width, och breddad x87 enhet. När de gick från 80bit till 128bit fördubblades nästan den fysiska storleken och det fördubblade SSE-prestanda, hade de gått hela vägen till 2x80bit hade det inte blivit mycket större ytmässigt men stått sig bättre mot i7 som vinner stort i spel på grund av detta, 2x128bit/256bit FMAC hade varit guld och faktiskt fått plats med god marginal både ytmässigt och värmemässigt på 32nm. Med lite innovation kanske de skulle kunna få en sådan enhet att klara 3x80bit också. Under alla år de utvecklat Bulldozer hade de kunnat göra detta och mer därtill, men Bulldozer har stulit en väldig massa tid.
Det man gjort med Bulldozer är att försämra både cache och praktisk issue width. Samtidigt som man förvisso fördubblat FPUn men låter "kärnor" dela på den. Man har i frekvensjakt förstört processorns förmåga i grunden att ha god IPC. Du kan inte laga detta med bättre frontend eller bättre scheduler. Du måste öka vidden på processorn igen, och hela pipelinen och cachestrukturen är byggd för frekvens. Cachen är av sämre write through-typ med skyhöga latenser och pipelinen har delats upp i fler steg. Samma saker du måste göra för att Phenom II ska bli riktigt konkurrenskraftig måste du alltså göra bara för att få Bulldozer duglig, och för att det ens ska vara möjligt måste du avsäga dig frekvensdesignen som hela bulldozer bygger på.
Man tycker att de borde lärt sig att frekvenser över 3GHz inte är värt effektutvecklingen och att IPC har varit kung sedan 2003. Att göra en arkitektur ruskigt ineffektiv i jakt på högre frekvenser var oförutseende när Intel gjorde det 2000, men nu när resultatet setts så är det galenskap 2011.
Bulldozer är helt enkelt för smalt byggd på grund av frekvensjakt för att ordentlig IPC ska vara särskilt enkelt att bygga in. Då är Phenom II bättre lämpad för det. Samtidigt så är utrymmet litet för att få igen prestandan genom höga frekvenser. 5.5-6GHz eller mer i en konsumentprocessor för att matcha i7 är inte rimligt.
Skrivet av Ratatosk:
Win 8 räcker inte för BD det är sant, men kanske för Piledriver.
Hacken brukar vara för korta för att de skall ses i min fps.
Jag tänker närmast på alla som rapporterar att de får mindre "stuttering" när de slår av HT.
Jag har letat efter ett test med tidsgrafer (där hacken syns), för 2600K HT vs 2600K utan HT, men ännu inte hittat något.
Piledriver kommer inte göra något åt BDs smala grundarkitektur, och jag tvivlar på att Piledriver kan ge de riktigt höga frekvenser som behövs för att få in BD i spelet, allra helst inte med den värmeutvecklingen. Visst kan de göra IPC förbättringar, men någon god IPC kommer BD aldrig ha, och något nämnvärt frekvensövertag att kompensera med är drömmar.