Som en del av SweClockers 25-årsfirande blickar vi, eller ja rent krasst jag, tillbaka på några av de stora händelserna som skett på hårdvarumarknaden sedan 1999. I den förra delen handlade det om det Nvidia kallade för "den första GPU:n" i och med lanseringen av det första grafikkortet i Geforce-familjen, och när vi nu korsar strecket för millennieskiftet tänkte jag istället skifta över fokus mot processorer och specifikt en arkitektur som skulle påverka Intels position under många år framöver.

KL_Intel_Pentium_III_Coppermine.jpg

Intel Pentium III "Coppermine" var mitt processorval år 2000. Bildkälla: Konstantin Lanzet (CC BY-SA 3.0)

Vi kan börja med att beskriva processorlandskapet i början av år 2000, där detta var extremt spännande och konkurrenskraftigt. Mot slutet av 1990-talet accelererade utvecklingen enormt sett till uppnådda klockfrekvenser och prestanda på processormarknaden. Tittar vi exempelvis på år 1997 så uppnådde Intels Pentium II-processorer 300 MHz – en nivå som även AMD träffade tätt därefter med K6-familjen. Två år senare hade båda bolagen modeller som rullade i 1 000 MHz – helt galet!

Gigahertz-gränsen spräcktes av AMD:s Athlon tätt följt av Intels Pentium III, och det var med dessa två processorfamiljer som de båda bolagen äntrade år 2000 i en väldigt jämn prestandakamp. Vägen framåt skulle dock se väldigt olik ut företagen emellan, där AMD såg en stark framtid för Athlon med ytterligare skalbarhet uppåt på klockfrekvensstegen ihop med nodkrympningar. Intel såg istället Pentium III som en återvändsgränd och arbetade därför med att koka ihop något helt nytt.

Intels arkitektur Netburst och löftet om att nå 10 GHz inom fem år

Med Pentium III förlitade sig Intel på mikroarkitekturen P6 som introducerades med Pentium Pro redan år 1995. Givetvis hade det skett förbättringar rent arkitekturellt och tillverkningstekniskt på vägen, vilket placerade Pentium III som en väldigt stark processorfamilj för sin tid sett till prestandan som uppnåddes per klockcykel. Intel förutspådde dock redan på Pentium II-tiden att klockfrekvenstaket för P6-arkitekturen närmade sig, och därför behövdes radikala förändringar.

p4_die_slide.webp

Pentium 4 blev först ut med att använda den nya arkitekturen Netburst. Bildkälla: Wikichip

Dessa förändringar stavades arkitekturen Netburst, vilken introducerades för första gången ihop med processorfamiljen Pentium 4 i november år 2000. Netburst skiljde sig enormt från sin föregångare P6 och var framtagen för att "hyperaccelerera" utvecklingen gällandes klockfrekvenser. Budskapet från Intels sida var tydligt – Netburst, ihop med periodiska nodkrympningar, skulle möjliggöra bolaget att ta sina processorer bortom 10 GHz inom loppet av fem år.

Med facit i hand vet vi att så aldrig blev fallet.

Högre klockfrekvenser men i många fall avsevärt sämre IPC

För att uppnå högre klockfrekvenser med Pentium 4 introducerade arkitekturen Netburst det Intel kallade för "Hyper Pipelined Technology". Detta är marknadsföringslingo för en förlängd instruktions-pipeline, där de första Pentium 4-processorerna hade en pipeline i 20 steg – dubbelt upp mot Pentium III med sina 10 steg. I praktiken innebar detta att Pentium 4 utförde färre instruktioner per klockcykel än Pentium III, men att det hela skulle kompenseras med betydligt högre klockfrekvenser.

image-5.webp

Netburst dubblerade antalet steg i sin pipeline. Bildkälla: Chips & Cheese

Likt många andra moderna processorer förlitade sig Pentium 4 på att kunna "gissa" vilken instruktion som skulle komma att exekveras härnäst med hjälp av en branch prediction-enhet. Netburst hade en kraftigt förbättrad branch prediction-enhet ställt mot P6, vilken i många fall kunde göra ett bra jobb med att gissa nästa operation – och i synnerhet när det kom till mer förutsägbara flyttalsoperationer. När allt gick som det ska kunde därför Pentium 4 distansera sig ytterligare från Pentium III.

Problemet är att en branch prediction-enhet inte kan trolla, och att vissa typer av instruktioner helt enkelt är väldigt svåra att förutspå. Medan Pentium III må ha gissat fel fler gånger än Pentium 4 så hade den underliggande arkitekturen endast 10 pipeline-steg att gå igenom vid en felgissning. Pentium 4 hade i sin tur ett dubblerat antal steg i sin pipeline, vilket innebar ett en felgissning kunde ge grova prestandastraff – något som också visade sig i många heltalsintensiva arbetslaster.

Framstressade Willamette, dyra minnen och en död plattform

Arkitekturen Netburst red som sagt mycket på sin förmåga att uppnå höga klockfrekvenser för att kunna distansera sig prestandamässigt från konkurrenterna. Detta var dock inte något som infriades vid lanseringen av Pentium 4 år 2000, då toppmodellen landade på 1,5 GHz. Detta var visserligen högre än Pentium III och AMD:s Athlon, som vid den tiden toppade ut vid 1 GHz respektive 1,2 GHz, men då IPC:n hos Netburst var så pass reducerad övertygande inte prestandan nämnvärt.

KL_Intel_Pentium_4_Wilamette.jpg

De första Pentium 4-processorerna toppade ut vid 1,5 GHz. Bildkälla: Konstantin Lanzet (CC BY-SA 4.0)

Intel var redan försenade med att introducera Netburst på marknaden, och många menar att det som släpptes år 2000 var en framstressad produkt som tvingades fram till följd av en ökande konkurrens från AMD:s Athlon och Pentium III-processorernas oförmåga att uppnå högre klockfrekvenser. De första Pentium 4-processorerna baserades på Willamette-kärnan, vilket likt den tiden Pentium III-processorer tillverkades på 180 nanometer – något som var en stoppkloss för frekvenserna.

Ovanpå detta tog de första processorerna plats på en dyr plattform utan någon direkt framtid. Sockel 423 som användes skulle redan nästa år ersättas av den långlivade sockel 478 samtidigt som den tillhörande styrkretsen i850 endast hade stöd för den ganska obskyra minnesstandarden RDRAM från Rambus. RDRAM hade helt klart sin styrka sett till sin klassledande minnesbandbredd ställt mot den tidens SDR och DDR, men priset var alldeles för högt för att nå en bred publik.

MR18R0828BN1-CG6.jpg

RDRAM var snabbt men snordyrt. Bildkälla: Mister rf (CC BY-SA 4.0)

Priserna för RDRAM var så pass höga att Intel vid lanseringen av Pentium 4 valde att svälja en del av kostnaden genom att bundla två 64 MB-moduler av minnestypen med varje såld processor. Detta gjorde dock sitt avtryck på processorernas slutpris till konsument, där 1,5 GHz-varianten låg på hissnande 819 USD – något som gjorde att många valde att satsa på den mer prisvärda föregångaren Pentium III eller AMD:s Athlon istället.

AMD byter marknadsföringsstrategi och introducerar PR-märkningen

Pentium 4-processorernas misslyckande är egentligen ganska avgränsat till den ursprungliga lanseringen i november år 2000. Året efter skiftade Intel över till den nya sockeln 478 och introducerade stöd för billigare SDRAM-minnen med styrkretsen 845 – något som ihop med prissänkningar på processorerna och högre klockade modeller gjorde att Pentium 4 hittade in på allvar i mainstream-segmentet – till konkurrenten AMD:s stora förtret.

Som många kan förstå hade Intel en stark marknadsföringsmässig fördel över AMD vid denna tid sett till vilka klockfrekvenser bolaget lyckades uppnå med sina Pentium 4-processorer ställt mot Athlon. Vanliga konsumenter hade ingen susning om vad IPC var för något, och därför gick många helt enkelt på "högre siffra är lika med högre prestanda". AMD var väldigt medvetna om detta, och därför frångick de att marknadsföra sina processorer med klockfrekvenser.

KL_AMD_Athlon_XP_Palomino.jpg

Athlon XP 2000+, lika snabb som en Pentium 4 vid 2 GHz? Bildkälla: Konstantin Lanzet (CC BY-SA 3.0)

Från och med introduktionen av Athlon XP år 2001 började AMD använda sig av ett PR-system (performance rating) för sina processorer, där modellnamnet då skulle återspegla vilken Pentium 4-processor som den aktuella Athlon-varianten presterade likvärdigt med. Som ett exempel skulle då en Athlon XP 1800+ prestera likvärdigt med en Pentium 4 vid 1,8 GHz, trots att den förstnämnda bara rullade i 1,53 GHz – något som ofta stämde till följd av den högre IPC:n hos Athlon-processorn.

Detta PR-system mottogs inte direkt väl av entusiastkåren, då många kände att det bara maskerade processorernas faktiska klockfrekvens och skapade förvirring. Så här i efterhand känns ommärkningen dock ganska nödvändig för bolaget för att hävda sig på marknaden, samtidigt som det i slutändan ändå skulle bli vägen fram för såväl AMD och Intel att använda modellnamn snarare än klockfrekvenser när processorer med flera kärnor äntrade marknaden flera år senare.

Prolog – Netbursts död och P6-arkitekturens återkomst

Pentium 4 och Netburst-arkitekturen hade en minst sagt skakig start men lyckades ändå under vissa punkter av sina sex levnadsår hitta in i entusiasternas, och mitt eget, hjärta. Mitt varmaste minne är utan tvekan introduktionen av Northwood-kärnan år 2002, vilken tillverkades på Intels krympta 130 nanometers-process och därmed kunde uppnå betydligt högre klockfrekvenser än tidigare. Ihop med god överklockningspotential och stöd för snabba men billiga DDR-minnen blev det en favorit.

Intel fortsatte jaga drömmen om skyhöga klockfrekvenser med den efterföljande Prescott-kärnan, men misslyckades fatalt med detta och uppnådde endast marginella frekvensökningar över Northwood – trots ytterligare förlängd pipeline och galen värmeutveckling. För egen del övergav jag skeppet innan detta och växlade återigen över till AMD med bolagets välslipade Athlon 64-familj.

Core_2_Duo_E7500_2.93GHz.jpg

Core 2-familjen var en riktig lyckoträff för Intel. Bildkälla: JulianVilla26 (CC BY-SA 4.0)

Netburst-arkitekturens död skedde år 2006 och ironiskt nog var det den gamla trotjänaren P6 som tog över stafettpinnen, om än i en väldigt omarbetat utförande. Intel hade nämligen insett tidigt att Netburst inte lämpade sig särskilt bra för bärbara datorer, och fortsatte därför arbetet med P6 parallellt för Pentium M-familjen. Det hela mynnade ut i arkitekturen Core, vilken stod som bas för den omåttligt populära processorfamiljen Core 2 som släpptes sommaren 2006.

Hög IPC var återigen kung och drömmen om 10 GHz lades i malpåse – och kanske var det lika bra.