Arkitekturen Bulldozer

AMD:s nya arkitektur har varit på tapeten i flera år och det har skrivits många spaltmeter om vad Bulldozer egentligen innebär. För att fräscha upp minnet passar vi på att gå igenom de viktigaste nyheterna.

amd_fx_0012_Layer 2.jpg

Medan Intel fortsätter att satsa på traditionella processorkärnor med Hyperthreading, det sistnämnda en teknik för att låta varje kärna exekvera två trådar samtidigt, väljer AMD en annan väg med modulbaserade Bulldozer.

Varje Bulldozer-modul innehåller två kärnor som kan exekvera varsin tråd. Dessa delar på resurser för att spara värdefull kretsyta, exempelvis flyttalsenhet (FPU) och L2-cache. Ytterligare fördelar med upplägget är att om endast en kärna är aktiv kan denna få tillgång till alla delade resurser, och om båda är belastade utnyttjas tillgångarna maximalt.

FXCPU_ArchDia.jpg

Enligt AMD:s beräkningar kan designen ge uppemot 80 procent mer prestanda med bara 15 procent fler transistorer i jämförelse med en traditionell flerkärnig processor. Samtidigt kan modulerna användas ungefär som byggklossar för att konstruera processorer med varierande antal kärnor, för olika målgrupper och prispunkter.

Ny processor med nya instruktioner

1.jpg
2.gif

Utöver upplägget med Bulldozer-moduler passar AMD även på att lägga till ett antal nya instruktioner för att snabba upp vissa typer av beräkningar:

  • SSE 4.1 och 4.2: Snabbar upp främst multimediarelaterade beräkningar, exempelvis videokodning och ansiktsigenkänning.

  • Advanced Vector Extensions (AVX): Ännu mer SIMD (single instruction, multiple data) för allt ifrån 3D-modellering, signalbehandling till multimedia. AMD lägger dock till FMA4/XOP som kan ge en prestandaskjuts i HPC-relaterade scenarion, exempelvis vädersimuleringar.

  • Advanced Encryption Standard (AES): Stöd för hårdvaruaccelererad kryptering med program som Truecrypt och Bitlocker. Motsvarar Intel AES-NI.

  • Light Weight Profiling (LWP): Gör det enklare för utvecklare att analysera applikationers funktion och prestanda.

Som alltid när det gäller nya instruktioner måste program uppdateras eller åtminstone kompileras om för att ta del av prestandavinsterna. AMD framhåller att exempelvis att FMA4/XOP i FX-8150, det vill säga instruktionerna som Intel saknar, kan ge upp till 56 gånger högre prestanda under vissa förhållanden i jämförelse med Core i7 2600K.

AMD Turbo Core Technology

amd_fx_0002_Layer 12.jpg

Sist men inte minst är det värt att ta upp den automatiska överklockningsfunktionen Turbo Core, som lever vidare och dessutom byggs ut i Bulldozer. Det hela handlar om att processorn kan reglera klockfrekvensen utefter strömförbrukningen (TDP) och ge en extra prestandaskjuts i program som inte använder alla kärnor.

I fallet FX-8150 är klockfrekvensen normalt 3,6 GHz, men när Turbo Core kopplas in kan processorn gå upp till 3,9 GHz. Är endast hälften av kärnorna aktiva höjs klockfrekvensen ytterligare ett snäpp till hela 4,2 GHz och stannar kvar där så länge strömförbrukningen och värmeutvecklingen kan hanteras.