Permalänk
Medlem

Pentium M och IPC

Blev lite förvånad då min nya laptop som har en Pentium M processor på 1.4Ghz med 1Mb L2 cache och 400Mhz fsb mot 512Mb 266Mhz DDR minne faktiskt kompilerade om min Athlon XP 2400+ på 2Ghz med 768Mb PC2100 minne.
Den värkar väldigt snabb i syntetiska test med.
Har inte så mö program å testa den seriöst med i linux och med tanke på dess kassa grafikort så är spel inte mö å testa.

Pentium 4 har en IPC på 6 och Pentium 3 ska ha högre IPC än Pentium 4 och Pentium M i sin tur högre IPC än Pentium 3 och det avsevärt högre.
Den infon jag hittat sa nån på ett forum att Pentium M hade en IPC på 8 men det låter lite lågt då om den nu hade avsvärt högre IPC än Pentium 3.

AMD:s prosessorer från athlon och duron till amd64 processorerna har en IPC på 9 vitt jag vet och med tanke på att en 1.4Ghz Pentium M värkar snabbare än min 2400+ XP misstänker jag att IPC:n på pentium M är högre än 8 ändå men hittar igen info googlat arslet av mig.
Hade vart kul å veta vad pentium M har för IPC igäntligen och vad som gör den så attans snabb.
Deta måste vara min bästa intel sedan min Pentium 166. Pentium M 1.4Ghz drar 22W inte illa inte.

Lite resulat jag fixat med olika processorer som fick kompilera DCGUI-qt 0.2.21.

PC2100, Pentium M 1.4Ghz = 4 min 26 sek
PC2100, Athlon XP 2400+ = 5 min 27 sek
PC3200 Pentium 4 2.4b@2.88Ghz = 4 min 10

Hade varit gött om intel släppt dessa processorer för desktop marknaden med. en 2Ghz model hade inte varit direckt slö om man kollar tester på nätet.
Nya versionen med 2Mb cache lär inte vara sämmre.

Permalänk
Hedersmedlem

Det är (enorm) skillnad på teoretisk maximal IPC och "verklig" IPC.

Som du skrev kan AMD Athlon (K7) exekvera upp till 9 instruktioner per klockcykel, Pentium 3 (P6) kan bara exekvera 5 men det var ändå väldigt jämnt, både prestandamässigt och frekvensmässigt före P4-tiden vilket betyder att de hade nästan lika hög IPC i praktiken (Athlon var aningen vassare, speciellt i FPU-grejer).

Athlon 64 och Opteron (K8) kan i teorin exekvera lika många instruktioner per klockcykel som K7 men den verkliga prestandan är mycket bättre, det har du nog märkt själv också. Det beror på förbättrad cache och minnesåtkomst och ändringar i kärnan som förbättrad "branch predictor" och andra "magiska" grejer.

Själva exekveringskärnan i Pentium M är i stort sett en modifierad P6-kärna så den teoretiska IPC:n är oförändrad med ett undantag: vissa enkla instruktioner kan paras ihop och exekveras som om de vore en enda instruktion (om jag förstått det hela rätt). Nästan alla andra delar är antigen förbättrade eller helt ombyggda så det är svårt att säga hur hög prestanda man får i praktiken, enda sättet är att testa helt enkelt.

EDIT: Jag vet inte hur mycket de mekat om kärnan i Dothan, men av det jag sett hittills så är den bara en krympt Banias med mer cache. Det är inte som Prescott som fick 11 nya pipelinesteg...

Visa signatur

Nämen hej!

Permalänk
Medlem

Väldigt intressant läsning för oss med lite sämre koll på Intels Processorer!

Skriv gärna mer så får man lära sig lite till.

Visa signatur

Error 412: Precondition Failed - You need to use a real browser in order to view this signature!

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av Donan Fear
Det är (enorm) skillnad på teoretisk maximal IPC och "verklig" IPC.

Som du skrev kan AMD Athlon (K7) exekvera upp till 9 instruktioner per klockcykel, Pentium 3 (P6) kan bara exekvera 5 men det var ändå väldigt jämnt, både prestandamässigt och frekvensmässigt före P4-tiden vilket betyder att de hade nästan lika hög IPC i praktiken (Athlon var aningen vassare, speciellt i FPU-grejer).

Athlon 64 och Opteron (K8) kan i teorin exekvera lika många instruktioner per klockcykel som K7 men den verkliga prestandan är mycket bättre, det har du nog märkt själv också. Det beror på förbättrad cache och minnesåtkomst och ändringar i kärnan som förbättrad "branch predictor" och andra "magiska" grejer.

Själva exekveringskärnan i Pentium M är i stort sett en modifierad P6-kärna så den teoretiska IPC:n är oförändrad med ett undantag: vissa enkla instruktioner kan paras ihop och exekveras som om de vore en enda instruktion (om jag förstått det hela rätt). Nästan alla andra delar är antigen förbättrade eller helt ombyggda så det är svårt att säga hur hög prestanda man får i praktiken, enda sättet är att testa helt enkelt.

Var ju som sagt teoretisk IPC jag letade efter. Men nåt skumt i så fall är att överalt stog det att P4 hade sämme IPC än P3 dock kanske det var i pracktiken då. P4 har en teoretisk IPC på 6 vitt jag vet så då är ju 5 lägre.
P6 är inte så bra på flytal nej P3:an tycks bara kuna göra en flytalsberäkning om man räknar bort SSE.

Pentium M ska i alla fall ha betydligt högre IPC än P3 och P3 högre än P4 då snackar dom väll i pracktiken då.
Vad jag läste så kan en processor i genomsnit utföra 2 instrucktioner pär cykel. Men det måste la tas med en nypa salt då det skilljer avsevärt mellan olika processorer.
Igen processor i prackiken utför en hel instrucktion pär cykel vitt jag vet utan det tar ofta några cyklar.
Det var väll en del av vittsen med RISC processorer som skulle klara det men fins gott om halvfabrikat där med vitt jag vet som tar mer än en cykel pär instrucktion på sig.

Det jag testat värkar en Pentium M 1.4Ghz vara en del snabbare än en Athlon XP 2Ghz i alla fall kan tänka mig at athlon XP är en del bättre i spel men behöver nog inte skillja så mö.

Branch prediction enheten ska vara tagen från P4:an vitt jag vet då den är effecktivare sedan ska Pentium M ha så kallad micro-ops fusion.
Kan inte det så bra men när P6 architeckturen delar upp en instrucktion i flera delar kallade micro-ops som ROB och RS registret håller reda på och det tar plats å alstrar värme desutom slöare det ner lite så intel gjorde så att micro-ops som hörde samman blev som en grupp så istället för å hålla koll på varje micro-ops så håller ROB och RS registret koll på gruper av micro-ops så ROB och RS som håller koll på micro-ops behövde inte vara lika stort och det skulle la ge 5-10% prestandaökning och en lägre effektutväkling i processorn.

EDIT: Kom över dena länken förklarar Pentium M rätt OK men det värkar inte som nån vet exackt vad des IPC är och hur lång Pipline den har.

http://arstechnica.com/cpu/004/pentium-m/pentium-m-1.html