Intel i5 eller Phenom II X4 965

2009-07-06 19:27

Medlem

Plats: Gävle
Registrerad: Jul 2006

●

Intel i5 eller Phenom II X4 965

Vad tror ni? Så jäkla sugen på ett nytt paket just nu..
Trött på min gamla överklockade p4:a
Är ingen big fan utav AMD men det känns som att det är säkrare att bygga ett sånt system. Man vet ju inte riktigt när i5 kommer och hur mycket barn fel osv de kommer att vara. Så vad tycker ni? Har kollar runt på en del tester och kommit fram till att 955BC inte direkt är något jag vill ha.

Ska man kanske vänta och se vad Phenom II X4 965 har att komma med?
eller bara vänta på i5?

Rapportera Redigera

Citera flera Citera

2009-07-06 23:33

Permalänk

Piece of Cake

Medlem ★

Plats: Göteborg
Registrerad: Jun 2009

●

Jag tror med ganska stor säkerhet att 965 bara kommer vara 955 med 200 extra MHz

Visa signatur

Den här texten är helt j*vla onödig, men den ska vara här helt enkelt.
The Sleeper: Intel Core i7 930+Noctua NH-C12P SE14, Gigabyte GA-X58A-UD3R, XFX HD6970, Corsair 6GB 1600MHz, be quiet! Dark Power Pro P8 750W, WD Black 640GB, Lian Li PC-A77F
 MacBook Pro 4,1 17"  iMac 12,2 27"  Retina MacBook Pro 12,1 13"
CITERA VID SVAR PÅ MINA INLÄGG SÅ ATT JAG FÅR EN NOTIS!

Rapportera Redigera

Citera flera Citera

2009-07-06 23:52

Permalänk

Elgot

Hedersmedlem ★

Plats: Linköping
Registrerad: Apr 2004

●

Re: Intel i5 eller Phenom II X4 965

Citat:

Ursprungligen inskrivet av CheeO
Man vet ju inte riktigt när i5 kommer och hur mycket barn fel osv de kommer att vara.

Varför inte vänta på i5 och se hur de blir? Oväntade "barnfel" har vi väl inte sett sedan pentium?

Citat:

Ursprungligen inskrivet av CheeO
Ska man kanske vänta och se vad Phenom II X4 965 har att komma med?
eller bara vänta på i5?

Om du har hållit ut så länge med en p4 borde du väl nästan klara att även vänta in i5?

Rapportera Redigera

Citera flera Citera

2009-07-07 00:33

Permalänk

CheeO

Medlem

Plats: Gävle
Registrerad: Jul 2006

●

Re: Re: Intel i5 eller Phenom II X4 965

Citat:

Ursprungligen inskrivet av Elgot
Varför inte vänta på i5 och se hur de blir? Oväntade "barnfel" har vi väl inte sett sedan pentium?

Kanske inte barnfel, men drivisar osv. Kommer väl säkert vara nått dom inte har tänkt på eller så.

Citat:

Om du har hållit ut så länge med en p4 borde du väl nästan klara att även vänta in i5?

Haha jo de borde jag nog klara av fast ja är bra sugen på att klicka på knappen BESTÄLL på en quad men eftersom att 775 dör ut så känns de lite dumt

Senast redigerat 2009-07-07 00:49

Rapportera Redigera

Citera flera Citera

2009-07-07 01:17

Permalänk

CheeO

Medlem

Plats: Gävle
Registrerad: Jul 2006

●

Intel Core™ 2 Quad Q9550 2.83GHz

Asus Rampage Formula, X48

2x Corsair Dominator TWIN2X PC8500 4GB DDR2

2x XFX Radeon HD 4870 512MB GDDR5

Med det paketet skulle ja väl klara mig bra länge?

Rapportera Redigera

Citera flera Citera

2009-07-07 03:36

Permalänk

klk

Medlem

Plats: Norden
Registrerad: Okt 2008

●

Citat:

Ursprungligen inskrivet av CheeO
Intel Core™ 2 Quad Q9550 2.83GHz

Skall du ha en dator som är bra på DX11 anpassade spel så välj en processor med L3 cache

Rapportera Redigera

Citera flera Citera

2009-07-07 03:56

Permalänk

r3mpuh

Avstängd

Plats: Aspergerland
Registrerad: Maj 2007

●

Hej!

Jag chansar på att du är en gamer, och då ska du utan tvekan satsa på en x4 940. Komplett har ett supererbjudande på HD4890 just nu, plockade ihop ett fint paket till dig (:
http://www.komplett.se/k/shoplist.aspx?mode=receive&si=707352...

Här ser du hur x4 940 presterar i spelapplikationer jämfört med andra Processorer:

Det jag nu undrar över är varför du inte ska köpa Nätagg/Chassi/Kylning/Hårddisk/Skivspelare.

Förstår om du har en CD-spelare och chassi som stödjer ATX standarden sen innan och väntar med hårddisk uppgradering tills priserna på SSD-diskarna halveras i höst men. Nätaggregat, har du ett tillräckligt kraftfullt redan? Ska du inte införskaffa dig bättre CPU-Kylare?

Mvh r3mpuh

Rapportera Redigera

Citera flera Citera

2009-07-07 10:09

Permalänk

the squonk

Medlem ★

Plats: Stockholm
Registrerad: Mar 2004

●

Citat:

Ursprungligen inskrivet av klk
Skall du ha en dator som är bra på DX11 anpassade spel så välj en processor med L3 cache

Heh, du har missuppfattat en del. Q9xxx-serien har groteskt mycket L2 istället som kompenserar, och generellt är mycket L2 att föredra framför att ha L3 eftersom L2 är mycket snabbare. Det som inte är helt idealiskt på Q9xxx är att cachen inte är gemensam för alla fyra kärnorna vilket L3 är på de andra cpu och att den saknar QPI/Hypertransport buss. Men Q9xxx är fortfarande snabbare än Phenom II i väldigt många tillämpningar, framförallt snabbare/clock och den klockar bra. Dess svaghet är minnesintensiva tillämpningar eftersom bussen stryper bandbredden, dess styrka beräkningsintensiva tillämpningar där den slår Phenom II lätt. Allt beror på behov. Man skall heller inte glömma att Q9xxx drar rätt rejält med mindre ström än Phenom II.

DX11 kommer att fungera lika bra på Q9xxx och Phenom II, det som är tråkigt med Q9xxx är att det inte kommer att komma några fler s.775-processorer att uppgradera med. Man får byta alltihopa längre fram. Å andra sidan har AMD ingenting jättespännande på gång inom relativt överskådlig tid. Bara högre klock, och det kan man få redan nu genom att klocka.

Största framsteget som ligger i tiden, förutom DX11, är SATA3 och USB3. Vill man få de finesserna bör man vänta på Core i5 eftersom dess P55-moderkort kommer att ha de funktionerna och att Core i5 sannolikt kommer att vara ungefär lika mycket bättre än Phenom II som Core i7 är idag. Bara billigare.

Nu när i5 är så nära så skulle jag själv definitivt vänta på i5 om jag skulle köpa.

Visa signatur

9950X3D X870E HERO 96/6400c30/2200 RTX5090 Gaming OC || 7950X B650 Gaming Plus WIFI 32/6000c30 RTX5080 TUF OC(450w) UBUNTU || 12900KF Z690 Tomahawk WIFI 64/3600c16 Gear1 RTX4080 Ventus 3X OC(400W) || 5900X(B2) B550-F 32/3800c18 RTX3080 TUF OC V2 || 5800X3D CH VIII EXT. 32/3800c18 RTX3080 Gaming OC || 3700X X570 HERO 32/3000c16 RTX3070 FTW3 Ultra || Thinkpad P16s G2 PRO7840U 32/6400

Rapportera Redigera

Citera flera Citera

2009-07-07 10:54

Permalänk

CheeO

Medlem

Plats: Gävle
Registrerad: Jul 2006

●

Citat:

Ursprungligen inskrivet av r3mpuh

Här ser du hur x4 940 presterar i spelapplikationer jämfört med andra Processorer: http://img102.imageshack.us/img102/7664/x4940outperformsi7ing...

Kan det verkligen stämma? har kollat på en massa tester på Toms'hardware hittar ingen där amd ligger speciellt högt upp.

Citat:

Ursprungligen inskrivet av r3mpuh

Det jag nu undrar över är varför du inte ska köpa Nätagg/Chassi/Kylning/Hårddisk/Skivspelare.

Förstår om du har en CD-spelare och chassi som stödjer ATX standarden sen innan och väntar med hårddisk uppgradering tills priserna på SSD-diskarna halveras i höst men. Nätaggregat, har du ett tillräckligt kraftfullt redan? Ska du inte införskaffa dig bättre CPU-Kylare?
Mvh r3mpuh

funderarade på en raptor på 10.000 rpm och 150gig, men jag la aldrig med den i paketet eftersom att ja var osäker hur ja skulle göra.

Har en thermalright 120 extreme kylare på min gamla p4:a som jag har dragit upp i 4.2 från 3.0 och den kyler på bra som fan. Grym kylare så den hade jag tänkt att änvända

Rapportera Redigera

Citera flera Citera

2009-07-07 11:26

Permalänk

Arctunix

Medlem

Registrerad: Dec 2004

●

Citat:

Ursprungligen inskrivet av r3mpuh
Här ser du hur x4 940 presterar i spelapplikationer jämfört med andra Processorer: http://img102.imageshack.us/img102/7664/x4940outperformsi7ing...

Yeah, right... Källa?

Vilka plattformar och vilka hastigheter talar vi om? Överklockat vs icke-överklockat? "Tweakade" siffror?

En X4 940 klår inte ens en i7 920 oöverklockat (om inte applikationen i fråga är kraftigt GPU-bundet, vilket kan leda till en vinst åt båda hållen inom någon procent).

Överklockat drar oftast i7 920 ifrån ännu mera, om vi håller oss till vanlig luftkylning som TRUE/Noctua. Det finns inte en chans att en X4 940 ens klår en i7 920 i Vantage med sådana extrema siffror, om båda använder liknande komponenter i övrigt (läs: grafikkort) och ingen av dem har gimpade inställningar.

Att den skulle slå en i7 965 med dessa siffror är ännu mera orealistiskt... om dem nu inte gjorde något speciellt för att just handikappa Intel processorn, som t.ex. att köra single channel eller något liknande.

Se t.ex.:

http://www.guru3d.com/article/amd-phenom-ii-x4-920-and-940-re...

ps. Sedan får man inte bortse ifrån Vantage är Vantage... vanliga spel kommer systematiskt visa att Core i7-orna är snabbare. Dock så är de inte så mycket snabbare att de är värda sitt pris.

Edit: Observera att vi kraftigt GPU-bundna tester så är det inte ovanligt för en Phenom II att uppvisa aningen högre siffror än alla Core i7-or. Men då snackar vi om att top-of-the-range i7-or, Phenom II-or, bottom-of-the-range i7-or, Qxxxx alla uppvisar siffror inom sisådär 5-10%.

Visa signatur

"Nothing is impossible because impossible itself says I M Possible..."

Rapportera Redigera

Citera flera Citera

2009-07-07 11:46

Permalänk

lideri

Medlem

Plats: Luleå
Registrerad: Okt 2008

●

Citat:

Ursprungligen inskrivet av r3mpuh
Hej!

Här ser du hur x4 940 presterar i spelapplikationer jämfört med andra Processorer: http://img102.imageshack.us/img102/7664/x4940outperformsi7ing...

Mvh r3mpuh

Snygg paint bild, skulle vilja se länken till det där testet

Visa signatur

"Jag har inte gått 5 år på Chalmers, men till och med jag vet att det är en dum idé att blanda vatten och elektronik"
Min Fru

Rapportera Redigera

Citera flera Citera

2009-07-07 13:06

Permalänk

klk

Medlem

Plats: Norden
Registrerad: Okt 2008

●

Citat:

Ursprungligen inskrivet av Weeblie
[BEn X4 940 klår inte ens en i7 920 oöverklockat (om inte applikationen i fråga är kraftigt GPU-bundet, vilket kan leda till en vinst åt båda hållen inom någon procent).[/B]

I tunga partier i spelen så är Phenom något bättre jämfört med i7 eftersom cachen på phenom inte är lika kräsen. i7 kastar bort minne snabbare än phenom.

Medel på låga upplösningar kommer bli väldigt mycket bättre på i7. Men höj upplösningen så går till och med phenom förbi ibland, det beror på att den har något bättre prestanda vid komplicerade arbetssituationer för processorn.

Rapportera Redigera

Citera flera Citera

2009-07-07 13:09

Permalänk

klk

Medlem

Plats: Norden
Registrerad: Okt 2008

●

Citat:

Ursprungligen inskrivet av the squonk
Heh, du har missuppfattat en del. Q9xxx-serien har groteskt mycket L2 istället som kompenserar, och generellt är mycket L2 att föredra framför att ha L3 eftersom L2 är mycket snabbare. Det som inte är helt idealiskt på Q9xxx är att cachen inte är gemensam för alla fyra kärnorna vilket L3 är på de andra cpu och att den saknar QPI/Hypertransport buss. Men Q9xxx är fortfarande snabbare än Phenom II i väldigt många tillämpningar, framförallt snabbare/clock och den klockar bra.

För spel som har en renderingstråd (som ofta är låst till en kärna) och så hela spelet är beroende av så fungerar Core 2 utmärkt. Så länge den tråden går bra så flyter spelet.
Utvecklingen av DX11 spel kommer däremot skilja sig en hel del och beroende lite på hur de kodar så är verkligen inte Core 2 någon bra arkitetktur, den finns liksom anledningar till att intel konstruerat om hela processorn och precis som amd börjat använda L3 cache (delat cacke som alla kärnor kommer åt)

Rapportera Redigera

Citera flera Citera

2009-07-07 14:03

Permalänk

Arctunix

Medlem

Registrerad: Dec 2004

●

Citat:

Ursprungligen inskrivet av klk
I tunga partier i spelen så är Phenom något bättre jämfört med i7 eftersom cachen på phenom inte är lika kräsen. i7 kastar bort minne snabbare än phenom.

Syntetiska tester visar att p.g.a. de mindre cacharna på Core i7-orna så finns det vissa storlekar av data som Phenom II (och Core 2) uppvisar lägre cache-latencies i än Core i7. Detta gäller dock inte universellt för alla storlekar av data. Och dessutom... (se nedan)...

Citat:

Ursprungligen inskrivet av klk
Medel på låga upplösningar kommer bli väldigt mycket bättre på i7. Men höj upplösningen så går till och med phenom förbi ibland, det beror på att den har något bättre prestanda vid komplicerade arbetssituationer för processorn.

Komplicerade arbetssituationer på vilket sätt?

En högre upplösning ska teoretiskt sett inte belasta processorn nämnvärt annorlunda än för lägre upplösningar, när processorn i sig inte är i sitt idle-läge. Allt, inklusive grafikmotorn, kör mer eller mindre exakt samma instruktioner oavsett upplösning.

I normala fall kan man betrakta ett vanligt spel som att ha en följande main-loop (detta är ett mönster för ett enkeltrådat spel, men fler-trådade brukar ändå ha en huvud rit-tråd som följer detta mönster).

1. Läs input (försumbar tid).
2. Beräkna (mycket CPU, inget GPU).
3. Rita (lite CPU, mycket GPU).

I princip det enda som skiljer sig är att vissa av anropen till att "rita" tar (mycket) längre tid för högre upplösningar.

Att ladda in texturer till grafikkortsminnet tar också längre tid, men det görs sällan under själva spelets gång (någonsin undrat vad som egentligen händer under "loading" skärmen? ) och ska inte påverka resultatet alls.

RAM-minnesbussen (d.v.s. mellan CPU och RAM) ska teoretiskt sett uppvisa samma access-mönster oavsett upplösning.

Latencies och storleken på cache-minnena påverkar prestandan vilket också andra detaljer som branch prediction och hur bra out-of-order engine processorn har, men allt sådant är egentligen nere på mikro-nivån. Dagens processorer fussionerar/auto-parallelliserar inte ihop instruktioner på makro-nivå, d.v.s. om steg 2 (beräkna) är av tillräcklig storlek (vilket det är för spel) och tar 1 sekund på en processor, så tar 10 iterationer av steg 2 mer eller mindre exakt 10 sekunder.

Om Core i7-an tar kortare tid på sig att utföra steg 2 vid låga upplösningar än en Phenom II vid samma upplösningar så tar den också kortare tid på sig att utföra steg 2 vid högre upplösningar.

Det jag misstänker är att antingen per design så körs steg 2 och 3 mer eller mindre parallellt i vissa spel eller att steg 2 i sig tar försumbar tid i dem spelen (speciellt på höga upplösningar). Därmed skulle Core i7 övertaget försvinna när det egentligen är grafikkortet som flaskar (d.v.s. när steg 3 tar mycket längre tid än steg 2).

Kombinera det med att Phenom II arkitekturen kanske har lägre latencies för att anropa "externa" saker som grafikkortet (d.v.s. steg 3 tar aningen kortare tid på en Phenom II än på en Core i7) och det skulle stödja att Phenom II blir aningen snabbare i starkt GPU-flaskande spel. Det skulle också stödja varför något så gammalt som Qxxxx eller Exxxx ibland också uppvisar likvärdiga siffror i dem fallen.

ps. Allt detta är mer eller mindre rena spekulationer från min sida.

Visa signatur

"Nothing is impossible because impossible itself says I M Possible..."

Rapportera Redigera

Citera flera Citera

2009-07-07 15:14

Permalänk

klk

Medlem

Plats: Norden
Registrerad: Okt 2008

●

Citat:

Ursprungligen inskrivet av Weeblie
ps. Allt detta är mer eller mindre rena spekulationer från min sida.

Tänk på att gpu och cpu går asynkront. ibland är det cpu som tar mest tid och ibland är det gpu. det beror spelet. exempelvis gta iv, där är det i princip gpu som får vänta på cpu hela tiden. i spel som crysis, där får cpu vänta på gpu mesta tiden.

ett spel är inte linjärt utan det varierar. ibland händer väldigt lite och ibland händer mycket. är det detaljrikt så måste gpu jobba hårdare. är det mycket action med fysik och liknande så kan det vara cpu.

phenom har större L1 och L2 cache, det har den för att processorns uppbyggnad har något annorlunda fokus jämfört med i7.
L1 på phenom är 64 och L2 är 512 kb, i7 har hälften. L3 cachen på phenom II är 48 way associative jämfört med 16 på i7. Det är ganska avancerat och förklara vad det innebär men enkelt kan man säga att när minnet mellanlagras i cachen så har den en del valmöjligheter. valmöjligheterna vart minnet kan lägga sig för phenom är högre, i7 måste kasta bort minne snabbare (minne börjar kastas bort eftersom cachen inte kan mellanlagra hur mycket som helst) när processorn bearbetar data.

i7 är väldigt snabb när saker går lite mer på räls. det är det den är byggd för och programmerare försöker och optimera så också. men när det blir komplicerade situationer vilket innebär att processorn jobbar med minne från flera olika ställen, hoppar hit och dit samt trådar kommunicerar hårt med varandra, då är phenom bättre.

Vad gäller spel så är det just detta som är bra för spelet. Det är mycket svårt och skala ett spel på processorn. Mycket enklare för grafikkortet eftersom graffikkortet inte påverkar spelet. Där handlar det bara om att sätta på eller stänga av effekter men spelet är detsamma fast det kanske inte ser lika snyggt ut.
Processorn däremot sköter spelet. Krävs det en viss processor för att sköta 10 monster, så kanske en dubbelt så snabb processor skulle klara av och hantera logiken för 20 monster. Men då blir spelet ett annat.
Ofta lägger sig de som utvecklar spel på en viss nivå vad gäller processorn och har man den som är rekomenderad så kan man spela. Vad som är viktigt och gardera sig mot för spelare är det oförutsedda. Det kan uppstå situationer i spelet på grund av andra program mm som körs på dator vilket gör att processorn belastas hårdare och då kan spelet lagga. Kan säkert finnas en del olika saker som påverkar, det är detta jag menar med komplicerade situationer och det hanterar phenom bättre jämfört med i7.

Det kommer dröja rätt länge innan utvecklare lär sig skala spel på ett sätt så att de kan dra nytta av maximal kraft i en processor och spelet är ändå sig likt oberoende vilken cpu man kör på bara den ligger i nivå med rekomenderat eller högre. En del kan man säkert göra men det är som sagt väldigt svårt.

Rapportera Redigera

Citera flera Citera

2009-07-07 15:47

Permalänk

r3mpuh

Avstängd

Plats: Aspergerland
Registrerad: Maj 2007

●

Citat:

Ursprungligen inskrivet av lideri
Snygg paint bild, skulle vilja se länken till det där testet

Jag har inte ens Paint.exe på datorn? :S

http://www.bjorn3d.com/read.php?cID=1489&pageID=6334

Varse.

Mvh r3mpuh

Rapportera Redigera

Citera flera Citera

2009-07-07 16:34

Permalänk

anon118208

Inaktiv

Registrerad: Apr 2008

●

Citat:

Ursprungligen inskrivet av r3mpuh
Jag har inte ens Paint.exe på datorn? :S

http://www.bjorn3d.com/read.php?cID=1489&pageID=6334

Varse.

Mvh r3mpuh

Du kan ju också kolla sweclockers egna "AMD vs Intel - samma prisklass".
I det testet presterar 955:an ungefär lika som Q9550

Rapportera Redigera

Citera flera Citera

2009-07-07 16:40

Permalänk

Elgot

Hedersmedlem ★

Plats: Linköping
Registrerad: Apr 2004

●

Citat:

Ursprungligen inskrivet av klk
Tänk på att gpu och cpu går asynkront.

Är det du gosh?

Rapportera Redigera

Citera flera Citera

2009-07-07 16:45

Permalänk

Arctunix

Medlem

Registrerad: Dec 2004

●

Citat:

Ursprungligen inskrivet av klk
Tänk på att gpu och cpu går asynkront. ibland är det cpu som tar mest tid och ibland är det gpu. det beror spelet. exempelvis gta iv, där är det i princip gpu som får vänta på cpu hela tiden. i spel som crysis, där får cpu vänta på gpu mesta tiden.

Mjo... precis.

Och asynkront är endast delvist sant.

Nu var det rätt så länge sedan jag sist höll på med spelprogrammering själv (läs: DirectX) men det är vanligen asynkront upp till anropet av "Present".

Citat:

Ursprungligen inskrivet av klk
ett spel är inte linjärt utan det varierar. ibland händer väldigt lite och ibland händer mycket. är det detaljrikt så måste gpu jobba hårdare. är det mycket action med fysik och liknande så kan det vara cpu.

Kan inte göra något annat att hålla med. Självklart är det så vilket gör det svårt att ibland dra generella slutsatser (läs: sådana finns helt enkelt inte).

Citat:

Ursprungligen inskrivet av klk
phenom har större L1 och L2 cache, det har den för att processorns uppbyggnad har något annorlunda fokus jämfört med i7.

L1 på phenom är 64 och L2 är 512 kb, i7 har hälften. L3 cachen på phenom II är 48 way associative jämfört med 16 på i7. Det är ganska avancerat och förklara vad det innebär men enkelt kan man säga att när minnet mellanlagras i cachen så har den en del valmöjligheter. valmöjligheterna vart minnet kan lägga sig för phenom är högre, i7 måste kasta bort minne snabbare (minne börjar kastas bort eftersom cachen inte kan mellanlagra hur mycket som helst) när processorn bearbetar data.

i7 är väldigt snabb när saker går lite mer på räls. det är det den är byggd för och programmerare försöker och optimera så också. men när det blir komplicerade situationer vilket innebär att processorn jobbar med minne från flera olika ställen, hoppar hit och dit samt trådar kommunicerar hårt med varandra, då är phenom bättre.

Det går inte att dra sådana snabba slutsatser här heller. L1 cachen påverkar i princip inte multitrådningsprestandan då den (mer eller mindre) måste tömmas vid varje trådbyte.

I slutändan beror det mesta på vilka loads man kör med, men Core i7 ansen ofta ha på pappret en bättre cache-design än vad Phenom II har (för att inte nämna en bättre prefetcher). Latenserna för Core i7-s cachar är 4, 11 respektive 36 cykler jämfört med 3, 15 respektive 53 cykler vilket är betydligt lägre (observera att siffrorna för L3 latenserna är lite sisådär; de verkar vara uppmätta med EVEREST medan "riktiga" från tillverkarna var inte alltför lätta att hitta snabbt). Core i7 sitter dessutom på en större L3 cache (8 MB vs 6 MB) och kör med inklusiva cachar (vilket egentligen negerar storleksvinsten men istället tjänar ytterliggare cykler på att cache-snooping inte behöver utföras lika ofta/djupt). Tripple-channel kan inte heller försummas i när man köra mer flera trådar.

Core i7 är faktiskt designat med multitrådning i minnet (läs: servermarknaden) och därav orsaken att man inte ser några (höga) prestandavinster jämfört med äns de gamla Core 2-orna i spel.

Har du några artiklar/papper som tyder på att Phenom II skulle prestera bättre än i7-or på server loads (eller någon annan form av "komplicerade situationer"?). Mer eller mindre alla dem jag har läst tyder på raka motsatsen (speciellt med hyperthreading i bilden) Se t.ex:

http://techreport.com/articles.x/16147/11

Visa signatur

"Nothing is impossible because impossible itself says I M Possible..."

Rapportera Redigera

Citera flera Citera

2009-07-07 17:09

Permalänk

klk

Medlem

Plats: Norden
Registrerad: Okt 2008

●

Citat:

Ursprungligen inskrivet av Weeblie
Det går inte att dra sådana snabba slutsatser här heller. L1 cachen påverkar i princip inte multitrådningsprestandan då den (mer eller mindre) måste tömmas vid varje trådbyte.

Fakta på det? det beror ju helt på vilken typ av arbete tråden utför. Och när det gäller spelande som vi diskuterar här så är vad jag vet de flesta prestsandakrävande spel designade för att kunna köras på en tvåkärning utan L3 cache. När det gäller renderingstråden så tror jag de flesta försöker låsa den vid en kärna (så den inte flyttar).
Om de ökar till att sätta minimigränsen till tre kärnor så tappar man en hel del kunder.

Citat:

Ursprungligen inskrivet av Weeblie
I slutändan beror det mesta på vilka loads man kör med, men Core i7 ansen ofta ha på pappret en bättre cache-design än vad Phenom II har (för att inte nämna en bättre prefetcher). Latenserna för Core i7-s cachar är 4, 11 respektive 36 cykler jämfört med 3, 15 respektive 53 cykler vilket är betydligt lägre (observera att siffrorna för L3 latenserna är lite sisådär; de verkar vara uppmätta med EVEREST medan "riktiga" från tillverkarna var inte alltför lätta att hitta snabbt). Core i7 sitter dessutom på en större L3 cache (8 MB vs 6 MB) och kör med inklusiva cachar (vilket egentligen negerar storleksvinsten men istället tjänar ytterliggare cykler på att cache-snooping inte behöver utföras lika ofta/djupt). Tripple-channel kan inte heller försummas i när man köra mer flera trådar.

De har olika typer av fokus. i7 är designad efter prestanda. Phenom har en design som går mer på strömsnålhet samt kunna hantera flexibla hårdvarulösningar och återanvändning av processorn. i7 är mer som en enhet då varje del är mer knuten till andra delar. det är fördel där för att få upp hastigheten men du kommer inte se en i7 X3 där man kopplat av en bit. Som du påpekade så cachen inclusive och det innebär att de lagrar minne i alla cachar. Phenom har ju faktiskt mer total cache jämfört med i7 även om den bara har 6 MB L3 cache.

Citat:

Ursprungligen inskrivet av Weeblie
Core i7 är faktiskt designat med multitrådning i minnet (läs: servermarknaden) och därav orsaken att man inte ser några (höga) prestandavinster jämfört med äns de gamla Core 2-orna i spel.

Ja precis, och du kommer inte se den typen av belastning i spel som i7 är gjord för att hantera bra. Det skulle sänka en hel del andra processorer (exempelvis alla core 2 varianter). Skulle ett spel kräva väldigt mycket bandbredd på minne så hade det krävts en i7 men den marknaden är försvinnande liten så jag tvivlar starkt på att ett sådant spel kommer dyka upp.
På en server däremot som exempelvis kör stora databaser med massor av minne, där är den typen av hantering väldigt bra.

Citat:

Ursprungligen inskrivet av Weeblie
Har du några artiklar/papper som tyder på att Phenom II skulle prestera bättre än i7-or på server loads

Nej och jag har heller inte diskuterat den typen av arbete utan det jag nämnt är spel. Det är mycket lätt och optimera serverprogramvara och det är inte för inte att den typen av programvara ofta är trådad med för det är lätt och tråda upp dessa program. Mycket mer komplicerat att tråda upp ett program som gör ett flertal olika arbeten för att komma fram till ett slutresultat (en ny spelbild för spelt att renderas av grafikkkort).

Rapportera Redigera

Citera flera Citera

2009-07-07 17:16

Permalänk

r3mpuh

Avstängd

Plats: Aspergerland
Registrerad: Maj 2007

●

Citat:

Ursprungligen inskrivet av v1lle
Du kan ju också kolla sweclockers egna "AMD vs Intel - samma prisklass".
I det testet presterar 955:an ungefär lika som Q9550

Hmm, ja där låg q5550 ganska jämnt med x4 955 i prestanda (Sweclockers använder sig utav minnen med CL9 Latens till den).
Men i bjorn3ds test använder dom den billigare processorn x4 940 tillsammans med 4gb ddr2 cl5 minnen.

Min slutsats är att Phenom processorerna drar betydligt mer nytta utav låga latens som cl4, cl5 än intel. Det ser vi i Bjorn3ds test där x940 presterar bättre än alla Intels processorer i 3Dmark Vantage som jämför spelprestanda.

/r3mpuh

Rapportera Redigera

Citera flera Citera

2009-07-07 18:43

Permalänk

Arctunix

Medlem

Registrerad: Dec 2004

●

Citat:

Ursprungligen inskrivet av klk
Fakta på det? det beror ju helt på vilken typ av arbete tråden utför.

En thread-context switch (d.v.s. att byta från en tråd till en annan) är en relativt dyr operation uppmätt i "runt tusen eller tusentals" cykler. Läs t.ex. från: http://www.cs.rochester.edu/u/cli/research/switch.pdf (3,8 mikrosekunder är ungefär 2000 cykler).

Detta är jämförbart och i samma storleksordning som att helt populera L1 cachen.

Vanligtvis sker inte thread-context switchar väldigt ofta (högst några tusen gånger per sekund med dagens processorer, och även då är det oftast ett tecken på att någonting onormalt sker alternativt att man har någon kraftig form av I/O).

Den aktiva tiden som spenderas av en tråd som faktiskt "räknar" är i varje thread-context switch i "miljontals cykler" vilket skulle gömma L1 cachens betydelse vid multitrådningen i sig ( http://www.cs.huji.ac.il/~feit/exp/expcs07/papers/161.pdf ).

Citat:

Ursprungligen inskrivet av klk
Och när det gäller spelande som vi diskuterar här så är vad jag vet de flesta prestsandakrävande spel designade för att kunna köras på en tvåkärning utan L3 cache.

Ummmm.... heh... väldigt få program, även spel, är designade med tankarna om att man har tillgång till vissa lager av cachar av vissa storlekar eller att man har tillgång till vissa speciella egenskaper hos processorn (kan med enkelhet ses genom att spel eller program sällan har separata "kod-stigar" för att t.ex. köras på en i7 eller på en Phenom II).

Jag tror att du stirrar dig alltför blint på namnen L1, L2 och L3. Nej, Core 2-orna har ingen L3 cache. Men i praktisk mening så har den ändå "ett par megabyte" minne som kan avläsas med låg latency (runt 50 cykler eller lägre). Processorn matas fortfarande av med data och instruktioner i en tillräckligt snabb takt.

Citat:

Ursprungligen inskrivet av klk
När det gäller renderingstråden så tror jag de flesta försöker låsa den vid en kärna (så den inte flyttar).
Om de ökar till att sätta minimigränsen till tre kärnor så tappar man en hel del kunder.

Det finns för och nackdelar med att låsa trådar till en viss kärna. Oftast är det inget man behöver göra manuellt då operativsystemets schemaläggare själv försöker att göra det (en viss kostnad att flytta en tråd till en annan kärna, då L2 cachen på i7/Phenom II då innehåller "fel" data och måste ompopuleras).

Citat:

Ursprungligen inskrivet av klk
De har olika typer av fokus. i7 är designad efter prestanda. Phenom har en design som går mer på strömsnålhet samt kunna hantera flexibla hårdvarulösningar och återanvändning av processorn. i7 är mer som en enhet då varje del är mer knuten till andra delar. det är fördel där för att få upp hastigheten men du kommer inte se en i7 X3 där man kopplat av en bit.

Hur strömsnåla de är är inte riktigt relevant. Och att det inte säljs i7 X3... tja... det är egentligen inget som hindrar dem från att göra det. Steger för AMD att få HT är enormt mycket större än steget för Intel att påbörja försäljningen av i7 X3 (vilket med största sannolikhet aldrig kommer att hända då behovet inte finns).

Citat:

Ursprungligen inskrivet av klk
Som du påpekade så cachen inclusive och det innebär att de lagrar minne i alla cachar. Phenom har ju faktiskt mer total cache jämfört med i7 även om den bara har 6 MB L3 cache.

Vet du föresten varför Phenoms har "fler vägars" cachar? Jo, för att just inte flaska vid cache-snooping.

Phenom II kanske har en liten del mer cache totalt än vad i7-orna har men det har nästan ingen betydelse alls för prestandan (förutom om man skapar syntetiska tester som just pressar den exakt rätta mängden; för mycket och båda läcker ändå ut till RAM-minnet och det är snarare pre-fetcherna som tävlar emot varandra, för lite och båda duger finfint). Och man får inte glömma att en tråd kan använda hela 8 MB "totalt cache" på en i7 medan den endast får 6,5-ish på en Phenom II. Vad har det för egentlig betydelse? Tja... nästan ingen alls.

I grund och botten är designen av cacharna och processorn i övrigt långt viktigare än att jämföra mängden cache mellan båda arkitekturerna. Benchmarks visar på att Core i7-orna presterar i de allra flesta fallen bättre för CPU-tunga loads än vad Phenom II-orna gör och det är inget konstigt med det.

Dock så skulle det vara intressant att verkligen få redan på den riktiga orsaken varför de presterar aningen sämre än Phenom II-orna i spel på mycket hög grafik (när de presterar mycket bättre på låg). Cache? Nej, det är inte riktigt rimligt. Om inte någon kan få fram lite tyngre argument för det.

Citat:

Ursprungligen inskrivet av klk
Nej och jag har heller inte diskuterat den typen av arbete utan det jag nämnt är spel. Det är mycket lätt och optimera serverprogramvara och det är inte för inte att den typen av programvara ofta är trådad med för det är lätt och tråda upp dessa program. Mycket mer komplicerat att tråda upp ett program som gör ett flertal olika arbeten för att komma fram till ett slutresultat (en ny spelbild för spelt att renderas av grafikkkort).

Um... huh?

Jag nämnde endast server-loads eftersom det är sådana som oftast pressar multitrådningsegenskaperna av en processor till maximum. Det var mer eller mindre svar på tal till:

Citat:

Ursprungligen inskrivet av klk
i7 är väldigt snabb när saker går lite mer på räls. det är det den är byggd för och programmerare försöker och optimera så också. men när det blir komplicerade situationer vilket innebär att processorn jobbar med minne från flera olika ställen, hoppar hit och dit samt trådar kommunicerar hårt med varandra, då är phenom bättre.

Benchmarks (på server och vanligen multitrådningsloads generellt sett) visar på motsatsen där. i7 är inte byggd för att utföra "seriella" operationer snabbt; det var Netburst som var det. i7 är designad för att ta tillbaka servermarknaden från AMD där just multitrådning är en viktig del. Core 2 var oerhört populära bland "gamers" men inte alltför dugliga på servrar (blev ännu värre när virtualisering blev populärt).

Visa signatur

"Nothing is impossible because impossible itself says I M Possible..."

Rapportera Redigera

Citera flera Citera

2009-07-07 22:49

Permalänk

klk

Medlem

Plats: Norden
Registrerad: Okt 2008

●

Citat:

Ursprungligen inskrivet av Weeblie
En thread-context switch (d.v.s. att byta från en tråd till en annan) är en relativt dyr operation uppmätt i "runt tusen eller tusentals" cykler. Läs t.ex. från: http://www.cs.rochester.edu/u/cli/research/switch.pdf (3,8 mikrosekunder är ungefär 2000 cykler).

Detta är jämförbart och i samma storleksordning som att helt populera L1 cachen.

?
Tror du ärligt själv på att det tar 2000 cykler för att gör en switch mellan en tråd till en annan? Möjligen har de gjort någon egen mjukvarustyrd hantering för att switcha trådar. Kan inte exakt hur många cykler respektive processorer tar på sig (om man bara ser till själva switchen) men ta en funderare på hur effektivt HT (hyperthreading) skulle vara för i7 om det tog 2000 cykler för att switcha ;). Om switchen tar längre tid än vad det tar och hämta arbetsminne så faller lite av poängen där

Tippar på att den verkliga hastigheten är mer än 20 gånger snabbare, kanske 40 gånger snabbare (alltså runt 50 cykler).

Orkar inte riktigt fortsätta argumentationen

Rapportera Redigera

Citera flera Citera

2009-07-07 22:57

Permalänk

Fire_Ice

Medlem ★

Registrerad: Jun 2007

●

Citat:

Ursprungligen inskrivet av v1lle
Du kan ju också kolla sweclockers egna "AMD vs Intel - samma prisklass".
I det testet presterar 955:an ungefär lika som Q9550

Deras test ger jag inte mycket för.

Citat:

Ursprungligen inskrivet av Elgot
Är det du gosh?

Vad är det här för mobbing?

Visa signatur

Arch Linux - i5 12500@4.75GHz - Asrock B760M PG Riptide - 32GB DDR5 6000MHz - RTX 2070 Super - 1TB SN770 - 1TB SN550 - U32PWQU 4K
Dell Latitude 7400 2 in 1 - Arch Linux - i5 8265u

Rapportera Redigera

Citera flera Citera

2009-07-07 23:41

Permalänk

ZaXx

Medlem

Plats: Aneby
Registrerad: Nov 2006

●

Vilken processor är den snabbaste?? mängder av olika tester men en av processorerna måste ju vara snabbare? core i5/corei7 eller phenom 2 x4?

Visa signatur

Pentium 3.6 |8800gs | E2400hd | modded X-fi extreme music |Marantz sr 4010|Dynavoice m-85 ||~*

Rapportera Redigera

Citera flera Citera

2009-07-07 23:54

Permalänk

Arctunix

Medlem

Registrerad: Dec 2004

●

Citat:

Ursprungligen inskrivet av klk
?
Tror du ärligt själv på att det tar 2000 cykler för att gör en switch mellan en tråd till en annan? Möjligen har de gjort någon egen mjukvarustyrd hantering för att switcha trådar. Kan inte exakt hur många cykler respektive processorer tar på sig (om man bara ser till själva switchen) men ta en funderare på hur effektivt HT (hyperthreading) skulle vara för i7 om det tog 2000 cykler för att switcha ;). Om switchen tar längre tid än vad det tar och hämta arbetsminne så faller lite av poängen där

Tippar på att den verkliga hastigheten är mer än 20 gånger snabbare, kanske 40 gånger snabbare (alltså runt 50 cykler).

Orkar inte riktigt fortsätta argumentationen

Jag tror ärligt talat inte att du vet riktigt vad du pratar om.

Thread-context switchar är mjukvarustyrd och involverar vissa delar av operativsystemskärnan som t.ex. schemaläggaren (i stort sett i alla fall; numera finns det ett par extra hårdvaru-funktioner för att just accelera upp det hela, som att t.ex. snabbare dumpa ner registren). En "klocka" ställs in i förväg och som skickar ett interrupt när trådens "time slice" är över och det är dags att byta till nästa tråd (kort och gott men inte 100% tekniskt korrekt, interrupten väcker schemaläggaren).

Multitrådning sker inte bara "magiskt" av processorn. Beroende på vilket operativsystem man pratar om och mellan vilka trådar som bytet av "ägandeskapet av kärnan" sker mellan så kan olika minnes-sidor behöva fasas ut först också. Allt detta "kostar". Bytet till kernel-läge själv är mycket dyrt.

Presentera gärna siffror från riktiga benchmarks/papper som visar att bytet mellan trådar endast tar runt 50 cykler. Att låsa/släppa mutexar tar något i storleksordningen tusen cykler. Att använda lättvikts-mutexar (d.v.s. CRITICAL_SECTION för Windows) vilket normalt sett kan betraktas som en av de absolut billigaste multitrådnings-objekten tar något i storleksordningen 100 cykler.

Och innan någon säger någonting annat; ja under 50 cykler kan man komma om man själv specialdesignar kooperativa "trådar" i sitt program. Men det är inte riktigt samma typ av "trådar" som man vanligen pratar om (i.e. om man säger att ett program är multitrådat så menar man inte om ett program internt eller ej kör med kooperativa trådar utan om programmet själv använder sig av den typen av trådar som anses standard för operativsystemet, i detta fall, Linux och Windows).

Hyperthreading är någonting mer eller mindre helt orelaterat till multitrådning själv. HT är förenklat sett en kärna med två uppsättningar av register och som visas som två "virtuella" kärnor till operativsystemet. De båda "virtuella" kärnorna delar på alla execution units på den "riktiga" kärnan.

Visa signatur

"Nothing is impossible because impossible itself says I M Possible..."

Rapportera Redigera

Citera flera Citera

2009-07-07 23:55

Permalänk

Arctunix

Medlem

Registrerad: Dec 2004

●

Citat:

Ursprungligen inskrivet av ZaXx
Vilken processor är den snabbaste?? mängder av olika tester men en av processorerna måste ju vara snabbare? core i5/corei7 eller phenom 2 x4?

Core i7 är generellt sett (i genomsnitt) snabbare än alla andra, men det finns vissa typer av loads som gör att andra processorer passerar Core i7-orna.

Visa signatur

"Nothing is impossible because impossible itself says I M Possible..."

Rapportera Redigera

Citera flera Citera

2009-07-08 03:00

Permalänk

klk

Medlem

Plats: Norden
Registrerad: Okt 2008

●

Citat:

Ursprungligen inskrivet av Weeblie
Jag tror ärligt talat inte att du vet riktigt vad du pratar om.

ok...
när du pratar om trådbyte på en kärna, menar du själva trådbytet eller menar du en massa annat utöver det för menar du annat så måste du specificera det andra du menar. exakt hur olika operativ schedulerar varierar. vista räknar exempelvis hur många clockcykler tråden har kört.

Rapportera Redigera

Citera flera Citera

2009-07-08 06:35

Permalänk

Essin

Medlem

Plats: Eskilstuna
Registrerad: Jun 2006

●

Mitt bästa tips: Lyssna aldrig på någon som har ett förtags logo som avatar.

Tydligare tecken på fanboy finns inte och allt de säger kommer vara extremt vinklat.

Visa signatur

Home: i5 3570K, 16GB RAM, Gigabyte HD7950 WF, Samsung 830 SSD 128GB, Corsair 650W.
Work: Xeon X5260, 8GB RAM, nVidia Quadro FX 4600.

Rapportera Redigera

Citera flera Citera

2009-07-08 07:20

Permalänk

the squonk

Medlem ★

Plats: Stockholm
Registrerad: Mar 2004

●

Citat:

Ursprungligen inskrivet av Essin
Mitt bästa tips: Lyssna aldrig på någon som har ett förtags logo som avatar.

Tydligare tecken på fanboy finns inte och allt de säger kommer vara extremt vinklat.

Om det vore så enkelt. Allt är inte svart eller vitt. Men du lär dig när du växer upp

(tänk ex. fotbollspelare som gladeligen byter lag så fort de får ett bättre bud, de har inte bara en liten avatar på ett forum, de springer omkring offentligt i klubbens mundering inför tusentals människor. Relatera det till hårdvara, finner man bättre prestanda mer förmånligt någon annanstans, finns det ett enda skäl att inte byta?)

Visa signatur

9950X3D X870E HERO 96/6400c30/2200 RTX5090 Gaming OC || 7950X B650 Gaming Plus WIFI 32/6000c30 RTX5080 TUF OC(450w) UBUNTU || 12900KF Z690 Tomahawk WIFI 64/3600c16 Gear1 RTX4080 Ventus 3X OC(400W) || 5900X(B2) B550-F 32/3800c18 RTX3080 TUF OC V2 || 5800X3D CH VIII EXT. 32/3800c18 RTX3080 Gaming OC || 3700X X570 HERO 32/3000c16 RTX3070 FTW3 Ultra || Thinkpad P16s G2 PRO7840U 32/6400

Rapportera Redigera

Citera flera Citera

Intel i5 eller Phenom II X4 965

Intel i5 eller Phenom II X4 965

Re: Intel i5 eller Phenom II X4 965

Re: Re: Intel i5 eller Phenom II X4 965

Externa nyheter