Citat:
Ursprungligen inskrivet av
virtual void
Fast hur är X3000 relevant, det är en GPU för laptops från 2006? I så fall kan man klaga på att nVidia Riva TNT också krävde CPUn för T&L... Det som beskrivs på den sidan stämmer inte sedan Intel HD (Arrandale vilket är den mobila versionen av Nehalem på 45nm), en CPU som kom för mer än 3 år sedan.
Och som du ser ovan är det inte GPUn jag framför kritik mot, det är den grundläggande designen av CPUn. Designen i sig är inte heller fel, felet är att man i praktiken verkar behöva nästan lika mycket transistorer för en modul som för två "riktiga" kärnor. En stor anledningen är nog att det krävs en så stor L2 cache (cache kräver MASSOR med transistorer, fast frågan om det verkligen krävs, skulle vara kul att sett tester på de versioner av Trinity med endast 1M L2 cache) och man duplicerat kanske lite för mycket så det inte finns några synergieffekter. Som det är nu har man problem med att avkodare och L1I-cache är en flaskhals, något som varit ett icke-problem om man använt två separata kärnor.
Problemet med moduldesignen är att en APU ska vara bättre än summan av sina delar. Sedan SNB så kan GPUn och CPUn dela L3 cache, något som inte är möjligt i AMDs design, HT gör så att man effektivt kan utnyttja tillgängliga resurser både i enkeltrådade och flertrådade saker. Moduldesignen är sämre en två "riktiga" kärnor, men kostar nästan lika mycket att implementera i transistorer. Ovanpå detta så har ju saker som OpenCL och DirectCompute inte direkt tagit fart och med saker som FMA (fused multiple add) och AVX så minskar antalet problem där det är värt kostnaden (i både utvecklingstid och latens till/från CPU<->GPU) att använda GPUn.
Också här har Intel kommit längre vad det gäller integration, latensen mellan CPU/GPU är ett par heltalsfaktorer lägre i SNB/IVY jämfört med Trinity (tack vare att SNB/IVY kan kommunicera med GPUn via L3-cache), Trinitys GPU har dock betydligt mycket mer kraft. Men en högre latens gör att färre problem blir vettiga att köra på GPUn.
Men det viktigaste är ändå komplexiteten. AMD skulle behöva ta ~100% mer för Trinity jämfört vad Intel tar för sina IVB Core i3 för att ha samma marginaler och alla inser att det inte skulle fungera.
Bulldozer har och hade många problem, men några av dessa har rättats till dels via bättre tillverkningsteknik och dels via bättre design, några har ju också åtgärdats i Piledriver.
Att det finns kvar många problem med CPUn, håller jag absolut med om, men jag tycker som sagt att förpackad med den fina GPUn blir ändå paketet tilltalande.
Den analys du gör och de svagheter du visar med CPUn, verkar trovärdigt även för mig utan djupgående kunskaper i CPU-design, men min förhoppning är att dessa rättas till eller förminskas med tiden, Steamroller verkar bli ett ordentligt omtag och AMDs numera automatiserade design kan ge fördelar vid förändringar, om den nu fungerar som den skall.
Eftersom CPU och GPU kommer att dela gemensam minnesarea i Steamroller bör inte heller kommunikationen CPU GPU vara något problem där.
Intel kommer inte sitta stilla och vänta det vet jag, men det är lättare att fixa något som inte är bra, än att förfina något som redan fungerar ganska bra.
Jag begär inte heller att AMD skall bli bättre än Intel, för mig räcker det, att de är konkurenskraftiga.
En fördel som AMD faktiskt har redan nu, är att de är starkare på det som brukar begränsa prestanda i spel, alltså GPUn, även AMDs CPU räcker i de flesta fall till.
edit Vi vet ju inte allt om Vishera ännu, en logisk sak vore väl att minska L3 cachens storlek.