Skrivet av ClintBeastwood:
Vore det inte bättre och kanske offra lite kretsar som inte klarar låg spänning och se bättre ut i benchmarkresultat istället? Jag frågar dig eftersom du verkar ha koll på såna saker så varför gör man inte det för det är ju inget specifikt för Vega utan även 400-500. Förstår så klart att du inte kan berätta hur dom tänker och dom har säkert goda anledningar men varför tror du?
Precis som du säger så blir det här inlägget ren spekulation, men det kan ju vara kul med lite sånt ibland.
Lång historia kort så tror jag att yielden på Vega 10 var fullständigt katastrofal, och vad värre är, att en del av defekterna inte kunde upptäckas förrän man hade monterat ihop den med HBM2-kretsarna på en interposer.
Men vi backar bandet lite. Det första man skall inse är att kostnaden för att utveckla ett helt nytt chip har rakat i höjden något alldeles absurt:
https://www.extremetech.com/computing/272096-3nm-process-node
(Jag vet inte om den siten är något att lita på i allmänhet, men siffrorna på vad det kostat att utveckla chip på äldre noder kan inte vara så kontroversiella).
AMD utvecklade GCN delvis för att motverka detta. De kan designa en CU med shaders och texturenheter, en centralenhet (dispatcher, geometrienheter osv) en backend med ROPpar och en memory controller, och sedan para ihop dessa som de vill och få ett nytt chip till ganska låg kostnad. Tahiti (7970) hade sex memory controllers och bara 32 ROPpar, men i övrigt har dessa två varit kopplade precis som hos nVidia, så antagligen är de ett block numer. Detta har varit nyckeln till AMDs framgångar bland konsollerna - de kan plocka en CPU här, några shaders där, en memory controller och lite annat och få ihop ett special-gjort chip till låg kostnad och sälja med liten vinst. Även om man uppdaterat lite här och var, har man levt länge på jobbet som gjordes med att utveckla första GCN. AMD gav tidigt upp på 20nm-processen (medan nVidia verkar ha gjort ett ärligt försök innan de gav upp), och har egentligen inte gjort något stort designjobb sen de chip som kom ut 2012.
Jag vet inte om du minns, men när AMD körde med kodnamn baserade på öar, hette en generation "Arctic Islands", med chippen Greenland, Ellesmere, Baffin och Lexa (det sista var inte med så mycket). När de bytte till stjärnor, blev Ellesmere till Polaris 10, Baffin Polaris 11 och Lexa Polaris 12. Greenland blev Vega 10. De var alltså en generation i ett läge, innan de delades upp. Vega 10 borde alltså ha kommit ut nästan samtidigt som Polaris 10.
Polaris är något nästan unikt inom grafikkort: det är helt kompatibelt med Tonga och Fiji, de två sista chippen på 28nm. AMD kallar den feature leveln "GFX 8". AMD har alltså inte designat om dem alls, utan bara portat sin gamla design från 28nm TSMC (plant) till 14nm GF (FinFET). Att Radeon 480 inte klockar lika högt som nVidias kort är således inte så konstigt, och AMD måste varit väl medvetna om att det antagligen skulle gå så. Det fungerar som en spoiler för Geforce 1060 och sålde säkert OK för den tämligen minimala investering som AMD måste ha gjort i det, men det kunde varit så mycket bättre. Så varför portade AMD bara ett gammalt chip? Min gissning är att de inte hann eller inte hade råd att göra en helt ny design, och bara kapade kostnaderna maximalt för att ha något ute samtidigt som nVidia. Om det blev halvbra så gjorde det inte så mycket, chippet skulle ju bara leva ett år. Den nya designen var Vega, GFX9, äntligen designad för 14nm.
Vegas lanseringsdatum sköts hela tiden upp, och försenades ännu mer med "Frontier Edition" och andra dumheter, trots att vi sett testchip ganska många månader tidigare. Jag tror att de första chippen som kom tillbaka från GF var katastrofalt dåliga. Omdesignen för 14nm gav inte alls de vinster AMD hade räknat med - de hade inte lagt ner två miljarder transistorer på att jaga upp klockfrekvensen om de vetat att den bara skulle hamna runt 50 MHz högre än vad Polaris 10 kunde klara. GFs process var helt enkelt för dålig - den drog för mycket ström, och korten power-throttlade. AMD försökte vänta för att få fram bättre chip, men det hjälpte inte.
I det här läget beslutade sig AMD för att rädda det som räddas kunde. Vega 11 försvann från kartan utan att vi ens var säkra på att vi såg det. Det verkar ha varit en ersättare till Polaris 10, men nu när det ändå inte skulle slå Polaris 10 så fanns det ingen anledning att utveckla det. Istället fick vi "Polaris 20", där AMD helt enkelt överklockade så mycket de klarade. Ingen anledning att hålla igen nu - de var redan hungrigare på el än nVidia, så nu gällde det att få ut så mycket man kunde av chippet. Vega 10 kände man sig tvungen att lansera, och nu fick man vackert prissätta den mot vad den presterade. Vega 56 kunde inte kosta mer än en Geforce 1070, och Vega 64 som en 1080. Problemet var mest att chippen säkert kostade AMD mer än så att producera. Anandtech, som annars är ganska snälla, kallade lanseringen för kaos:
https://www.anandtech.com/show/11717/the-amd-radeon-rx-vega-6...
Det har hetat att miners har köpt alla Vega 56 och Vega 64. De har de säkert, men jag tror också att AMD inte byggt så många, för de har gått back på varenda chip. Hade det funnits massor hos miners hade de dykt upp på begagnat-marknaden i mängder nu, och det gör de inte. Det finns däremot en massa 570/580 och diverse nVidia-kort.
Har man bara ett litet antal chip att sälja, kan man inte dela upp dem mer genom att göra en SKU till - Vega Nano dök aldrig upp, trots att det tydligt fanns kretskort designade för den (exempelvis Pulse-korten). Man fick helt enkelt baka ihop alla chip i så få SKUer som möjligt, designade direkt mot 1070 och 1080, och då blir det inga lågspännings-chip.
De senaste månaderna har det hänt något. Jag fick själv tag i ett Vega 56 med tredjepartskylare för 300 pund, vilket faktiskt är en bit under MSRP. Det kortet går att undervolta och överklocka med lätthet, och så är det för alla andra som får tag i Vega nu. Däremot är det god blandning för de som har ett äldre chip.
Jag tror att de Vega som kommer ut nu har bättre yield och hade klarat sig med mycket lägre spänning, och hade AMD lanserat idag hade de satt spänningen lägre. Om det är GF som börjar få ordning på något eller om det är AMD som fått till en ny stepping vet jag inte, men det verkar tydligt att processen inte sprider så katastrofalt längre.
Så varför inte göra en ny lansering, "Vega 56X" med lägre spänning och högre klockat HBM2? Jag har väntat lite på ett sådant kort - det finns ett beräkningskort som heter WX8200 som jag tänkte var mitt "Vega 56X" - men det verkar inte komma. Det om något antyder väl att det finns något nytt på gång.