Nvidia GK110 och Tesla K20 - sämre än väntat
Nvidia håller på att förbereda sitt nya flaggskepp i Tesla-segmentet efter väldigt lång väntan från deras kunder. Nu visar det sig att Nvidia är långt ifrån att uppfylla vad som först utlovats. Beräkningskraften är mycket lägre än väntat och även mängden minne har halverats.
Servermarknaden har länge väntat på uppföljaren till den Fermi-baserade Tesla M2090 och har bakom stängda dörrar varit allt annat än nöjda på alla förseningar från Nvidia. Men nu verkar Tesla K20 vara på ingång som kommer baseras på företagets nya grafikprocessor GK110 med Kepler-arkitekturen. Med 7,1 miljarder transistorer är det en riktig gigant som beräknas lägga sig på cirka 600 kvadratmillimeter. Nvidia gick tidigare i år ut med många löften om vad K20 skulle leverera och då var det sannerligen någonting värt att imponeras över.
Det nya flaggskeppet skulle bli runt tre gånger kraftfullare än föregående Tesla M2090. Nvidia hade satt ett mål på 4 500 gigaflops i singelprecisionsprestanda och 1 500 gigaflops i dubbelprecisionsberäkningar - tillräckligt för att slå AMD Firepro S9000 och Intel Xeon Phi på fingrarna med råge. Nu när vi börjar närma oss lanseringen ser det inte riktigt lika positivt ut. Den rekordstora kretsen har inte helt oväntat fått dåliga yields (fungerande kretsar i procent) hos TSMC, någonting som tvingat Nvidia att ta ett steg tillbaka med Tesla K20.
På grund av tillverkningsproblemen har Nvidia tvingats skala tillbaka GK110 och stänga av två SMX-enheter med 192 CUDA-kärnor vardera. Resultatet blir att Tesla K20 kommer levereras med 2 496 kärnor istället för 2 880. Även klockfrekvensen som borde legat på 781 megahertz och uppåt för att nå Nvidias målsättning har fått ta ett steg tillbaka och lägger sig istället på 705 megahertz. Resultatet blir att det Tesla K20 som Nvidia faktiskt kommer klara av att leverera får singelprecisionsprestanda på 3 519 gigaflops och 1 173 gigaflops i dubbelprecisionsprestanda.
Nvidia var tystlåtna med minnesmängden om Tesla K20 men det från början var planen att det skulle utrustas med hela tolv gigabyte GDDR5-minne. Samsung och Hynix ska vara de enda som är kapabla att tillverka tillräckligt höga kapaciteter för att möjliggöra ett sådant kort. Men på grund av den dåliga efterfrågan ska massproduktion aldrig ha inletts. En annan källa säger att båda aktörerna fråga om extra pengar från Nvidia för att ta detta högkapacitets GDDR5-minne till marknaden och att de samtidigt vägrade ge ett exklusivitetsavtal till Nvidia. Resultatet blir alltså att uppföljaren till Tesla M2090, Tesla K20, får exakt samma minnesmängd på sex gigabyte GDDR5 - varav fem gigabyte går att använda med ECC (Error-correcting code).
Med facit i hand ser det ut som att Nvidias nya flaggskepp inte kommer spela i en klass för sig som först väntat. Den teoretiska dubbelprecisionsprestandan är bara marginellt högre än både AMD Firepro S900 och Intel Xeon Phi. Det sistnämnda är ett stort bekymmer för Nvidia då många av deras potentiella kunder kan välja att gå över till Intels alternativ, där det är lättare att återanvända stora delar x86-kompatibel kod. Det är fortfarande en klar förbättring mot deras föregående generation men den stora frågan är om det är tillräckligt mot de konkurrerande alternativen?
http://www.nordichardware.se/nyheter/71-graphics/46734-nvidia...
Hur kommer detta påverka släppet för "big kepler"? Kommer den försenas? Kommer den inte komma alls ?
Verkar som att det inte är första gången nvidia gör för stor o krånglig.