Nvidia GK110 och Tesla K20 - sämre än väntat

Permalänk
Medlem

Nvidia GK110 och Tesla K20 - sämre än väntat

Nvidia håller på att förbereda sitt nya flaggskepp i Tesla-segmentet efter väldigt lång väntan från deras kunder. Nu visar det sig att Nvidia är långt ifrån att uppfylla vad som först utlovats. Beräkningskraften är mycket lägre än väntat och även mängden minne har halverats.
Servermarknaden har länge väntat på uppföljaren till den Fermi-baserade Tesla M2090 och har bakom stängda dörrar varit allt annat än nöjda på alla förseningar från Nvidia. Men nu verkar Tesla K20 vara på ingång som kommer baseras på företagets nya grafikprocessor GK110 med Kepler-arkitekturen. Med 7,1 miljarder transistorer är det en riktig gigant som beräknas lägga sig på cirka 600 kvadratmillimeter. Nvidia gick tidigare i år ut med många löften om vad K20 skulle leverera och då var det sannerligen någonting värt att imponeras över.
Det nya flaggskeppet skulle bli runt tre gånger kraftfullare än föregående Tesla M2090. Nvidia hade satt ett mål på 4 500 gigaflops i singelprecisionsprestanda och 1 500 gigaflops i dubbelprecisionsberäkningar - tillräckligt för att slå AMD Firepro S9000 och Intel Xeon Phi på fingrarna med råge. Nu när vi börjar närma oss lanseringen ser det inte riktigt lika positivt ut. Den rekordstora kretsen har inte helt oväntat fått dåliga yields (fungerande kretsar i procent) hos TSMC, någonting som tvingat Nvidia att ta ett steg tillbaka med Tesla K20.

På grund av tillverkningsproblemen har Nvidia tvingats skala tillbaka GK110 och stänga av två SMX-enheter med 192 CUDA-kärnor vardera. Resultatet blir att Tesla K20 kommer levereras med 2 496 kärnor istället för 2 880. Även klockfrekvensen som borde legat på 781 megahertz och uppåt för att nå Nvidias målsättning har fått ta ett steg tillbaka och lägger sig istället på 705 megahertz. Resultatet blir att det Tesla K20 som Nvidia faktiskt kommer klara av att leverera får singelprecisionsprestanda på 3 519 gigaflops och 1 173 gigaflops i dubbelprecisionsprestanda.
Nvidia var tystlåtna med minnesmängden om Tesla K20 men det från början var planen att det skulle utrustas med hela tolv gigabyte GDDR5-minne. Samsung och Hynix ska vara de enda som är kapabla att tillverka tillräckligt höga kapaciteter för att möjliggöra ett sådant kort. Men på grund av den dåliga efterfrågan ska massproduktion aldrig ha inletts. En annan källa säger att båda aktörerna fråga om extra pengar från Nvidia för att ta detta högkapacitets GDDR5-minne till marknaden och att de samtidigt vägrade ge ett exklusivitetsavtal till Nvidia. Resultatet blir alltså att uppföljaren till Tesla M2090, Tesla K20, får exakt samma minnesmängd på sex gigabyte GDDR5 - varav fem gigabyte går att använda med ECC (Error-correcting code).

Med facit i hand ser det ut som att Nvidias nya flaggskepp inte kommer spela i en klass för sig som först väntat. Den teoretiska dubbelprecisionsprestandan är bara marginellt högre än både AMD Firepro S900 och Intel Xeon Phi. Det sistnämnda är ett stort bekymmer för Nvidia då många av deras potentiella kunder kan välja att gå över till Intels alternativ, där det är lättare att återanvända stora delar x86-kompatibel kod. Det är fortfarande en klar förbättring mot deras föregående generation men den stora frågan är om det är tillräckligt mot de konkurrerande alternativen?

http://www.nordichardware.se/nyheter/71-graphics/46734-nvidia...

Hur kommer detta påverka släppet för "big kepler"? Kommer den försenas? Kommer den inte komma alls ?
Verkar som att det inte är första gången nvidia gör för stor o krånglig.

Permalänk
Medlem

Hmm tja. Det var ingen vidare munter läsning direkt, verkar som att AMD ligger en aningen före Nvidia på både server och grafikkretsar

Visa signatur

🖥️ Fractal Design Node 804 • Asrock Fatal1ty X99M Killer • Intel 5820K • Noctua NH-U12S • Corsair Vengeance 16GB • Gigabyte GTX 970 • be quiet! Dark Power Pro 550w • 2x Intel 520 120GB • 2x 1TB • 1x 3TB
💻 Microsoft Surface Pro (8GB/128GB)
 iPhone 11 64GB 🎧 SONY WH-1000XM3
🎵📲 SONY NW-ZX300 64GB [Region changed & Mr Walkman custom firmware loaded] + 256GB xtra • Audio Technica ATH-M50X

Permalänk
Entusiast
Skrivet av Jonathanknet:

Wall of text

Det är inte så att det där kanske är Geforce versionen?
Låter rimligt att det skulle kunna vara 780 och att endast de allra finaste kretsarna blir Tesla kort?
Eftersom att Nvidia inte planerar att släppa Maxwell förräns 2014 så kommer ju yieldsen förbättras extremt under tiden, så att Nvidia kanske drar en chansning och går med förlust i början men hoppas på att tjäna igen det under tiden?

Visa signatur

EVGA GTX 1080 Ti | Intel Core i9-9900K | Fractal Design Celsius S24 | ASUS ROG Strix Z390-I | 32 GB DDR4 @3200Mhz | Corsair SF750 | Samsung 970 Evo Plus 1 TB (M.2) | Crucial MX 500 & 300 1TB (2,5") | Louqe Ghost S1 Ash | AOC AGON AG271QG, Eizo Foris FS2333 & TCL 75EP660 | Windows 11 64-bit

Permalänk
Medlem
Skrivet av MrAdde:

Det är inte så att det där kanske är Geforce versionen?
Låter rimligt att det skulle kunna vara 780 och att endast de allra finaste kretsarna blir Tesla kort?
Eftersom att Nvidia inte planerar att släppa Maxwell förräns 2014 så kommer ju yieldsen förbättras extremt under tiden, så att Nvidia kanske drar en chansning och går med förlust i början men hoppas på att tjäna igen det under tiden?

Låter knappast troligt dock.
Inget företag vill med flit chansa på en produkt för att det kanske skall blir bättre framöver med senare produkter. För mycket kostnader inblandade.

Att detta inträffar är heller ingen direkt nyhet. När Fermi skulle släppas var det också där en höjning av kretsen till skyarna av nVidia.
När kortet väl släpptes vet vi ju alla att det inte blev som det var lovat på långa vägar...

Permalänk
Entusiast
Skrivet av wibbe44:

Låter knappast troligt dock.
Inget företag vill med flit chansa på en produkt för att det kanske skall blir bättre framöver med senare produkter. För mycket kostnader inblandade.

Att detta inträffar är heller ingen direkt nyhet. När Fermi skulle släppas var det också där en höjning av kretsen till skyarna av nVidia.
När kortet väl släpptes vet vi ju alla att det inte blev som det var lovat på långa vägar...

Nja, då släppte man ju först 480 som var en trasig GF100, sedan släppte man ju den hela pga bättre yields - GTX 580 alltså.
Nu har vi ju redan haft en generation av Kepler med små kretsar, så Nvidia kanske lärde sig av sina misstag att inte bygga för stora kretsar precis när man börjar använda en ny tillverkningsteknik.
Då räknade de kanske inte med att TSMC skulle faila så hårt med 28nm iofs.

Visa signatur

EVGA GTX 1080 Ti | Intel Core i9-9900K | Fractal Design Celsius S24 | ASUS ROG Strix Z390-I | 32 GB DDR4 @3200Mhz | Corsair SF750 | Samsung 970 Evo Plus 1 TB (M.2) | Crucial MX 500 & 300 1TB (2,5") | Louqe Ghost S1 Ash | AOC AGON AG271QG, Eizo Foris FS2333 & TCL 75EP660 | Windows 11 64-bit

Permalänk
Medlem
Skrivet av MrAdde:

Nja, då släppte man ju först 480 som var en trasig GF100, sedan släppte man ju den hela pga bättre yields - GTX 580 alltså.
Nu har vi ju redan haft en generation av Kepler med små kretsar, så Nvidia kanske lärde sig av sina misstag att inte bygga för stora kretsar precis när man börjar använda en ny tillverkningsteknik.
Då räknade de kanske inte med att TSMC skulle faila så hårt med 28nm iofs.

Dock så var ju inte tanken att den skulle vara "trasig" utan det var ju exakt samma visa som nu. De ville mer än vad som var möjligt. De har mao inte lärt sig av sitt misstag och därför kommer inte detta som någon direkt nyhet...
Den enda förloraren på detta är nVidia. Det är aldrig bra att kasta sten i glashus, men det verkar inte nVidia förstått, utan här trampar man på samma mina en gång till.

Permalänk
Skrivet av wibbe44:

Dock så var ju inte tanken att den skulle vara "trasig" utan det var ju exakt samma visa som nu. De ville mer än vad som var möjligt. De har mao inte lärt sig av sitt misstag och därför kommer inte detta som någon direkt nyhet...
Den enda förloraren på detta är nVidia. Det är aldrig bra att kasta sten i glashus, men det verkar inte nVidia förstått, utan här trampar man på samma mina en gång till.

Problemet de har är just "minan" du pratar om, nämligen TSMC som tyvärr inte har lyckats hålla i närheten av samma tempo som Intel vilket har drabbat inte bara nVidia utan också tex AMD.

Nu säger jag inte att det är klokt att försöka tillverka 600mm^2 stora kretsar och framför allt inte att försöka göra det när en tillverkare har haft stora problem med kvantiteten den senaste teknikövergångarna men jag kan tänka mig att det är jäkligt frustrerande att sitta där som ingenjör och ha designat den fetaste kretsen ever men inte lyckas få den igenom produktionen för att deras partner återigen har problem.

Permalänk
Medlem

Fast man kan också se det som att kretsdesignern totalt misslyckats med sitt uppdrag iom att de har designat kretsar som inte är tillverkningsbara, dvs det är lätt att skylla på andra men som i detta fall kanske svårare att lägga sig på en nivå där kretsarna är konkurrenskraftiga och samtidigt tillverkningsbara med dagens teknik.

Det är ingen som klarar av att hålla Intels tempo och det är lite av problemet, hur man inte i nu läget funderar på att bryta upp Intel som företag pga dess dominerande ställning är för mig en gåta. Ett alternativ skulle tex vara att tillverkningen läggs i ett eget bolag som då blir öppet att ta emot "externa" kunder.

Visa signatur

/havoc

Permalänk
Entusiast
Skrivet av Batman:
Skrivet av wibbe44:
Skrivet av havoc:
Skrivet av Jonathanknet:

Tänkte uppdatera er om läget.

http://www.anandtech.com/show/6446/nvidia-launches-tesla-k20-...

Visa signatur

EVGA GTX 1080 Ti | Intel Core i9-9900K | Fractal Design Celsius S24 | ASUS ROG Strix Z390-I | 32 GB DDR4 @3200Mhz | Corsair SF750 | Samsung 970 Evo Plus 1 TB (M.2) | Crucial MX 500 & 300 1TB (2,5") | Louqe Ghost S1 Ash | AOC AGON AG271QG, Eizo Foris FS2333 & TCL 75EP660 | Windows 11 64-bit

Permalänk
Entusiast

Anantech säger raka motsatsen och hävdar bestämt att Nvidia har bra yields, eller ja, Nvidia hävdar att de har bra yields men det verkar som om annan information stämmer med deras påstående.

Vidare har TS missat att det släpps två K20, en K20 och en K20X där den senare versionen har 15 SMX och 6 minnescontrollers så det är en viss skillnad mellan den och K20.

Sen är jag fortfarande tveksam till att det här monstret kommer släppas som Geforece med tanke på att det är ännu mer beräkningsinriktat än Fermi var. Så risken är att man inte får ut så väldigt mycket mer prestanda mot GK104 samtidigt som strömdörbruking och pris sticker. Skulle väl vara om de kränger av lågt binnade kretsar som de inte kan ha till Tesla eller Quadro men det är ju också tveksamt om det är vettigt. Men vi får se, kanske släpper det en dyr serie med extrema kort bara för att göra lite PR och sno åt sig prestandakronan. Om rapporten från Anandetch stämmer kommer det dock dröja för det verkar som om Nvidia har fler beställningar än kort och enkel matematik säger att de mycket hellre säljer Tesla för $3000 än Geforce för $500 när tillverkningskostnaderna är i princip samma.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Entusiast
Skrivet av Zotamedu:

Om rapporten från Anandetch stämmer kommer det dock dröja för det verkar som om Nvidia har fler beställningar än kort och enkel matematik säger att de mycket hellre säljer Tesla för $3000 än Geforce för $500 när tillverkningskostnaderna är i princip samma.

Fast de korten som har defekta SMX'er kan man ju inte sälja som Tesla kort i vilket fall..

Visa signatur

EVGA GTX 1080 Ti | Intel Core i9-9900K | Fractal Design Celsius S24 | ASUS ROG Strix Z390-I | 32 GB DDR4 @3200Mhz | Corsair SF750 | Samsung 970 Evo Plus 1 TB (M.2) | Crucial MX 500 & 300 1TB (2,5") | Louqe Ghost S1 Ash | AOC AGON AG271QG, Eizo Foris FS2333 & TCL 75EP660 | Windows 11 64-bit