Nvidia Geforce "Pascal" GP104 fångas på bild

2016-04-11 16:20

Permalänk

SVclocker

Medlem ★

Plats: Falun
Registrerad: Feb 2010

●

Jag minns i fjol hur hypen var med AMD's 300 serie/HBM korten. Och sen hur allt i själva verket blev.

Jag ska nog vara extra försiktig nu med NVIDIA dessutom. Även om fast jag kommer stanna kvar på mitt 980 Ti.

Visa signatur

MSI X99A GODLIKE GAMING | i7-6950X 4.3GHz | 64GB RAM 3200MHz | RTX 2080

Nintendo Switch | PlayStation 5 | Xbox Series X

Min FZ Profil

Rapportera Redigera

Citera flera Citera (2)

2016-04-11 16:50

Permalänk

houze

Medlem ★

Plats: Sävsjö
Registrerad: Nov 2002

●

Skrivet av Videoapan:

Det som slår mig är att det kanske blir som med AMDs R9 Nano, de tar sjukt massa transistorer men kör dem i ganska låg klocka för att på så sätt få en imponerande prestanda/W. Det skulle förklara hur de planerar att klara av kylningen av så många transistorer på så liten yta, de tillåter dem helt enkelt inte att gå på full effekt. Det skulle kunna öppna upp för bra överklockning med custom-kylning om strömmen släpps fri (återigen, se på Nano som inte kan klockas på grund av strömbegränsning, är ju annars samma chip som FuryX).

Sen angående minnen så är väl betydelsen av de inte i närheten av betydelsen av GPU-klockan på de flesta moderna kort. Och lite som @tvelander skriver, det är först i höga upplösningar med flera grafikkort som man verkligen har nytta av allt minne (och då även all överföringshastighet, är minnet bara halvfullt räcker ju halva bandbredden (grovt förenklat)).

Gå till inlägget

Inte säkert att klockfrekvenser blir så låga, Tesla-korten med GP100 har core frekvens på 1328MHz och Tesla-korten brukar oftast vara lägre klockade än kretsarna i konsument-grafikkorten. GP100 har 300W TDP och är ungefär dubbelt så stor, så med samma frekvens borde GP104 dra 150W (+15-30W p.g.a. GDDR5) och ~165-180W lär inte vara några problem att kyla på en kretsyta som är 300 mm2, t.ex. GTX680 är i samma storlek, hade 195W TDP och den gick att klocka rätt bra.

Visa signatur

kill -s SIGCHLD `pidof Kenny`
bash: Oh my god, they killed Kenny
init: You Bastards

Rapportera Redigera

Citera flera Citera

2016-04-11 18:58

Permalänk

erixon

Medlem

Registrerad: Okt 2001

●

Jaha, hade nog trott att det skulle vara lite mer prestanda på GP104.
GP100 60SM-kluster (vara 56st aktiverade) och har en FP32 prestanda på 10600Gf vid 1480Mhz vilket ger SM-kluster ca 128F/klockcykel, vilket verkar rimligt.

GP104 har halva storleken, så rimligt vis har den halva antal SM-kluster, delvis 30st.
Om vi antar GP104 är klockad till 1600Mhz så får vi att GP104 (med alla kluster) FP32 prestanda på ca 6.1Tf vilket är ca 23% (6.144/4980~1.23) snabbare än 980 (standard).

Kolla man på minnes bandbredden som verkar bli 256GB/s vs 224GB/s så är det en ökning på 14%

Med andra ord verka den inte kunna klå 980ti...

Visa signatur

"Gravity is a myth, the earth sucks."

Rapportera Redigera

Citera flera Citera (2)

2016-04-11 20:24

Permalänk

Dinoman

Moderator

Testpilot ★

f.d. Dinoman 🦖

Plats: Älmhult
Registrerad: Jan 2002

●

Skrivet av erixon:

Jaha, hade nog trott att det skulle vara lite mer prestanda på GP104.
GP100 60SM-kluster (vara 56st aktiverade) och har en FP32 prestanda på 10600Gf vid 1480Mhz vilket ger SM-kluster ca 128F/klockcykel, vilket verkar rimligt.

GP104 har halva storleken, så rimligt vis har den halva antal SM-kluster, delvis 30st.
Om vi antar GP104 är klockad till 1600Mhz så får vi att GP104 (med alla kluster) FP32 prestanda på ca 6.1Tf vilket är ca 23% (6.144/4980~1.23) snabbare än 980 (standard).

Kolla man på minnes bandbredden som verkar bli 256GB/s vs 224GB/s så är det en ökning på 14%

Med andra ord verka den inte kunna klå 980ti...

Gå till inlägget

Det blir nog jämnt skägg.

Sen kan det finnas andra tekniker implementerade i GP104, t.ex. en ännu bättre komprimeringsteknik vilket skulle hämta upp lite av den klena minnesbandbredden.

Men nog är det Vega och GP100 som blir dom intressanta korten i år om man vill få en ordentlig prestanda boost.

Visa signatur

ASrock x470 Taichi Ultimate - AMD Ryzen R9 3900x - G.Skill Ripjaws@3.6GHz 16GB RAM - RTX 3080 Ti - Super Flower Leadex Gold 1000W - Phanteks Enthoo Pro - AOC AG35UCG 34" 3440x1440p@100Hz - kalaset vattenkylt

Rapportera Redigera

Citera flera Citera

2016-04-11 21:30

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av erixon:

Jaha, hade nog trott att det skulle vara lite mer prestanda på GP104.
GP100 60SM-kluster (vara 56st aktiverade) och har en FP32 prestanda på 10600Gf vid 1480Mhz vilket ger SM-kluster ca 128F/klockcykel, vilket verkar rimligt.

GP104 har halva storleken, så rimligt vis har den halva antal SM-kluster, delvis 30st.
Om vi antar GP104 är klockad till 1600Mhz så får vi att GP104 (med alla kluster) FP32 prestanda på ca 6.1Tf vilket är ca 23% (6.144/4980~1.23) snabbare än 980 (standard).

Kolla man på minnes bandbredden som verkar bli 256GB/s vs 224GB/s så är det en ökning på 14%

Med andra ord verka den inte kunna klå 980ti...

Gå till inlägget

Du räknar på 1920 shaders mao?
Det är väldigt lågt räknat. Antalet shaders skalar inte linjärt med kretsytan. Allra helst inte eftersom GP100 har en massa fokus på beräkningar som GP104 inte har. Tror nog vi får se 2560-2816 shaders på GP104. Vilket borde räcka mer än väl för att slå 980Ti med marginal.

Rapportera Redigera

Citera flera Citera

2016-04-11 21:52

Permalänk

erixon

Medlem

Registrerad: Okt 2001

●

Skrivet av Dinoman:

Det blir nog jämnt skägg.

Sen kan det finnas andra tekniker implementerade i GP104, t.ex. en ännu bättre komprimeringsteknik vilket skulle hämta upp lite av den klena minnesbandbredden.

Gå till inlägget

Visst finns det förbättringar, men jag tror fort farande bandbredden hamnar under 980ti även med förnyad komprimeringsteknik.
Det finns gränser hur effektiv komprimeringen kan bli, om GP104 ska få samma "bandbredd" 980ti så måste komprimeringen vara ca 31% bättre (336/256 ~ 1.31) samt inte ha för mycket latency.

Värt att notera är att GP100 har bandbredd på 720GB/s även om den inte använder all bandbredd så är den nästan 40% mer per SM-kluster än för GP104, så för att få liknade bandbredd som GP100 behövs GDDR5X eller en större bus exempel 384bitar. (för att uppnå 360GB/s)

Skrivet av Dinoman:

Men nog är det Vega och GP100 som blir dom intressanta korten i år om man vill få en ordentlig prestanda boost.

Gå till inlägget

Helt klart kommer det nya toppkorten att bli monster

Visa signatur

"Gravity is a myth, the earth sucks."

Rapportera Redigera

Citera flera Citera

2016-04-11 22:27

Permalänk

erixon

Medlem

Registrerad: Okt 2001

●

Skrivet av Aleshi:

Du räknar på 1920 shaders mao?
Det är väldigt lågt räknat. Antalet shaders skalar inte linjärt med kretsytan. Allra helst inte eftersom GP100 har en massa fokus på beräkningar som GP104 inte har. Tror nog vi får se 2560-2816 shaders på GP104. Vilket borde räcka mer än väl för att slå 980Ti med marginal.

Gå till inlägget

Visst är det så men kretsen verkar vara 294mm² delvis mindre än hälften av GP100 (610mm²/2 = 305mm²), och vissa delar exempelvis interfacet för PCI-E och video avkodare mm behövs det inte "dubbelt" av. Visst finns det annat som tar plats som inte finnas på GP104 exempel vis nVidia höghastighet länk. och en mindre "minnes" matris eller vad man ska kalla det.
Så visst kan den ha mer än 30 SM-kluster (1920) men att den skulle ha 40-44 SM-kluster (2560-2816) ser jag som osannolikt om de inte har slaktat FP64 prestandan helt (jämfört med GP100), men även då svårt att se få plats med 40-44 SM-kluster (2560-2816)

Det skulle innebära att de skulle kunna göra Krets med 60 SM-kluster i storleken ca +440mm² (294/40*60 ~ 441) med 384bitars bus och samma grafik prestanda som GP100... nja, jag lite svårt att tro på det...

Dessutom så verka bandbredden tyda SM-kluster hamnar runt 30 talet så kanske på 32.
Visst kan jag ha fel men det känns GP104 har hypas upp för mycket och information (om den är korrekt) verkar peka på åt det hållet.

Visa signatur

"Gravity is a myth, the earth sucks."

Rapportera Redigera

Citera flera Citera (1)

2016-04-11 23:43

Permalänk

Aleshi

Medlem ★

Registrerad: Nov 2011

●

Skrivet av erixon:

Visst är det så men kretsen verkar vara 294mm² delvis mindre än hälften av GP100 (610mm²/2 = 305mm²), och vissa delar exempelvis interfacet för PCI-E och video avkodare mm behövs det inte "dubbelt" av. Visst finns det annat som tar plats som inte finnas på GP104 exempel vis nVidia höghastighet länk. och en mindre "minnes" matris eller vad man ska kalla det.
Så visst kan den ha mer än 30 SM-kluster (1920) men att den skulle ha 40-44 SM-kluster (2560-2816) ser jag som osannolikt om de inte har slaktat FP64 prestandan helt (jämfört med GP100), men även då svårt att se få plats med 40-44 SM-kluster (2560-2816)

Det skulle innebära att de skulle kunna göra Krets med 60 SM-kluster i storleken ca +440mm² (294/40*60 ~ 441) med 384bitars bus och samma grafik prestanda som GP100... nja, jag lite svårt att tro på det...

Dessutom så verka bandbredden tyda SM-kluster hamnar runt 30 talet så kanske på 32.
Visst kan jag ha fel men det känns GP104 har hypas upp för mycket och information (om den är korrekt) verkar peka på åt det hållet.

Gå till inlägget

Grejen är den att FP64-prestandan brukar vara rätt slaktad på deras G***4 - G***8 -kretsar. Får tänka på att det är ungefär lika många transistorer som GM200 som har 3072 shaders och 384-bitars buss. Visst kan Pascal ha lite mer utrymmeskrävande komponenter. Men tror inte att det är på den skalan. Om det krävs 50% mer utrymme för ett visst antal shaders så borde det avspeglas i prestandan. Därför finner jag 1920 shaders högst osannolikt om de inte presterar ordentligt mycket bättre än de i Maxwell.

Rapportera Redigera

Citera flera Citera (1)

Nvidia Geforce "Pascal" GP104 fångas på bild

Externa nyheter

Spelnyheter från FZ