Nvidia Geforce "Pascal" GP104 fångas på bild

Permalänk
Medlem

Jag minns i fjol hur hypen var med AMD's 300 serie/HBM korten. Och sen hur allt i själva verket blev.

Jag ska nog vara extra försiktig nu med NVIDIA dessutom. Även om fast jag kommer stanna kvar på mitt 980 Ti.

Visa signatur

MSI X99A GODLIKE GAMING | i7-6950X 4.3GHz | 64GB RAM 3200MHz | RTX 2080

Nintendo Switch | PlayStation 5 | Xbox Series X

Min FZ Profil

Permalänk
Medlem
Skrivet av Videoapan:

Det som slår mig är att det kanske blir som med AMDs R9 Nano, de tar sjukt massa transistorer men kör dem i ganska låg klocka för att på så sätt få en imponerande prestanda/W. Det skulle förklara hur de planerar att klara av kylningen av så många transistorer på så liten yta, de tillåter dem helt enkelt inte att gå på full effekt. Det skulle kunna öppna upp för bra överklockning med custom-kylning om strömmen släpps fri (återigen, se på Nano som inte kan klockas på grund av strömbegränsning, är ju annars samma chip som FuryX).

Sen angående minnen så är väl betydelsen av de inte i närheten av betydelsen av GPU-klockan på de flesta moderna kort. Och lite som @tvelander skriver, det är först i höga upplösningar med flera grafikkort som man verkligen har nytta av allt minne (och då även all överföringshastighet, är minnet bara halvfullt räcker ju halva bandbredden (grovt förenklat)).

Inte säkert att klockfrekvenser blir så låga, Tesla-korten med GP100 har core frekvens på 1328MHz och Tesla-korten brukar oftast vara lägre klockade än kretsarna i konsument-grafikkorten. GP100 har 300W TDP och är ungefär dubbelt så stor, så med samma frekvens borde GP104 dra 150W (+15-30W p.g.a. GDDR5) och ~165-180W lär inte vara några problem att kyla på en kretsyta som är 300 mm2, t.ex. GTX680 är i samma storlek, hade 195W TDP och den gick att klocka rätt bra.

Visa signatur

kill -s SIGCHLD `pidof Kenny`
bash: Oh my god, they killed Kenny
init: You Bastards

Permalänk
Medlem

Jaha, hade nog trott att det skulle vara lite mer prestanda på GP104.
GP100 60SM-kluster (vara 56st aktiverade) och har en FP32 prestanda på 10600Gf vid 1480Mhz vilket ger SM-kluster ca 128F/klockcykel, vilket verkar rimligt.

GP104 har halva storleken, så rimligt vis har den halva antal SM-kluster, delvis 30st.
Om vi antar GP104 är klockad till 1600Mhz så får vi att GP104 (med alla kluster) FP32 prestanda på ca 6.1Tf vilket är ca 23% (6.144/4980~1.23) snabbare än 980 (standard).

Kolla man på minnes bandbredden som verkar bli 256GB/s vs 224GB/s så är det en ökning på 14%

Med andra ord verka den inte kunna klå 980ti...

Visa signatur

"Gravity is a myth, the earth sucks."

Permalänk
Moderator
Testpilot
Skrivet av erixon:

Jaha, hade nog trott att det skulle vara lite mer prestanda på GP104.
GP100 60SM-kluster (vara 56st aktiverade) och har en FP32 prestanda på 10600Gf vid 1480Mhz vilket ger SM-kluster ca 128F/klockcykel, vilket verkar rimligt.

GP104 har halva storleken, så rimligt vis har den halva antal SM-kluster, delvis 30st.
Om vi antar GP104 är klockad till 1600Mhz så får vi att GP104 (med alla kluster) FP32 prestanda på ca 6.1Tf vilket är ca 23% (6.144/4980~1.23) snabbare än 980 (standard).

Kolla man på minnes bandbredden som verkar bli 256GB/s vs 224GB/s så är det en ökning på 14%

Med andra ord verka den inte kunna klå 980ti...

Det blir nog jämnt skägg.

Sen kan det finnas andra tekniker implementerade i GP104, t.ex. en ännu bättre komprimeringsteknik vilket skulle hämta upp lite av den klena minnesbandbredden.

Men nog är det Vega och GP100 som blir dom intressanta korten i år om man vill få en ordentlig prestanda boost.

Visa signatur

ASrock x470 Taichi Ultimate - AMD Ryzen R9 3900x - G.Skill Ripjaws@3.6GHz 16GB RAM - RTX 3080 Ti - Super Flower Leadex Gold 1000W - Phanteks Enthoo Pro - AOC AG35UCG 34" 3440x1440p@100Hz - kalaset vattenkylt

Permalänk
Medlem
Skrivet av erixon:

Jaha, hade nog trott att det skulle vara lite mer prestanda på GP104.
GP100 60SM-kluster (vara 56st aktiverade) och har en FP32 prestanda på 10600Gf vid 1480Mhz vilket ger SM-kluster ca 128F/klockcykel, vilket verkar rimligt.

GP104 har halva storleken, så rimligt vis har den halva antal SM-kluster, delvis 30st.
Om vi antar GP104 är klockad till 1600Mhz så får vi att GP104 (med alla kluster) FP32 prestanda på ca 6.1Tf vilket är ca 23% (6.144/4980~1.23) snabbare än 980 (standard).

Kolla man på minnes bandbredden som verkar bli 256GB/s vs 224GB/s så är det en ökning på 14%

Med andra ord verka den inte kunna klå 980ti...

Du räknar på 1920 shaders mao?
Det är väldigt lågt räknat. Antalet shaders skalar inte linjärt med kretsytan. Allra helst inte eftersom GP100 har en massa fokus på beräkningar som GP104 inte har. Tror nog vi får se 2560-2816 shaders på GP104. Vilket borde räcka mer än väl för att slå 980Ti med marginal.

Permalänk
Medlem
Skrivet av Dinoman:

Det blir nog jämnt skägg.

Sen kan det finnas andra tekniker implementerade i GP104, t.ex. en ännu bättre komprimeringsteknik vilket skulle hämta upp lite av den klena minnesbandbredden.

Visst finns det förbättringar, men jag tror fort farande bandbredden hamnar under 980ti även med förnyad komprimeringsteknik.
Det finns gränser hur effektiv komprimeringen kan bli, om GP104 ska få samma "bandbredd" 980ti så måste komprimeringen vara ca 31% bättre (336/256 ~ 1.31) samt inte ha för mycket latency.

Värt att notera är att GP100 har bandbredd på 720GB/s även om den inte använder all bandbredd så är den nästan 40% mer per SM-kluster än för GP104, så för att få liknade bandbredd som GP100 behövs GDDR5X eller en större bus exempel 384bitar. (för att uppnå 360GB/s)

Skrivet av Dinoman:

Men nog är det Vega och GP100 som blir dom intressanta korten i år om man vill få en ordentlig prestanda boost.

Helt klart kommer det nya toppkorten att bli monster

Visa signatur

"Gravity is a myth, the earth sucks."

Permalänk
Medlem
Skrivet av Aleshi:

Du räknar på 1920 shaders mao?
Det är väldigt lågt räknat. Antalet shaders skalar inte linjärt med kretsytan. Allra helst inte eftersom GP100 har en massa fokus på beräkningar som GP104 inte har. Tror nog vi får se 2560-2816 shaders på GP104. Vilket borde räcka mer än väl för att slå 980Ti med marginal.

Visst är det så men kretsen verkar vara 294mm² delvis mindre än hälften av GP100 (610mm²/2 = 305mm²), och vissa delar exempelvis interfacet för PCI-E och video avkodare mm behövs det inte "dubbelt" av. Visst finns det annat som tar plats som inte finnas på GP104 exempel vis nVidia höghastighet länk. och en mindre "minnes" matris eller vad man ska kalla det.
Så visst kan den ha mer än 30 SM-kluster (1920) men att den skulle ha 40-44 SM-kluster (2560-2816) ser jag som osannolikt om de inte har slaktat FP64 prestandan helt (jämfört med GP100), men även då svårt att se få plats med 40-44 SM-kluster (2560-2816)

Det skulle innebära att de skulle kunna göra Krets med 60 SM-kluster i storleken ca +440mm² (294/40*60 ~ 441) med 384bitars bus och samma grafik prestanda som GP100... nja, jag lite svårt att tro på det...

Dessutom så verka bandbredden tyda SM-kluster hamnar runt 30 talet så kanske på 32.
Visst kan jag ha fel men det känns GP104 har hypas upp för mycket och information (om den är korrekt) verkar peka på åt det hållet.

Visa signatur

"Gravity is a myth, the earth sucks."

Permalänk
Medlem
Skrivet av erixon:

Visst är det så men kretsen verkar vara 294mm² delvis mindre än hälften av GP100 (610mm²/2 = 305mm²), och vissa delar exempelvis interfacet för PCI-E och video avkodare mm behövs det inte "dubbelt" av. Visst finns det annat som tar plats som inte finnas på GP104 exempel vis nVidia höghastighet länk. och en mindre "minnes" matris eller vad man ska kalla det.
Så visst kan den ha mer än 30 SM-kluster (1920) men att den skulle ha 40-44 SM-kluster (2560-2816) ser jag som osannolikt om de inte har slaktat FP64 prestandan helt (jämfört med GP100), men även då svårt att se få plats med 40-44 SM-kluster (2560-2816)

Det skulle innebära att de skulle kunna göra Krets med 60 SM-kluster i storleken ca +440mm² (294/40*60 ~ 441) med 384bitars bus och samma grafik prestanda som GP100... nja, jag lite svårt att tro på det...

Dessutom så verka bandbredden tyda SM-kluster hamnar runt 30 talet så kanske på 32.
Visst kan jag ha fel men det känns GP104 har hypas upp för mycket och information (om den är korrekt) verkar peka på åt det hållet.

Grejen är den att FP64-prestandan brukar vara rätt slaktad på deras G***4 - G***8 -kretsar. Får tänka på att det är ungefär lika många transistorer som GM200 som har 3072 shaders och 384-bitars buss. Visst kan Pascal ha lite mer utrymmeskrävande komponenter. Men tror inte att det är på den skalan. Om det krävs 50% mer utrymme för ett visst antal shaders så borde det avspeglas i prestandan. Därför finner jag 1920 shaders högst osannolikt om de inte presterar ordentligt mycket bättre än de i Maxwell.