Anmäl dig till Roborock Challenge!

Nvidia Ampere – en teknisk djupdykning

Permalänk
Medlem
Skrivet av Yoshman:

Slutligen: om man går på vad som sagts om RTX IO utförs det på Tensor-kärnorna. Kan bli ett problem i spel som använder DLSS, men i övriga spel används inte Tensor-kärnorna alls så borde rimligen inte bli någon större prestandapåverkan.

Här kan det även vara värt att påpeka att som det fungerar nu sker det inte heller gratis. Jag har sett påståenden om att det kan belasta ett par processorkärnor fullt ut (i praktiken fördelas det dock över tillgängliga kärnor). Då är också en del av det overhead i form av instruktioner för att dekomprimera datan. Oavsett hur man gör kostar det resurser men att använda GPU;n gör det mycket effektivare.

Permalänk
Medlem
Skrivet av Aleshi:

Jag pratar inte om att förrendera. Jag pratar om att påbörja rendera nuläget medan den tidigare framen färdigställs. Det finns ingen mening med att början av pipen är oanvänd för att slutet av den fortfarand jobbar med en frame. Man behöver inte vänta på att den nått skärmen innan man börjar arbetet med nästa.

Och tiden är visst valbar, inom vilket område man kan välja är beroende på arkitektur och hur snabbt grafikkort man har. Men du kan välja kortare tid om du väljer att rendera lägre upplösning med mindre krävande effekter. Det är därför framerate går upp när du sänker inställningar.

vi pratar om ärtor o päron... du kan inte ändra förutsättningarna mellan varje frame är min poäng - så ja, om du kör 1024x768 så kanske ett "äldre" RTX kort kan hinna med

Permalänk
Medlem
Skrivet av Tea42BBS:

vi pratar om ärtor o päron... du kan inte ändra förutsättningarna mellan varje frame är min poäng - så ja, om du kör 1024x768 så kanske ett "äldre" RTX kort kan hinna med

Du sa att du inte förstod eftersom enligt artikeln borde pre 3-serie kort maxa 30 FPS eller lägre. Det finns inget i artikeln som antyder att de korten inte kan maxa mycket högre än så. Och benchmarks visar mycket riktigt att de maxar långt högre än så även i höga upplösningar.

Skrivet av scara:

Du har rätt, Ampere eller iaf GA104 och GA102 mellan och inbördes kan skala linjärt. Förvånande med tanke på att det inte var så för Pascal; 1080Ti +50% mer kärnor över 1080, är ~35% snabbare, detta kan inte förklaras med +100 MHz). Sen så har ju vi AMD och dess GCN. Fury X och R9 285 (eller vad den nu heter, varför byter AMD namnschema åtminstone varannan generation....) tillhör samma generation enligt Anandtech ("GCN 1.2") men prestandaförbättringen vill jag minnas var så långt ifrån linjärt man kan komma. Där var det arkitekturen (och/eller som det ryktades om ROPS/Shader Engines) och effektförbrukningen (krävdes vattenkylning) som satte stopp.

Är inte riktigt med på var du har fått siffrorna ifrån. Men om du multiplicerar frekvenser och beräkningsenheter på de båda korten så ser du att 1080Ti har 29% högre teoretisk prestanda i basfrekvens och 28% högre prestanda i turbo. När jag kollade ett prestandaindex på Sweclockers i 4K så ligger 1080Ti 29% snabbare i DX12 och 31% snabbare i DX11. Med tanke på att de båda rör sig lite inom sitt frekvensspann så är det väldigt spot on om du frågar mig.

Och sedan tänker jag nog att det är mycket som gör att 285 vs Fury X inte är jämförbara. Dels har du minnet där 285 är cripplat och är bandbreddssvultet och har för lite VRAM, och Fury X har HBM-minne som presterar enormt mycket bättre.
Sedan är de i så pass olika klasser att du har svårt att hitta test inte är för lätt för Fury X och inte är för tungt för 285. Det syns när man räknar också. Fury X har 160% högre teoretisk prestanda, och presterar 106% bättre i 1080P, 125% bättre i 1440P, och 208% bättre i 4K. Resultaten skevar av olika anledningar åt olika håll eftersom de är för långt i från varandra prestandamässigt för att något bench ska vara rättvist för båda. I 1080P flaskas Fury X av processorn mycket mer, i 1440P är det mer rättvist, och i 4K så verkligen avlider 285 och faller långt efter eftersom den är strypt på minnesbandbredd och minne, medan Fury X med sitt HBM skiner. Det var helt enkelt ont om spel som var så grafiskt krävande att de inte fick CPU att flaska Fury X i låga upplösningar samtidigt som de inte var för tunga för minnessytemet på 285 i höga upplösningar.

I normala fall så brukar minne och övriga beräkningsenheter vara anpassade till att skala med shaders. Men i just fallet Fury X och 285 så blir det fel eftersom Fury X har nära tre gånger så snabbt minne. De är helt enkelt inte jämförbara arkitektoniskt.

Permalänk
Medlem
Skrivet av Aleshi:

Är inte riktigt med på var du har fått siffrorna ifrån. Men om du multiplicerar frekvenser och beräkningsenheter på de båda korten så ser du att 1080Ti har 29% högre teoretisk prestanda i basfrekvens och 28% högre prestanda i turbo. När jag kollade ett prestandaindex på Sweclockers i 4K så ligger 1080Ti 29% snabbare i DX12 och 31% snabbare i DX11. Med tanke på att de båda rör sig lite inom sitt frekvensspann så är det väldigt spot on om du frågar mig.

Och sedan tänker jag nog att det är mycket som gör att 285 vs Fury X inte är jämförbara. Dels har du minnet där 285 är cripplat och är bandbreddssvultet och har för lite VRAM, och Fury X har HBM-minne som presterar enormt mycket bättre.
Sedan är de i så pass olika klasser att du har svårt att hitta test inte är för lätt för Fury X och inte är för tungt för 285. Det syns när man räknar också. Fury X har 160% högre teoretisk prestanda, och presterar 106% bättre i 1080P, 125% bättre i 1440P, och 208% bättre i 4K. Resultaten skevar av olika anledningar åt olika håll eftersom de är för långt i från varandra prestandamässigt för att något bench ska vara rättvist för båda. I 1080P flaskas Fury X av processorn mycket mer, i 1440P är det mer rättvist, och i 4K så verkligen avlider 285 och faller långt efter eftersom den är strypt på minnesbandbredd och minne, medan Fury X med sitt HBM skiner. Det var helt enkelt ont om spel som var så grafiskt krävande att de inte fick CPU att flaska Fury X i låga upplösningar samtidigt som de inte var för tunga för minnessytemet på 285 i höga upplösningar.

I normala fall så brukar minne och övriga beräkningsenheter vara anpassade till att skala med shaders. Men i just fallet Fury X och 285 så blir det fel eftersom Fury X har nära tre gånger så snabbt minne. De är helt enkelt inte jämförbara arkitektoniskt.

Fallet Fury X är typexemplet på en obalanserad GPU, den var ca 5% bättre än R9 Fury utan X, de andra 512 kärnorna orkade inte mer då de slog i effektväggen (tror jag).

Så här såg det ut för 1080Ti vid release:

1080Ti har 50% fler kärnor, presterar 35% bättre (de flesta sidor har lägre siffra).
Prestanda skalar inte linjärt mot antal kärnor vilket återigen betyder inte att det inte skalar mot kärnor * frekvens. Frekvensen beror ju mest på tillverkningsnoden (och uarch som kan utnyttja den förstås), det har varit relativt blygsamma frekvensökningar historiskt sett (16/14nmff-generationen var undantaget) liknande kommande Ampere release, därför är det inte samma sak som andra flaskhalsar Nvidia/AMD har kontroll över. Allting (nästan?) ökar ju när man ökar frekvensen, så därför får det gärna hållas fixt om man ska jämföra två GPUer. Fast nu finns det mängder med anomalier även om frekvensen är lika.

Permalänk
Medlem
Skrivet av scara:

Fallet Fury X är typexemplet på en obalanserad GPU, den var ca 5% bättre än R9 Fury utan X, de andra 512 kärnorna orkade inte mer då de slog i effektväggen (tror jag).

Så här såg det ut för 1080Ti vid release:
https://tpucdn.com/review/nvidia-geforce-gtx-1080-ti/images/perfrel_3840_2160.png

1080Ti har 50% fler kärnor, presterar 35% bättre (de flesta sidor har lägre siffra).
Prestanda skalar inte linjärt mot antal kärnor vilket återigen betyder inte att det inte skalar mot kärnor * frekvens. Frekvensen beror ju mest på tillverkningsnoden (och uarch som kan utnyttja den förstås), det har varit relativt blygsamma frekvensökningar historiskt sett (16/14nmff-generationen var undantaget) liknande kommande Ampere release, därför är det inte samma sak som andra flaskhalsar Nvidia/AMD har kontroll över. Allting (nästan?) ökar ju när man ökar frekvensen, så därför får det gärna hållas fixt om man ska jämföra två GPUer. Fast nu finns det mängder med anomalier även om frekvensen är lika.

50% fler lägre klockade kärnor...

Permalänk
Medlem
Skrivet av medbor:

50% fler lägre klockade kärnor...

https://www.sweclockers.com/test/20792-amd-radeon-r9-fury-fra...
Fury X har högre klock, och då är det vattenkyld. Förresten så har den 22% mer TFLOPs, presterar i bästa fall 14% bättre, i själva verket ännu lägre om också Fury utan X är vattenkyld.

Edit: 1080Ti har 150 MHz lägre frekvens enligt Spec; detta kan svårligen motivera 15% i procentenheter skillnad i prestanda. Så länge vi inte snackar om perf/TFLOPS så stämmer det.

Permalänk
Medlem
Skrivet av scara:

https://www.sweclockers.com/test/20792-amd-radeon-r9-fury-fra...
Fury X har högre klock, och då är det vattenkyld. Förresten så har den 22% mer TFLOPs, presterar i bästa fall 14% bättre, i själva verket ännu lägre om också Fury utan X är vattenkyld.

Edit: 1080Ti har 150 MHz lägre frekvens enligt Spec; detta kan svårligen motivera 15% i procentenheter skillnad i prestanda. Så länge vi inte snackar om perf/TFLOPS så stämmer det.

Jag vet inte om du missade att läsa inlägget från @Aleshi ovan, men 28% vs 28% verkar ju skala ganska bra... hur är det 50% enligt dig?

1080:
2560 cores
1607-1733MHz
Performance ~ 4.2M

1080ti:
3584 cores (40% fler)
1481-1582MHz (9% lägre)
Performance ~ 5.5M (30% högre)

Visa gärna dina siffror så kan vi jämföra?

Permalänk
Medlem
Skrivet av medbor:

Jag vet inte om du missade att läsa inlägget från @Aleshi ovan, men 28% vs 28% verkar ju skala ganska bra... hur är det 50% enligt dig?

1080:
2560 cores
1607-1733MHz
Performance ~ 4.2M

1080ti:
3584 cores (40% fler)
1481-1582MHz (9% lägre)
Performance ~ 5.5M (30% högre)

Visa gärna dina siffror så kan vi jämföra?

Jag svarade honom så jag missade inte honom, så varsågod och läs ? Har du missat det jag har försökt säga?
1. Prestanda skalar inte mot antal kärnor.
2. Prestanda skalar mot antal TFLOPs (inom samma arkitektur).

Jag hävdade 1. i en annan tråd. Då kom Yoshman med 2. Insiktsfullt, men inte relevant till mitt påstående då TFLOPS ≠ Prestanda.

Permalänk
Medlem
Skrivet av scara:

Fallet Fury X är typexemplet på en obalanserad GPU, den var ca 5% bättre än R9 Fury utan X, de andra 512 kärnorna orkade inte mer då de slog i effektväggen (tror jag).

Så här såg det ut för 1080Ti vid release:
https://tpucdn.com/review/nvidia-geforce-gtx-1080-ti/images/perfrel_3840_2160.png

1080Ti har 50% fler kärnor, presterar 35% bättre (de flesta sidor har lägre siffra).
Prestanda skalar inte linjärt mot antal kärnor vilket återigen betyder inte att det inte skalar mot kärnor * frekvens. Frekvensen beror ju mest på tillverkningsnoden (och uarch som kan utnyttja den förstås), det har varit relativt blygsamma frekvensökningar historiskt sett (16/14nmff-generationen var undantaget) liknande kommande Ampere release, därför är det inte samma sak som andra flaskhalsar Nvidia/AMD har kontroll över. Allting (nästan?) ökar ju när man ökar frekvensen, så därför får det gärna hållas fixt om man ska jämföra två GPUer. Fast nu finns det mängder med anomalier även om frekvensen är lika.

Vet som sagt inte var du får siffrorna ifrån. 1080 Ti har 40% fler kärnor, i 8-9% lägre frekvens. Det är typ 128-129% av shaderprestandan hos 1080. Matchar benchmarks riktigt väl.

EDIT: Fick telefonsamtal halvvägs genom meddelandet så ser att det svarats lite till sedan jag började skriva detta meddelandet, ska läsa vad jag missat i tråden.

Permalänk
Medlem
Skrivet av Aleshi:

Vet som sagt inte var du får siffrorna ifrån. 1080 Ti har 40% fler kärnor, i 8-9% lägre frekvens. Det är typ 128-129% av shaderprestandan hos 1080. Matchar benchmarks riktigt väl.

EDIT: Fick telefonsamtal halvvägs genom meddelandet så ser att det svarats lite till sedan jag började skriva detta meddelandet, ska läsa vad jag missat i tråden.

Du har rätt, 3840 är full krets. Vet dock inte vad din invändning mot min argument är? Har redan sagt 5x ggr prestanda skalar mot flops och tsk från "prestanda" är det ej jämförbart mellan arkitekturer och så länge inget specifikt nämner frekvens eller TFLOPS (Yoshman) så stämmer det.

Permalänk
Medlem
Skrivet av scara:

Jag svarade honom så jag missade inte honom, så varsågod och läs ? Har du missat det jag har försökt säga?
1. Prestanda skalar inte mot antal kärnor.
2. Prestanda skalar mot antal TFLOPs (inom samma arkitektur).

Jag hävdade 1. i en annan tråd. Då kom Yoshman med 2. Insiktsfullt, men inte relevant till mitt påstående då TFLOPS ≠ Prestanda.

Det skalar ju som sagt linjärt med kärnor och snittfrekvens väldigt bra precis som @Yoshman sade. Jag vet inte om du försöker säga samma sak men misslyckas eller om du faktiskt menar något annat?

Permalänk
Medlem
Skrivet av scara:

Jag svarade honom så jag missade inte honom, så varsågod och läs ? Har du missat det jag har försökt säga?
1. Prestanda skalar inte mot antal kärnor.
2. Prestanda skalar mot antal TFLOPs (inom samma arkitektur).

Jag hävdade 1. i en annan tråd. Då kom Yoshman med 2. Insiktsfullt, men inte relevant till mitt påstående då TFLOPS ≠ Prestanda.

Alltså jag är inte riktigt med på hur du menar här. Du skrev:

"Multiplicera Turing-kärnor med 1.7/3 för att få motsvarande prestanda/kärna för Ampere. Ett typ exempel på varför prestanda
ej skalar linjärt mot antal kärnor, oavsett motsvarande ökning av frekvens eller ej; Ampere har inte bandbredden och ökning av de andra komponenter i övrigt."

Man får intrycket att du missar frekvensens roll samt att grafikprestanda oftast skalar väldigt bra med kärnor*frekvens. Men som du skriver nu så verkar det som att du är medveten om frekvensens roll. Men att du väljer att bortse från både frekvens och arkitektur för att göra din poäng som i så fall stämmer. Nämligen att grafikprestanda inte skalar med kärnor ifall arkitektur eller frekvens skiljer. Men då är vi ju inne på att slåss mot väderkvarnar. För ingen skulle väl någonsin hävda något annat? Då det skulle innebära att arkitektur och frekvens inte spelar roll, vilket givetvis är falskt.

Så förklara gärna vad du menar. Du är alltså medveten om att prestandanskalningen i spel mellan 1080 och 1080 Ti är spot on skillnaden mellan dem i kärnor*frekvens? Får inte det att gå ihop med när du säger att frekvens inte kan förklara skillnaden.

EDIT:

Här är en annan kommentar där du pratar om en skillnad som inte förklaras av kärnor och frekvens. Men tar man hänsyn till kärnor och frekvens så finns det ju ingen skillnad som ska förklaras. Så vad är det du menar?

"Du har rätt, Ampere eller iaf GA104 och GA102 mellan och inbördes kan skala linjärt. Förvånande med tanke på att det inte var så för Pascal; 1080Ti +50% mer kärnor över 1080, är ~35% snabbare, detta kan inte förklaras med +100 MHz)"

Permalänk
Medlem
Skrivet av Aleshi:

Alltså jag är inte riktigt med på hur du menar här. Du skrev:

"Multiplicera Turing-kärnor med 1.7/3 för att få motsvarande prestanda/kärna för Ampere. Ett typ exempel på varför prestanda
ej skalar linjärt mot antal kärnor, oavsett motsvarande ökning av frekvens eller ej; Ampere har inte bandbredden och ökning av de andra komponenter i övrigt."

Man får intrycket att du missar frekvensens roll samt att grafikprestanda oftast skalar väldigt bra med kärnor*frekvens. Men som du skriver nu så verkar det som att du är medveten om frekvensens roll. Men att du väljer att bortse från både frekvens och arkitektur för att göra din poäng som i så fall stämmer. Nämligen att grafikprestanda inte skalar med kärnor ifall arkitektur eller frekvens skiljer. Men då är vi ju inne på att slåss mot väderkvarnar. För ingen skulle väl någonsin hävda något annat? Då det skulle innebära att arkitektur och frekvens inte spelar roll, vilket givetvis är falskt.

Så förklara gärna vad du menar. Du är alltså medveten om att prestandanskalningen i spel mellan 1080 och 1080 Ti är spot on skillnaden mellan dem i kärnor*frekvens? Får inte det att gå ihop med när du säger att frekvens inte kan förklara skillnaden.

EDIT:

Här är en annan kommentar där du pratar om en skillnad som inte förklaras av kärnor och frekvens. Men tar man hänsyn till kärnor och frekvens så finns det ju ingen skillnad som ska förklaras. Så vad är det du menar?

"Du har rätt, Ampere eller iaf GA104 och GA102 mellan och inbördes kan skala linjärt. Förvånande med tanke på att det inte var så för Pascal; 1080Ti +50% mer kärnor över 1080, är ~35% snabbare, detta kan inte förklaras med +100 MHz)"

Det var en jämförelse mellan Ampere och Turing, vilket var det ursprungliga ämnet i tidigare tråd. Alltså för att göra påståendet komplett:

Prestanda skalar inte mot antal kärnor; om inte frekvensen är densamma. Yoshman la till det fetstilta, det jag har försökt säga, påståendet duger utan det fetstilta då min ursprungliga poäng var att rätta en som hävdade att 3090 har 140% mer kärnor skulle också prestera därefter jämfört med Turing. Mer behövdes inte sägas egentligen....

Edit: Du sa:
Här är en annan kommentar där du pratar om en skillnad som inte förklaras av kärnor och frekvens. Men tar man hänsyn till kärnor och frekvens så finns det ju ingen skillnad som ska förklaras. Så vad är det du menar?

FLOP = 2*f*CU, notera tvåan

Permalänk
Medlem
Skrivet av medbor:

Det skalar ju som sagt linjärt med kärnor och snittfrekvens väldigt bra precis som @Yoshman sade. Jag vet inte om du försöker säga samma sak men misslyckas eller om du faktiskt menar något annat?

Jag har faktiskt ingen aning vad du pratar om alls.

Permalänk
Medlem
Skrivet av scara:

Det var en jämförelse mellan Ampere och Turing, vilket var det ursprungliga ämnet i tidigare tråd. Alltså för att göra påståendet komplett:

Prestanda skalar inte mot antal kärnor; om inte frekvensen är densamma. Yoshman la till det fetstilta, det jag har försökt säga, påståendet duger utan det fetstilta då min ursprungliga poäng var att rätta en som hävdade att 3090 har 140% mer kärnor skulle också prestera därefter jämfört med Turing. Mer behövdes inte sägas egentligen....

Edit: Du sa:
Här är en annan kommentar där du pratar om en skillnad som inte förklaras av kärnor och frekvens. Men tar man hänsyn till kärnor och frekvens så finns det ju ingen skillnad som ska förklaras. Så vad är det du menar?

FLOP = 2*f*CU, notera tvåan

Så du slåss mot väderkvarnar? För ingen har väl någonsin sagt att alla arkitekturer är helt likvärdiga vid samma antal kärnor? Självklart fungerar det inte att räkna så mellan arkitekturer.
Men om det är så, så passar det fortfarande inte ihop med dina kommentarer om att frekvensskillnaden är för låg för att förklara prestandaskillnaden mellan 1080 och 1080 Ti. Av allt att döma ville du påvisa skillnader mellan dem som inte kärnor eller frekvens kan förklara.

Permalänk
Medlem
Skrivet av Aleshi:

Så du slåss mot väderkvarnar? För ingen har väl någonsin sagt att alla arkitekturer är helt likvärdiga vid samma antal kärnor? Självklart fungerar det inte att räkna så mellan arkitekturer.
Men om det är så, så passar det fortfarande inte ihop med dina kommentarer om att frekvensskillnaden är för låg för att förklara prestandaskillnaden mellan 1080 och 1080 Ti. Av allt att döma ville du påvisa skillnader mellan dem som inte kärnor eller frekvens kan förklara.

Om du följer den ursprungliga tråden så handlade det om olika arkitekturer, det var inte jag som började, jag sa bara det "uppenbara" (fastän det upprepas då och då)...
Jo, jag ville påvisa att det kan finnas andra flaskhalsar, som det var med Fury X och 1080Ti. I det senare fallet var det fel då Nvidia är bättre på att skala upp sina arkitekturer. Anledningen till att jag länkade till TPU var för att de visar prestandan och inte TFLOPs. Hela min argument är prestanda, inte TFLOPS.

Permalänk
Medlem
Skrivet av scara:

Om du följer den ursprungliga tråden så handlade det om olika arkitekturer, det var inte jag som började, jag sa bara det "uppenbara" (fastän det upprepas då och då)...
Jo, jag ville påvisa att det kan finnas andra flaskhalsar, som det var med Fury X och 1080Ti. I det senare fallet var det fel då Nvidia är bättre på att skala upp sina arkitekturer. Anledningen till att jag länkade till TPU var för att de visar prestandan och inte TFLOPs. Hela min argument är prestanda, inte TFLOPS.

Okej, du medgav inte att du haft fel om 1080 Ti. Så det verkade som du stod på dig eftersom du pratade som att vi inte läst. Det blev svårt att få ihop vad du egentligen menade när du inte medgav att du ändrat dig i den frågan. För du hade ju tydligt pekat på att frekvens inte förklarade skillnaden tidigare i tråden.
Så ja, mellan arkitekturer kan man självklart inte jämföra. Men det brukar skala väldigt bra med shaders*frekvens inom arkitekturer eftersom kretsar för det mesta är balanserade och övriga enheter skalas med i balans med shaders.

Men nu är jag förvirrad igen. Du säger inte TFLOPS? Men TFLOPS räknar du ju ut på antal shaders och frekvens. Och du var med på att just shader och frekvens var generellt sett bra att räkna på inom arkitekturer? Så då är ju TFLOPs visst bra att gå på inom arkitekturer. 1080 vs. 1080Ti är ju ett praktexempel.

Permalänk
Medlem
Skrivet av Aleshi:

Okej, du medgav inte att du haft fel om 1080 Ti. Så det verkade som du stod på dig eftersom du pratade som att vi inte läst. Det blev svårt att få ihop vad du egentligen menade när du inte medgav att du ändrat dig i den frågan. För du hade ju tydligt pekat på att frekvens inte förklarade skillnaden tidigare i tråden.
Så ja, mellan arkitekturer kan man självklart inte jämföra. Men det brukar skala väldigt bra med shaders*frekvens inom arkitekturer eftersom kretsar för det mesta är balanserade och övriga enheter skalas med i balans med shaders.

Men nu är jag förvirrad igen. Du säger inte TFLOPS? Men TFLOPS räknar du ju ut på antal shaders och frekvens. Och du var med på att just shader och frekvens var generellt sett bra att räkna på inom arkitekturer? Så då är ju TFLOPs visst bra att gå på inom arkitekturer. 1080 vs. 1080Ti är ju ett praktexempel.

Grafen visar inte TFLOPs, den visar prestanda. De skalar inte mot prestanda, men de skalar mot TFLOPS (förutsatt att GPUn är balanserad), men grafen visar inte TFLOPs. FLOPS är teoretisk kapacitet som ej är användbar inom olika arkitekturer. Det är därför man visar slutresultatet dvs prestandan och den skalar inte mot antalet kärnor, man måste ange en specifik med frekvens för att få linjär skalning - som jag sa till Yoshman, GPUer har sällan samma frekvens, därför pratar man om prestanda inte TFLOPS. Vad är det som är förvirrande och vem är det slåss mot väderkvarnar egentligen?!

Permalänk
Medlem
Skrivet av scara:

Grafen visar inte TFLOPs, den visar prestanda. De skalar inte mot prestanda, men de skalar mot TFLOPS (förutsatt att GPUn är balanserad), men grafen visar inte TFLOPs. FLOPS är teoretisk kapacitet som ej är användbar inom olika arkitekturer. Det är därför man visar slutresultatet dvs prestandan och den skalar inte mot antalet kärnor, man måste ange en specifik med frekvens för att få linjär skalning - som jag sa till Yoshman, GPUer har sällan samma frekvens, därför pratar man om prestanda inte TFLOPS. Vad är det som är förvirrande och vem är det slåss mot väderkvarnar egentligen?!

Kärnor gånger frekvens är ju precis teraflops, vilket enligt hela denna argumentation alltså skalar väldigt bra mot faktisk prestanda när man jämför kort inom samma arkitektur, men det sista du skriver är plötsligt att det inte stämmer? Man måste inte köra gpuer i samma frekvens för att de ska skala lika i tflops vs prestanda, de kommer skala lika där ändå. Men man kan inte rakt av jämföra antalet kärnor och se prestandan direkt utan man måste vikta den siffran med vilken frekvens korten kör på sina kärnor för att få en bra skattning av prestandan

Permalänk
Medlem

@scara:
Altså, om du har en funktion f(x,y) = C*x*y så kan du inte påstå att den inte skalar linjärt mot x bara för att den har en till fri parameter y. Den skalar linjärt mot både x och y.

Permalänk
Medlem
Skrivet av medbor:

Men hur kan folk inte vara sura över att detta? Jaja... som alltid är det väl med fanboys? Lite som med MAGA-gänget men mindre extremt såklart

Förstår jag er rätt nu, ni är arga på Nvidia för att ni tycker deras nya gpuer är för billiga och ni vill bojkotta dem för att de ger för mycket prestanda per krona?

Permalänk
Medlem
Skrivet av Chrisj:

Förstår jag er rätt nu, ni är arga på Nvidia för att ni tycker deras nya gpuer är för billiga och ni vill bojkotta dem för att de ger för mycket prestanda per krona?

Jag har ingen Nvidia GPU nyare än min 850M i min laptop.

Min poäng var alltså att folk borde vara sura över att Nvidia höjde priserna extremt för något med dålig prestanda och beta-hårdvara bara för att de kunde och AMD inte konkurrerade. Priserna var alldeles för höga på 2000-serien och de som behövde ett nytt kort då har blivit ’lurade’ att de skulle vara värt det med RTX. Nu säljer de större och dyrare chip med allting bättre än förr för extremt lite pengar. Jag skulle aldrig mer ge dom en krona

Jag känner mig övertygad om att de hade kunnat sälja Turing för 50-70% och fortfarande tjänat groteska pengar

Permalänk
Medlem
Skrivet av DevilsDad:

@scara:
Altså, om du har en funktion f(x,y) = C*x*y så kan du inte påstå att den inte skalar linjärt mot x bara för att den har en till fri parameter y. Den skalar linjärt mot både x och y.

Den funktionen säger ingenting om linjäritet öht. Misstänker att du blandar ihop proportionalitet med linjäritet.

Permalänk
Medlem
Skrivet av scara:

Den funktionen säger ingenting om linjäritet öht. Misstänker att du blandar ihop proportionalitet med linjäritet.

https://sv.wikipedia.org/wiki/Linj%C3%A4ritet

Permalänk
Medlem

Du har inte visat eller angett att f är linjärt mot någon av variablerna, varför mitt påpekande. Det du visade var en godtycklig funktion som kan betyda vadsomhelst.
Hade underlättat om du förklarat vad variablerna betyder också. Men antar
f= prestanda
C = konstant
x= frekvens
y= #kärnor

Ja då är f∝x och f∝y alltså proportionalitet - allt det säger att f har någon form av beroende av x och y, på intet säger leder detta till att
f∝y*x är ett linjärt samband. Att f är linjär mot både x och y betyder inte att det är nödvändigtvis linjärt mot y*x. Så du får gärna öppna en mattebok om du vill gå vidare

Men men, jag har ingen aning om vad du vill säga egentligen och vad för nytt du kommer med som inte redan har sagts i tråden?

Permalänk
Quizmaster Malmö 22

Denna sortens artiklar är något ja trodde ja gillade men ja skummar bara igenom den för ja pallar inte läsa den....massa tekniskt snack som är oviktigt för mig....

Visa signatur

[Gigabyte EP35-DS4][Intel Core 2 Duo E8400 3.0 Ghz][2x2GB Corsair XMS 2][Gainward GTX 570][Sandisk Extreme II 480GB][Corsair HX 620W][Fractal Design Define XL R4][Acer GD245HQBID]

Permalänk
Moderator
Forumledare

*tråd rensad*

Matematiska bråk (🥁) tas bäst i pm

Visa signatur

Forumets regler | Har du synpunkter på hur vi modererar? Kontakta SweClockers/moderatorerna

Jag stavar som en kratta

Gillar lök på discord

Permalänk
Avstängd
Skrivet av hakd:

Jag har fortfarande en magkänsla att något inte stämmer, det känns lite väl bra.

Läste detta och tänkte att detta måste vara skrivet av en "amd fanboooi".
Fortsätter läsa och ser din datorspec, amdfanboi confirmed.

Jo jag förstår att ni inte gillar denna release som är som en roundhouse KO på amd.
Jag förväntar mig att amd kommer branda om sitt flagskepp till en nivå som tävlar med 3070... Tror inte de har något att släppa i 3080/90 nivå.

Permalänk
Skrivet av Campaigner:

Denna sortens artiklar är något ja trodde ja gillade men ja skummar bara igenom den för ja pallar inte läsa den....massa tekniskt snack som är oviktigt för mig....

Hehe, jag känner mig totalt IQ-befriad varje gång jag läser de här artiklarna, liksom de efterföljande diskussionstrådarna. Det är som om man plötsligt delgivits esoterisk kunskap, förbehållen några få invigda och smått obegriplig för en vanlig dödlig. Allt jag själv vill veta om Ampere är:

1. Är prestandaförbättringarna så pass stora att det är värt att dumpa mitt två år gamla 2080 Ti för ett kort ur 3000-serien (mera precist ett 3080).

2. Ljudnivåer, temperaturer och effektförbrukning. Ingen masugn under mitt skrivbord, tack!

Håll ut, om mindre än två veckor har vi svaret!

Visa signatur

Main: i9-9900, 32 Gb, RTX 3080 12 Gb, Win 11 + Mac Mini 2014
Övriga: i7-8700, 16 Gb, GTX Titan X (M) | i7-4770T, 32 Gb, GTX Titan | i7-870, 16 Gb, GTX 550 Ti | Core 2 Duo E7400, 2 Gb, Radeon HD6670 | PowerMac G4 Dual, 2 Gb, Radeon 9600 Pro PC/Mac Ed

Permalänk
Medlem
Skrivet av Barilla08:

Läste detta och tänkte att detta måste vara skrivet av en "amd fanboooi".
Fortsätter läsa och ser din datorspec, amdfanboi confirmed.

Jo jag förstår att ni inte gillar denna release som är som en roundhouse KO på amd.
Jag förväntar mig att amd kommer branda om sitt flagskepp till en nivå som tävlar med 3070... Tror inte de har något att släppa i 3080/90 nivå.

änvideja-fläktpojke konfirmerad!

Nej men vi får väl vänta och se. En rimlig kalkyl på läckorna visar ju allt från 20-50% över 2080ti om 80CU stämmer och varje CU är ungefär på samma nivå som 5700XT. En glädjekalkyl kan ju räkna upp det ganska mycket mer (exempel nedan)

Om 5700XT räknas som 70% av 2080ti och BigNavi får dubbelt så många CU och dubblerad minnesbandbredd. Dessutom klockar ju PS5 på ca 2.2GHz (20% mer än 5700XT). Då borde ju prestandan utan att anta något om förbättrad arkitektur landa kring:
0.7x2x120%= 68% över 2080ti. Nu kanske inte det går att klocka en så stor krets lika högt som PS5 med sina 36CU, men detta är i alla fall inom räckhåll för 3090 till och med. Ryktena pratar ju om 512-bitars buss till minnet så 16 eller galna 32gb är absolut en möjlighet...

Vi får se, men jag tror BigNavi har en stor chans att konkurrera i alla fall, även om det kanske inte blir så extremt som en glädjekalkyl kan visa. Oavsett borde alla vilja att kretsen levererar extremt bra, annars blir alla framtida generationer lika ovärda som 2000-serien var...