Hur mycket prestanda ger shader-processorer?

Permalänk
Melding Plague

Hur mycket prestanda ger shader-processorer?

Det var en tid sedan de första grafikkorten med förenade shader-processorer dök upp på markanden. Men hur effektiva är dessa shader-processorer och behöver man verkligen så många som exempelvis 128?

Läs nyheten

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Helt klart intressant! Däremot trist att dem testade så få spel.

Men som man kan se så är alltså antalet shaders relativt viktigt - åtminstonde på bättre kort där upplösningen ofta är hög.
I nyare spel kommer nog behovet av fler att öka, så skillnaden mellan 128st- samt 96st-shaders blir nog större.

Visa signatur

FT02B | Z68 Extreme7 | 2600K @ 4.6GHz + 212 Evo | HD7950 | 16GB 1866Mhz CL9 | SP-SS750M
Naos 7000, M65, 5K, MX518 | TK Blue + Rapid Black
Vaio Pro 13" (Mint) | Elitebook 2540p (Arch)

Permalänk
Medlem

Riktigt intressant men då det knappt gjorde någon skillnad i Stalker kan det betyda att spelet helt enkelt inte använder sig speciellt mycket av grafikstrukturen i de nuvarande grafikkortet, vilket i sin tur är riktigt dåligt, fast å andra sidan tycker jag personligen inte att stalker är optimerad på ett bra sätt så det beror på hur man ser på det.

Visa signatur

LG OLED77CX • Intel i9 10900K @ 5.0GHz • Noctua NH-D15 • ASUS Strix Z490-H • Corsair 32GB DDR4 3200MHz • GIGABYTE RTX 4080 • Phanteks Evolv X • Corsair RM 850W V2

Permalänk
Medlem

Dom kunde ju testat med en snabbare processor..

Permalänk
Medlem

Kunde de inte testa skillnaden på olika mycket klock på shaders istället?:(

Permalänk
Inaktiv

klock? överklockning menar du?

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av Sanazin
Riktigt intressant men då det knappt gjorde någon skillnad i Stalker kan det betyda att spelet helt enkelt inte använder sig speciellt mycket av grafikstrukturen i de nuvarande grafikkortet, vilket i sin tur är riktigt dåligt, fast å andra sidan tycker jag personligen inte att stalker är optimerad på ett bra sätt så det beror på hur man ser på det.

Jag håller inte med. Borde inte det snarare tyda på att Stalker blivit så pass optimerat så att det funkar bra även om man har ett mer low-end kort än GTX, och att det finns prestanda utrymme till mods och annat roligt? Istället för att maxxa kortet och elräkningen.
Särskilt med tanke på spelets komplexitet skulle jag säga att det var ett bra resultat.

Sen just att använda en långsam processor ger ju mer märkbar skillnad vid de olika jämförelser, eftersom man borde väl mära av mer när GPU'n hjälper till mer.
Däremot borde be väl ha testat med en liknande rigg eller en nyare rigg och klockat ner den för att jämföra, och sen klockat upp den. Då hade man kunnat se hur hela system skalar kanske.

Visa signatur

Laptop: HP ZBook 15.
WS : i9-9900K, Asus Prime-A, 24 GB ram @3600 MHz, Qaudro K4000, 2 TB SSD + blandade HDD.

Permalänk
Citat:

Ursprungligen inskrivet av Regert
Jag håller inte med. Borde inte det snarare tyda på att Stalker blivit så pass optimerat så att det funkar bra även om man har ett mer low-end kort än GTX, och att det finns prestanda utrymme till mods och annat roligt? Istället för att maxxa kortet och elräkningen.
Särskilt med tanke på spelets komplexitet skulle jag säga att det var ett bra resultat.

Sen just att använda en långsam processor ger ju mer märkbar skillnad vid de olika jämförelser, eftersom man borde väl mära av mer när GPU'n hjälper till mer.
Däremot borde be väl ha testat med en liknande rigg eller en nyare rigg och klockat ner den för att jämföra, och sen klockat upp den. Då hade man kunnat se hur hela system skalar kanske.

Stalker är inte bra optimerat och fungerar inte bra med ett kort som är mindre starkt.

Visa signatur

Min musik
@albinloan
Allt vi kan tänka, kan vi skapa.

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av segas
klock? överklockning menar du?

Över och under.

Permalänk
Medlem

De har säkert som alla andra nyhets sidor jävligt taskig budget, och förlitar sig på snälla leverantörers/medlemmars vilja att låna ut hårdvara.

Testet är ju endå intressant och om någon anser att de gjort fel så finns det ju inget hinder för vem som helst att göra ett liknande test på "rätt" hårdvara...

Rätt säker på att samma dilemma finns här på sweclockers redaktion också.

Permalänk

Denna nya arkitektur är utvecklad för dx10. Jag tror behovet av shaders kommer att öka då dx10 stödjer mer och fräckare special effekter.

We used the following testbed configuration:
CPU: AMD Athlon 64 X2 4600+ Socket 939

Smart att använda en CPU som flaskhalsar!
Att de inte får någon större prestanda förlust i första och i bland andra sänkningen av shaders beror snarare på att CPU´n inte kan nyttja 128 och 96 shaders.
Bra test ide, dåligt genomförd.

Permalänk
Inaktiv

4600+ är flaskhalsen. det är cpun som först måste rita upp hur scenen ska bli, sen renderar GPUn. och GPUn väntar på att CPUn ska skicka mera data, så den får helt enkelt idla vilket gör att inte 8800gtxs hela kraft utnyttjas.

Permalänk
Citat:

Ursprungligen inskrivet av jonathan82
Denna nya arkitektur är utvecklad för dx10. Jag tror behovet av shaders kommer att öka då dx10 stödjer mer och fräckare special effekter.

We used the following testbed configuration:
CPU: AMD Athlon 64 X2 4600+ Socket 939

Smart att använda en CPU som flaskhalsar!
Att de inte får någon större prestanda förlust i första och i bland andra sänkningen av shaders beror snarare på att CPU´n inte kan nyttja 128 och 96 shaders.
Bra test ide, dåligt genomförd.

Nja, i låga upplösningar och lite lägre kvalitetsinställningar så lär ju CPU vara en begränsande faktor, definitivt. Men i höga upplösningar och höga kvalitetsinställningar, så är det i de flesta fall grafikkortet som utgör den begränsande faktorn.

Men jag läser ut att de ville kolla om de lite billigare korten med färre shaders skulle prestera bättre med mer shaderkraft. I de fallet så är processorn mer i paritet med ett normalsystem och resultatet relevant. (speciellt eftersom ett low-midrangekort har en klenare GPU och därmed blir en begränsande faktor tidigare än ett high-end kort)

Det skulle dock varit intressant om de också hade klockat ned kortet till lägre klockfrekvens för att bättre spegla t.ex. ett 8800GTS med fler aktiva shaders än ett normalt 8800GTS.

Visa signatur

~Pelle~

Permalänk
Medlem

Alltså shader-processorerna borde inte påverkas något större utav hur snabb CPU:n är, när CPU:n väl skickat datan till GPU:n. När CPU:n väl har behandlat färdigt scenen och skickat den för rendering till GPU:n så är det upp till GPU:n att rita ut det hela.

Hurvida X antal shader-processorer begränsar renderingen beror ju på hur många pixlar som skall renderas, då det sker på per-pixel nivå, och hur avancerade belysningsmodeller och shadingalgoritmer man använder.

Visa signatur

~ Macbook <> Debian-server

Permalänk
Medlem

Intressant test! Dock är jag väldigt förvånad att detta inte testats tidigare.

Angående att Stalker är cpu-begränsat så vetefan...
Hothardware översta grafen. Stalker är där begränsat av grafikkortet redan i 1024*768. Jag kunde däremot inte hitta vilket grafikkort som användes, så det är ju möjligt att de använt ett 8600GT eller liknande (vilket förövrigt vore rätt smart då de testar cpus).
Sen att cpu:n agerar flaskhals i de lägsta kvalitetsinställningarna i Fear, Serious Sam och Quake4, tycker jag låter mer rimligt.

Visa signatur

AMD 5700X@Vatten | asus prime x370pro | Asus 2080 Strix | 2x16GB Kingston Fury Renegade RGB DDR4 3.6GHZ | Lian Li O11d EVO + 2x240 EKWB RAD + 6 Lian Li AL120 | CoolerMaster V850 | NVME 2TB Seagate Firecuda 510 + NVME 1TB WD BLACK + 3 SSD | Samsung Odyssey 49" G9| DELL 2713HM | Varmilo VA69 Clear/brown | Logitech G502 2016.

Phenom X6 1045T | Corsair TWIN2X PC6400C4DHX 2x2GB + Crucial Ballistix Sport 2x2GB | Gigabyte ma785gmt-us2h | Silverstone Temjin 08 | Corsair VX450

Permalänk
Medlem

Company of heroes släpptes för ett år sedan, inte så "nysläppt" som Stalker even. Men jo intressant men knappast förvånande, mer är inte alltid mer.

Visa signatur

Kunskap är en personlig upplevelse. Allt annat är bara information. /A. Einstein

Permalänk
Medlem

Förstår inte varför de inte kör på antal "enheter". Alltså fler TMU, ROP och shader samlingar. Finns ingen mening med t.ex. 2900xt's 320 shaders när det bara ska förse 16 ROP's det hade räckt med hälften om inte färre.

Som det är nu så är det fyra samlingar av (4 TMU + 80 shaders + 4 ROP)
Bästa hade varit tio samlingar av (4 TMU + 16 shaders + 4 ROP)

Eller är jag helt fel ute?

Visa signatur

[Asus P8H67] - [Intel i2500k] - [Corsair 4gb pc10600] - [Asus 560ti 1gb]

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av TinMann
Förstår inte varför de inte kör på antal "enheter". Alltså fler TMU, ROP och shader samlingar. Finns ingen mening med t.ex. 2900xt's 320 shaders när det bara ska förse 16 ROP's det hade räckt med hälften om inte färre.

Som det är nu så är det fyra samlingar av (4 TMU + 80 shaders + 4 ROP)
Bästa hade varit tio samlingar av (4 TMU + 16 shaders + 4 ROP)

Eller är jag helt fel ute?

Jag är inte insatt i hur grafikkort fungerar och förstår således ingenting när du lattjar med "enheterna". Förklara gärna hur du tänker och varför.
Med det övre exemplet tror jag du menar 16, 16, 320 (mao 2900xt's uppsättning?). Vad är och gör en ROP/TMU/Shader?

Visa signatur

AMD 5700X@Vatten | asus prime x370pro | Asus 2080 Strix | 2x16GB Kingston Fury Renegade RGB DDR4 3.6GHZ | Lian Li O11d EVO + 2x240 EKWB RAD + 6 Lian Li AL120 | CoolerMaster V850 | NVME 2TB Seagate Firecuda 510 + NVME 1TB WD BLACK + 3 SSD | Samsung Odyssey 49" G9| DELL 2713HM | Varmilo VA69 Clear/brown | Logitech G502 2016.

Phenom X6 1045T | Corsair TWIN2X PC6400C4DHX 2x2GB + Crucial Ballistix Sport 2x2GB | Gigabyte ma785gmt-us2h | Silverstone Temjin 08 | Corsair VX450

Permalänk
Medlem

Som det är nu så ser det nog ut såhär:

TMU: Texture mapping units. Alltså den del av gpu:n som lägger texturer baserat på 3d... "saker". Cpu:n sköter geometrin och TMU:n lägger till textur.
Shader: alltså den del som sköter effekter. Tillexempel skuggar texturer, lägger till volumetriska effekter etc etc.
ROP: Renderoutput, det som tar allt det där och skickar till skärmen. Sköter även AA

Dessa är inte bara slängda en masse på grafikkortet utan är samlade i "enheter". Alltså samlingar av TMU's, Shaders och ROP's.
Flera enheter: mer prestanda.

Det är ingen stor skillnad mellan mitt 1950pro och 1950XT förutom att XT har en till "enhet": eller samling av TMU, shaders och ROP. (lite extra klock också såklart). Det är där det XT-kortet får så mycket extra prestanda jämför med mitt.

Det jag menar är att det är nog billigare att skapa fler enheter som är mindre än att lägga till onödigt många shaders i en enda.

Sen kommer busshastighet och klock också såklart, det är i den hastigheten varje enhet arbetar i. Men det är av sekundär betydelse.

EDIT - för att förenkla: bättre att ha fler filer på en motorväg än extra breda men färre.

Visa signatur

[Asus P8H67] - [Intel i2500k] - [Corsair 4gb pc10600] - [Asus 560ti 1gb]

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av A.N'doja
Stalker är inte bra optimerat och fungerar inte bra med ett kort som är mindre starkt.

Tja.. vet inte Jag har ett X800GTO som oklockat funkar rätt bra, eller jag tycker inte det är särskilt laggigt. Och för att vara ett över två år gammalt kort tycker jag det presterar riktigt bra.
Har för övrigt ett 939 system med ne 165 opteron i och 2 GB ram. Sen när det gäller Stalker så är visserligen partch 1.0004 ett mirakel jämfört med de tidigare. Men vilket spel flyter på ordentligt idag från första början såvida det inte körs på ett 2x GTX setup?

Visa signatur

Laptop: HP ZBook 15.
WS : i9-9900K, Asus Prime-A, 24 GB ram @3600 MHz, Qaudro K4000, 2 TB SSD + blandade HDD.

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av dakorp
Alltså shader-processorerna borde inte påverkas något större utav hur snabb CPU:n är, när CPU:n väl skickat datan till GPU:n. När CPU:n väl har behandlat färdigt scenen och skickat den för rendering till GPU:n så är det upp till GPU:n att rita ut det hela.

Det är just det den inte hinner med
GPUn hinner rita färdigt föregående frame sen ligger den och väntar på ny data från CPUn och kan därför inte bidra till högre framerate hur bra den än är.

Permalänk
Avstängd

Ska man göra som många andra o dra en jämförelse till bilvärlden? På ett forum som detta. ^^ Sätter man 90åriga agda bakom ratten i en koenigsegg så blir det inte samma resultat som ifall man sätter en 25årig racingförare där.

Likaså får man inget bra resultat när man inte använder mjukvara som är optimerad för hårdvaran. Detta gäller ju CPU såväl som GPU. Minns Quake-tiden... o Quake3.

Visa signatur

Intel Core i7 3770K@3.5, ASUS P8Z77V-DELUXE, 16GB RAM, GeForce GTX 660 Ti, ASUS XONAR ESSENCE STX, SAMSUNG 830 256GB SSD, 5x Samsung HD204UI, 4x WD40EFRX, 1x Western Digital Caviar Green WD20EARX, 1x Samsung HD103UJ, Windows 8.1 Pro