Intel: GPU mångdubbelt snabbare än CPU

Permalänk
Medlem
Skrivet av Gramner:

Vadå "i mjukvara", hur tror du att en CPU fungerar egentligen? Dessutom är en CPU betydligt snabbare än en GPU på att genomföra beräkningar, skillnaden är att en GPU kan utföra stora mängder enkla beräkningar samtidigt förutsatt att beräkningarna är fristående från varandra och på så vis få ett bättre totalresultat, problemet är dock att det är extremt få typer av algoritmer som kan dra nytta av extrem parallellism.

Cpun kan tex generera både shaders och texturer men eftersom den saknar dedikerad hårdvara för det måste den göra det i form av mjukvara som emulerar sps och tmus. Kvalitetsmässigt blir resultatet minst lika bra eller bättre, men oändligt långsamt eftersom uppgiften inte går att parallelisera mer än till max 12 trådar idag med den värsta processorn(i980X). Med en gpu har du upp till 1600 shaderenheter och upp till 80 texturenheter som alla kör parallelt. Det blir lite snabbare. Men som sagt, sen kan gpun inte göra så värst mycket mer än dessa och liknande beräkningar. Cpun kan beräkna i princip vad som helst.

3DSMax eller Maya tex kan generera all typ av grafik som ett high-end grafikkort kan och mycket mer, och de gör det i mjukvara, men då kan du få vänta ett bra tag på att EN ENDA bild genereras. Ett grafikkort kan spotta ur sig något hundratal i sekunden av samma bild.

Numera finns det plugins åtminstone för 3DSmax som renderar vissa typer av bilder direkt på grafikkortet, det går mycket snabbare.

edit. en annan liknelse är videoavspelning av HD-material, det går inte att få mycket bättre kvalitet på bilden än med ffdshow, men då är risken att det hackar på en för klen processor eftersom hela filmen renderas i mjukvara. Med DXVA eller VDPAU sköts samma sak av grafikkortet och HD-film går att se med en skräpprocessor, kvaliteten blir inte bättre men det blir ryckfritt.

Visa signatur

9950X3D X870E HERO 96/6400c30/2200 RTX5090 Gaming OC || 7950X B650 Gaming Plus WIFI 32/6000c30 RTX5080 TUF OC(450w) UBUNTU || 12900KF Z690 Tomahawk WIFI 64/3600c16 Gear1 RTX4080 Ventus 3X OC(400W) || 5900X(B2) B550-F 32/3800c18 RTX3080 TUF OC V2 || 5800X3D CH VIII EXT. 32/3800c18 RTX3080 Gaming OC || 3700X X570 HERO 32/3000c16 RTX3070 FTW3 Ultra || Thinkpad P16s G2 PRO7840U 32/6400

Permalänk

Varför bygger inte nvidia en gpu som man kan sätta på moderkortet istället för en vanlig processor?

Permalänk
Medlem

Därför att det helt enkelt inte fungerar på det viset. En GPU är högt specialiserad, på ett fåtal typer av beräkningar. Att försöka utföra generella CPU instruktioner med en sådan enhet är bara löjligt. En CPU är istället (i jämförelse) väldigt dåligt specialisera, men kan hantera stora mängder enkla instruktioner i snabb följd.
B!

Visa signatur

Allting jag skriver är om inget annat uttrycks, min åsikt! Ingenting måste vara dagens sanning enligt din åsikt, och gör du antaganden baserade på mina åsikter hoppas jag att du övervägt mer än bara just min åsikt.

Permalänk

Hehe Intel failade lite där på att mythbusta ^^

Visa signatur

Gammalt nick: Darkst@r

Permalänk
Hedersmedlem
Skrivet av Darkst@r:

Hehe Intel failade lite där på att mythbusta ^^

Nej, de lyckades väl visa vad de ville (att prestandavinsten vanligtvis är mycket mindre än 10-1000 ggr)?

Permalänk
Skrivet av Elgot:

Nej, de lyckades väl visa vad de ville (att prestandavinsten vanligtvis är mycket mindre än 10-1000 ggr)?

Ja egentligen men samtidigt är det lite som att någon påstår att man bara kan bänka 10 KG när man kan bänka "hela" 15 KG...

Visa signatur

Gammalt nick: Darkst@r

Permalänk
Hedersmedlem
Skrivet av Darkst@r:

Ja egentligen men samtidigt är det lite som att någon påstår att man bara kan bänka 10 KG när man kan bänka "hela" 15 KG...

Men för dem som vacklar mellan gpu-lösningar och mera traditionella är det förmodligen inte ett helt ointressant resultat; 2,5 ggr snabbare är förvisso bättre, men kanske är det inte värt de programförändringar som måste göras?

Permalänk
Medlem
Skrivet av the squonk:

en annan liknelse är videoavspelning av HD-material, det går inte att få mycket bättre kvalitet på bilden än med ffdshow, men då är risken att det hackar på en för klen processor eftersom hela filmen renderas i mjukvara. Med DXVA eller VDPAU sköts samma sak av grafikkortet och HD-film går att se med en skräpprocessor, kvaliteten blir inte bättre men det blir ryckfritt.

Det är lite intressant att du nämner decoding av H.264 som en fördel för GPU, det är nämligen så att inte ens den mest extremt överklockade GPUn med en väldigt GPU-optimerad decoding-mjukvara skulle vara i närheten av att ens klara av att decoda 720p i realtid då H264:s entropy coding (av design) är en algoritm som är helt beroende på tidigare beräkningar och därför ej kan parallelliseras i någon större utsträckning. Det är därför DXVA och liknande använder en speciell krets för ändamålet som inte har någonting med en GPU att göra förutom att den råkar sitta på samma instickskort.

Visa signatur

Assembly är ett högnivåspråk.

Permalänk
Medlem
Skrivet av Gramner:

Det är lite intressant att du nämner decoding av H.264 som en fördel för GPU, det är nämligen så att inte ens den mest extremt överklockade GPUn med en väldigt GPU-optimerad decoding-mjukvara skulle vara i närheten av att ens klara av att decoda 720p i realtid då H264:s entropy coding (av design) är en algoritm som är helt beroende på tidigare beräkningar och därför ej kan parallelliseras i någon större utsträckning. Det är därför DXVA och liknande använder en speciell krets för ändamålet som inte har någonting med en GPU att göra förutom att den råkar sitta på samma instickskort.

My bad, men principen att använda dedikerad hårdvara istället för en mjukvaru-algoritm är densamma även om det inte går att använda sps för den saken. Det kan hända att de används ändå när man ser på filmen, eftersom efterbehandling av signalen sker över sps.

Visa signatur

9950X3D X870E HERO 96/6400c30/2200 RTX5090 Gaming OC || 7950X B650 Gaming Plus WIFI 32/6000c30 RTX5080 TUF OC(450w) UBUNTU || 12900KF Z690 Tomahawk WIFI 64/3600c16 Gear1 RTX4080 Ventus 3X OC(400W) || 5900X(B2) B550-F 32/3800c18 RTX3080 TUF OC V2 || 5800X3D CH VIII EXT. 32/3800c18 RTX3080 Gaming OC || 3700X X570 HERO 32/3000c16 RTX3070 FTW3 Ultra || Thinkpad P16s G2 PRO7840U 32/6400

Permalänk
Skrivet av Elgot:

Men för dem som vacklar mellan gpu-lösningar och mera traditionella är det förmodligen inte ett helt ointressant resultat; 2,5 ggr snabbare är förvisso bättre, men kanske är det inte värt de programförändringar som måste göras?

Det tänkte jag inte på i och för sig.

Decisions!

Visa signatur

Gammalt nick: Darkst@r