Intel: GPU mångdubbelt snabbare än CPU

Permalänk
Medlem
Skrivet av Gramner:

Vadå "i mjukvara", hur tror du att en CPU fungerar egentligen? Dessutom är en CPU betydligt snabbare än en GPU på att genomföra beräkningar, skillnaden är att en GPU kan utföra stora mängder enkla beräkningar samtidigt förutsatt att beräkningarna är fristående från varandra och på så vis få ett bättre totalresultat, problemet är dock att det är extremt få typer av algoritmer som kan dra nytta av extrem parallellism.

Cpun kan tex generera både shaders och texturer men eftersom den saknar dedikerad hårdvara för det måste den göra det i form av mjukvara som emulerar sps och tmus. Kvalitetsmässigt blir resultatet minst lika bra eller bättre, men oändligt långsamt eftersom uppgiften inte går att parallelisera mer än till max 12 trådar idag med den värsta processorn(i980X). Med en gpu har du upp till 1600 shaderenheter och upp till 80 texturenheter som alla kör parallelt. Det blir lite snabbare. Men som sagt, sen kan gpun inte göra så värst mycket mer än dessa och liknande beräkningar. Cpun kan beräkna i princip vad som helst.

3DSMax eller Maya tex kan generera all typ av grafik som ett high-end grafikkort kan och mycket mer, och de gör det i mjukvara, men då kan du få vänta ett bra tag på att EN ENDA bild genereras. Ett grafikkort kan spotta ur sig något hundratal i sekunden av samma bild.

Numera finns det plugins åtminstone för 3DSmax som renderar vissa typer av bilder direkt på grafikkortet, det går mycket snabbare.

edit. en annan liknelse är videoavspelning av HD-material, det går inte att få mycket bättre kvalitet på bilden än med ffdshow, men då är risken att det hackar på en för klen processor eftersom hela filmen renderas i mjukvara. Med DXVA eller VDPAU sköts samma sak av grafikkortet och HD-film går att se med en skräpprocessor, kvaliteten blir inte bättre men det blir ryckfritt.

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Permalänk

Varför bygger inte nvidia en gpu som man kan sätta på moderkortet istället för en vanlig processor?

Permalänk
Medlem

Därför att det helt enkelt inte fungerar på det viset. En GPU är högt specialiserad, på ett fåtal typer av beräkningar. Att försöka utföra generella CPU instruktioner med en sådan enhet är bara löjligt. En CPU är istället (i jämförelse) väldigt dåligt specialisera, men kan hantera stora mängder enkla instruktioner i snabb följd.
B!

Visa signatur

Allting jag skriver är om inget annat uttrycks, min åsikt! Ingenting måste vara dagens sanning enligt din åsikt, och gör du antaganden baserade på mina åsikter hoppas jag att du övervägt mer än bara just min åsikt.

Permalänk

Hehe Intel failade lite där på att mythbusta ^^

Visa signatur

Gammalt nick: Darkst@r
Intel Core i7 860 @ 3,6 GHz/Noctua NH-D14|Asus GTX 970 Strix|2x2 GB Corsair Dominator DDR3 1600 CL8|Asus P7P55D Deluxe|Intel X-25M G2 80GB|Samsung 850 Pro 256 GB|Samsung Spinpoint F3 1TB|Windows 7 Home Premium 64-bit|Nanoxia Deep Silence 1|Corsair VX550|

Permalänk
Hedersmedlem
Skrivet av Darkst@r:

Hehe Intel failade lite där på att mythbusta ^^

Nej, de lyckades väl visa vad de ville (att prestandavinsten vanligtvis är mycket mindre än 10-1000 ggr)?

Permalänk
Skrivet av Elgot:

Nej, de lyckades väl visa vad de ville (att prestandavinsten vanligtvis är mycket mindre än 10-1000 ggr)?

Ja egentligen men samtidigt är det lite som att någon påstår att man bara kan bänka 10 KG när man kan bänka "hela" 15 KG...

Visa signatur

Gammalt nick: Darkst@r
Intel Core i7 860 @ 3,6 GHz/Noctua NH-D14|Asus GTX 970 Strix|2x2 GB Corsair Dominator DDR3 1600 CL8|Asus P7P55D Deluxe|Intel X-25M G2 80GB|Samsung 850 Pro 256 GB|Samsung Spinpoint F3 1TB|Windows 7 Home Premium 64-bit|Nanoxia Deep Silence 1|Corsair VX550|

Permalänk
Hedersmedlem
Skrivet av Darkst@r:

Ja egentligen men samtidigt är det lite som att någon påstår att man bara kan bänka 10 KG när man kan bänka "hela" 15 KG...

Men för dem som vacklar mellan gpu-lösningar och mera traditionella är det förmodligen inte ett helt ointressant resultat; 2,5 ggr snabbare är förvisso bättre, men kanske är det inte värt de programförändringar som måste göras?

Permalänk
Medlem
Skrivet av the squonk:

en annan liknelse är videoavspelning av HD-material, det går inte att få mycket bättre kvalitet på bilden än med ffdshow, men då är risken att det hackar på en för klen processor eftersom hela filmen renderas i mjukvara. Med DXVA eller VDPAU sköts samma sak av grafikkortet och HD-film går att se med en skräpprocessor, kvaliteten blir inte bättre men det blir ryckfritt.

Det är lite intressant att du nämner decoding av H.264 som en fördel för GPU, det är nämligen så att inte ens den mest extremt överklockade GPUn med en väldigt GPU-optimerad decoding-mjukvara skulle vara i närheten av att ens klara av att decoda 720p i realtid då H264:s entropy coding (av design) är en algoritm som är helt beroende på tidigare beräkningar och därför ej kan parallelliseras i någon större utsträckning. Det är därför DXVA och liknande använder en speciell krets för ändamålet som inte har någonting med en GPU att göra förutom att den råkar sitta på samma instickskort.

Visa signatur

Assembly är ett högnivåspråk.

Permalänk
Medlem
Skrivet av Gramner:

Det är lite intressant att du nämner decoding av H.264 som en fördel för GPU, det är nämligen så att inte ens den mest extremt överklockade GPUn med en väldigt GPU-optimerad decoding-mjukvara skulle vara i närheten av att ens klara av att decoda 720p i realtid då H264:s entropy coding (av design) är en algoritm som är helt beroende på tidigare beräkningar och därför ej kan parallelliseras i någon större utsträckning. Det är därför DXVA och liknande använder en speciell krets för ändamålet som inte har någonting med en GPU att göra förutom att den råkar sitta på samma instickskort.

My bad, men principen att använda dedikerad hårdvara istället för en mjukvaru-algoritm är densamma även om det inte går att använda sps för den saken. Det kan hända att de används ändå när man ser på filmen, eftersom efterbehandling av signalen sker över sps.

Visa signatur

|| R9 7950X MSI PRO X670-P WIFI 32GB-DDR5-6400c32 MSI RTX4080 Ventus 3X OC || CORE i9 12900KF MSI Z690 Tomahawk WIFI DDR4 32GB-3600c16 Gear1 TUF RTX3080 OC V2 || R7 5800X3D X570S CH8 Extreme 32GB-3800c18 Gigabyte RTX3080 GAMING OC || R9 5900X(B2) B550-F 32GB-3800c18 EVGA RTX3070 FTW Ultra || R9 3900X X470-Prime Pro 32GB-3200c16 MSI RTX2070 Super ||

Permalänk
Skrivet av Elgot:

Men för dem som vacklar mellan gpu-lösningar och mera traditionella är det förmodligen inte ett helt ointressant resultat; 2,5 ggr snabbare är förvisso bättre, men kanske är det inte värt de programförändringar som måste göras?

Det tänkte jag inte på i och för sig.

Decisions!

Visa signatur

Gammalt nick: Darkst@r
Intel Core i7 860 @ 3,6 GHz/Noctua NH-D14|Asus GTX 970 Strix|2x2 GB Corsair Dominator DDR3 1600 CL8|Asus P7P55D Deluxe|Intel X-25M G2 80GB|Samsung 850 Pro 256 GB|Samsung Spinpoint F3 1TB|Windows 7 Home Premium 64-bit|Nanoxia Deep Silence 1|Corsair VX550|