Skrivet av AplAy:
Ursäkta att jag är noob, men vad exakt är det dessa delar i grafikkortet beräknar/arbetar med?:
- CUDA-kärnor? (matematiska/fysiska beräkningar från NVIDIA?)
- Texturenheter? (endast för texturer/pixlar?)
- Rasterenheter? (har det något med "rasterize" att göra?)
Och vad ger fler i respektive grej, en för fördel? Typ som att mer videominne innebär större upplösningar...
Tack för svar på förhand! / AplAy.
Tvekade på om jag skulle skriva något, jag är ingen expert .. but here goes
CUDA är en slag beräkningsplattform som man kan skicka instruktioner till .. typ.. fast kortfattat .. Nvidia har skapat en plattform för ett antal olika typer av beräkningar, i detta fallet är det grafikinstruktioner.
Texturenhet vad jag vet möjliggör att rendera en bild på en 3D modell. Texture Mapping Unit (TMU)
Rasterenhet är det som renderar bilden som hanteras av texturenheten. Render Output Unit (ROP)
Videominnet är där alla information om t ex texturer etc finns, så att det är nära GPUn. Har du för lite vram så måste informationen hämtas antingen från datorns ram eller i värsta fall från hårddisk .. har du för lite vram så blir det som att swappa på hårddisken när din dators ram är fullt. Dvs risken för lagg är extrem
Fler eller mindre av varje del skulle kunna beskrivas i en jämförelse mellan GTX1080 och 1070.
GTX1080 av 20 Streaming Multiprocessors (SM) i 4 cluster. så 5 SM i varje cluster.
Varje cluster har 16 ROPs, varje SM består av 128 CUDA cores och 8 TMUs.
Dvs 2560 CUDA cores, 64 ROPs och 160 TMU's
GTX1070 verkar ha ett sådant SM cluster avstängt (antar det eftersom det är samma chip för 1080 som för 1070), så 2560->1920 CUDA cores, 64 -> 48 ROPs och 160 -> 120 TMU's ..
Sedan har dom två korten olika typer av VRAM (1080=GDDR5X, 1070=GDDR5), men samma mängd (8GB).
GTX1070 har helt enkelt mindre "cores" att göra beräkningar, färre enheter som kan rendera bilder och dessutom från ett långsammare minne.
Mina beskrivningar kanske inte är dom bästa lol, men googla lite så hittar du säkert mer och säkerställd info. Men du kanske fick en indikation iaf
EDIT: kollade upp specs på gtx1070 och såg att det också har 64ROPs, så det verkar som det fortfarande är 4 cluster (4x16=64ROPs) men "bara" 15SMs