Fermi: En ny grafikprocessor

Grafikprocessorn Fermi är inte en helt ny design. Även om processorn är fullpackad med nyheter bygger den på föregångarna G80 och GT200, vilket bland annat syns i användningen av CUDA Cores.

512 stycken CUDA Cores (de gröna rektanglarna ovan) organiseras i 16 stycken Streaming Multiprocessors. Varje Streaming Multiprocessor har tillgång till 16 eller 48 KB (konfigurerbart) L1-cache och 768 KB L2-cache. Dessa styrs av en schemaläggare som kallas för Gigathread Engine som bland annat är tio gånger snabbare på kontextbyten än tidigare.

Cacheminnet har också en parallell datahierarki som ger hastighetsökningar i applikationer där minnesadresserna inte är kända i förväg. Detta kan exempelvis vara vid ray-tracing eller matrismultiplikationer.

En annan nyhet i Fermi är att den nya grafikprocessorn är betydligt bättre på 64-bitars flyttalsoperationer (double) än föregångarna. Nvidia hävdar att Fermi är upp till åtta gånger snabbare än GT200 i detta avseende vilket kan ge hastighetsökningar på över 400 procent i vissa applikationer.

Sammantaget är Fermi från grunden designad för att vara en så programmerbar grafikprocessor som möjligt. Nvidias nykomling stöder givetvis DirectX 11 med DirectCompute och OpenCL, men kan även programmeras i "vanlig" C++. Detta kan ge upphov till en mängd intressanta applikationer i framtiden.