När Nvidia avtäckte Geforce RTX 3000-serien med "Ampere"-arkitekturen sköt antalet CUDA-kärnor i höjden, något som under evenemanget minst sagt förvånade även SweClockers redaktörer. Den stora ökningen visade sig i efterhand vara till följd av att Nvidia ändrat hur antalet kärnor räknas, då kapaciteten i de nya grafikkortens beräkningsenheter (SM) inte riktigt motsvarade tidigare modeller med "Turing"-arkitekturen.

Med nästa generations grafikkort, som väntas blir Geforce RTX 4000-serien och arkitekturen "Ada Lovelace" kan antalet CUDA-kärnor skjuta i höjden ännu en gång. Redan i slutet av 2020 cirkulerade uppgifter om att toppmodellen AD102 kan få hela 18 432 stycken, uppgifter som dykt upp igen i samband med dataläckor efter att Nvidia utsatts för en cyberattack.

Grafikkrets
Produktnamn

AD102

GA102
RTX 3090

AD103

GA103
RTX 3080 Ti (Laptop)

Teknik

5nm TSMC

8nm Samsung

5nm TSMC

8nm Samsung

SM-kluster

144 st.

84 st.

84 st.

60 st.

CUDA-kärnor

18 432 st.

10 752 st.

10 752 st.

7 680 st.

L2 Cache

96 MB

6 MB

64 MB

4 MB

Minnesbuss

384-bit

384-bit

256-bit

320-bit

Den här gången är det inte endast specifikationer för toppkretsen AD102 som letar sig ut. I en tabell som cirkulerar på Twitter specificeras antalet SM-kluster för hela uppställningen kretsar. Förutsatt att Nvidia inte ännu en gång ändrar på hur antalet CUDA-kärnor räknas ger det nästan det dubbla antalet för toppkretsen i fullfjädrat utförande.

Grafikkrets
Produktnamn

AD104

GA104
RTX 3070

AD106

GA106
RTX 3060

AD107

GA107
RTX 3050 (Laptop)

Teknik

5nm TSMC

8nm Samsung

5nm TSMC

8nm Samsung

5nm TSMC

8nm Samsung

SM-kluster

60 st.

48 st.

36 st.

30 st.

24 st.

24 st.

CUDA-kärnor

7 680st.

6 144 st.

4 608 st.

3 840 st.

3 072 st.

3 072 st.

L2 Cache

48 MB

4 MB

32 MB

3 MB

32 MB

2 MB

Minnesbuss

192-bit

256-bit

128-bit

192-bit

128-bit

128-bit

För mellansegmentet och de enklare kretsarna är ökningen inte lika dramatisk. Något som däremot står ut är en rejäl ökning av L2-cache, något som letat sig ut i samma läcka. Där uppges Nvidia skruva upp övre segmentets 6 MB respektive 4 MB till 96 MB och 64 MB, med motsvarande ökningar för mellansegmentet.

Samtidigt som mängden L2-cache går upp bantas minnesbussen istället ned något för samtliga utom AD102, vilket påminner något om hur AMD gör med Infinity Cache. Den utökade cache-storleken når förvisso inte samma mängd som AMD:s Infinity Cache, men i gengäld satsar Nvidia på ett stort L2-cache istället för L3. Det har i regel lägre latenser och högre bandbredd än dess L3-dito, men precis som med alla typer av lagring kan överföringshastighet inte helt ersätta minnesmängd eller vice versa.

Då Nvidia ännu inte tagit bladet från munnen gällande någon av specifikationerna bör de tas med en nypa salt. Trots de multipla läckorna som letat sig ut de senaste dagarna saknas säkra bevis för både om och vilken data som faktiskt härstammar från grafikkortsjättens servrar.

Läs mer om grafikkort: