Nvidia "Ada Lovelace" uppges få 18 432 CUDA-kärnor

När Nvidia avtäckte Geforce RTX 3000-serien med "Ampere"-arkitekturen sköt antalet CUDA-kärnor i höjden, något som under evenemanget minst sagt förvånade även SweClockers redaktörer. Den stora ökningen visade sig i efterhand vara till följd av att Nvidia ändrat hur antalet kärnor räknas, då kapaciteten i de nya grafikkortens beräkningsenheter (SM) inte riktigt motsvarade tidigare modeller med "Turing"-arkitekturen.

Med nästa generations grafikkort, som väntas blir Geforce RTX 4000-serien och arkitekturen "Ada Lovelace" kan antalet CUDA-kärnor skjuta i höjden ännu en gång. Redan i slutet av 2020 cirkulerade uppgifter om att toppmodellen AD102 kan få hela 18 432 stycken, uppgifter som dykt upp igen i samband med dataläckor efter att Nvidia utsatts för en cyberattack.

Grafikkrets Produktnamn	AD102	GA102 RTX 3090	AD103	GA103 RTX 3080 Ti (Laptop)
Teknik	5nm TSMC	8nm Samsung	5nm TSMC	8nm Samsung
SM-kluster	144 st.	84 st.	84 st.	60 st.
CUDA-kärnor	18 432 st.	10 752 st.	10 752 st.	7 680 st.
L2 Cache	96 MB	6 MB	64 MB	4 MB
Minnesbuss	384-bit	384-bit	256-bit	320-bit

Den här gången är det inte endast specifikationer för toppkretsen AD102 som letar sig ut. I en tabell som cirkulerar på Twitter specificeras antalet SM-kluster för hela uppställningen kretsar. Förutsatt att Nvidia inte ännu en gång ändrar på hur antalet CUDA-kärnor räknas ger det nästan det dubbla antalet för toppkretsen i fullfjädrat utförande.

Grafikkrets Produktnamn	AD104	GA104 RTX 3070	AD106	GA106 RTX 3060	AD107	GA107 RTX 3050 (Laptop)
Teknik	5nm TSMC	8nm Samsung	5nm TSMC	8nm Samsung	5nm TSMC	8nm Samsung
SM-kluster	60 st.	48 st.	36 st.	30 st.	24 st.	24 st.
CUDA-kärnor	7 680st.	6 144 st.	4 608 st.	3 840 st.	3 072 st.	3 072 st.
L2 Cache	48 MB	4 MB	32 MB	3 MB	32 MB	2 MB
Minnesbuss	192-bit	256-bit	128-bit	192-bit	128-bit	128-bit

För mellansegmentet och de enklare kretsarna är ökningen inte lika dramatisk. Något som däremot står ut är en rejäl ökning av L2-cache, något som letat sig ut i samma läcka. Där uppges Nvidia skruva upp övre segmentets 6 MB respektive 4 MB till 96 MB och 64 MB, med motsvarande ökningar för mellansegmentet.

Samtidigt som mängden L2-cache går upp bantas minnesbussen istället ned något för samtliga utom AD102, vilket påminner något om hur AMD gör med Infinity Cache. Den utökade cache-storleken når förvisso inte samma mängd som AMD:s Infinity Cache, men i gengäld satsar Nvidia på ett stort L2-cache istället för L3. Det har i regel lägre latenser och högre bandbredd än dess L3-dito, men precis som med alla typer av lagring kan överföringshastighet inte helt ersätta minnesmängd eller vice versa.

Då Nvidia ännu inte tagit bladet från munnen gällande någon av specifikationerna bör de tas med en nypa salt. Trots de multipla läckorna som letat sig ut de senaste dagarna saknas säkra bevis för både om och vilken data som faktiskt härstammar från grafikkortsjättens servrar.