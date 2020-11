"Fördelarna för Nvidia fortsätter när det kommer till beräkningar av glesbefolkade matriser (sparse). För FP64 når A100 här 195 TFLOPS medan Instinct MI100 får nöja sig med 11,5 FTLOPS. För FP32 blir resultatet förkrossande 156 TFLOPS i Nvidias favör mot AMD:s 23,1 TFLOPS. Likaledes förkrossande är FP16-resultaten, med 624 TFLOPS i det gröna lägret kontra 185 TFLOPS för röda laget."

Lite väl snabbt ihopsnickrat,

Nvidia får visserligen fram 156 TFlop fast det är för TF32 (TensorFloat-32 (TF32) provides the range of FP32 with the precision of FP16)

då viftar också blåvalarna i 312 TFloppar i glesbefolkade områden.

Men det är väl troligt att nVidia-användare vill kompilera om sin kod för det då FP32 bara ger 19.5 TFlop i jämförelse (vilket är lägre än AMD för de som behöver precision och kompatibilitet).