AMD Instinct MI100 är första beräkningskortet med arkitekturen CDNA

Permalänk
Melding Plague

AMD Instinct MI100 är första beräkningskortet med arkitekturen CDNA

Med Instinct MI100 gör AMD:s beräkningsfokuserade arkitektur CDNA premiär, där ledande prestanda för flyttalsberäkning utlovas.

Läs hela artikeln här

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Medlem

Läste titeln lite snabbt och tänkte "med stöd för CUDA". Vart paff och glad där en sekund.

Visa signatur

i7-2700K 5GHz | 32GB DDR3-1600 | ASUS Maximus V Gene | GTX 980 2-way SLI

Permalänk
Medlem

"Fördelarna för Nvidia fortsätter när det kommer till beräkningar av glesbefolkade matriser (sparse). För FP64 når A100 här 195 TFLOPS medan Instinct MI100 får nöja sig med 11,5 FTLOPS. För FP32 blir resultatet förkrossande 156 TFLOPS i Nvidias favör mot AMD:s 23,1 TFLOPS. Likaledes förkrossande är FP16-resultaten, med 624 TFLOPS i det gröna lägret kontra 185 TFLOPS för röda laget."

Lite väl snabbt ihopsnickrat,
Nvidia får visserligen fram 156 TFlop fast det är för TF32 (TensorFloat-32 (TF32) provides the range of FP32 with the precision of FP16)
då viftar också blåvalarna i 312 TFloppar i glesbefolkade områden.
Men det är väl troligt att nVidia-användare vill kompilera om sin kod för det då FP32 bara ger 19.5 TFlop i jämförelse (vilket är lägre än AMD för de som behöver precision och kompatibilitet).

Permalänk
Livsnjutare 😎

AMD slår från alla fronter nu... !

Visa signatur

Citera eller Svara för respons! •
• Life is a playground {|;^) •

Permalänk
Medlem

120CU låter lovande, ge oss 6950XT tack!

Permalänk
Medlem
Skrivet av medbor:

120CU låter lovande, ge oss 6950XT tack!

Men det är inte RDNA utan CDNA som inte har några grafikfunktioner. Dvs en compute-arkitektur.

Visa signatur

R&D Elektronikingenjör

Permalänk
Medlem
Skrivet av Nyhet:

Sett till beräkning av tätbefolkade matriser (dense) anger AMD ett markant övertag i flyttalsprestanda över Nvidia A100, med 19,5 procent bättre resultat för dubbel precision (FP64) och 18,5 procent övertag för enkel precision (FP32). AMD-lägret får dock se sig ordentligt akterseglade av A100 när det gäller halvprecision (FP16), där Nvidias kort mäktar med 69 procent bättre resultat

18,5 till 19,5%, har man inte sätt den prestandan nyligen?

Visa signatur

Server: Fractal design Define 7 XL | AMD Ryzen 7 5800X 8/16 | ASUS ROG CROSSHAIR VIII DARK HERO | 64GB Corsair @ 3000MHz | ASUS Radeon RX 460 2GB | Samsung 960 PRO 512 GB M.2 | 2x 2TB Samsung 850 PRO SSD | 6x Seagate Ironwolf Pro 10TB
WS: Phantex Entoo Elite | AMD Ryzen Threadripper 1950X 16/32 | ASUS Zenith extreme | 128GB G.Skill @ 2400MHz | ASUS Radeon HD7970 | 3x 2TB Samsung 960PRO M.2 | 6x Seagate Ironwolf Pro 10 TB
NEC PA301W 30" @ 2560x1600 | Linux Mint 21.3 Cinnamon

Permalänk
Medlem
Skrivet av Rebben:

Men det är inte RDNA utan CDNA som inte har några grafikfunktioner. Dvs en compute-arkitektur.

Jag vet, men de är ganska nära besläktade och det visar ju att storleken på chippet går att skala med allt vad det innebär.

Permalänk
Medlem

Jag må vara lite av en ATi fanboy, men den videon var ju bara löjlig. Vem riktar den sig till egentligen? Känns som att videon riktar sig till unga personer, men detta är ju ett rent cumpute kort... Eh.....

Visa signatur

www.fckdrm.com - DRM år 2024? Ha pyttsan.

Permalänk
Medlem

MINING HYPE???

Permalänk
Medlem
Skrivet av medbor:

Jag vet, men de är ganska nära besläktade och det visar ju att storleken på chippet går att skala med allt vad det innebär.

Det är inte alls säkert att grafikbiten skalar lika bra. Är computekärnorna mycket mindre, vilket jag tror, så går det in fler på samma yta.

Visa signatur

R&D Elektronikingenjör

Permalänk
Medlem
Skrivet av Rebben:

Det är inte alls säkert att grafikbiten skalar lika bra. Är computekärnorna mycket mindre, vilket jag tror, så går det in fler på samma yta.

Jag tror ärligt att det är tvärt om eftersom en compute-kärna vill ha fullt stöd för 64-bit FP och annat liknande, dessutom dessa matrisenheter som artikeln pratar om. Vi får väl vänta och se helt enkelt.

80CU RDNA2 är ju ca 500mm2, så 120 borde ju kunna få plats ändå om taket är uppe vid 800mm2 som vanligt. Inga siffror på chippet i artikeln än dock...