Permalänk

Singel precision och fp16

Försöker jämföra lite olika grafikkort mellan generationer och mellan olika märken. Det senaste inbyggda grafikkorten från Intel Iris Xe Graphics G7 har som bäst runt 4000 GFLOPS i FP16. Jämför man det med Nvidias grafikkort så har ett Nvidia GTX 780 lika mycket GFLOPS i singel precision.

Går det att jämföra?

Permalänk
Medlem
Skrivet av Dinkefing:

Går det att jämföra?

Ja, en GFLOP ska vara samma sak oavsett hårdvara - dvs 1 miljard Floating Point OPerations.

Däremot kan det väl inte översättas direkt till prestanda i exvis spel då fler saker spelar in (typ bandbredder, exvis GPU <> minne).

Måttstock för hastighet på beräkningar alltså, bra att veta när exvis grafikkort sätts på GPGPU-jobb.
Troligen något som bl.a. miners lusläser innan köp osv.

Visa signatur

Hårdvara:
Varierande nog, = onödig information.

Gillar Linux, det kan vara värt vetande. 🙂

Permalänk
Medlem

Som ovan nämnt så är det svårt att jämföra. Det beror helt på var korten eller CPU ska göra. Då det blivit populär med "AI" och att man insett att det kanske inte är så viktigt att alt är så noggrant utan snarare går fort så har man sänkt kraven i många fall på flyttals beräkningarna.
Då är det inte bara Singel FP16 FT32 FP64 mm.
Det gäller evan FP8 mm.
Idag så specialiserar man mer då man inte kan fixa det på ett annat bra sätt.

För att spara tid så kan dagen grafikkort koppa mellan dessas och bli snabbare på de lägre värdena, ett tag var det inte så lätt.

Så du fick inte så mycket mer att gå ner till FP16 eller till FP8 Från FP32. Detta är enkelt förklarat då mycket av jobbet behövdes göras endå och hindrade de andra delarna från att arbeta. Dvs en flaskhals i systemet. Men idag är det inte lika dant. I det man brukar prata om då det kommer till AI yada yada. så är det låga flytalsoprationer man ofta pratar om men många. Så det är viktigare att se 1000000 kameror en 1000 med bra kvalitet. De är byggda för snabb io och prat till en databas inte för att vissa min senaste snygga bild på ett träd i solnedgång på min m2 disk.

Förlåt för min otydlighet.
Matte: Genom att inte göra det hela så korrekt. 1x2=2(1x2) Istället för att 1,9999999999999x2=4(2x2) så sparar man tid, massvis med tid och resurser. Sen att det blir lite fel ja det löser vi senare. Detta ovan var en hyperbol. Hur man avrundar mm. Beronde på hur många decimaler/tal man räknar med.

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Skrivet av m1k3_dd:

Ja, en GFLOP ska vara samma sak oavsett hårdvara - dvs 1 miljard Floating Point OPerations.

Däremot kan det väl inte översättas direkt till prestanda i exvis spel då fler saker spelar in (typ bandbredder, exvis GPU <> minne).

Måttstock för hastighet på beräkningar alltså, bra att veta när exvis grafikkort sätts på GPGPU-jobb.
Troligen något som bl.a. miners lusläser innan köp osv.

Nej men det ger väl ändå en generell bild? Eller har jag misstolkat? Hur ofta är ett kort med mindre GFLOPS långsammare än ett med högre?

Skrivet av hACmAn:

Som ovan nämnt så är det svårt att jämföra. Det beror helt på var korten eller CPU ska göra. Då det blivit populär med "AI" och att man insett att det kanske inte är så viktigt att alt är så noggrant utan snarare går fort så har man sänkt kraven i många fall på flyttals beräkningarna.
Då är det inte bara Singel FP16 FT32 FP64 mm.
Det gäller evan FP8 mm.
Idag så specialiserar man mer då man inte kan fixa det på ett annat bra sätt.

För att spara tid så kan dagen grafikkort koppa mellan dessas och bli snabbare på de lägre värdena, ett tag var det inte så lätt.

Så du fick inte så mycket mer att gå ner till FP16 eller till FP8 Från FP32. Detta är enkelt förklarat då mycket av jobbet behövdes göras endå och hindrade de andra delarna från att arbeta. Dvs en flaskhals i systemet. Men idag är det inte lika dant. I det man brukar prata om då det kommer till AI yada yada. så är det låga flytalsoprationer man ofta pratar om men många. Så det är viktigare att se 1000000 kameror en 1000 med bra kvalitet. De är byggda för snabb io och prat till en databas inte för att vissa min senaste snygga bild på ett träd i solnedgång på min m2 disk.

Förlåt för min otydlighet.
Matte: Genom att inte göra det hela så korrekt. 1x2=2(1x2) Istället för att 1,9999999999999x2=4(2x2) så sparar man tid, massvis med tid och resurser. Sen att det blir lite fel ja det löser vi senare. Detta ovan var en hyperbol. Hur man avrundar mm. Beronde på hur många decimaler/tal man räknar med.

Tack för genomgången men blev inte smartare där tyvärr.