Singel precision och fp16

2021-02-05 02:32

Medlem

Registrerad: Sep 2019

●

Singel precision och fp16

Försöker jämföra lite olika grafikkort mellan generationer och mellan olika märken. Det senaste inbyggda grafikkorten från Intel Iris Xe Graphics G7 har som bäst runt 4000 GFLOPS i FP16. Jämför man det med Nvidias grafikkort så har ett Nvidia GTX 780 lika mycket GFLOPS i singel precision.

Går det att jämföra?

Rapportera Redigera

Citera flera Citera

2021-02-05 03:02

Permalänk

m1k3_dd

Medlem

Plats: Gävle/Sandviken
Registrerad: Maj 2019

●

Skrivet av Dinkefing:

Går det att jämföra?

Gå till inlägget

Ja, en GFLOP ska vara samma sak oavsett hårdvara - dvs 1 miljard Floating Point OPerations.

Däremot kan det väl inte översättas direkt till prestanda i exvis spel då fler saker spelar in (typ bandbredder, exvis GPU <> minne).

Måttstock för hastighet på beräkningar alltså, bra att veta när exvis grafikkort sätts på GPGPU-jobb.
Troligen något som bl.a. miners lusläser innan köp osv.

Visa signatur

Hårdvara:
Varierande nog, = onödig information.

Gillar Linux, det kan vara värt vetande. 🙂

Rapportera Redigera

Citera flera Citera

2021-02-05 03:25

Permalänk

hACmAn

Medlem

Plats: Södertälje
Registrerad: Aug 2007

●

Som ovan nämnt så är det svårt att jämföra. Det beror helt på var korten eller CPU ska göra. Då det blivit populär med "AI" och att man insett att det kanske inte är så viktigt att alt är så noggrant utan snarare går fort så har man sänkt kraven i många fall på flyttals beräkningarna.
Då är det inte bara Singel FP16 FT32 FP64 mm.
Det gäller evan FP8 mm.
Idag så specialiserar man mer då man inte kan fixa det på ett annat bra sätt.

För att spara tid så kan dagen grafikkort koppa mellan dessas och bli snabbare på de lägre värdena, ett tag var det inte så lätt.

Så du fick inte så mycket mer att gå ner till FP16 eller till FP8 Från FP32. Detta är enkelt förklarat då mycket av jobbet behövdes göras endå och hindrade de andra delarna från att arbeta. Dvs en flaskhals i systemet. Men idag är det inte lika dant. I det man brukar prata om då det kommer till AI yada yada. så är det låga flytalsoprationer man ofta pratar om men många. Så det är viktigare att se 1000000 kameror en 1000 med bra kvalitet. De är byggda för snabb io och prat till en databas inte för att vissa min senaste snygga bild på ett träd i solnedgång på min m2 disk.

Förlåt för min otydlighet.
Matte: Genom att inte göra det hela så korrekt. 1x2=2(1x2) Istället för att 1,9999999999999x2=4(2x2) så sparar man tid, massvis med tid och resurser. Sen att det blir lite fel ja det löser vi senare. Detta ovan var en hyperbol. Hur man avrundar mm. Beronde på hur många decimaler/tal man räknar med.

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Rapportera Redigera

Citera flera Citera

2021-02-05 08:54

Permalänk

Dinkefing

Medlem

Registrerad: Sep 2019

●

Skrivet av m1k3_dd:

Ja, en GFLOP ska vara samma sak oavsett hårdvara - dvs 1 miljard Floating Point OPerations.

Däremot kan det väl inte översättas direkt till prestanda i exvis spel då fler saker spelar in (typ bandbredder, exvis GPU <> minne).

Måttstock för hastighet på beräkningar alltså, bra att veta när exvis grafikkort sätts på GPGPU-jobb.
Troligen något som bl.a. miners lusläser innan köp osv.

Gå till inlägget

Nej men det ger väl ändå en generell bild? Eller har jag misstolkat? Hur ofta är ett kort med mindre GFLOPS långsammare än ett med högre?

Skrivet av hACmAn:

Som ovan nämnt så är det svårt att jämföra. Det beror helt på var korten eller CPU ska göra. Då det blivit populär med "AI" och att man insett att det kanske inte är så viktigt att alt är så noggrant utan snarare går fort så har man sänkt kraven i många fall på flyttals beräkningarna.
Då är det inte bara Singel FP16 FT32 FP64 mm.
Det gäller evan FP8 mm.
Idag så specialiserar man mer då man inte kan fixa det på ett annat bra sätt.

För att spara tid så kan dagen grafikkort koppa mellan dessas och bli snabbare på de lägre värdena, ett tag var det inte så lätt.

Så du fick inte så mycket mer att gå ner till FP16 eller till FP8 Från FP32. Detta är enkelt förklarat då mycket av jobbet behövdes göras endå och hindrade de andra delarna från att arbeta. Dvs en flaskhals i systemet. Men idag är det inte lika dant. I det man brukar prata om då det kommer till AI yada yada. så är det låga flytalsoprationer man ofta pratar om men många. Så det är viktigare att se 1000000 kameror en 1000 med bra kvalitet. De är byggda för snabb io och prat till en databas inte för att vissa min senaste snygga bild på ett träd i solnedgång på min m2 disk.

Förlåt för min otydlighet.
Matte: Genom att inte göra det hela så korrekt. 1x2=2(1x2) Istället för att 1,9999999999999x2=4(2x2) så sparar man tid, massvis med tid och resurser. Sen att det blir lite fel ja det löser vi senare. Detta ovan var en hyperbol. Hur man avrundar mm. Beronde på hur många decimaler/tal man räknar med.

Gå till inlägget

Tack för genomgången men blev inte smartare där tyvärr.

Rapportera Redigera

Citera flera Citera

Singel precision och fp16

Singel precision och fp16

Externa nyheter