Nvidia Tesla K20 med GK110 i handeln – kostar över 30 000 kronor

Permalänk
Medlem
Skrivet av Yoshman:

Är det verkligen ett kap?

Svaret är antagligen att många byggt in sig i CUDA. Finns en del motvilja att slänga all den väl-optimerade koden som fungerar bra och börja om. Xeon Phi är väl ett försök att
kring-gå CUDA genom att det finns x86-kod redan. OpenCL verkar det gå väldigt trögt för.

Visa signatur

--
A shark on whiskey is mighty risky, but a shark on beer is a beer engineer.

Permalänk
Medlem

Undra hur lång tid det tar innan man ser första kortet här: http://setiathome.berkeley.edu/top_hosts.php

Permalänk
Avstängd
Skrivet av RzrTrek:

Kortet ni länkar är skandal, då ett överklockat HD7950 (som är hälften så dyrt) får bättre prestanda!

Japp... HD7950 kostar i din värld alltså 15000?

Visa signatur

||NZXT H440 Black/Red||Intel i5 2500k @ 4,2GHz ||Noctua NH-D14 ||GA-Z77X-UD3H ||8 gb Corsair Vengeance 1600mhz DDR3 ||MSI GeForce GTX 970 ||OCZ Agility 3 120GB SSD ||Samsung Spinpoint F3 1TB ||Corsair HX750W||
Software is like sex, it's better when it's free. - Linus Torvalds

Permalänk
Medlem
Skrivet av riktigninja:

nä .. kanske om 30 år

Snarare 3 år. Ett sketet 7770 ligger på den nivån som var toppnivån 3 år tidigare.

Permalänk
Entusiast
Skrivet av Pholostan:

Svaret är antagligen att många byggt in sig i CUDA. Finns en del motvilja att slänga all den väl-optimerade koden som fungerar bra och börja om. Xeon Phi är väl ett försök att
kring-gå CUDA genom att det finns x86-kod redan. OpenCL verkar det gå väldigt trögt för.

Tror inte det är ett så stort problem för CUDA är fortfarande relativt nytt på HPC-marknaden. Inom vetenskapliga beräkningar är det standard att kompilera om och pilla hela tiden för att optimera för att man måste kompliera om varje gång man byter hårdvara för att optimera mot just den. Så sitter man redan på massa Tesla och ska köpa K20 så blir det att skriva om koden ändå om man vill ha ut all prestanda. Fördelen med Xeon Phi är att det är lättare att skriva mot den då man inte behöver använda specialgrejer som CUDA på samma sätt utan den beter sig mer som en vanlig processor.

Skillnaden lär väl snarare ligga i vilket som är mest effektivt för ett specifikt problem. 2000 långsamma kärnor eller 60 snabba kärnor.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Skrivet av Aleshi:

Snarare 3 år. Ett sketet 7770 ligger på den nivån som var toppnivån 3 år tidigare.

En indikation på att det kanske inte är sant.

http://www.hwcompare.com/11950/radeon-hd-5850-vs-radeon-hd-77...

http://www.hwcompare.com/11965/radeon-hd-4890-1gb-vs-radeon-h...

Visa signatur

Ryzen 5600X | 16 gb DDR4 | B550 ASUS-bräda | MSI GTX 1060 6gb | Samsung 840 250 gb | Corsair RM750 | Fractal Design Arc | Win 10 Pro

Permalänk
Medlem
Skrivet av Vexo:

Undra hur lång tid det tar innan man ser första kortet här: http://setiathome.berkeley.edu/top_hosts.php

Hoppas du vet varför man inte foldar med 6xx

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Datavetare
Skrivet av Zotamedu:

Tror inte det är ett så stort problem för CUDA är fortfarande relativt nytt på HPC-marknaden. Inom vetenskapliga beräkningar är det standard att kompilera om och pilla hela tiden för att optimera för att man måste kompliera om varje gång man byter hårdvara för att optimera mot just den. Så sitter man redan på massa Tesla och ska köpa K20 så blir det att skriva om koden ändå om man vill ha ut all prestanda. Fördelen med Xeon Phi är att det är lättare att skriva mot den då man inte behöver använda specialgrejer som CUDA på samma sätt utan den beter sig mer som en vanlig processor.

Skillnaden lär väl snarare ligga i vilket som är mest effektivt för ett specifikt problem. 2000 långsamma kärnor eller 60 snabba kärnor.

Många långsamma kärnor är alltid MYCKET svårare att hantera än färre snabba kärnor, så skulle vara väldigt intressant att veta hur nära den teoretiskt prestandan man faktiskt når med ett typiskt CUDA-program. Enda fördelen med många svaga kärnor är att man normalt sett kan nå en betydligt mycket högre aggregerad prestanda med många svaga kärnor jämfört med några få starka kärnor givet en viss ström- och transistor-budget. I detta fall så verkar skillnaden väl liten för att det ska vara värt huvudvärken.

Framförallt så måste CUDA vara ett rejält gissel då det är väldigt likt C medan Fortran fortfarande är väldigt populärt då det är en mycket bättre match vid bl.a. matris-beräkningar jämfört med C. Till Xeon Phi, som i praktiken kör något som är väldigt likt AVX, finns ju redan Fortran-kompilatorer (Intel har en egen sådan). Sedan har Intels C++ kompilator (ICC) har stöd för Xeon Phi + att det finns ett tillägg som kallas Cilk+ som ingår i ICC, Cilk+ lägger till några saker till C/C++ som gör det möjligt för programmeraren att uttrycka vektorer och matris som språk-primitiver (direkt kopierat från Fortran) som i sin tur gör det trivialt för kompilatorn att inse hur den kan köra den koden med SIMD-instruktioner.

Tesla har ju en till svaghet jämfört med Xeon Phi i det att en GPU kan i praktiken bara hantera problem som är data-parallella (vilket t.ex. matris-beräkningar är och det är den form av parallellism som SSE/AVX/NEON/AltiVec är designade för). Men det är bara en form av parallellism som finns, den andra är instruktions-parallella system som är den form av parallellism som de flesta kanske tänker på då det är vad man har i multitrådade program som kör på "vanliga" CPU:er. Skulle tro att Xeon Phi får rejält med stryk av en "vanlig" CPU på instruktions-parallella problem, men det är i alla fall möjligt att hantera sådant med en rimlig effektivitet.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem
Skrivet av Pholostan:

Svaret är antagligen att många byggt in sig i CUDA. Finns en del motvilja att slänga all den väl-optimerade koden som fungerar bra och börja om. Xeon Phi är väl ett försök att
kring-gå CUDA genom att det finns x86-kod redan. OpenCL verkar det gå väldigt trögt för.

Kan inte skriva cuda (eller något anant heller för den delen) men var inte hela iden att man kan skriva i C och i openCL men inte x86. Den biten tar vi sepaprat. Är ingen programerare och Nvidia var inte snabba på opencl men går det inte att skriva i det nu?

Edit:
virtual void
i stand corected

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Datavetare
Skrivet av Elgot:

Det beror väl på hur man räknar. Kan man ens köpa xeon phi än? Och även om phi-programmering egentligen har fördelar är det inte osannolikt att folk i branschen redan har erfarenhet av CUDA och liknande (och system som använder dem).

Man kan tydligen inte köpa den Xeon Phi jag refererade till tidigare som är ett utannonserat pris på ~$2000, den ska komma Q1 2013.

Den version som går att köpa ligger på $2700, men då får man 512-bitars buss mot 5GHz GDDR5 i stället för den 384-bitars buss som Tesla och den billigare Xeon Phi använder. Huruvida 30% högre bandbredd mot RAM spelar någon roll beror på vilken typ av problem man har, den teoretiska flyttalsprestandan verkar vara den samma på båda versionerna av Xeon Phi.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

virtual void
det finns ett problem som din inte nämner
Hitta roppen av programeranra är svårt. Dä är det lättare att lära välden det näst bästa. Och även om vi har alla som vet vad mov ax,dx är så tar det för lång tid. Det är lägg att bygga supperdatorer, det är svårt att skriva till dem. Preseis som du redans sagt. Det finns funktioner. Men hur många vet det? Jag är inten programerare. Jag och min stavning skulle sänka hela världen och sen skulle de fråga varför.??? skulle det inte vare ett. Dinns en anleding till att GPGPU administreras av cpu som är helt programbara.
Off tocpick igen. värkara vara mig sak.

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Medlem
Skrivet av Tumnus:

Japp... HD7950 kostar i din värld alltså 15000?

I den väld vi pratar så betyder 1 eller en 0 att man får slänga ALLT, ALT

Vi kör hellre med långsammare system som ALDRIG räknare fel. Och det är anledningen till att jag inte alltid är så positiv till att man inte kan stänga av ECC. Jag vill se att det räknas rätt innan jag slår på det.

Edit: Savning och mening.

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Medlem

Varför? För att du inte kan räkna? 3 år innan 7770 släpptes var 4870 den snabbaste GPUn från AMD och GTX 285 den snabbaste från nVidia, ja GTX 285 var den snabbaste så sent som 2 år innan från nVidia. Och 7770 är en hel del bättre på beräkningar än båda.

Permalänk
Datavetare
Skrivet av hACmAn:

virtual void
det finns ett problem som din inte nämner
Hitta roppen av programeranra är svårt. Dä är det lättare att lära välden det näst bästa. Och även om vi har alla som vet vad mov ax,dx är så tar det för lång tid. Det är lägg att bygga supperdatorer, det är svårt att skriva till dem. Preseis som du redans sagt. Det finns funktioner. Men hur många vet det? Jag är inten programerare. Jag och min stavning skulle sänka hela världen och sen skulle de fråga varför.??? skulle det inte vare ett. Dinns en anleding till att GPGPU administreras av cpu som är helt programbara.
Off tocpick igen. värkara vara mig sak.

Men tror du inte det är lättare att hitta programmerare som kan hantera relativt gamla och etablerade språk som C och Fortran än att hitta programmerare som kan hantera CUDA eller OpenCL? Fördelen med att skriva för etablerade språk är ju att man inte blir låst till en specifik leverantör på samma sätt som om man skriver allt för CUDA. Nu tror jag inte det är ett problem för superdatorer, då man tydligen är ganska "van" i de kretsarna att få skriva om rätt stora delar av sin programvara för att hantera de ganska radikala HW-designerna man jobbar med. Men för lite mer "vanlig" användning blir det en väldigt stor kostnad att vara tvungen att skriva om stora delar av systemet i det läget att man vill/måste byta HW-leveratör.

Vad det gäller Fortran blev jag själv ganska överraskad över hur mycket det används inom vissa specifika områden. Framförallt hade jag lite svårt att se varför Intel lägger ner rätt mycket resurser på sin Fortran-kompilator, men inser nu att det just inom vissa typer av beräkningsintensiva områden som Fortran fortfarande är det bästa (mest effektiva) språk man har just p.g.a. att det är lätt att extrahera data-parallellism ur sådan kod.

Visa signatur

Care About Your Craft: Why spend your life developing software unless you care about doing it well? - The Pragmatic Programmer

Permalänk
Medlem

Vi kör med Tesla c2070, det kortet har sparat mig många timmar. Hur mycket snabbare är detta kort?
Måste programvaran skrivas om för varje kort, enligt spec'en till programmet stöds endast: C1060, C2050 och C2070 ?

Permalänk
Medlem

Glöm inte python! De nisarna kan assabler också.

Edited:

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Medlem

de kan programera maskiner

Edit
skulle vart en edit

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Entusiast
Skrivet av Yoshman:

Många långsamma kärnor är alltid MYCKET svårare att hantera än färre snabba kärnor, så skulle vara väldigt intressant att veta hur nära den teoretiskt prestandan man faktiskt når med ett typiskt CUDA-program. Enda fördelen med många svaga kärnor är att man normalt sett kan nå en betydligt mycket högre aggregerad prestanda med många svaga kärnor jämfört med några få starka kärnor givet en viss ström- och transistor-budget. I detta fall så verkar skillnaden väl liten för att det ska vara värt huvudvärken.

Framförallt så måste CUDA vara ett rejält gissel då det är väldigt likt C medan Fortran fortfarande är väldigt populärt då det är en mycket bättre match vid bl.a. matris-beräkningar jämfört med C. Till Xeon Phi, som i praktiken kör något som är väldigt likt AVX, finns ju redan Fortran-kompilatorer (Intel har en egen sådan). Sedan har Intels C++ kompilator (ICC) har stöd för Xeon Phi + att det finns ett tillägg som kallas Cilk+ som ingår i ICC, Cilk+ lägger till några saker till C/C++ som gör det möjligt för programmeraren att uttrycka vektorer och matris som språk-primitiver (direkt kopierat från Fortran) som i sin tur gör det trivialt för kompilatorn att inse hur den kan köra den koden med SIMD-instruktioner.

Tesla har ju en till svaghet jämfört med Xeon Phi i det att en GPU kan i praktiken bara hantera problem som är data-parallella (vilket t.ex. matris-beräkningar är och det är den form av parallellism som SSE/AVX/NEON/AltiVec är designade för). Men det är bara en form av parallellism som finns, den andra är instruktions-parallella system som är den form av parallellism som de flesta kanske tänker på då det är vad man har i multitrådade program som kör på "vanliga" CPU:er. Skulle tro att Xeon Phi får rejält med stryk av en "vanlig" CPU på instruktions-parallella problem, men det är i alla fall möjligt att hantera sådant med en rimlig effektivitet.

Jag har letat lite men det är rätt ont om benchmarks för den typen av applikationer. Annars är det väl bara att räkna på prestandan från Titan? Den hade en peak på 27112,5 TFLOP/s och presterar 17590 TFLOP/s med LINPACK enligt Top500. Så med 90 % av prestandan från grafikkort får vi (0,9*17590)/18688=0.8471 vilket ju är en bit ifrån det teoretiska max på 1,31 eller 1,17 TFLOP/s. Verkar inte helt självklart om det är K20 eller K20X som sitter i Titan. Det står lite olika men om man räknar på teoretiskt max så ser det ut som om det är K20X. För jag antar att LINPACK enbart kör DP. Sen är ju frågan hur mycket mer prestanda man kan sparka ur datorn om man gör lite optimeringar. Vet inte hur mycket man optimerar LINPACK inför körningarna. En del av prestandaökningen i K20 jämfört med tidigare versioner av Tesla är ju mjukvara som kräver att man skriver om koden en del. Men den biten har du mycket bättre koll på än jag.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Medlem
Skrivet av Yoshman:

Men tror du inte det är lättare att hitta programmerare som kan hantera relativt gamla och etablerade språk som C och Fortran än att hitta programmerare som kan hantera CUDA eller OpenCL? Fördelen med att skriva för etablerade språk är ju att man inte blir låst till en specifik leverantör på samma sätt som om man skriver allt för CUDA. Nu tror jag inte det är ett problem för superdatorer, då man tydligen är ganska "van" i de kretsarna att få skriva om rätt stora delar av sin programvara för att hantera de ganska radikala HW-designerna man jobbar med. Men för lite mer "vanlig" användning blir det en väldigt stor kostnad att vara tvungen att skriva om stora delar av systemet i det läget att man vill/måste byta HW-leveratör.

Vad det gäller Fortran blev jag själv ganska överraskad över hur mycket det används inom vissa specifika områden. Framförallt hade jag lite svårt att se varför Intel lägger ner rätt mycket resurser på sin Fortran-kompilator, men inser nu att det just inom vissa typer av beräkningsintensiva områden som Fortran fortfarande är det bästa (mest effektiva) språk man har just p.g.a. att det är lätt att extrahera data-parallellism ur sådan kod.

ja och nej hitta dom finns för. Men de är svåra att få tag på. De som kan Fortran C (c++ inte inräknat) osv de har ofta en familj nu och har börjat jobba med något annat. Och de är igen O slipade. Kan man aktiver dem så är det programerarna som alla vill ha. Men de ska inte lockas med pengar. Utan med utmaningar. Jag vet några sådana. Men de har familj och det ses som ett hinder. Idioter i ledningen säger jag.

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Medlem
Skrivet av Zotamedu:

Jag har letat lite men det är rätt ont om benchmarks för den typen av applikationer. Annars är det väl bara att räkna på prestandan från Titan? Den hade en peak på 27112,5 TFLOP/s och presterar 17590 TFLOP/s med LINPACK enligt Top500. Så med 90 % av prestandan från grafikkort får vi (0,9*17590)/18688=0.8471 vilket ju är en bit ifrån det teoretiska max på 1,31 eller 1,17 TFLOP/s. Verkar inte helt självklart om det är K20 eller K20X som sitter i Titan. Det står lite olika men om man räknar på teoretiskt max så ser det ut som om det är K20X. För jag antar att LINPACK enbart kör DP. Sen är ju frågan hur mycket mer prestanda man kan sparka ur datorn om man gör lite optimeringar. Vet inte hur mycket man optimerar LINPACK inför körningarna. En del av prestandaökningen i K20 jämfört med tidigare versioner av Tesla är ju mjukvara som kräver att man skriver om koden en del. Men den biten har du mycket bättre koll på än jag.

Du kan inte räkna så. Kan inte rigktigt förklara men Om jag ber din mobil att räkna hur jordskorpan rör sig så kommer jag sakna en hel del delar som kan byggas in i din mobol. Om jag då tar en produkt och ber den göra samma sak. Och dom säger vad vill du ha och VARFÖR? och hur mycket kostar det. Då hamnar vi på. OK detta måste lösas. pengar samt Varför sa ni.. Detta är en HYPTES. Men ber man snält så får man reda på andra saker som kanske inte bara handlar om pengar.

Edit:
Detta kommer jag bli hattad för.
vi, VI foldar. Vi gör det för att det är kull och för att vi vill göra en skillnad. Vi uppmanar folk med gamla datarorer. konsolser osv att delta. Har ni tänkt på vad det kostar o fosila bränslänn att hålla gamla datorer i liv som inte räknar så snabt längre. Dubbel eggat svärd. Jag är för det nya och inte emot det gamla. Men Både på GPU och CPU så måste jag säga att det är välkommet. Så länge som man tar hand om det gamla. Så Intel nVIDIA och AMD stand upp and tell upp how you can give more peformance.

Det vart off toppic. hoppas någon fattade.
Programerare tycker inte om system som säger men du skrev typ så- Gör vad vi skriver. Tack

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Skrivet av hACmAn:

Edit:
Detta kommer jag bli hattad för.
vi, VI foldar. Vi gör det för att det är kull och för att vi vill göra en skillnad. Vi uppmanar folk med gamla datarorer. konsolser osv att delta. Har ni tänkt på vad det kostar o fosila bränslänn att hålla gamla datorer i liv som inte räknar så snabt längre. Dubbel eggat svärd. Jag är för det nya och inte emot det gamla. Men Både på GPU och CPU så måste jag säga att det är välkommet. Så länge som man tar hand om det gamla. Så Intel nVIDIA och AMD stand upp and tell upp how you can give more peformance.

Det vart off toppic. hoppas någon fattade.
Programerare tycker inte om system som säger men du skrev typ så- Gör vad vi skriver. Tack

Behöver dock inte kosta någonting alls i fossila bränslen Min dator kan precis lika gärna drivas av sol, vind, vatten eller kärnkraft

Permalänk
Medlem
Skrivet av Zotamedu:

Så när kommer K20X för den som verkligen vill vara värst? Den har alla SMX upplåsta och kommer vara lite högre klockat, mer minne, bredare minnesbuss och så vidare. Extra allt med andra ord.

För den som vill veta mer om Titan så har Anandtech skrivit lite om monstret. Över 20 PFLOPS är helt galet och tydligen ska typ 90 % av kapaciteten komma från grafikkort. Man kan göra mycket roligt med så mycket beräkningskraft och det fina är att den kommer vara gratis att använda för forskning.

http://www.anandtech.com/show/6421/inside-the-titan-supercomp...

Tack för trådens ända vettiga inlägg. Bra läsning dessutom.

Permalänk
Entusiast
Skrivet av _MmattiasS_:

Behöver dock inte kosta någonting alls i fossila bränslen Min dator kan precis lika gärna drivas av sol, vind, vatten eller kärnkraft

Det är det stora problemet med elförbrukning. Ska man räkna medelel eller marginalel? Det skiljer ungefär en faktor 10 i koldioxidutsläpp mellan de båda här i Sverige eftersom vår medelel är kärnkraft och vattenkraft medan marginalelen är gasturbiner och tysk kolkraft.

Visa signatur

Q9450, HD4850, 8 GB DDR2 800 MHz, 3x750 GB, Antec 300, Dell 2408WFP, U2410, Qnap TS-419p+ 4x2 TB Samsung F4, Asus UL30A-QX056V, Logitech Z-680, Sennheiser HD380pro, M-Audio FastTrack Pro, Ibanez sa160qm, Ibanez TB 15R, Zoom 505II, Ibanez GSR 200, Ibanez SW 35, Cort AC-15, Squier SD-3 BBL, Yamaha PSR 270, Røde NT1-A, Nikon D200, Nikkor 18-70/3,5-4,5, 70-300VR, 50/1,8, 28/2,8, Tamron 17-50/2,8, 90/2,8, Sigma 30/1,4, SB-800, SB-25, SB-24

Permalänk
Medlem
Skrivet av Yoshman:

Vad det gäller Fortran blev jag själv ganska överraskad över hur mycket det används inom vissa specifika områden. Framförallt hade jag lite svårt att se varför Intel lägger ner rätt mycket resurser på sin Fortran-kompilator, men inser nu att det just inom vissa typer av beräkningsintensiva områden som Fortran fortfarande är det bästa (mest effektiva) språk man har just p.g.a. att det är lätt att extrahera data-parallellism ur sådan kod.

Fortran är toppen om man arbetar mycket med vektorer och matriser (i matematisk mening)! Koden blir mycket kompaktare och mer lättläst. Dessutom brukar den exekvera märkbart snabbare än ett väloptimerat C/C++ program.

Är mycket nyfiken på Xeon Phi. Du säger den sitter på ett PCIe kort, hur mycket minne finns onboard på kortet? Det största problemet med GPU-beräkningar i min mening är att det finns så förbaskat lite minne, även på highend-korten. 6 GB räcker verkligen inte långt. Så om Xeon Phi kommer med 32GB eller liknande kunde det vara mkt intressant!

Förvisso, om man verkligen vill åt prestanda vill man ju ha många beräkningsenheter per enhet av data, men om man inte har råd att köpa ett dussin Tesla/Phi så är mer minne enda utvägen.

Permalänk
Medlem
Skrivet av wounds:

Precis, det är bara företag som jobbar med riktigt avancerade 3d-modelleringar, typ olje-/gasbolag som behöver ett sådant kort. Absolut inte dyraste Tesla-kortet heller, fanns ett förut som låg runt 45k-50k ex moms och det finns säkert ännu värre än så.

Nej. Det är inte ett kort för 3D. Det är ett kort för beräkningar. (Du tänker på Quadro-korten förmodar jag.) Detta kort är för de som håller på med simuleringar och behöver fet beräkningskraft. Funkar säkert för rendering också iofs, men inget man kan se på en skärm då den inte ens har skärmanslutningar.

Permalänk
Medlem

Bara för att sätta det i lite proportion.

Man kan ju få 4st GTX690 för samma pengar, så vilket ger mest poäng i F@H, 4st GTX690 eller 1st K20?

Visa signatur

Hur kan syltkakor överleva i det vilda utan ögon?

Permalänk
Hedersmedlem
Skrivet av JesperA:

Bara för att sätta det i lite proportion.

Man kan ju få 4st GTX690 för samma pengar, så vilket ger mest poäng i F@H, 4st GTX690 eller 1st K20?

K20 verkar ge 3,52 TFlop/s och GTX690 2x2,8 TFlop/s med enkel precision, så om man klarar sig med sådan (vilket verkar vara fallet för seti@home) är nog inte detta något att satsa på. För dubbel precision gäller dock 1,17 TFlop/s respektive 2x0,12 TFlop/s.

Permalänk
Medlem
Skrivet av Mikael07:

Fortran är toppen om man arbetar mycket med vektorer och matriser (i matematisk mening)! Koden blir mycket kompaktare och mer lättläst. Dessutom brukar den exekvera märkbart snabbare än ett väloptimerat C/C++ program.

Är mycket nyfiken på Xeon Phi. Du säger den sitter på ett PCIe kort, hur mycket minne finns onboard på kortet? Det största problemet med GPU-beräkningar i min mening är att det finns så förbaskat lite minne, även på highend-korten. 6 GB räcker verkligen inte långt. Så om Xeon Phi kommer med 32GB eller liknande kunde det vara mkt intressant!

Förvisso, om man verkligen vill åt prestanda vill man ju ha många beräkningsenheter per enhet av data, men om man inte har råd att köpa ett dussin Tesla/Phi så är mer minne enda utvägen.

Host? Gamla tesla hade 16GB på fermi. Har svårt att tro att varken amd eller nvidia har gått backatt dessa värden sedan dess. Hur minnet hanteras är ifs en sak. (En av anledningarnag jag blev mins sakt besviken på remotefx även i 2012.)

Edit:

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Medlem
Skrivet av JesperA:

Bara för att sätta det i lite proportion.

Man kan ju få 4st GTX690 för samma pengar, så vilket ger mest poäng i F@H, 4st GTX690 eller 1st K20?

Åter igen inte samma sak. Vi pratar beräkningar som aldrig får gå fel. Vi kan ta två exempel. Rälnas det fel på hålfasthetslärarn i en byggnad kan allt rasa. Räknas det fel vid medicin för folk eller blir skadade och deras nära blir skadade osv. Det får inte räknas fel. Och man kör inte en test en gång även om dett "bara är mattematiskt.
Jag tycker om det att hitta vad hårdvara klarar. Men för det vi pratar om hade jag nog valt 100 k20 med full minnesbandbredd. Och då finns inte spel på karatan. Fysik finns, men inte spel.

Edit:
Edit2:

Visa signatur

CPU: 5900x. Mem:64GB@3200 16-17-17-34-1T. (ImDIsk)
GPU: 1080 Ti@ca 6-7%OC. Sound: SB-Z -> toslink (DTS)-> old JVC. MB Realtek to Z-2300 for VOIP.

Permalänk
Medlem
Skrivet av hACmAn:

Host? Gamla tesla hade 16GB på fermi. Har svårt att tro att varken amd eller nvidia har gått backatt dessa värden sedan dess. Hur minnet hanteras är ifs en sak. (En av anledningarnag jag blev mins sakt besviken på remotefx även i 2012.)
Edit:

Nej. Tesla fermi kommer med max 6 GB. Nya Tesla Kepler kommer (inledningsvis) med 5 GB. Trist utveckling.