Nvidia lanserar "billig" superdator

Permalänk
Melding Plague

Nvidia lanserar "billig" superdator

Nvidia lanserar Tesla, ett system som kallas "en personlig superdator". Hemligheten är grafikprocessorer med CUDA.

Läs nyheten

Visa signatur

Observera att samma trivselregler gäller i kommentarstrådarna som i övriga forumet och att brott mot dessa kan leda till avstängning. Kontakta redaktionen om du vill uppmärksamma fel i artikeln eller framföra andra synpunkter.

Permalänk
Avstängd

Mycket bra initiativ, mer sådant!

Visa signatur

"Jo men det var exakt det jag menade med att den enda moddningen detta galleriet innehåller är Sanningsmodifikation och photoshoppande :)"

Permalänk
Medlem

Trevligt, någon som ska köpa en?

Permalänk
Medlem

Verkar väldigt trevligt för utvecklingen.

Permalänk

Intressant! Kan man tänka sig verkligen att grafikprocessorer (gpu) kommer att ersätta vanliga hederliga processorer (cpu)? Har det blivit dags att säga hej då till Pentium, Core, Core2Duo, Core2Quad, Xenon, Athlon, Duron, Opteron, och allt vad det heter? Vad krävs för att det ska ske i så fall?

Visa signatur

"Good teaching is one-fourth preparation and three-fourths pure theatre."—Gail Godwin
Sweclockers BB kod
0101001101000111

Permalänk
Avstängd

Nvidia levererar som vanligt då <3

Visa signatur

Intel E8400@3,15 Ghz (AMAZING?)| XfX 9800 GTX+ @ 800/1988/1165 | Corsair Dominator PC2-8500 | Aerocool Extremengine <3t | Gigabyte EP35-DS3 | 900 GB...
Hp NC8000 Intel Pentium 1,6 Ghz | 1 GB ram | Amd Mobility 9600 64mb | Slutkört batteri...

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av ElectroGeeza
Intressant! Kan man tänka sig verkligen att grafikprocessorer (gpu) kommer att ersätta vanliga hederliga processorer (cpu)? Har det blivit dags att säga hej då till Pentium, Core, Core2Duo, Core2Quad, Xenon, Athlon, Duron, Opteron, och allt vad det heter? Vad krävs för att det ska ske i så fall?

Icke. Beror helt enkelt på att CPU och GPU är bra på olika saker. Till just medicinska beräkningar (exempelvis Folding@Home och även massa annat), fysikberäkningar, och grafiska beräkningar så är GPU:er överlägsna pga att de är experter på att göra många saker samtidigt.
En CPU är istället expert på att göra få saker samtidigt, men väldigt mycket snabbare.
Så om du exempelvis ska räkna ut 8miljoner decimaler på talet pi (Som i SuperPI) så är CPU:n överlägsen, med många många hästlängder.

Därför tror jag inte att CPUn kommer fasas ut på länge än, däremot kommer nog multi-GPU-riggar att bli än vanligare..

Permalänk
Medlem

Fy helvete vad jävla ballt! Trodde faktiskt inte att det skulle komma så "snart" till konsumentmarknaden. Trevligt!

Permalänk
Avstängd

Hur mäter sig grafikprocessorn GT200 mot Cell?

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av leksak
Hur mäter sig grafikprocessorn GT200 mot Cell?

PS. 10000 kr, det är ganska trevligt för hobby forskare.

10000 $ är inte lika trevligt

Visa signatur

Asus GeForce2GTS@250/440MHz, AMD Thunderbird 1200@1240MHz. Samsung 900p 19" crt

Permalänk
Citat:

Ursprungligen inskrivet av leksak
Hur mäter sig grafikprocessorn GT200 mot Cell?

PS. 10000 kr, det är ganska trevligt för hobby forskare.

dollar....

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av leksak
Hur mäter sig grafikprocessorn GT200 mot Cell?

PS. 10000 kr, det är ganska trevligt för hobby forskare.

(Inget ont menat) Men det stod "Systemet kan byggas för mindre än 10 000 DOLLAR" (ca 80 000kr)

Visa signatur

Om ni/du hittar stav fel i mina inläg så bry er/dig inte (om du/ni inte förstår PM:a så ska jag försöka förklar så gått jag kan)

Permalänk
Citat:

Ursprungligen inskrivet av ElectroGeeza
Intressant! Kan man tänka sig verkligen att grafikprocessorer (gpu) kommer att ersätta vanliga hederliga processorer (cpu)? Har det blivit dags att säga hej då till Pentium, Core, Core2Duo, Core2Quad, Xenon, Athlon, Duron, Opteron, och allt vad det heter? Vad krävs för att det ska ske i så fall?

GPUn kan bara användas till vissa speciella saker. Matrisoperationer t.ex. det gör den å andra sidan väldigt bra.

Du behöver alltså en CPU och en GPU. Men det finns ju ingenting som hindrar dom från att göra ett allt i ett chip

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av Coffinrot
GPUn kan bara användas till vissa speciella saker. Matrisoperationer t.ex. det gör den å andra sidan väldigt bra.

Du behöver alltså en CPU och en GPU. Men det finns ju ingenting som hindrar dom från att göra ett allt i ett chip

Computer on a Chip. har ju funnits MYCKET länge. Fans väl i princip enkla x86 kloner av tidiga 8080 som enchipsdator redan på 80 talet.

Men poängen är väl snarare att med dagens höga densitet så borde det utan problem gå att intergrera både CPU, GPU och allt annat på ett å samma chip.

Permalänk
Avstängd

ja ser det komma mot mig
kraven på vad en superdator e blir lägre och lägre

snart e hela datahandeln fylld av superdatorer, några för kontorsarbete, några för gaming och några för multimedia. ;D

Permalänk
Inaktiv
Citat:

Ursprungligen inskrivet av leksak
Hur mäter sig grafikprocessorn GT200 mot Cell?

Varför frågar du ens? Svaret är väl så uppenbart att det får anses som en mycket löjlig fråga. Cell är dessutom ingen GPU. Frågan är väl hur många storleksordningar snabbare/bättre gt200 är jämfört med cell.
Sony har sagt att detta chip ska prestera 1.8 Tflops (eller hur var det nu?) men detta stämmer självklart inte.
Hur de kan ha kommit fram till resultaten är att de kanske har tagit den högsta teoretiska kapaciteten + så kallade "fixed function units" (vilka inte bidrar något till beräkningskapaciteten i verkligheten eller i teoretiska sammanhang) och multipicerat dessa resultat med 10. En del konsol-fanboys har dock tagit denna smörja som fakta inristat i sten vilket kanske är anledningen till att vissa fortfarande tror på detta.

Permalänk

Ummm, OK för att vara helt korrekt så är det nya här just "Tesla Personal Supercomputer", inte Tesla i sig.
Det här har kanske inte gått ut på så bred front tidigare utan levt lite i skymundan, men Tesla som sådant har funnits ett tag.

Det som de slår på trumman för nu är den ANDRA generationens Tesla-serie. http://www.nvidia.com/object/tesla_computing_solutions.html

För HPC (high performance computing) är nog S1070 den mest intressant modellen - en 1U server med 4 Tesla T10P-preocessorer.

Tesla T10P - som är i pincip samma som GTX280 men med bredare minnesbuss, en högre grad av testning innan den lämnar fabrik och något lägre klockfrekvens - sitter även på de C1060-kort som sitter i systemet i artikeln.

Föregångarna hette S870 och C870 och fasas nu mer eller mindre ut: http://www.nvidia.com/object/tesla_8_series.html

Ett litet problem med Tesla för HPC är att de inte har ECC-minnen så man _kan_ råka ut för oupptäckta minnesfel, även om Nvidia testar dessa kort noga. Vill man vara garanterat felfri får man altså bränna kraft på att skydda datat själv.

På nvision'08 hade Nvidia ett system som snurrade som liknar det i artikeln, 3 C1060 och ett GTX280. GTX280 används för visualisering eftersom Teslakorten inte har någon skärmutgång.

Det händer mycket inom detta område just nu och vem som helst kan hämta hem CUDA och sätta igång att skriva sin accelererade program. CUDA + Visual C++ Express eller gcc är allt som behövs. Förutom ett CUDA-kapabelt grafikkort och drivrutin då (180.84 t.ex.).

---

Nuukeer, nu är du ute och snurrar lite. Hur tror du t.ex. att Nvidia kommer upp i 1 Tflops på en T10P? De om någon räknar varje hårdvaruimplementerad funktion när de kommit fram till sina teoretiska siffror. T.ex. så räknar de in den hårda texturfiltreringens operationer om jag minns rätt.

Prestanda för en PowerXcell uppges av t.ex. Fixstars (http://www.fixstars.com/en/products/gigaaccel180/) till 180 Gflops single precision, 90 double precision. Den första siffran slår man kanske med en C1060, den andra blir tuff eftersom inte alla beräkningsenheter har en egen double precision-enhet, de delas av 8 st eller så, men jag tror att man får ungefär 1/12 av prestanda med double precision av någon anledning.

Svaret på om man ska bygga något med Cell eller Tesla är inte helt givet, det beror delvis på hur applikationen ser ut - arkitekturerna skiljer en del.

Roadrunner - världens för stunden snabbaste superdator - bygger på Cell + Opteron, närmare bestämt intressanta trippelmackor med bl.a. http://www-03.ibm.com/systems/bladecenter/hardware/servers/qs...

Det händer rätt mycket på den här "alternativa arkitekturer för HPC"-marknaden just nu, det ska bli intressant att se hur det ser ut när OpenCL blir klart...och Larrabee kommer...och...FPGA...och etc etc

---

Angående vad som är en superdator, tja..vem vet. Ett S1070 med 4 Tflops har en 1/250 av Roadrunner, så kan man effektivt få 300 S1070 att jobba ihop så är man i teorin snabbast i världen. Detta då med bara 1200 processorer + antagligen 1200 till för att styra elendet och kommunicera med andra noder istället för tiotusentals eller hundratusentals som de andra har: http://www.top500.org/list/2008/11/100

Permalänk
Inaktiv
Citat:

Ursprungligen inskrivet av arcticslayer
Nuukeer, nu är du ute och snurrar lite. Hur tror du t.ex. att Nvidia kommer upp i 1 Tflops på en T10P? De om någon räknar varje hårdvaruimplementerad funktion när de kommit fram till sina teoretiska siffror. T.ex. så räknar de in den hårda texturfiltreringens operationer om jag minns rätt.

Prestanda för en PowerXcell uppges av t.ex. Fixstars (http://www.fixstars.com/en/products/gigaaccel180/) till 180 Gflops single precision, 90 double precision. Den första siffran slår man kanske med en C1060, den andra blir tuff eftersom inte alla beräkningsenheter har en egen double precision-enhet, de dellas av 8 st eller så.

Svaret på om man ska bygga något med Cell eller Tesla är inte helt givet, det beror delvis på hur applikationen ser ut - arkitekturerna skiljer en del.

Roadrunner - världens för stunden snabbaste superdator - bygger på Cell + Opteron, närmare bestämt intressanta trippelmackor med bl.a. http://www-03.ibm.com/systems/bladecenter/hardware/servers/qs...

Det händer rätt mycket på den här "alternativa arkitekturer för HPC"-marknaden just nu, det ska bli intressant att se hur det ser ut när OpenCL blir klart...och Larrabee kommer...och...

Nej, nej nej. nvidias nummer får man fram genom klockfrekvens * antalet stream-processorer (och inte varje hårdvarumimplementerad funktion) * 3. (ja det blir 3 eftersom varje SP hanterar 2 MADD och 1 MUL eller hur var det nu?)
Samma sak för ATI, men deras SP:er utför bara 2 instruktioner per klock (och de har dessutom mycket lägre klockfrekvens) men det går mindre transistorer per SP då också och då kan de få in många fler per chip.

Permalänk
Medlem

Kommer inte frågan om den "klarar Crysis"?

Åf fy fan, vad jag är less på allt med Crysis att göra.

Visa signatur

Hiroshima 45, Tjernobyl 86, Windows 95.

Leeloo Dallas Multipass

Permalänk
Citat:

Ursprungligen inskrivet av Nuukeer
Nej, nej nej. nvidias nummer får man fram genom klockfrekvens * antalet stream-processorer (och inte varje hårdvarumimplementerad funktion) * 3. (ja det blir 3 eftersom varje SP hanterar 2 MADD och 1 MUL eller hur var det nu?)
Samma sak för ATI, men deras SP:er utför bara 2 instruktioner per klock (och de har dessutom mycket lägre klockfrekvens) men det går mindre transistorer per SP då också och då kan de få in många fler per chip.

Så du menar att Nvidia frivilligt skulle utelämna sina double precision-enheter, sina hårdvaruimplementatione för trigonometriska funktioner (och annat) och den bilinjära filtreringen i texturminnet när man tar fram marketingsiffror?

Edit:
OK, enligt vissa källor så inkluderar man inte de hårdvaruimplementerade funktionerna, men tar med tecturfiltreringen. 3 operationer per cykel är en sanning med modifikation då det är kopplade operationer "fused MADD and MUL". De lärde tvistar om ifall det är ett rättvist sätt att mäta.

Permalänk
Inaktiv
Citat:

Ursprungligen inskrivet av arcticslayer
Så du menar att Nvidia frivilligt skulle utelämna sina double precision-enheter, sina hårdvaruimplementatione för trigonometriska funktioner (och annat) och den bilinjära filtreringen i texturminnet när man tar fram marketingsiffror?

Edit:
OK, enligt vissa källor så inkluderar man inte de hårdvaruimplementerade funktionerna, men tar med tecturfiltreringen. 3 operationer per cykel är en sanning med modifikation då det är kopplade operationer "fused MADD and MUL". De lärde tvistar om ifall det är ett rättvist sätt att mäta.

Fused kanske det var i g80, men i gt200 så är det fullt ut 3 enheter (det var mer som 2 enheter i g80) men detta verkar dessvärre inte påverka prestandan så mycket som många har hoppats på (jag själv hoppades på att de 240 shaders som gt200 har skulle motsvara 360 av den typ som finns i g80).

Permalänk
Citat:

Ursprungligen inskrivet av Leeloo
Kommer inte frågan om den "klarar Crysis"?

Åf fy fan, vad jag är less på allt med Crysis att göra.

varför tar du upp det då om du är så trött på det....

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av Leeloo
Kommer inte frågan om den "klarar Crysis"?

Åf fy fan, vad jag är less på allt med Crysis att göra.

Ändå fortsätter du snacket om det. Ingen vill ens se namnet på det spelet:P

Men detta är ju en bra grej iallfall.

edit: var för långsam^^

Visa signatur

HD5770 1GB| Phenom 2 x2 555 3.2ghz BE@ x3 3.6Ghz| 2x2048ddr3 corsair xms3 1600mhz | Corsair HX520w | HP w2207| Antec 180b

Permalänk
Medlem

Haha, undra hur monga fps den fårr i crisis

Visa signatur

Intel Core i5 12600K | MSI Pro Z690-A DDR4 Wifi | MSI RTX 3080 Ventus 3X Plus | 4x8 GB G.SKILL Trident Z RGB 3200MHz | Samsung 970 EVO 500GB | Seasonic Focus+ Gold 750W | Corsair Obsidian 500D | LG 34GN850

Permalänk
Medlem

hur bra hade fyra st 260 kort funkat då?
känns ju väldgt prisvärda men de kanske är chanslösa i den här genren, nån som vet??

Visa signatur

[Tiger MP. 2xAMD Athlon MP 1.4GHz , 2x512MB ddr, ?350w PSU, 80GB HDD, Geforce4 ti 4600]
[i7 950, ASUS p6t, xfx 650w, 30GB SSD a-data, 3x2GB corsair xms3, 8800GT, ][i7 920, 3x4GB Vengeance, gtx 260] [i5 3570k, MSI twin frozr PE GTX 570, Corsair 4x2GB xms3]
[3930k, GA-X79-UD3, EVGA GTX 780SC ACX, Corsair Force 3 120GB, XFX 850w, Corsair Air 540, Corsair h100i, Corsair 4x4GB Vengeance]

Permalänk
Avstängd

Få väl börja med en ny fråga istället för Krajsis!

Klarar den folding? hur många ppd får man med den?

Visa signatur

WS:/ASUS M4A78-E/Phenom 940BE/OCZ Reaper DDR2 PC8500 6Gb/CF Ati 4870 1GB//Server: AMD Phenom 9550/MSI K9A2 CF-F/OCZ Reaper PC8500 2Gb/XFX GTS 250 Nvidia
"En enskild människas död är en tragedi, en miljon döda är statistik" -Josef Stalin

Permalänk
Avstängd

synd att sweclockers inte skriver det alla vill veta. dvs hur många fps får den i crysis

Permalänk
Medlem

Jag undrar hur många FPS den får i skrivbordet i Windows / Linux med AA avslaget.

Visa signatur

Hiroshima 45, Tjernobyl 86, Windows 95.

Leeloo Dallas Multipass

Permalänk

Efter lite grävande:
http://www.beyond3d.com/content/reviews/51/3
http://www.beyond3d.com/content/reviews/51/4

Intressant bild:
http://www.beyond3d.com/images/reviews/gt200-arch/GT200-full-...

Jag tolkar det som att de räknar inte skalärinterpolatorn i de där MADD + MUL.

Hur som helst, det är inget snack om att det är imponerande single precision-prestanda i en GT200/T10P. Double precision ligger den på ungefär samma nivå som en PowerXCell 8i i teorin.

Till syvende och sist så beror naturligtvis prestanda mellan GPU vs Cell på hur väl applikationen mappar på arkitekturen och där är det ganska stora skillnader skulle jag vilja påstå.

Permalänk

Hmm man kan ju undra om det blir så billigt i längden?

Högre temperatur som måste tas om hand om. stabila och driftsäkta nätagg som klarar att leverera kräm. är de smarta så bör de bygga ihop ett eget nätaggregat med transformatorer som har hand om alla berörda datorer istället. Dvs mindre förluster till värme och enklare att få ut mer kraft. nackdel? tungt och tar bra mycket plats.

Visa signatur

I am Extrazz.