AMD Opteron i ny superdator på KTH

Permalänk
Skrivet av Vexo:

Now we're talkin, petaflops!

Permalänk
Medlem
Skrivet av jookeer:

En såndäringa superduperklump är omodern om 2 år - så då blir det slaktparty för alla swecare, en kasse CPUer till oss alla, så kan vi vinna foldingräjset på en vecka.

Med tanke på att projektet är budgeterat över 4 år så är livslängden minst 4 år. Sen kan ju hända att det uppgraderar systemet, Jaguar bytte t.ex. ut 16000 cpu:er, http://www.sweclockers.com/nyhet/10114-cray-forbi-ibm-jaguar-...

Visa signatur

kill -s SIGCHLD `pidof Kenny`
bash: Oh my god, they killed Kenny
init: You Bastards

Permalänk
Medlem

Men varför inte bygga en superdator med massor av General Purpose GPU:er istället för de är väl mycket effektivare? Typ som denna men i superdatorformat: Fastra desktop supercomputer packs 13 NVIDIA chipsets | Electronista

Visa signatur

HTPC Lian Li PC-A05FNB | Intel Core i5-13400 | 32 GB DDR5-6000 | 4,5 TB SSD | RTX 4070 12 GB
Laptop Razer Blade 15 Base 2021 | Intel Core i7-10750H | 16 GB DDR4-2933 | 1,5 TB SSD | RTX 3070 8 GB
Laptop Lenovo ThinkPad E585 | AMD Ryzen 5 2500U | 16 GB DDR4-2400 | 756 GB SSD | Radeon Vega 8

Klocka GTX 460 med NiBiTor 5.8

Permalänk
Medlem

305teraflops inte illa, blir ju typ som 60-70st 5970... wait :S. Men seriöst som calle2003 sa borde det inte vara oerhört mycket billigare att skriva om mjukvaran så vissa eller rent av dem flesta beräkningar kan göras av grafikkort istället? Kan man använda gpu:n till grafik, fysik och folding borde man väl kunna beräkna andra saker också.

Permalänk
Medlem

Alltid lika kul att se oss swecare som "Messerbisserschmittare" - tänk va' mycke' bättre vi vet än specialisterna på KTH som kan "sticka å brinna" + "slänga sig i väggen" för dom inte KAN det här området alls.

Permalänk
Medlem
Skrivet av Sapiens:

305teraflops inte illa, blir ju typ som 60-70st 5970... wait :S. Men seriöst som calle2003 sa borde det inte vara oerhört mycket billigare att skriva om mjukvaran så vissa eller rent av dem flesta beräkningar kan göras av grafikkort istället? Kan man använda gpu:n till grafik, fysik och folding borde man väl kunna beräkna andra saker också.

GPGPU-"program" brukar skrivas i (en dialekt av) C++, om jag inte kommer ihåg fel, så svaret är väl: nte helt omöjligt i alla fal.

Permalänk

Det är väl inte bara att trycka in x antal grafikkort då mammabrädorna troligen inte ens har någon port och sen är frågan vad som är billigast och effektivast i längden.

hade varit skoj att ha den burken en dag elelr två och folda lite på haha någon som jobbar på KTH och vill smyga in lite program i bakgrunden

Visa signatur

I am Extrazz.

Permalänk

Den lär maxa windwos experience med en SSD!

Visa signatur

Eclipse G500A | ASUS ROG Strix X670E-F | Ryzen 9 7950X3D w/ Arctic Liquid Freezer II 360 | RTX 4090 | Samsung Oddysey G95SC OLED | Kingston Fury Renegade M. 2 NVMe SSD Gen 4 4TB | 128GB Kingston DDR5 6000MHz CL36 FURY |

Permalänk
Avstängd
Skrivet av RemixV2:

...vad alla började bry sig om crysis...

Exakt, allt är inte gjort för spel, men det har folk svårt att förstå

Visa signatur

AMD Phenom II 955BE x4 @3.61GHz|SamSung 2 x 500GB 7200 RPM|Asus M4A79T Deluxe|4GB OCZ Black Edition 12800@1600MHz|Sapphire HD5870 1GB RAM|OS varierar, men mest Win XP x64

Permalänk
Inaktiv

Tror inte folk inser hur mycket snabbare kommunikationen mellan dessa CPUer är jämfört med vad som helst ur GPU världen. De köpte en cray just specifikt för att kunna köra laster som kräver mycket och snabb kommunikation mellan noderna.

Permalänk
Medlem

Hoppas att denna hamnar på mitt campus (Valhallavägen) och inte i kista!

Visa signatur

MacBook Pro 15" i5 520M 8GB GT330M 750GB

Permalänk
Medlem
Skrivet av Sapiens:

305teraflops inte illa, blir ju typ som 60-70st 5970... wait :S. Men seriöst som calle2003 sa borde det inte vara oerhört mycket billigare att skriva om mjukvaran så vissa eller rent av dem flesta beräkningar kan göras av grafikkort istället? Kan man använda gpu:n till grafik, fysik och folding borde man väl kunna beräkna andra saker också.

5970 klarar 1.088 TFlop/s så 300 st borde det vara i så fall, inte 60-70....
Sen har väl inte AMD's 5970 stöd för ECC minne ännu, så det är bara nVidia Tesla som är användbara i praktiken.

Mjukvaran kan kosta rätt mycket att skriva om, jag antar att MPI/OpenMP använts, för att skriva om det att pass kluster med GPU-noder så måste det skapas ett helt nytt ramverk, det är inte svårt att bränna 100 miljoner på mjukvaru-utveckling.

GPU:er använder sitt egna minne att göra operation på, så det blir lätt dubbelkopiering av data, dvs, data måste inte bara flyttas mellan noders primärminne, det måste sedan också flyttas mellan nodens primärminne och GPU:ns minne vilket ökar latency. Samt att det finns inget protokoll för coherency mellan GPU och övriga noders minne så du kan aldrig vet om data du opererar på har förändrats, med Crays Gemini(StarSea) så är inte det ett problem.

Visst, GPU:er är jättesnabbt och bra när man arbetar med massa små dataset som inte har något beroende, men ska arbeta på större dataset med beroende så skulle det bara bli en flaskhals.

Visa signatur

kill -s SIGCHLD `pidof Kenny`
bash: Oh my god, they killed Kenny
init: You Bastards

Permalänk
Medlem
Skrivet av houze:

5970 klarar 1.088 TFlop/s så 300 st borde det vara i så fall, inte 60-70....
Sen har väl inte AMD's 5970 stöd för ECC minne ännu, så det är bara nVidia Tesla som är användbara i praktiken.

5970 klarar av 4,64 Tflops (32-bit FP). 5970 Eyefinity klarar 5,44 Tflops. Därför är runt 60 st ganska rimligt. Eller du kanske tänkte på 64-bit flyttal.

ECC finns inte nej, men det går iofs att fixa i mjukvara om man behöver det (eller räkna dubbelt/trippelt). 4870x2 har inte heller ECC, men ändå byggde man en enorm superdator i Kina bestående av en stor mängd 4870x2 (något underklockade dock).

Visa signatur

AMD Ryzen 5 3600 | 4x8GiB 18-20-16-36-52-2T DDR4-3400 | MSI B450-A Pro Max AGESA 1.2.0.7 | Sapphire RX 480 Nitro+ OC 8GiB | Crucial MX500 500GB | PNY CS900 2TB | Samsung 850 EVO 500GB | Samsung PM961 512GB | Scythe Kamariki 4 450W

Permalänk
Medlem

"47,3 TB RAM", klarar den multitasking?

Visa signatur

En budget compaq laptop från 2007.

Permalänk
Medlem
Skrivet av m3tr0:

5970 klarar av 4,64 Tflops (32-bit FP). 5970 Eyefinity klarar 5,44 Tflops. Därför är runt 60 st ganska rimligt. Eller du kanske tänkte på 64-bit flyttal.

ECC finns inte nej, men det går iofs att fixa i mjukvara om man behöver det (eller räkna dubbelt/trippelt). 4870x2 har inte heller ECC, men ändå byggde man en enorm superdator i Kina bestående av en stor mängd 4870x2 (något underklockade dock).

Ja, man mäter prestanda i 64 bitars flyttal.

Visa signatur

kill -s SIGCHLD `pidof Kenny`
bash: Oh my god, they killed Kenny
init: You Bastards

Permalänk
Medlem

GPU:er mäts ofta i singel precision alltså 32bit men numera stödjer alla nya GPU:er double precision men x86 processorer har sedan 8087 stöt extended double precision på 80bit. Så upp till 80bit klarar en X86 CPU faktiskt och C stödjer vitt jag vet det och många andra språk. Om GPU:er stödjer Extended double precision vet e tusan men skulle inte tro det.

Permalänk
Medlem
Skrivet av pa1983:

GPU:er mäts ofta i singel precision alltså 32bit men numera stödjer alla nya GPU:er double precision men x86 processorer har sedan 8087 stöt extended double precision på 80bit. Så upp till 80bit klarar en X86 CPU faktiskt och C stödjer vitt jag vet det och många andra språk. Om GPU:er stödjer Extended double precision vet e tusan men skulle inte tro det.

Eftersom det här var en artikel om superdatorer så är det double precision som gäller då man mäter superdator med double precision. Double-extended precision stöds inte av så många cpu:er (är väl princip bara x86 som har det).

Visa signatur

kill -s SIGCHLD `pidof Kenny`
bash: Oh my god, they killed Kenny
init: You Bastards

Permalänk
Medlem
Skrivet av houze:

Eftersom det här var en artikel om superdatorer så är det double precision som gäller då man mäter superdator med double precision. Double-extended precision stöds inte av så många cpu:er (är väl princip bara x86 som har det).

Alltså, bygg en Tesla superdator?

Visa signatur

HTPC Lian Li PC-A05FNB | Intel Core i5-13400 | 32 GB DDR5-6000 | 4,5 TB SSD | RTX 4070 12 GB
Laptop Razer Blade 15 Base 2021 | Intel Core i7-10750H | 16 GB DDR4-2933 | 1,5 TB SSD | RTX 3070 8 GB
Laptop Lenovo ThinkPad E585 | AMD Ryzen 5 2500U | 16 GB DDR4-2400 | 756 GB SSD | Radeon Vega 8

Klocka GTX 460 med NiBiTor 5.8

Permalänk
Medlem
Skrivet av houze:

Eftersom det här var en artikel om superdatorer så är det double precision som gäller då man mäter superdator med double precision. Double-extended precision stöds inte av så många cpu:er (är väl princip bara x86 som har det).

Jo och nu är ju Opteron just x86 så vad säger att dom INTE använder det menar du bara för dom inte mäter i det vilket jag redan vet.