Folding på 8kärning linuxburk..

Permalänk
Medlem

Folding på 8kärning linuxburk..

Hej alles!
Jag har en god vän som erbjudit sig att prova folding på sitt företags databasserver när den inte har något bättre för sig (eventuellt på totalt 3 nästan identiska maskiner :S).

Hårdvaran ser ut som följer:
2x Intel Xenon E5420
Vi pratar alltså totalt 8 kärnor , ramminne i överflöd, sval och ventilerad miljö, tja ni fattar..

Vad jag undrar är hur sjutton vi ska sätta upp den, jag har själv ganska begränsad erfarenhet av folding, framför allt i linux..

Så vitt jag förstått kan en SMP-klient bara hantera två kärnor (eller en kärna med HT). Detta betyder i så fall i mitt huvud att han ska köra totalt 8 SMP-klienter (en per kärna eftersom HT är aktiverat), eller?

Och i så fall, kan man vara säker på att allting fungerar bara man kör igenom konfigen, ger dem olika ID, och sen startar med -smp och -verbosity 9 flaggorna? Eller måste man ge dem varsin flagga för att de ska hålla sig till sin kärna? (läste att man måste ge typ -gpu 0 och -gpu 1 om man har flera gpu-klienter t.ex.).

Behöver ni nån mer information om setupen så är det bara att fråga så ska jag ta reda på svaren bäst jag kan

Väldigt tacksam för hjälp!
//AtreX aka Emil

Permalänk
Medlem

SMP-klienten i Linux är mer effektiv än Windowsditon, så det kan bli skoj..

Default så startar alla SMP-klienter 4 processer, det är alltså tänkt att man ska köra en SMP-klient per quad-processor. Vad jag förstått får man bäst prestanda med en klient per två kärnor i Linux, dvs han får köra 4 klienter per maskin. Misstänker att det behövs något för att sätta "CPU affinity", dvs vilka kärnor klienterna skall låsa sig till, men där kan jag inte hjälpa dig tyvärr. Nån som vet hur man gör det i Linux?

Annars kan man ju köra en klient per processor, dvs två per maskin. Detta kan vara gynnsamt om maskinen faktiskt gör annat också - då vinner man inte så mycket på fler klienter skulle jag tro. Klienten multitaskar inget vidare (i Windows iaf!), den tappar en hel del fart när processorn används till annat.

Och: jag tror faktiskt att man kan köra en klient på alla 8 kärnor i Linux, testa "-smp 8" innan ni gör nåt annat. Har för mig jag läste nåt om det..

I övrigt är det inga konstigheter. Installera separata klienter, ge dem olika machine id och kör hårt med "-smp -verbosity 9"

Visa signatur

Fractal Define 7, Aorus X570 Xtreme, Ryzen 5950X, Fractal Celsius+ S36, 64GB TridentZ Neo CL14/3600 RAM, MSI RTX 3090 Suprim X, 5TB NVMe SSD + 12TB SATA SSD + 64TB Seagate IronWolf Pro HD, Fractal Ion+ 860W Platinum, LG 32GP850 + LG 42C2 OLED

Permalänk
Medlem

Okej, tack för hälpen so far
Dock har vi funnit en intressant grej!
Killen i fråga kör även smp-klienter på ett par andra maskiner, bl.a. wn Windowsburk med Q6600. Där startar SMP-klienten med flaggorna "-smp verbosity 9" 8st processer?!
Och på hans AMD X2 5k+ (eller ngt sånt) med linux så startar den 4 processer med samma flaggor?
Det stämmer ju inte riktigt med det du skrev:

Citat:

Ursprungligen inskrivet av osgorth
Default så startar alla SMP-klienter 4 processer

Kan de ha ändrat i 6.23 eller är det något annat som spökar?

Permalänk
Medlem

Det har jag aldrig sett, att den skulle starta 8 processer.. Det skall vara en för själva klienten + 4st FahCore_a1.exe i Windows. Kanske är gamla processer som ligger kvar och spökar? Ibland när man terminerar klienten i Windows så dödas inte FahCore-processerna.. Prova att boota om och starta upp klienten på nytt?

Förresten, du skriver "-smp verbosity 9", var det ett skrivfel? Det skall vara "-smp -verbosity 9".

BTW, i Windows kör man med fördel 2st SMP-klienter på en quad.. Går att köra 4st också.

Visa signatur

Fractal Define 7, Aorus X570 Xtreme, Ryzen 5950X, Fractal Celsius+ S36, 64GB TridentZ Neo CL14/3600 RAM, MSI RTX 3090 Suprim X, 5TB NVMe SSD + 12TB SATA SSD + 64TB Seagate IronWolf Pro HD, Fractal Ion+ 860W Platinum, LG 32GP850 + LG 42C2 OLED

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av osgorth
Det har jag aldrig sett, att den skulle starta 8 processer.. Det skall vara en för själva klienten + 4st FahCore_a1.exe i Windows. Kanske är gamla processer som ligger kvar och spökar? Ibland när man terminerar klienten i Windows så dödas inte FahCore-processerna.. Prova att boota om och starta upp klienten på nytt?

Ska be honom testa detta, återkommer när jag har någonting att komma med

Citat:

Ursprungligen inskrivet av osgorth
Förresten, du skriver "-smp verbosity 9", var det ett skrivfel? Det skall vara "-smp -verbosity 9".

Det var, precis som du misstänkte, ett skrivfel

Citat:

Ursprungligen inskrivet av osgorth
BTW, i Windows kör man med fördel 2st SMP-klienter på en quad.. Går att köra 4st också.

Jag föreslog det för honom också (har nog lusläst alla trådar på foldingforumets förstasida vid det här laget ^^), det gav honom ungefär +200ppd. Osäker på om det blev fler processer av det dock.. Ska kolla med honom.
4st SMP-klienter på en quad? Låter lite jobbigt tycker jag ^^ Man undrar hur GPU-klienten ska få någon tid ^^

Permalänk
Medlem

Hehe, jo det går.. Min spelburk t.ex. har en 9650 @ 3.8ghz + ett 4870x2, och jag kör 3st SMP-klienter på varsin kärna 1, 2 och 3, GPU-klient på kärna 4 samt en uniprocessorklient på kärna 4 som får ta "slasken" från GPU-klienten. GPU-klienten har prio "normal" och resten står på "idle".

Av detta får jag ut runt ~3500 PPD för SMP, ~3600 PPD för GPU och 150-200 för CPU-klienten. Med en SMP-klient på alla kärnor med prio idle och GPU med högre prio på kärna 4 får jag ut ~2200 för SMP och samma för GPU.. Så visst gör det skillnad. Mycket väsen för ingenting kanske, men det är ju synd att inte utnyttja kraften som redan finns där.

Jag kunde köra 2 SMP såklart, men det är inte gynnsamt i Win när en av kärnorna är upptagna (jag har testat). SMP-klienten i Win är riktigt usel på multitasking. När den har något annat som har högre prio än sig själv på en kärna segar den ner ordentligt (mer än den borde), så 1 klient kan vara snabbare än 2 t.ex.. I mitt fall låser jag 3 klienter till 3 kärnor som är helt "idle" när jag inte använder datorn, och låser dessutom GPU enbart till kärna 4. Det funkar.

Dessutom, när man kör SMP på endast en kärna så blir det ingen "crosstalk" (kommunikation mellan kärnorna), vilket är en stor flaskhals har jag förstått. T.ex. så är ofta en SMP på 3 kärnor långsammare än en SMP på 2 kärnor..

Visa signatur

Fractal Define 7, Aorus X570 Xtreme, Ryzen 5950X, Fractal Celsius+ S36, 64GB TridentZ Neo CL14/3600 RAM, MSI RTX 3090 Suprim X, 5TB NVMe SSD + 12TB SATA SSD + 64TB Seagate IronWolf Pro HD, Fractal Ion+ 860W Platinum, LG 32GP850 + LG 42C2 OLED

Permalänk
Medlem

mycket intressant läsning
Synd att du inte har någon CTRL+P-knapp på dig (eller det kanske du har? jag har inte kollat ^^) så man kunde skriva ut dina erfarenheter