Feta problem med GPU-klienten? Nya kärnan som spökar?

Permalänk

Feta problem med GPU-klienten? Nya kärnan som spökar?

Passivt kylt 9600GT (Originalklock)
Nvidia drivers 178.24
GPU-Klient 6.20r1
Arbetstemperatur på GPU = 60 grader

Enda sedan klienten automatiskt uppdaterade till den nya kärnan, version 1.15 har jag haft problem med WU's som slutat för tidigt. Till en början avslutades var tredje WU men nu är det i princip varje som avslutas.

Den näst senaste var UNSTABLE_MACHINE och eftersom jag inte överklockat mitt system så började jag med att byta till 178.24 från 178.13.

Efter bytet av drivrutin dröjde det inte länge förrän nästa WU skulle gå i stöpet och då var det EARLY_UNIT_END.

Dessutom efter varje gång en WU plötsligt blir avslutad så klockar grafikkortet ner sig (som det ska göra när det inte belastas) men klienten fortsätter arbeta, vilket resulterar i att det jobbar på halvfart och för att få upp det i full fart igen krävs utloggning alternativ omstart av datorn.

Om jag inte har läst helt fel så släpptes den senaste kärnan (1.15) nu i dagarna och klienten har aldrig strulat innan dess.
Är det möjligt att det är den som spökar?

Log från båda tillfällena

[14:52:40] Completed 36%
[14:53:51] Run: exception thrown during GuardedRun
[14:53:51] Run: exception thrown in GuardedRun -- Gromacs cannot continue further.
[14:53:51] Going to send back what have done -- stepsTotalG=25000000
[14:53:51] Work fraction=0.3671 steps=25000000.
[14:53:55] logfile size=47847 infoLength=47847 edr=0 trr=23
[14:53:55] - Writing 48383 bytes of core data to disk...
[14:53:55] ... Done.
[14:53:55]
[14:53:55] Folding@home Core Shutdown: UNSTABLE_MACHINE
[14:53:59] CoreStatus = 7A (122)
[14:53:59] Sending work to server
[14:53:59] Project: 5506 (Run 6, Clone 849, Gen 83)
[14:53:59] - Read packet limit of 540015616... Set to 524286976.

[17:30:52] Completed 83%
[17:32:18] Run: exception thrown during GuardedRun
[17:32:18] Run: exception thrown in GuardedRun -- Gromacs cannot continue further.
[17:32:18] Going to send back what have done -- stepsTotalG=25000000
[17:32:18] Work fraction=0.8386 steps=25000000.
[17:32:22] logfile size=100957 infoLength=100957 edr=0 trr=23
[17:32:22] - Writing 101493 bytes of core data to disk...
[17:32:22] Done: 100981 -> 11044 (compressed to 10.9 percent)
[17:32:22] ... Done.
[17:32:22]
[17:32:22] Folding@home Core Shutdown: EARLY_UNIT_END
[17:32:25] CoreStatus = 72 (114)
[17:32:25] Sending work to server
[17:32:25] Project: 5016 (Run 5, Clone 342, Gen 71)
[17:32:25] - Read packet limit of 540015616... Set to 524286976.

Visa signatur

Datorlös

Permalänk
Medlem

Det kan mycket väl vara strul med den nya kärnan på foldingen.. Jag märkte en ganska stor temperatur ökning efter att jag uppgraderade, så testa att köra på en äldre core så kanske det fungerar bättre..

/P

Visa signatur

Folding@Home: 1x8800GTS | 1xQ6600 | 10xE2210 | 1xXeon E5120 |
SweClockers hjälper Stanford University att finna lösningen till svåra sjukdomar. Häng med oss nu!
#foldingatsweclockers

Permalänk

Jag provade att tanka ner 1.13 från http://www.stanford.edu/~pande/Win32/x86/NVIDIA/G80/
och bytade filnamnet till FahCore_11.exe och ersatte den nuvarande.
Fick då detta meddelande

[18:06:20] + Processing work unit
[18:06:20] Core required: FahCore_11.exe
[18:06:20] Core found.
[18:06:20] Working on queue slot 04 [October 15 18:06:20 UTC]
[18:06:20] + Working ...
[18:06:22] CoreStatus = 63 (99)
[18:06:22] + Error starting Folding@Home core.

Visa signatur

Datorlös

Permalänk
Medlem

Döp inte om filen, utan ta enbart bort den gamla filen och stoppa in den nya exe'n, sedan kör du den filen!

/P

Visa signatur

Folding@Home: 1x8800GTS | 1xQ6600 | 10xE2210 | 1xXeon E5120 |
SweClockers hjälper Stanford University att finna lösningen till svåra sjukdomar. Häng med oss nu!
#foldingatsweclockers

Permalänk

Jag tar bort den nuvarande FahCore_11.exe och slänger in den jag laddar ner i katalogen sedan kör jag Folding@home......?

Visa signatur

Datorlös

Permalänk
Medlem

Nej, det är själva Folding@home filen du ska ersätta om du förstår hur jag menar?

/P

Visa signatur

Folding@Home: 1x8800GTS | 1xQ6600 | 10xE2210 | 1xXeon E5120 |
SweClockers hjälper Stanford University att finna lösningen till svåra sjukdomar. Häng med oss nu!
#foldingatsweclockers

Permalänk

Folding@home-Win32-GPU <- den jag ska ta bort? Och sen?

Visa signatur

Datorlös

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av carlgustav
Folding@home-Win32-GPU <- den jag ska ta bort? Och sen?

Precis, ersätt den med den nya kärnan!

Visa signatur

Folding@Home: 1x8800GTS | 1xQ6600 | 10xE2210 | 1xXeon E5120 |
SweClockers hjälper Stanford University att finna lösningen till svåra sjukdomar. Häng med oss nu!
#foldingatsweclockers

Permalänk

Då måste jag döpa om filen jag laddar ner? (Core_11.fah_v113)

Visa signatur

Datorlös

Permalänk
Medlem

Eller vänta lite, jag tänkte på CPU klienten... Gör så att du tar bort work, que, config och FahCore... Sedan laddar du ner den gamla coren och kör igång Folding@Home....

My bad=)

/P

Visa signatur

Folding@Home: 1x8800GTS | 1xQ6600 | 10xE2210 | 1xXeon E5120 |
SweClockers hjälper Stanford University att finna lösningen till svåra sjukdomar. Häng med oss nu!
#foldingatsweclockers

Permalänk

Står att Core is not present or corrupted sen laddar den ner nya igen (1.15).

Visa signatur

Datorlös

Permalänk
Medlem

Jadu, det kanske är så att core'n du laddar hem är skadad?

Jag måste tyvärr sticka iväg för kvällen, återkommer i morgon med mer hjälp om du inte har löst problemet innan dess! Lycka till iaf!

/P

Visa signatur

Folding@Home: 1x8800GTS | 1xQ6600 | 10xE2210 | 1xXeon E5120 |
SweClockers hjälper Stanford University att finna lösningen till svåra sjukdomar. Häng med oss nu!
#foldingatsweclockers

Permalänk

Har provat en annan också, utfallet blir detsamma att den laddar om den nya. Provade bara för sakens skull att döpa om den gamla jag tankade ner och ersatte den nya men då får jag

[18:58:13] + Processing work unit
[18:58:13] Core required: FahCore_11.exe
[18:58:13] Core found.
[18:58:13] Working on queue slot 01 [October 15 18:58:13 UTC]
[18:58:13] + Working ...
[18:58:13] - Calling '.\FahCore_11.exe -dir work/ -suffix 01 -checkpoint 5 -verbose -lifeline 2640 -version 620'

[18:58:15] CoreStatus = 63 (99)
[18:58:15] + Error starting Folding@Home core.
[18:58:15] - Attempting to download new core...

Tack för hjälpen hittills! Meddelar ifall jag löser det.

Visa signatur

Datorlös

Permalänk
Medlem

Den nya kärnan pressar kortet betydligt hårdare än förut, därav ökningen i poäng.. Bieffekten är tyvärr att det blir känsligare mot överklockning. Jag har fått ställa ner flera kort nästan hela vägen till stock för att få det att funka stabilt..

Så, ser ni dessa Early Unit End / Unstable Machine-felen, prova först och främst att klocka ner kortet! Det är väldigt stor sannolikhet att det är där felet ligger.

Visa signatur

Fractal Define 7, Aorus X570 Xtreme, Ryzen 5950X, Fractal Celsius+ S36, 64GB TridentZ Neo CL14/3600 RAM, MSI RTX 3090 Suprim X, 5TB NVMe SSD + 12TB SATA SSD + 64TB Seagate IronWolf Pro HD, Fractal Ion+ 860W Platinum, LG 32GP850 + LG 42C2 OLED

Permalänk

Dessvärre är ju kortet fabriksöverklockat, skall försöka mig på en nerklocknings med Nvidia tools.

Visa signatur

Datorlös

Permalänk
Medlem

Prova 175.19 driver till din 9600GT.
Jag gissar på att det är driver som ger problem, inte själva kortet.

Visa signatur

"The flames of freedom. How lovely. How just. Ahh, my precious anarchy.."

Permalänk
Medlem

Om ni testar äldre drivers, se till att ladda hem en med stöd för CUDA! Numera har alla det, men tidigare var det särskilda versioner som hade CUDA-support. Utan det går det inte att folda.

Visa signatur

Fractal Define 7, Aorus X570 Xtreme, Ryzen 5950X, Fractal Celsius+ S36, 64GB TridentZ Neo CL14/3600 RAM, MSI RTX 3090 Suprim X, 5TB NVMe SSD + 12TB SATA SSD + 64TB Seagate IronWolf Pro HD, Fractal Ion+ 860W Platinum, LG 32GP850 + LG 42C2 OLED

Permalänk
Citat:

Ursprungligen inskrivet av DataNusse
Prova 175.19 driver till din 9600GT.
Jag gissar på att det är driver som ger problem, inte själva kortet.

Ska helt klart ge det ett försök!
För övrigt så klockade jag ner kortet igårkväll och det har varit felfritt under natten vilket är en lättnad, men fungerar det utan nerklock med andra drivrutiner så är det optimalt.

Inget stöd för CUDA i 175.19?

Visa signatur

Datorlös

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av carlgustav
Inget stöd för CUDA i 175.19?

Vet ej. Men mycket troligt att den har då jag kör min 9600GT med 175.19 utan problem och ger hyfsat PPD (~3400PPD). Allt över 178.xx gör att min 9600GT går på hypervarv och ger upp mot 4500PPD men WU hinner aldrig att blir klar utan krashar efter 20-30 min.

Det är ingetligen intressant varför det blir så. För om man kunnde få stabilitet på arbete då skulle alla 9600GT ägare vara rätt så glada.

Visa signatur

"The flames of freedom. How lovely. How just. Ahh, my precious anarchy.."

Permalänk
Citat:

Ursprungligen inskrivet av DataNusse
Vet ej. Men mycket troligt att den har då jag kör min 9600GT med 175.19 utan problem och ger hyfsat PPD (~3400PPD). Allt över 178.xx gör att min 9600GT går på hypervarv och ger upp mot 4500PPD men WU hinner aldrig att blir klar utan krashar efter 20-30 min.

Det är ingetligen intressant varför det blir så. För om man kunnde få stabilitet på arbete då skulle alla 9600GT ägare vara rätt så glada.

Det var märkligt, vilket operativsystem kör du?
Jag kör Vista och jag avinstallerade 178.24 nu imorse och installerade sedan 175.19 men fick sedan meddelandet av GPU-klienten att CUDA inte var installerat.
Gick sedan in på Nvidia.com och kollade informationen om drivrutinen jag tankar ner (175.19) och där stod ingenting om CUDA support, vilket det gör på de senare drivrutinerna.

På tal om PPD så tror jag mitt Fahmon börjat luras med mig, har på sistone stått 4300-4400 i PPD och nu när jag drog ner frekvenserna lite så ska klienten enligt fahmon producera lite mycket, trots att varje frame tar 10 sekunder längre än tidigare.

Visa signatur

Datorlös

Permalänk
Medlem

Ursäkta om det redan behandlats (har inte läst hela tråden) men....

Jag har åkt på samma plötsliga out-of-the-blue-EUE strul tidigare. Det som slutligen fixade mitt problem var reinstall av Cuda drivers. Testa det om du inte redan gjort det

Visa signatur

Gigabyte - Terrabyte - Cenobite

Permalänk

Har provat byta drivrutiner fram och tillbaka, vilket inte har hjälpt. Det enda som löst problemmet hitills har varit att klocka ner grafikkortet.

Visa signatur

Datorlös