Har jag förstört ett grafikkort? - Det ger bara halv PPD.

Permalänk
Medlem

Har jag förstört ett grafikkort? - Det ger bara halv PPD.

Jag foldar på två gtx275. Hela dagen idag har det ena kortet bara levererat ca halva av den vanliga PPD-takten (enligt fahmon). Jag har provat att starta om klienten, ladda ner nya projekt, startat om datorn, öka och minska klock på kortet. Just nu ger kortet ca 4400 PPD på en klock och med en WU som brukar ge ungefär 9200 PPD. Någon som har några idéer på vad som kan vara fel?

Visa signatur

Asus G73JH-TZ178Y med SSD // Asus G73JH-TY171V // Acer Aspire 7738G // PS3 // Fusion-HTPC

"What doesn't kill you makes you smaller" - Super Mario

Permalänk
Medlem

Bara låta den jobba på kanske rättar till sig själv till slut annars äre något som är fel på riktigt

Permalänk
Medlem

Nu är allt som vanligt. Stängde av datorn en stund bara. Konstigt att inte omstart fungerade då.

Visa signatur

Asus G73JH-TZ178Y med SSD // Asus G73JH-TY171V // Acer Aspire 7738G // PS3 // Fusion-HTPC

"What doesn't kill you makes you smaller" - Super Mario

Permalänk
Medlem

Nej, nu är det knas igen. Nu hänger sig projekten i mitten och börjar på ett nytt (utöver det jag skrev ovan). Såhär slutar logfilen för ett avbrutet projekt:

[05:35:53] Completed 65%
[05:42:57] Completed 66%
[05:50:02] Completed 67%
[05:51:49] SEH code: 3221225477
[05:51:49] Run: exception thrown during GuardedRun
[05:51:49] Run: exception thrown in GuardedRun -- Gromacs cannot continue further.
[05:51:49] Going to send back what have done -- stepsTotalG=8000000
[05:51:49] Work fraction=0.6725 steps=8000000.
[05:51:53] logfile size=189419 infoLength=189419 edr=0 trr=23
[05:51:53] - Writing 189955 bytes of core data to disk...
[05:51:54] Done: 189443 -> 6062 (compressed to 3.1 percent)
[05:51:54] ... Done.
[05:51:54]
[05:51:54] Folding@home Core Shutdown: UNSTABLE_MACHINE
[05:51:57] CoreStatus = 7A (122)
[05:51:57] Sending work to server
[05:51:57] Project: 5912 (Run 9, Clone 847, Gen 12)
[05:51:57] - Read packet limit of 540015616... Set to 524286976.

[05:51:57] + Attempting to send results [January 7 05:51:57 UTC]
[05:51:58] + Results successfully sent

Jag kan tillägga att detta sker när kortet är rejält nedklockat. Idéer?

Visa signatur

Asus G73JH-TZ178Y med SSD // Asus G73JH-TY171V // Acer Aspire 7738G // PS3 // Fusion-HTPC

"What doesn't kill you makes you smaller" - Super Mario

Permalänk
Medlem

Det är nog bara lite galna WU's du får isf, det är inget att oroa sig för.
Men blir det så på varenda WU så är det nog nåt som hänt med ditt kort ja.

Det har inte gått varmt tidigare? Det ska ju kortet sköta själv o klocka ner sig, men ändå?

Visa signatur

WS: Asus P8Z77-I Deluxe mITX | Intel 3770K@4.6 | NH-U12P | Asus 780 GTX | Corsair 2x8GB 1600Mhz CL9 | Samsung 840 512GB | Ubuntu 16.04.3 x86_64 | Corsair AX750 | 2x Dell U2412M | Puppe.se | NAS: i7 860, 16GB DDR3, GA-P55M-UD4, FD Define R3, 8x2TB Samsung F4EG, Serveraid M1015, EVGA 750W G2 PSU, FreeBSD x64

Permalänk
Medlem

Nja, i och med att problemet kvarstår med att det bara går på halv effekt så att säga så är ju kortet nu snarare svalare än det var innan. Under det arbetet som loggen är hämtad från t.ex. så låg det på 65 grader. Det löste sig efter att jag stängt av datorn men nu inatt har det alltså stökat till sig igen. Jag har haft stabil folding ända upp till klocken 730/1230/2600 på kortet och nu inatt var klocken mycket lägre. Det kan vara så att det är knasiga WU's men det verkar bara drabba det ena kortet. Problemet är alltså både att kortet foldarlångsamt och att det inte klarar hela WU's.

Visa signatur

Asus G73JH-TZ178Y med SSD // Asus G73JH-TY171V // Acer Aspire 7738G // PS3 // Fusion-HTPC

"What doesn't kill you makes you smaller" - Super Mario

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av TheJerk
Nja, i och med att problemet kvarstår med att det bara går på halv effekt så att säga så är ju kortet nu snarare svalare än det var innan. Under det arbetet som loggen är hämtad från t.ex. så låg det på 65 grader. Det löste sig efter att jag stängt av datorn men nu inatt har det alltså stökat till sig igen. Jag har haft stabil folding ända upp till klocken 730/1230/2600 på kortet och nu inatt var klocken mycket lägre. Det kan vara så att det är knasiga WU's men det verkar bara drabba det ena kortet. Problemet är alltså både att kortet foldarlångsamt och att det inte klarar hela WU's.

Edit: Fin överklock på grafikkortet du har där btw

Edit 2: Tryckte visst "citera" istället för "ändra". Ursäkta.

Visa signatur

Asus G73JH-TZ178Y med SSD // Asus G73JH-TY171V // Acer Aspire 7738G // PS3 // Fusion-HTPC

"What doesn't kill you makes you smaller" - Super Mario

Permalänk
Medlem

Uppdatering:

Problemen kvarstår, många projekt påbörjas/avslutas inte och de som funkar går sakta. Här en bit av loggen från inatt som visar lite nya felmeddelanden jämfört med de jag sett tidigare:

Working on p4744_lam5w_300K
[03:18:49] Client config found, loading data.
[03:18:49] Starting GUI Server
[03:20:15] Completed 1%
[03:20:16] mdrun_gpu returned
[03:20:16] NANs detected on GPU
[03:20:16]
[03:20:16] Folding@home Core Shutdown: UNSTABLE_MACHINE
[03:20:18] CoreStatus = 7A (122)
[03:20:18] Sending work to server
[03:20:18] Project: 10101 (Run 473, Clone 4, Gen 25)
[03:20:18] - Read packet limit of 540015616... Set to 524286976.
[03:20:18] - Error: Could not get length of results file work/wuresults_09.dat
[03:20:18] - Error: Could not read unit 09 file. Removing from queue.
[03:20:18] EUE limit exceeded. Pausing 24 hours.

Är det någon som kan hjälpa mig förstå vad klienten upplever som ett problem? Ena kortet funkar prima, det är bara ett av korten som har problem och detta oavsett klock och temp.

Visa signatur

Asus G73JH-TZ178Y med SSD // Asus G73JH-TY171V // Acer Aspire 7738G // PS3 // Fusion-HTPC

"What doesn't kill you makes you smaller" - Super Mario

Permalänk
Medlem

Fungerar det bättre men standard klock?

så här får jag när mina grafikkort blir ostabila.

[14:04:29] Working on Protein
[14:04:30] Client config found, loading data.
[14:04:30] Starting GUI Server
[14:05:22] Completed 1%
[14:06:14] Completed 2%
[14:07:01] Completed 3%
[14:07:01] mdrun_gpu returned
[14:07:01] NANs detected on GPU
[14:07:01]
[14:07:01] Folding@home Core Shutdown: UNSTABLE_MACHINE
[14:07:04] CoreStatus = 7A (122)
[14:07:04] Sending work to server

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av The_dreamer
Fungerar det bättre men standard klock?

Det spelar ingen roll vilken klock jag har. Har provat allt från högsta stabila jag lyckats uppnå ner till lägsta som jag kan ställa in med min mjukvara. Nyss kom denna:

15:29:45] Completed 30%
[15:30:42] Completed 31%
[15:31:38] Completed 32%
[15:32:35] Completed 33%
[15:33:31] Completed 34%
[15:33:52] Run: exception thrown during GuardedRun
[15:33:52] Run: exception thrown in GuardedRun -- Gromacs cannot continue further.
[15:33:52] Going to send back what have done -- stepsTotalG=10000000
[15:33:52] Work fraction=0.3436 steps=10000000.
[15:33:56] logfile size=15257 infoLength=15257 edr=0 trr=23
[15:33:56] + Opened results file
[15:33:56] - Writing 15793 bytes of core data to disk...
[15:33:56] Done: 15281 -> 4635 (compressed to 30.3 percent)
[15:33:56] ... Done.
[15:33:56] DeleteFrameFiles: successfully deleted file=work/wudata_01.ckp
[15:33:56]
[15:33:56] Folding@home Core Shutdown: UNSTABLE_MACHINE
[15:34:00] CoreStatus = 7A (122)
[15:34:00] Sending work to server
[15:34:00] Project: 10101 (Run 124, Clone 2, Gen 26)
[15:34:00] - Read packet limit of 540015616... Set to 524286976.

[15:34:00] + Attempting to send results [January 9 15:34:00 UTC]
[15:34:00] + Results successfully sent
[15:34:00] Thank you for your contribution to Folding@Home.

Visa signatur

Asus G73JH-TZ178Y med SSD // Asus G73JH-TY171V // Acer Aspire 7738G // PS3 // Fusion-HTPC

"What doesn't kill you makes you smaller" - Super Mario

Permalänk
Medlem

Vilken drivrutin använder du?

Föreslår att du drar ner senaste drivrutinen härifrån, ser om det hjälper?
(http://www.nvidia.co.uk/object/cuda_get_uk.html)

Visa signatur

WS: Asus P8Z77-I Deluxe mITX | Intel 3770K@4.6 | NH-U12P | Asus 780 GTX | Corsair 2x8GB 1600Mhz CL9 | Samsung 840 512GB | Ubuntu 16.04.3 x86_64 | Corsair AX750 | 2x Dell U2412M | Puppe.se | NAS: i7 860, 16GB DDR3, GA-P55M-UD4, FD Define R3, 8x2TB Samsung F4EG, Serveraid M1015, EVGA 750W G2 PSU, FreeBSD x64

Permalänk
Medlem

Bytt drivare nu och det verkar gå stabilare. Lite svårt att veta vad som löste det dock. Problemet med halv effekt uppstår inte längre men jag har å andra sidan stängt av alla strömsparfunktioner så det kan vara det. Innan så failade klienten så fort jag gjorde något, t.ex. öppna en webläsare. T.o.m. när jag bara rörde musen så att skärmsläckaren avaktiverades så failade den vid något tillfälle. Innan kunde jag ibland glömma klienten på när jag spelade spel och den pallade ändå. Nu är det inga problem men nu är jag å andra sidan väldigt noga med att pausa innan jag hittar på något. Ja ja, nu funkar det iaf, gött är väl det, tackar.

Inbillar jag mig eller går korten lite svalare med den drivaren du länkade till?

Visa signatur

Asus G73JH-TZ178Y med SSD // Asus G73JH-TY171V // Acer Aspire 7738G // PS3 // Fusion-HTPC

"What doesn't kill you makes you smaller" - Super Mario

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av TheJerk
Bytt drivare nu och det verkar gå stabilare. Lite svårt att veta vad som löste det dock. Problemet med halv effekt uppstår inte längre men jag har å andra sidan stängt av alla strömsparfunktioner så det kan vara det. Innan så failade klienten så fort jag gjorde något, t.ex. öppna en webläsare. T.o.m. när jag bara rörde musen så att skärmsläckaren avaktiverades så failade den vid något tillfälle. Innan kunde jag ibland glömma klienten på när jag spelade spel och den pallade ändå. Nu är det inga problem men nu är jag å andra sidan väldigt noga med att pausa innan jag hittar på något. Ja ja, nu funkar det iaf, gött är väl det, tackar.

Inbillar jag mig eller går korten lite svalare med den drivaren du länkade till?

Jag tror inte att den går svalare pga drivrutinen, det är nog andra projekt du får. Dom jobbar lite olika beroende på projekt. Men du kan ha haft en gammal drivrutin, som inte gillat att det kommit nya versioner av projekten, därav dina krasher..

Hoppas det håller i sig för dig, så vi inte tappar en medlem pga strul

Happy folding!

Visa signatur

WS: Asus P8Z77-I Deluxe mITX | Intel 3770K@4.6 | NH-U12P | Asus 780 GTX | Corsair 2x8GB 1600Mhz CL9 | Samsung 840 512GB | Ubuntu 16.04.3 x86_64 | Corsair AX750 | 2x Dell U2412M | Puppe.se | NAS: i7 860, 16GB DDR3, GA-P55M-UD4, FD Define R3, 8x2TB Samsung F4EG, Serveraid M1015, EVGA 750W G2 PSU, FreeBSD x64