Permalänk
Medlem

BsoD vid belastning av grafikkort

Godagens!

Först vill jag bara passa på och tacka alla som som kör techsupport på detta forum, ni är till ovärderlig hjälp och detta är första gången jag inte hittar en tråd med en lösning.

Som sagt var, efter många år av trogen tjänst med bara mindre problem så har min dator börjat krasar när jag belastar grafikkortet, även ibland så lite som att se en Youtube video i fullscreen. Skärmen flimrar till, en varnings triangel hoppar upp nere vid systemikonerna som säger "nvidia kernel mode driver has stopped responding and has recovered" (Ser inte denna varning om jag spelar), skärmen flimrar till igen, ljud börjar upprepa sig och sen blir skärmen svart (Jag får inte bluescreen, ingen aning varför). Jag får känslan att när det har hänt en gång (testade i går att starta ARMA) så krävs det mindre för att krascha igen några timmar.

Jag har testat:
Att installera om alla drivrutiner till grafikkortet.
Systemåterställning.
Ominstallation av Windows.
Att öka tiden innan TDR checker hoppar in.
Memtest86 (inga errors efter 8 passes)

Specs:
Operativsystem: Microsoft Windows 7 och senaste drivrutinerna
Processor: Intel Core i5 2500K (Ej överklockad)
Processorkylare: Hyper 212 plus
Moderkort: ASUS p8p67m-pro
Minne: x2 Corsair 4GB DDR3 (4GB DDR3 1333MHz CL9 tror jag, minns ej exakta modellen)
Grafikkort: GTX 480
Hårddisk: Samsung HD103 SJ
Nätaggregat: modxstream pro 700w
Övrig kylning: 1x120mm utblås
Övriga komponenter: DVDbrännare
Temperaturer: CPU ca 60-70 vid maxbelastning, GPU ca 95-100 vid maxbelastning.

Minidumps: http://www.filefactory.com/file/52dq2xyw0865/Sproges_Minidump...

Use !analyze -v to get detailed debugging information.

BugCheck 116, {fffffa80071824e0, fffff880051d1f50, ffffffffc000009a, 4}

Unable to load image \SystemRoot\system32\DRIVERS\nvlddmkm.sys, Win32 error 0n2
*** WARNING: Unable to verify timestamp for nvlddmkm.sys
*** ERROR: Module load completed but symbols could not be loaded for nvlddmkm.sys
Probably caused by : nvlddmkm.sys ( nvlddmkm+8f0f50 )

Followup: MachineOwner
---------

3: kd> !analyze -v
*******************************************************************************
* *
* Bugcheck Analysis *
* *
*******************************************************************************

VIDEO_TDR_FAILURE (116)
Attempt to reset the display driver and recover from timeout failed.
Arguments:
Arg1: fffffa80071824e0, Optional pointer to internal TDR recovery context (TDR_RECOVERY_CONTEXT).
Arg2: fffff880051d1f50, The pointer into responsible device driver module (e.g. owner tag).
Arg3: ffffffffc000009a, Optional error code (NTSTATUS) of the last failed operation.
Arg4: 0000000000000004, Optional internal context dependent data.

Debugging Details:
------------------

FAULTING_IP:
nvlddmkm+8f0f50
fffff880`051d1f50 803db205f0ff00 cmp byte ptr [nvlddmkm+0x7f1509 (fffff880`050d2509)],0

DEFAULT_BUCKET_ID: GRAPHICS_DRIVER_TDR_FAULT

CUSTOMER_CRASH_COUNT: 1

BUGCHECK_STR: 0x116

PROCESS_NAME: System

CURRENT_IRQL: 0

STACK_TEXT:
fffff880`05fb2a48 fffff880`03f2e140 : 00000000`00000116 fffffa80`071824e0 fffff880`051d1f50 ffffffff`c000009a : nt!KeBugCheckEx
fffff880`05fb2a50 fffff880`03f01867 : fffff880`051d1f50 fffffa80`08ec6000 00000000`00000000 ffffffff`c000009a : dxgkrnl!TdrBugcheckOnTimeout+0xec
fffff880`05fb2a90 fffff880`03f2df4f : fffffa80`ffffd84d ffffffff`fffe7960 fffffa80`071824e0 00000000`00000000 : dxgkrnl!DXGADAPTER::Reset+0x2a3
fffff880`05fb2b40 fffff880`0486e03d : fffffa80`08f44d50 00000000`00000080 00000000`00000000 fffffa80`08eba010 : dxgkrnl!TdrResetFromTimeout+0x23
fffff880`05fb2bc0 fffff800`05b182ea : 00000000`fffffc32 fffffa80`08ee9610 fffffa80`0668f4a0 fffffa80`08ee9610 : dxgmms1!VidSchiWorkerThread+0x101
fffff880`05fb2c00 fffff800`0586c8e6 : fffff800`059f6e80 fffffa80`08ee9610 fffff800`05a04cc0 fffff880`00e4c3bb : nt!PspSystemThreadStartup+0x5a
fffff880`05fb2c40 00000000`00000000 : 00000000`00000000 00000000`00000000 00000000`00000000 00000000`00000000 : nt!KiStartSystemThread+0x16

STACK_COMMAND: .bugcheck ; kb

FOLLOWUP_IP:
nvlddmkm+8f0f50
fffff880`051d1f50 803db205f0ff00 cmp byte ptr [nvlddmkm+0x7f1509 (fffff880`050d2509)],0

SYMBOL_NAME: nvlddmkm+8f0f50

FOLLOWUP_NAME: MachineOwner

MODULE_NAME: nvlddmkm

IMAGE_NAME: nvlddmkm.sys

DEBUG_FLR_IMAGE_TIMESTAMP: 52314e10

FAILURE_BUCKET_ID: X64_0x116_IMAGE_nvlddmkm.sys

BUCKET_ID: X64_0x116_IMAGE_nvlddmkm.sys

Followup: MachineOwner

Tack på förhand!

Sproge

Permalänk
Medlem

Älskar såna här trådar, detaljerna i felspecifikationen är super.

Har du bekräftat att det är grafikkortet och inte moderkortet genom att byta moderkortet, alt flytta grafikkortet till en testburk?
Behöver inte vara grafikkortet nödvändigtvis (tyvärr lite dålig på vad alla felkoderna betyder).

Visa signatur

Citera om du vill ha svar, hjälpte jag dig, gilla svaret!

Permalänk
Medlem

Håller med ovan, gillar skarpt när man skriver detaljer redan från första början.

Det behöver inte vara fel på grafikkortet, har du kollat så grafikkortet inte sitter löst? Ta ur och montera om samt likadant med kablar. Ifall det kvarstår, prova byt PCIe slot och ändra till ''maximal prestanda'' i nvidia inställningar.

Permalänk
Medlem

Jag hade nog testat att köra Furmark för att se temperaturen. (Nu lär det väl crasha datorn rätt snabbt iofs..)
Inte igendammat eller så?

Visa signatur

Speldator :[I] AMD 5600X - 16GB fläskigt ram - AMD 580RX - AOC 32" Wide
HTPC : i5 3450S - 8GB G.Skill - Streacom F8

Permalänk
Medlem
Skrivet av Sproge:

Godagens!

Jag har testat:
Att installera om alla drivrutiner till grafikkortet.

Memtest86 (inga errors efter 8 passes)

GPU ca 95-100 vid maxbelastning.

Goddag!
Svarar i lite omvänd ordning mot vad citatet ovan visar och börjar därför nerifrån i den citerade texten.

GPU-temp på närmare 100C låter inte alls bra, det är någonstans där som kortet klockar ner sig och rent av stänger av sig för att skydda mot överhettning. Det skulle kunna förklara problemet. Hur belastar du kortet för att uppnå den tempen undrar jag då, och vad visar GPU för temp vid låg belastning? Rengöring av grafikortets fläkt med hjälp av tryckluft skulle kunna vara på sin plats. Viktigt att man inte låter fläkten spinna upp då man blåser på den, så håll i den och blås, snurra lite grand och blås igen så alla fläktblad verkligen blir rena.

Det finns en risk att dina tempsensorer visar för litet värde i mjukvara och att tempen därför går i taket. Har du provat köra med chassit öppet så grafikkortet får mer luft, gärna nära ett öppet fönster under en liten stund. Borde få ner tempen en liten aning så att du ser om det gör någon skillnad.

Memtest86 i 8 pass säger endast att det inte finns några "större" fel på minnena. Ett mindre fel som uppstår ibland kan slinka igenom utan problem. Detta bör aldrig köras mindre än 24 timmar om inte fel visar sig snabbare förstås. Prova köra med en minneskrets i taget och se ifall datorn kraschar. Det kanske går fortare än att testa dem med mjukvara.

Apropå drivrutinerna. Prova gå in i felsäkert läge och avinstallera allt med namnet Nvidia med hjälp av Driversweeper. Den är väl inte uppdaterad på ett par år så vi får hoppas den funkar på ditt OS.
Installera sedan om drivrutinerna, blir det likadant gör om samma rensning igen och prova en äldre drivrutin.
Kollat igenom dina dumpfiler som är identiska och egentligen ger noll i upplysning förutom att drivrutinen för Nvidia krashar och inte kan återställas. Detta kan iofs vara bra då det inte direkt pekar på hårdvarufel, såvida jag inte missat något förstås.

Kolla även drivrutiner till chipset för moderkortet, ljuddrivrutiner, nätverk och installera om Direct X. Alla dessa kan påverka.

Övrigt. Det finns en risk att din PSU håller på att ge sig och inte orkar hålla jämn effekt till grafikkortet, det borde iofs visat sig i dumpfilen kan jag nog tycka. Men har du tillgång till en annan PSU så testa ifall det gör någon skillnad!

Edit: Hittade en länk där en snubbe fick hjälp med i stort sett samma problem fast på ett ATI-kort. I det fallet var det Symantecs Norton samt ATI-drivare som verkade vara problemet. http://www.pchelpforum.com/xf/threads/windows7-blue-screen.10...

Permalänk
Medlem

Okay, tack för tipsen. Jag bytte PCIe slot och det verkar ha gjort susen! Datorn är för tillfället stabil, jag återkommer om problem uppstår igen.

/Sproge