Permalänk

BSOD hjälp. Video TDR error

Hej!

Jag får BSOD sedan igår, och sitter nu i felsäkert läge på samma dator och skriver detta. Jag har sökt och försökt nyttja guider här och på andra ställen om hur man hanterar BSOD och felsöker vilket jag nu fortsätter med. Samtidigt tänkte jag skriva ner här för feedback och återkoppling från Er med mer insikt som har ett perspektiv något utifrån. Förhoppningsvis löser jag problemet, och då kan det vara till hjälp för någon annan. Frågor följer längst ner!

*SAMMANFATTNING LÄNGRE NER*

Händelseförlopp:

1.Igår när jag spelade WoW fick jag en första BSOD. Efter dator reboot går den in i windows utan problem. Vid uppstart av WoW kopplar den ner direkt. Detta upprepar jag 2-3 ggr.
2. Därefter går jag runt i windows, och gör ingenting särskilt.
3. Cirka en h senare gör jag ett nytt försök. Då kommer jag in, och får spela i cirka 20 minuter. Därefter kraschar det. Vid upprepade reboots kraschar den så fort WoW går igång.
4. Jag ger upp spelkarriären för kvällen och surfar runt. Efter någon H kraschar den återigen (ser på youtube).
5.Efter denna krasch går det endast att starta den i felsäkert läge. Startar jag den i normalt läge startar den antingen om och om i en loop, alternativt kommer in i Windows (hör ljudet) men ger ingen bild.
6. Felsäkert läge fungerar över tiden.

Dold text

Systemet:

W7 64 bit
ASus maximus VII ranger
i7-4770
2x MSI 980 TI
500 GB Samsung SSD (tror 850 pro eller evo)
16 gb ram
Datorn är köpt begagnad, dock ihopbyggd av den tidigare ägaren i somras. Garanti bör finnas på alla delar (möjligen undantaget för processorn). Den har fungerat mer eller mindre felfritt i 2 månader.

Har kontrollerat temperaturer med HWMonitor:
CPU: Ca 30 grader på alla kärnor.
GPU: Gpu Ca 63 grader.

Dold text

Utdrag ur åtgärdscentrets probleminformation

"Beskrivning
Ett problem med din grafikmaskinvara gör att Windows inte längre fungerar korrekt.

Problemsignatur
Händelsenamn: LiveKernelEvent
OS-version: 6.1.7601.2.1.0.256.48
Språkvariant-ID: 1053

Filer som bidrar till att beskriva problemet
WD-20151006-2108.dmp
sysdata.xml
WERInternalMetadata.xml

Visa en tillfällig kopia av dessa filer
Varning: Om problemet orsakades av ett virus eller något annat säkerhetshot kan datorn skadas av att du öppnar en kopia av filerna.

Extra information om problemet
BCCode: 117
BCP1: FFFFFA8011A424E0
BCP2: FFFFF8800495768C
BCP3: 0000000000000000
BCP4: 0000000000000000
OS Version: 6_1_7601
Service Pack: 1_0
Product: 256_1"

WhoCrashed säger: (Den första, de ser likadana ut, därefter Conclusion)
On Tue 2015-10-06 19:09:16 GMT your computer crashed
crash dump file: C:\Windows\Minidump\100615-5569-01.dmp
This was probably caused by the following module: dxgkrnl.sys (dxgkrnl+0x5D134)
Bugcheck code: 0x116 (0xFFFFFA8010A4E010, 0xFFFFF88005096B78, 0xFFFFFFFFC000009A, 0x4)
Error: VIDEO_TDR_ERROR
file path: C:\Windows\system32\drivers\dxgkrnl.sys
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: DirectX Graphics Kernel
Bug check description: This indicates that an attempt to reset the display driver and recover from a timeout failed.
The crash took place in a standard Microsoft module. Your system configuration may be incorrect. Possibly this problem is caused by another driver on your system that cannot be identified at this time.
Google query: Microsoft Corporation VIDEO_TDR_ERROR

Conclusion

11 crash dumps have been found and analyzed. Only 10 are included in this report. A third party driver has been identified to be causing system crashes on your computer. It is strongly suggested that you check for updates for these drivers on their company websites. Click on the links below to search with Google for updates for these drivers:

dxgkrnl.sys (DirectX Graphics Kernel, Microsoft Corporation)

If no updates for these drivers are available, try searching with Google on the names of these drivers in combination with the errors that have been reported for these drivers. Include the brand and model name of your computer as well in the query. This often yields interesting results from discussions on the web by users who have been experiencing similar problems.

Read the topic general suggestions for troubleshooting system crashes for more information.

Note that it's not always possible to state with certainty whether a reported driver is responsible for crashing your system or that the root cause is in another module. Nonetheless it's suggested you look for updates for the products that these drivers belong to and regularly visit Windows update or enable automatic updates for Windows. In case a piece of malfunctioning hardware is causing trouble, a search with Google on the bug check errors together with the model name and brand of your computer may help you investigate this further.
"

Dold text

Felsökning:

Åtgärdscentret anger att jag sedan igår fått "Fel i grafikmaskinvara" samt "oväntad avstängning" 16 ggr. Det hände ytterligare 2x under augusti. Har för mig att det då hände när jag spelade TW3.

Jag har genomfört:
1. Installerat nya drivrutiner till grafikkortet. Har samma problem (kommer in i windows, hör ljud, ser ingen bild. Fungerar fortsatt bra att komma in i felsäkert läge).
2. Har öppnat DxDiag, men den tycker jag inte sa så mycket.

Nu är frågan vad jag ska göra härnäst. Och här tar jag gärna er hjälp.
Lösningar/sätt jag identifierat:

Inledningsvis felsöka efter mjukvaruproblem:
1. Försök hitta en lösning på VIDEO_TDR_ERROR och Dxgkrnl.sys problematiken. Kan jag uppdatera ngn mer drivrutin än Nvidias grafikdrivrutin? Vad göra?
2. Undersöka temperaturerna i datorn. Hur kan jag se det på enklaste sätt?
3. Om möjligt, återställ datorn bakåt i tid (oklart om jag har någon sådan fil).
4. Ogärna; gör en reboot av windows. Ominstallation. (Saknar förnärvarande cdläsare/bootmedia).

Därefter om nödvändigt gör hårdvarukontroller:
1. Ta ut ett RAM-minne i taget. Använd första slotten.
2. Ta ut ett av grafikkorten i taget. Undersök om det andra fungerar.
3. Skjut mig själv om det fortfarande inte funkar.

Dold text

Hur genomför man det här bäst? Ser ni någon annan bra lösning? Tacksam för hjälp

Uppdaterade temperaturer i systemfliken.
Permalänk

Har vidtagit följande åtgärder nu (hyfsat framgångsrikt so far):

Gjorde en systemåterställning två dagar tillbaka.
Startade om, samma problem.
Därefter drog jag ur displayport kabeln och stoppade i det nedre grafikkortet. Då slocknar draken på sidan av det övre (Men lyser upp igen när jag gör en norsk avstängning).

Därefter hör jag hur datorn går igång igen.
Drar ur displayportkabeln och stoppar in den i den övre. Då fungerar det hela heltplötsligt. Är inte heller i felsäkert läge.

Edit:
Försökte starta WoW igen. BSOD -> Krasch. FML. Hjälp?
Lyckades frammana problemet genom att köra Hearthstone också. Datorn lade ner efter ett par minuter. Ljudet kvar.
Samma problem även med League of Legends.
Nu senast slöar datorn märkbart ner i loadingscreens och så, vilket gör att jag blir rädd för att det är fler saker som börjar strula nu än bara grafikkort. :/

Dold text

Får vid upprepade tillfällen bluescreen/reboot. Antingen när jag spelar spel eller öppnar helskärmsapplikationer som är grafiska (har triggats med LoL, WoW, Hearthstone och Youtube via Chrome) eller ibland direkt vid boot. I felsäkert läge eller med avinstallerade drivrutiner fungerar det hela.

Vad göra? Snälla, hjälp!

Fråga: Är det lämpligt att ta ur ett grafikkort och pröva med bara ett?

Update.
Permalänk

Har plockat ut det första kortet, och kör bara med kort nr 2 just nu. Har ännu inte fått någon crash i Hearthstone eller WoW. Däremot laddar texturer in väldigt långsamt, och det har fryst i ett par sekunder vid ett tillfälle. Återkommer imorgon efter mer felsökning.

Permalänk
Hedersmedlem

Vilket nätaggregat?

Kört memtest86?

Visa signatur

W10, Intel 5820K, Asus X99-S, Crucial DDR4 2133MHz 32GB, Sapphire 290X Tri-X, Intel 730 SSD, WD Black+Green+HGST, Silverstone FT02, Corsair AX1200, Corsair K90, Logitech MX518, Eizo 2736w, Eaton 5115 UPS. Pixel 7 pro

Permalänk
Medlem

Jag hade själv problem med blåskärmar och TDR med mitt 980 ti. Jag kunde inte spela något alls nästan, utan fick TDR/blåskärm 20-90 minuter in i ett spel. Även ibland när jag inte ens använde datorn.

Jag har ingen aning om vad felet var för mig. Jag prövade allt. Överklocka, underklocka, andra maskiner, annan hårdvara. Dra ned allt i delar och bygga om igen, kolla alla kablar mm.
Till slut så skickade jag in kortet till affären för felsökning, då jag var säker på att något måste vara fel med det. Men jag fick hem kortet igen med en lapp som sa "inget fel hittades, return to sender" jahopp tänker jag. Stoppar in kortet i datorn igen och.... sedan fungerade det.
Har absolut ingen aning om vad felet är. Och då har man även byggt om datorn 2 gånger, prövat i en annan dator med helt annan hårdvara på ett annat ställe där jag hade samma problem... Och sedan bara fungerar det.

Visa signatur

Maximus X Hero - 8700k @5.1GHz - H115i - 32GB LPX@3466MHz - MSI 980Ti Gaming - EVGA SuperNova 750 G2 - Asus vg248qe - FD R5

Permalänk

Hej!
Jag har kört Windows egna memorytest. Det var inga problem.
Har ett Corsair AX860.

Sista jag gjorde igår var att plocka ur ett grafikkort. Då fungerade det hela idag i 6 h. Fram tills alldeles nyss. Nu blev det "no signal" igen, och fick starta om datorn. Är rätt idélös här just nu... :/

Vad kan det vara? Vad bör jag göra härnäst?

Permalänk
Hedersmedlem

@Stralmark: Det enda som går att lita på till 100% är memtest86 (eller +), windows inbyggda har inte alls den precisionen (om inget ändrats med W10) och kan visa grönt ljus trots fel. Hade jag menat Windows inbyggda hade jag skrivit det.

Edit: Byggdes datorn med ESD-skydd? Annars låter detta exakt som ett scenario där en eller flera saker skadats av ESD och fallerar inom några månader.

Visa signatur

W10, Intel 5820K, Asus X99-S, Crucial DDR4 2133MHz 32GB, Sapphire 290X Tri-X, Intel 730 SSD, WD Black+Green+HGST, Silverstone FT02, Corsair AX1200, Corsair K90, Logitech MX518, Eizo 2736w, Eaton 5115 UPS. Pixel 7 pro

Permalänk

Kommer köra memtest86 alldeles strax nu. Tack för tipset.

Avseende din EDIT så köpte jag datorn begagnat, och kan därmed varken säga bu eller bä. Hur kan jag felsöka det? Vilka delar lär ligga i farozonen då? Innebär det något särskilt att det ger sig uttryck just på grafikdelen? Gäller garanti i detta fall?

Dessutom. Att gå vidare till w10. Skulle det innebära att mjukvarufel kan uteslutas? Är din uppfattning att det här är ett hårdvaruproblem?

Jag är lite dumbstruck här. Väldigt tacksam för hjälp!

EDIT: Memtest86 genomfört. Verkar vara problemfria.

Permalänk
Hedersmedlem

Eftersom det inte är du som byggt så hade jag rivit isär hela datorn, undersökt så att allt ser rent och helt ut, speciellt sockelpinnarna till CPU som kan ge blåskärmar och inte går att felsöka på annat sätt än att fysiskt undersöka. Du behöver dock ny kylpasta om du rör kylaren.
Givetvis kolla så att moderkortsdistanser sitter rätt osv.

Sedan hade jag monterat minsta konfig, moderkort-CPU-ett minne (och ett grafikkort om CPU/moderkort inte har inbyggt) och testat. Fungerar det, plugga in fler saker efterhand.

Köp ESD-armband också, kostar inte mycket.

Edit: Sockelpinnar kan skadas men ändå fungera några månader innan de ger upp helt. Väldigt beroende på vad som skadas. Likadant med moderkortsdistanser. Kan fungera ett tag innan det blir full kontakt/kortslutning.

Visa signatur

W10, Intel 5820K, Asus X99-S, Crucial DDR4 2133MHz 32GB, Sapphire 290X Tri-X, Intel 730 SSD, WD Black+Green+HGST, Silverstone FT02, Corsair AX1200, Corsair K90, Logitech MX518, Eizo 2736w, Eaton 5115 UPS. Pixel 7 pro

Permalänk

Försöker sammanfatta här åtgärder jag vidtagit, så att nytillkomna läsare inte behöver sätta sig in i mina wall of texts.

Vad: Bluescreens vid spelande (Egentligen omstarter). Ibland Bluescreens vid uppstarter också.
Hur: Helt plötsligt säger skärmen "No Signal". Ljud och windows fortsätter i bakgrunden vad jag kan förstå.
Konstigheter: Efter den första problematiken som var i tisdags har det ibland fungerat. 6+h. För att därefter fallera igen. Nu vill den inte spela alls.

Vad jag gjort:
1. Använt WhoCrashed -> Felmeddelanden har pekat mot grafikkorten och drivrutiner. Ibland DXGkrnl, ibland nvlddmkm.
2. HWMonitor visar vad jag förstår inga större konstigheter.
3. Uppgraderat till nyaste och äldre grafikdrivrutiner.
4. Systemåterställt datorn till en tidpunkt före problemen.
5. Genomfört Memtest86 (Inga felrapporter).
6. Provat med ett kort i taget med båda korten. (Det första funkade i 6h spelande, sedan bluescreen. Det andra går inte igång alls i spel. Båda fungerar i windows/youtube enklare belastning)

Nu försöker jag identifiera fler saker jag kan göra. Har ni några tips på hur jag går vidare?

Permalänk

@MultiMan:
Hur ligger det till med garanti på sånt här?
Vad tror du om att bara lämna in den till en datorrepfirma? Har tagit mig vatten över huvudet här känner jag.

Permalänk
Hedersmedlem

@Stralmark: Garanti finns ju på de enskilda delarna, men det ingår inte felsökning på hemmabyggen, där måste man själv ta reda på vad som är trasigt, eller betala någon annan att göra det.

Tänk dock på att garantin egentligen bara gäller förste ägaren men de större firmorna är nog rätt flexibla med detta (varierar!), dock måste du ju ha kvitto på inköpen och står någon annan person där måste det gå genom honom/henne.

Visa signatur

W10, Intel 5820K, Asus X99-S, Crucial DDR4 2133MHz 32GB, Sapphire 290X Tri-X, Intel 730 SSD, WD Black+Green+HGST, Silverstone FT02, Corsair AX1200, Corsair K90, Logitech MX518, Eizo 2736w, Eaton 5115 UPS. Pixel 7 pro

Permalänk

@MultiMan:
Jag förstår. Kvitton finns, och jag kan nog vid behov gå genom den ursprungliga köparen.
Hur felsöker jag processorn/moderkortet på bästa sätt? Antar att det är det som är kvar att göra.

Edit: Vad avser att stoppa in delarna en i taget så vet jag inte riktigt hur det skulle hjälpa mig att identifiera felet. Det händer ju bara när jag spelar.

Permalänk
Hedersmedlem

Det mest känsliga och som tyvärr för ofta skadas av slarviga hemmabyggare är sockelpinnarna till CPUn, så det är det viktigaste att kontrollera vid den här typen av svåra problem. Som jag redan skrivit så måste du dock rengöra och använda ny kylpasta om du tar loss kylaren.

Det är vad jag skulle kollat först i detta läget eftersom du kan se om något är skadat rent fysiskt.

Edit: Och som jag väl redan skrivit också så hade jag tagit ur moderkortet och kollat distanserna för att utesluta kortslutning pga någon felplacerad.

Visa signatur

W10, Intel 5820K, Asus X99-S, Crucial DDR4 2133MHz 32GB, Sapphire 290X Tri-X, Intel 730 SSD, WD Black+Green+HGST, Silverstone FT02, Corsair AX1200, Corsair K90, Logitech MX518, Eizo 2736w, Eaton 5115 UPS. Pixel 7 pro

Permalänk

Vad innebär det att problemet kommer och går? När det igår fungerar 6+h, för att idag inte vilja fungera alls?