Anmäl dig till Roborock Challenge!
Permalänk
Medlem

BSOD, men inte i Felsäkert läge

Hej!

Sedan igår drabbas datorn av en blåskärm 2-5 minuter efter start. Felsäkert läge förhindrar blåskärmar.

Det började med att jag upptäckte att min processor inte använde boost-läget. Detta löstes genom att uppdatera moderkortet med de senaste BIOS. Sedan fungerade datorn som vanligt i nästan 24 timmar. Igår kväll fick datorn en BSOD - Machine-Check Exception när jag spelade Star Citizen. Efter att datorn automatiskt startade om sig själv fick den återigen en BSOD efter bara några minuter, denna gång Clock Watchdog Timeout. Clock Watchdog Timeout fortsatte att orsaka BSOD 2-5 minuter efter start, varje gång. Efter ett tag uppkom fler felmeddelanden vilket jag trodde kanske berodde på alla plötsliga avstängningar. Clock Watchdog Timeout var dock den absolut vanligaste, och även Machine-Check Exception upprepades några gånger.

Den enda åtgärden som hjälper är att köra Windows i Felsäkert läge. Windows har inte kraschat en enda gång i felsäkert läge. Om inte för detta hade jag misstänkt ett hårdvarufel men nu vet jag inte vad jag ska tro. Nu känner jag mig ganska vilsen så jag är tacksam för all hjälp.

Åtgärder jag har testat utan resultat

  • Stängt av turbo-läge (CPU boost) i BIOS. Clock Watchdog Timeout ska enligt Google vara vanligt tillsammans med OC. CPU:n är inte överklockad men för säkerhets skull testade jag att stänga av turbo-läget i BIOS också.

  • Stängt av XMP

  • Återställt BIOS-inställningarna till default

  • Ominstallerat ljud- och grafikkortsdrivrutin med DDU

  • Kopplat ur alla onödiga enheter från datorn

  • Memtest86

  • Undersökt eventuella felmeddelanden i Event Viewer. Intressant nog finns inget särskilt fel dokumenterat innan den första kraschen förutom ett problem med Kernel-EventTracing som verkar ha skett ungefär var femte minut sedan några dagar tillbaka. Oklart om det är relaterat till problemet. Därefter följer en massa varningar som till mitt otränade öga ser ut att vara konsekvenser av de oväntade omstarterna. Om ni tror att det skulle hjälpa kan jag ladda upp loggen.

  • Virusskanning med Malwarebytes

  • Boot med endast Windowstjänster aktiverade och alla startup-program deaktiverade

  • Ominstallation av Windows med bibehållen personlig data (program och Windowsinstallation rensades).

BSOD-meddelanden som har förekommit åtminstone en gång

  • Machine-Check Exception

  • Clock Watchdog Timeout

  • IRQL Not less or equal

  • System thread exception not handled

  • Critical process died

  • System thread exception not handled: dxgmms2.sys

  • Page fault in non-paged area

  • System service exception

  • System service exception: Ntfs.sys

Specs

  • Operativsystem: Windows 10 med senaste drivrutiner

  • Moderkort: ASUS ROG STRIX Z390-F GAMING (2019)

  • RAM: Corsair 32GB (2x16GB) DDR4 3200MHz CL16 (2019)

  • PSU: Corsair RM650X V2 650W (2019)

  • Lagring:

  • Samsung 850 Evo 500 GB SSD (2016)

  • Samsung 860 Evo 500 GB SSD (2019)

  • Samsung 970 Evo Plus 2 TB SSD (2020, systemdisk)

  • CPU: Intel i7-9700K (2019)

  • GPU: Palit GTX 1070 (2016)

  • Temperaturer: 60-70 grader för CPU under load, GPU:n är aningen varmare

Permalänk

Du har ju nästan provat det mesta som föreslås för felet.
Måste dock fråga, är det en "fräsch" installation av Windows ? Inte bara flyttat HD från gammal hårdvara ?

Visa signatur

Main PC: I7-12700K, 32Gb Corsair Vengeance RGB DDR4 3200Mhz, MSI Z690 Pro DDR4, MSI SuprimX RTX 4080,
Seasonic Focus 850W, Wallmounted, Display: Samsung Odyssey G5
Guest PC: I9-9900K, 32Gb Corsair LPX DDR4 3000Mhz, MSI z390-a Pro, MSI Ventus RTX 3070 8Gb, Seasonic Platinum 750W,
Wallmounted, Display: MSI Optix MAG321cqr
Laptop: Acer Nitro (i5-12450H,RTX 4060, 16Gb DDR5)

Permalänk
Medlem
Skrivet av CaptainRedbeard:

Du har ju nästan provat det mesta som föreslås för felet.
Måste dock fråga, är det en "fräsch" installation av Windows ? Inte bara flyttat HD från gammal hårdvara ?

Sorry, jag förstår inte riktigt vad du menar. Windows installerades från början på systemdisken i samband med att jag köpte den 2020. Ominstallationen som jag gjorde i samband med det här problemet gjordes med Windowsverktyget för det. Dess exakta namn undgår mig just nu

Permalänk

Ville bara få fram om windows installationen var gjord på hårdvaran som är i maskin nu. Missade tydligen det i texten
Jag skulle nog göra en Fullständig formatering och installation av Windows, Malwarebytes är också ett program som har iaf tidigare orsakat diverse probelm/fel

Edit: Annars är det nog bara att full ominstallation och börja med så lite extra saker kopplade till maskin som möjligt, fungerar det börjar du lägga till dem

Visa signatur

Main PC: I7-12700K, 32Gb Corsair Vengeance RGB DDR4 3200Mhz, MSI Z690 Pro DDR4, MSI SuprimX RTX 4080,
Seasonic Focus 850W, Wallmounted, Display: Samsung Odyssey G5
Guest PC: I9-9900K, 32Gb Corsair LPX DDR4 3000Mhz, MSI z390-a Pro, MSI Ventus RTX 3070 8Gb, Seasonic Platinum 750W,
Wallmounted, Display: MSI Optix MAG321cqr
Laptop: Acer Nitro (i5-12450H,RTX 4060, 16Gb DDR5)

Permalänk

De 2 filerna som den pekar på i de 2 felkoder a pekar ju på varisin felorsak.

Den ena har med grafikdrivrutiner att göra dxgmms2.sys och pekar på crashande eller trasig grafikdrivrutin.

Kan bero på att versionen du försöker använda är faktiskt trasig eller att grafikkortet får drivrutinen att crasha pga trasig hårdvara.

Den andra ntfs.sys är systemfil för lagringsenheter som kan tyda på problem med din c: disk.

Iom att det slutar i felsäkert kan bero på att endast windows generic drivare laddas så alla 3e part drivare är avstängda vilket gör att nvidia drivaren inte kan orsaka fel.

Dock iom att det började ihop med att du drog igång boost på cpun skulle kunna betyda att cpun inte går stabilt i boosthastigheterna watchdog koden skvallrar väl om det delvis och ev kan få drivare att crasha.

1. Testa några äldre drivrutiner till grafikkortet senaste kanske inte går stabilt.
2. Dra ur alla extra diskar (utom c:) och onödiga usbenheter du inte behöver varit med om att en fallerande lagringsenhet orsakat bsod nån gång även usbenheter kan orsaka div fel.
3. Testa annan disk till ditt operativsystem

Visa signatur

ASUS B550-f-Gaming, R9 5800X3D, HyperX 3200Mhz cl16 128Gb ram, rtx 3070ti.
[Lista] De bästa gratisprogrammen för Windows
[Diskussion] De bästa gratisprogrammen för Windows

Permalänk
Medlem

Det jag reagerar på:

1. Du upptäckte att CPU inte boostade.
2. Du uppdaterade BIOS, CPU boostar nu.
3. Du har börjat få krasher.

För mig pekar detta om att det är ett problem relaterat till PSU, CPU eller moderkort.
En CPU som boostar bör rimligtvis kräva mer effekt.
650W bör vara mer än tillräckligt för detta system såvida det inte är något fel på PSU:n som gör att den inte levererar tillräckligt med effekt.
Nu skall denna PSU vara relativt ny... 2019 enligt listan, det är dock ingen garanti att denna är felfri.
Kontrollera att strömkablarnas kontakter sitter i ordentligt i båda ändar.
Har GPU en eller två strömkontakter?
Om två, används en kabel? Om ja, Prova installera en separat kabel för den andra kontakten.

Är EPS-kontakten (8-pin till CPU) delad? Om ja, kontrollera att båda "halvorna" sitter i ordentligt.

Moderkortet har en "MemOK! II"-switch, jag skulle rekommendera att titta närmare på denna så den står i rätt läge samt läsa på om funktionen för denna i manualen.

Det du beskriver med att det verkar fungera utan problem i felsäkert läge tyder ofta på att det är problematiskta drivrutiner.
Har du installerat CHIPSET-drivrtuiner efter uppdateringen av BIOS?

Nästa steg som jag ser det är att lyfta på CPU och kontrollera att det inte finns några böjda kontaktbleck i CPU-sockeln samt att alla kontaktytor är hela och rena på undersidan av CPU.

Frågan är egentligen, varför boostade inte CPU från början?

Edit:
Måste även tillägga.
Högerklicka på startknappen, klicka på "Enhetshanteraren" och kontrollera så du inte har en massa "okänd enhet" eller varningstrianglar.
Har du det så saknas drivrutiner för diverse enheter.

Permalänk
Medlem

Tack för all hjälp. Det var moderkortets drivrutiner (utöver BIOS) som behövde uppdateras, jag antar att gamla drivrutiner inte samarbetade med nytt BIOS. Handflatan får möta ansiktet i och med att jag inte gjorde det tidigare (uppdaterade bara några drivrutiner) men nu funkar allting i alla fall som det ska igen!

Permalänk
Medlem

Hej igen. Tyvärr är problemet tillbaka med full kraft. Nu får datorn BSOD:en Machine Check Exception (MCE) innan Windowsinloggningsskärmen, varje gång. Den kan ladda BIOS och kraschar inte heller i BIOS-menyn, men får MCE efter att Windowsladdningscirkeln har snurrat några varv.

  • Båda RAM-stickorna har testats var för sig i rekommenderade slots.

  • Kabelanslutningar till moderkortet är kollade.

  • Endast det essentiella är inkopplat i datorn.

Jag försökte installera Pop-OS (linux) från ett USB-minne men installationen fastnade med ett felmeddelande som verkar peka på CPU:n (se bild, bland de sista raderna). Imorgon kan jag öppna datorn för att se om CPU:n har något uppenbart visuellt fel.

Jag har ju garanti kvar på CPU bland annat men innan jag skickar iväg den på reklamation undrar jag bara om det finns något mer jag kan göra för att 100% bekräfta att det är CPU:n. Det skulle vara ganska trist om support inte finner något fel med den så att reklamationsprocessen måste börjas om, särskilt med tanke på att jag ska skriva exjobb nu i vår (stress? vadå stress?) så en fungerande dator är trevligt. Tyvärr är CPU, Mobo, och PSU alla köpta från olika butiker (Black Friday) så det är inte heller särskilt smidigt att skicka dem alla tillsammans. Nåja, nog med gruffandet från min sida, tack på förhand för all hjälp

Permalänk
Medlem

Har du provat ta ut 1070-kortet och bara använda den iGPU:n i CPU:n?

Startar PopOS upp i "Live-miljö" eller startar den en installation direkt? Om det inte är en "Live-miljö" så kan det vara en god idé att prova en Linux-dist med en sådan istället.

Själv skulle jag nog i detta läge lyfta ur CPU och inspektera dess undersida samt att inga "pinns"/metallbleck i CPU-sockeln på moderkortet ser konstiga/böjda ut.

Permalänk
Medlem
Skrivet av Viita:

Har du provat ta ut 1070-kortet och bara använda den iGPU:n i CPU:n?

Startar PopOS upp i "Live-miljö" eller startar den en installation direkt? Om det inte är en "Live-miljö" så kan det vara en god idé att prova en Linux-dist med en sådan istället.

Själv skulle jag nog i detta läge lyfta ur CPU och inspektera dess undersida samt att inga "pinns"/metallbleck i CPU-sockeln på moderkortet ser konstiga/böjda ut.

Hej igen, jag är lite osäker med vad som menas med livemiljö? Jag försökte installera Pop genom att flasha det till ett USB-minne med Etcher. Då kom jag så här längt.

Bilder på CPU och sockel finns nedan.
CPU
Sockel

Sockel, referensbild från Wikipedia

Om du tror att det kan hjälpa kan jag montera CPU:n igen och testa med CPU:ns iGPU.

Permalänk
Medlem
Skrivet av Oyes:

Hej igen, jag är lite osäker med vad som menas med livemiljö? Jag försökte installera Pop genom att flasha det till ett USB-minne med Etcher. Då kom jag så här längt.

Bilder på CPU och sockel finns nedan.
CPU
Sockel

Sockel, referensbild från Wikipedia

Om du tror att det kan hjälpa kan jag montera CPU:n igen och testa med CPU:ns iGPU.

Ok, jag förstår nu hur Pop OS! startar upp, var tvungen att ladda ner det för att kolla.
Det startar alltså till en "Live!"-miljö, dvs, du kan använda datorn utan att faktiskt installera det, dvs, öppna webläsaren etc.
I ditt fall ser det ut som att du inte ens kommer till Live!-miljön.

Svårt att uttala mig om sockeln då bilden är lite oskarp men tycker det ser bra ut.
Bilden på CPU:n visar inte heller några konstigheter.

Jag skulle själv prova att montera CPU:n igen.
Placera CPU:n i sockeln men innan du fäller ner låsbygeln så "skjuter du runt" CPU:n i sockeln litegranna.
Det finns typ en 10-dels mm spel eller något sådant.
Tanken är att eventuellt skit på någon kontaktyta/kontaktbleck skall "ruggas undan".
Kör på CPU:ns iGPU.

Såg av en slump följande på Asus forum:
https://rog.asus.com/forum/showthread.php?122148-MCE-decoder-...
I detta fall är det också någon som har problem efter en BIOS-uppdatering.

Hjälper inget av det ovan så vet jag tyärr inte om jag har någon mer vettig idé.
Det är även svårt att säga om det är CPU eller Moderkort eller något annat även om mycket talar för CPU eller Moderkort.
Normalt brukar man säga att det är mycket ovanligt att CPU:er går sönder, men på senare tid tycker jag att felfrekvensen verkar ha ökat.

Permalänk
Medlem

Tyvärr verkar det inte ha hjälpt. Jag monterade tillbaka CPU:n och ruckade lite på den, testade med iGPU, och satte BIOS-inställningarna enligt länken, men datorn får fortfarande MCE innan inloggningsskärmen. Tack ändå för engagemanget, det har verkligen varit guld värt att få vägledning. Nu tror jag att jag lämnar över den till en lokal datorbutik så får de diagnostisera CPU/mobo/annat. Jag kan återkomma med lösningen ifall någon annan skulle stöta på samma problem