Felsökning krasch svartskärm, fläktar 100% främst Tropico 6

Permalänk
Medlem

Felsökning krasch svartskärm, fläktar 100% främst Tropico 6

Jag har periodvis när jag spelar haft problem med att datorn där jag plötsligt får svart skärm och 100% varvtal fläktarna. Jag hör alltså inget spel ljud utan det verkar som att datorn dör, jag får hålla in power knappen för att bryta strömmen och starta om. Jag spelar väldigt sällan (VR ibland och då brukar det fungera) , har nu kört Tropico 6 och burken har dött 9-10ggr på 2dagar

Har provat olika drivrutiner av AMD drivrutinerna, kör nu 19.4.2
Har kört in alla uppdateringar till Windows 10 x64
Har uppdaterat övriga drivrutiner i burken med Driver Booster 6.4 Pro https://www.iobit.com/en/driver-booster.php
Rensat och städat med CCleaner / avinstallerat onödiga program etc, etc

Vad mer kan jag göra för att felsöka? Windows 10 Event Viewer är ju en röra i sig vet inte ens var jag ska börja men under critical med keyword (70368744177664),(2) får jag

The system has rebooted without cleanly shutting down first. This error could be caused if the system stopped responding, crashed, or lost power unexpectedly.

Minnet körs i en lägre hastighet/default vad MOBO't hittar om jag minns rätt, då datorn inte blev stabil med vad minnet klarar av, funderar på om det kan vara ett problem. Har för länge sen kör windows inbyggda minnes diagnostik utan att den har hittat problem. Har inte uppdaterat bios

Funderar på om PSU'n orsakar problem vet inte riktigt hur det ska kunna testas, kanske flytta lite kablar men litet chassi väldigt tidskrävande insats som jag helst undviker om det finns annat att titta på. Mätverktyg?

Funderat på temperaturer, men chassit körs öppet just nu känns inte realistiskt. Finns det några dumpar från catalyst eller event viewer eller går det att spara ner det utan tredje parts program? Openhardware trycker ut en hel del skit men tempen verkar det inte vara något problem med: https://docs.google.com/spreadsheets/d/1tfV1Nnipt3qm0kZpjuUtF....
Rad 9401: 67C på CPU #1, och 71C på GPU , lyckades spela i 2h spelet dog bara var inne i en meny när man väljer inriktning

Då jag har en dan case v2 sitter det en 3M PCI-e riser cable till GPU'n som inte borde skapa problem, https://smallformfactor.net/forum/threads/flexible-pcie-riser...

Windows 10 x64 Retail Corsair SF600 600W (v1 80+ Gold) Sapphire Radeon RX Vega 64 black G.Skill TridentZ DDR4-3600 C15 DC SR - 16GB ASUS ROG STRIX B350-I GAMING Asetek 545LC 92mm Performance Liquid CPU Cooler Samsung 960 EVO 500GB M.2 2280 PCIe SSD Amd Ryzen 7 1800X Samsung SE790C 34" 21:9 Dan Case v2 with 3M riser cable for GPU

Permalänk
Medlem

Loggboken, under system, kolla tidpunkterna för sakerna. eventid.net för att söka på vad det kan röra sig om. Hittar du inget alls som har med drivrutiner etc att göra är det hårdvarufel. Jag kan inte specar på dina grejer men 600W borde räcka eller?

Visa signatur

CPU: I7 4770K Grafik: Poseidon Platinum GeForce GTX 980Ti Moderkort: Asus Maximus VI Hero Z87 RAM: 16Gb Corsair Dominator Platinum CL9 Nätagg: Corsair HX1050 Gold SSD: Corsair Force GT 240Gb SSHD: Seagate Desktop 4TB Låda: Corsair Graphite 600T

Permalänk
Medlem

Kör du med displayport kabel?, isåfall prova byta den mot en annan.

har själv haft skumma krascher pga displayportkablar.

Visa signatur

Dator : GPU: Asus RTX3090 ROG Strix |CPU: AMD Ryzen 7 7800X3D |
| RAM: Kingston Fury 32GB 6000MHz | Hifiman HE-500 | Musical Fidelity M1HPAP |

Permalänk
Medlem
Skrivet av Gurk:

Loggboken, under system, kolla tidpunkterna för sakerna. eventid.net för att söka på vad det kan röra sig om. Hittar du inget alls som har med drivrutiner etc att göra är det hårdvarufel. Jag kan inte specar på dina grejer men 600W borde räcka eller?

Jo 600W borde räcka kan jag tycka, jag har ingenting i loggboken under system vid den tidpunkten (30minuter innan kraschen, och 1minut efter/uppstart av datorn igen)

Skrivet av HaBBarN:

Kör du med displayport kabel?, isåfall prova byta den mot en annan.

har själv haft skumma krascher pga displayportkablar.

Yep displayport, köpte en certad kabel ska kolla om jag har någon liggande som kan testas

Openhardware trycker ut en hel del skit men tempen verkar det inte vara något problem med https://docs.google.com/spreadsheets/d/1tfV1Nnipt3qm0kZpjuUtF...
Rad 9401: 67C på CPU #1, och 71C på GPU , lyckades spela i 2h spelet dog bara var inne i en meny när man väljer inriktning

Permalänk
Medlem

Okej nu har skiten kraschat 4ggr till

Permalänk
Medlem

Bios uppdaterat från 0314 till 4207, kraschar som tidigare.
enda positiva är att minnet fungerar över stock 2133, kör 3333 nu, postar inte på 3400+ övrigt är på auto (volt, timings) så leker man med det kanske det går att få upp det till 3600+.

Kan man köra något stresstest på specifika delar exvis enbart psu'n om den inte kraschar, gpu'n om det då kraschar kan man testa pci-e risern på något sätt? Mätverktyg?

Permalänk
Medlem

Okej ett par stresstest gjorda, RMA'ade PSU'n den lät förjävligt och fick BSOD På OCCT's power supply test. Efter RMA'n skulle jag spela in ljudet men nu "är det lite coilwhine ibland, inte alls som förut 95% bättre och den kraschade inte på samma test, verkade som att jag behövde nöta in agget lite".

Visade sig att tempen på NVME'n var 60-70C samt 90C på sensor 2 som är oklart vad det är, justerade fläkten till vattenkylningen, passade på att ändra från prestanda till energispar i windows då det visar sig att ryzen's dynamiska upp/nedklockning enbart fungerade i energispar för min del, klockar nu ner sig till 0.8V 2.2ghz. i idle/desktop. Efter att burken har vilat lite nvme ligger på 45, sensor2 på 67, cpu på 36 gissar att nvme'n håller bättre temperaturer sen, antagligen spillvärme från CPU'n (kört fläkten väldigt lågt förut) mobo't är vertikalt med CPU'n just under NVME'n

Har inte orkat/hunnit stresstesta om datorn fortsätter att kraschar eller vilka temps det blir vid användning, har funderat på om överhettad nvme kan orsaka svartskärm med 100% fläkthastighet på allting, men det känns osannolikt, etc, etc, etc, blir i alla fall att avvakta med RMA'n på PSU'n lite.

Permalänk
Medlem

Och det kraschar, verkar enbart vara hot-spot temperaturen som springer iväg men enligt google så avläses den olika i olika versioner, och vid max 110C så throttlar kortet fram och tillbaka 200mhz för att hålla tempen i check. Gissar att detta inte heller är problemet

Sensor 2 var uppe och nuddade vid 80C (tidigare 90 C) och CPU'n gick inte över 40C (tidigare 90C) så mycket bättre än tidigare. Eventuellt köper jag en aktiv eller passiv kylfläns till NVME SSD'n men har rätt dåligt luftflöde kanske blir värre, den håller sig runt 50C bara sensor 2 som springer iväg. Svårt att tro att problemet ligger här.

Funderar på om jag ska logga volt och lite annat, men har för dålig koll på om man kan utesluta något via det.

Logg ända fram till krachen, bytte till HWInfo: Temperatur loggar

Permalänk
Medlem

Har underklockat kortet bios switchen ska vara 30W mindre, samt att jag har klockat ner det till från balanced till powersave i AMD Wattman borde vara några W till.

Furmark: GPU 6h ingen krasch , hot spot temperaturen var uppe på 111C trots UC, ser inget annat konstigt i loggen. Både NVME och CPU håller sig på lägre temperaturer

** Prime95 torture test: 2h, körde blend (some of everything lots of memory) ingen logg på det, efter det Small FTT's ~1.5h (maximum heat FPU stress not so much memory), och sista halvtimmen In-place large FFT's (maximum power consumption, some ram tested). Datorn dog strax efter att lager FFT tested kördes. CPU'n på rimlig temp NVME Sensor 2 vid 80C antingen belastas disken hårt vid prime95 eller så påverkas det lite av spillvärmen på CPU'n.

Heaven: GPU 2h ingen krasch alla temperaturer rimliga nivåer.

Testade tropico och den dog men har ingen logg
Gnerellt sedan UC så verkar datorn lite stabilare, antingen är det NVME'n som överhettas och datorn bryter men Sensor 2 är ju någonting annat, controllern/disken ligger ca 30C under sensor 2 s(har inte sett att någon annan har råkat ut för det, och det verkar vara där många får tempen på sensor 2). Sedan underklock trots att hot-spot temperaturen på GPU' sticker iväg på sjuka nivåer så kör datornv vidare därmot har den dött när tempen har legat lägre.

Vet inte om man kan dra slutsatsen att PSU'n inte kan leverera stabilt vid högre laster. Tänker då på furmark maximum power consumption testet, och att det knappt har gått att spela när GPU'n har legat på stock.
Kan man få ut någonting vettigt vid kraschen från loggarna? (furmark tabben) https://docs.google.com/spreadsheets/d/1tfV1Nnipt3qm0kZpjuUtF...