Slumpmässiga omstarter vid låg last (Crosshair VIII Dark Hero)

Permalänk
Medlem

Slumpmässiga omstarter vid låg last (Crosshair VIII Dark Hero)

Jag tog mig förra helgen tid att byta från uppgradera moderkort från ett Strix X370-F Gaming till ett Crosshair VIII Dark Hero, samt montera i mitt RTX 3080 TUF OC. Eftersom datorn även agerar både GameStream-dator och hemmaserver brukar den vara igång 24/7. Detta har fungerat utmärkt sedan slutet av 2019 med samma CPU (3900X), minnen (samma konfiguration) och övriga komponenter bortsett från moderkortet och grafikkortet.

Sedan uppgraderingen har jag dock börjat få problem med att datorn dör och startar om sig vid låg last/idle. Vid hög last är det däremot tillsynes inget problem alls.

På moderkortet kör jag senaste BIOS-version 3501 (senaste beta-versionen med AGESA 1.2.0.2). Jag har även testat att stänga av DF C-states och ändra Power Supply Idle Control till "Typical current idle", utan märkbar skillnad. Processorn är ej överklockad och har som sagt fungerat felfritt en lång tid med det gamla moderkortet. Därmed känns det som att det kan vara någon form av BIOS-bugg, någon spänning som är för låg i vissa lägen eller liknande.

Är det någon som stött på liknande problem?

Permalänk
Medlem

Kontrollfråga: Du installerade väl om Windows?

Permalänk
Medlem

Min dator startar inte om sig men fryser typ explorer helt random ibland när man bara slösurfar, aldrig hittat vad det beror på.
Verkar dock bli bättre om jag stänger nzxt cam, icue etc direkt datorn startar.

CH 7 wifi, 5800x, 3080 ftw3 ultra.

Permalänk
Medlem

De flesta gångerna jag åkt på liknande problem har det varit minnet och framförallt xmp-profilen/manuell minnesöverklockning som inte fungerat. Det kan ju också vara som ovan beskriver men windows är rätt bra på att fixa det mesta själv nuförtiden...

Permalänk
Medlem
Skrivet av Phod:

Kontrollfråga: Du installerade väl om Windows?

Nej, då det inte handlar om byte av hårdvaru-plattform i någon större grad. Bland de resultat jag hittade när jag sökte runt bland inlägg där folk hade liknande problem var det ingen som sett någon förbättring efter ominstallation av Windows.

För att förtydliga lite så är det Kernel-Power event 41 med alla värden nollade som syns i Event Viewer. Detta sägs indikera att strömmen brutits, inte något mjukvarufel.

Skrivet av Jud1th:

De flesta gångerna jag åkt på liknande problem har det varit minnet och framförallt xmp-profilen/manuell minnesöverklockning som inte fungerat. Det kan ju också vara som ovan beskriver men windows är rätt bra på att fixa det mesta själv nuförtiden...

Dessa timings har fungerat fint på mitt X370-moderkort, vilket rimligen borde ha sämre trace layout än detta nyare kort. TM5 med 1usmus v2-konfiguration har inte visat några fel ännu heller, även om jag absolut bör köra detta längre tid. Det kan absolut vara värt att testa lite lösare timings eller andra relaterade inställningar dock. En lite lustig sak är att datorn vägrar boota (har för mig att memory training misslyckas, men skulle behöva dubbelkolla debug-koden) med Power Down Mode avstängt.

Det handlar förresten inte om frysningar utan snarare som att någon snabbt flippade strömbrytaren.

Permalänk
Medlem

Har liknande problem men inte riktigt. Min dator kraschar i spel efter 5-10 minuter. Så jag börja testa efter hårdvarufel.

1) Ominstallation
2) Nya och gamla grafikdrivrutiner
3) Bytt skärmkabel
4) Bytt skärm
5) Testat ett annat grafikkort (GTX 970) (då är spel stabilt)
6) Testat byta till ett annat nätaggregat som är på 1000 watt
7) Testat ett annan PCI-express-slot på moderkortet
8) Uppdaterat till senaste Bios
9) Senaste AMD chipset drivrutiner
10) Testat ramminnen
11) Bytt vägguttag
12) Testat stänga av XMP-profile

Efter det var jag ganska säker på att grafikkortet var problemet så skickade in det till Inet. Men enligt deras test så fungerade grafikkortet som vanligt med över 4 timmars spel och stresstest.

Stresstestar jag CPUn så är den stabil. Stresstestar jag GPUn så är den stabil.

Corsair 32GB (2x16GB) DDR4 3200MHz CL16
Corsair Force MP510 960GB
be quiet! Dark Rock Pro 4
Gigabyte X570 AORUS ELITE
AMD Ryzen 9 3900X 3.9 GHz 70MB
Palit GTX 2080

Överväger att beställa en Intel-CPU nu ikväll för jag orkar inte med det längre

Permalänk
Medlem

Möjliga fel: För hårda timings XMP, Curve Optimizer, För gammalt BIOS.

Permalänk
Medlem
Skrivet av Fallzone:

Har liknande problem men inte riktigt. Min dator kraschar i spel efter 5-10 minuter. Så jag börja testa efter hårdvarufel.

1) Ominstallation
2) Nya och gamla grafikdrivrutiner
3) Bytt skärmkabel
4) Bytt skärm
5) Testat ett annat grafikkort (GTX 970) (då är spel stabilt)
6) Testat byta till ett annat nätaggregat som är på 1000 watt
7) Testat ett annan PCI-express-slot på moderkortet
8) Uppdaterat till senaste Bios
9) Senaste AMD chipset drivrutiner
10) Testat ramminnen
11) Bytt vägguttag
12) Testat stänga av XMP-profile

Efter det var jag ganska säker på att grafikkortet var problemet så skickade in det till Inet. Men enligt deras test så fungerade grafikkortet som vanligt med över 4 timmars spel och stresstest.

Stresstestar jag CPUn så är den stabil. Stresstestar jag GPUn så är den stabil.

Corsair 32GB (2x16GB) DDR4 3200MHz CL16
Corsair Force MP510 960GB
be quiet! Dark Rock Pro 4
Gigabyte X570 AORUS ELITE
AMD Ryzen 9 3900X 3.9 GHz 70MB
Palit GTX 2080

Överväger att beställa en Intel-CPU nu ikväll för jag orkar inte med det längre

Symptomen du beskriver låter lite annorlunda än de jag upplever. Har inte upplevt problem i spel än så länge. Troligen värt att starta en egen tråd?

Skrivet av Herr Kantarell:

Möjliga fel: För hårda timings XMP, Curve Optimizer, För gammalt BIOS.

Ja, kan testa lösare timings. Curve Optimizer har inte stöd för Zen 2 såvitt jag vet. Har inte rört funktionen i alla fall. Har senaste BIOS med senaste AGESA som AMD släppt.

Permalänk
Medlem

om du kör CAM software för rgb/fläktar så är det känt för denna typ av problem.

Gällande för låg cpu-volt vid låg last så borde du kan testa o sätta cpu volt manuellt - du kanske tappar lite turbo boost, men om datorn funkar klockrent då, så vet du var du ska lägga krutet för felsökningen

// LZ

Permalänk
Medlem
Skrivet av blunden:

För att förtydliga lite så är det Kernel-Power event 41 med alla värden nollade som syns i Event Viewer. Detta sägs indikera att strömmen brutits, inte något mjukvarufel.

Jag borde ha förstått det av ditt första inlägg.

Permalänk
Medlem

Om inget har förändrats på hårdvaru- samt mjukvarumässig nivå den senaste tiden så skulle jag gissa på, baserat på felbeskrivningen, att det är någon spänningsregulator som inte gör som den skall vid låg last(ger för hög/låg spänning kanske?).

Permalänk
Medlem
Skrivet av Tea42BBS:

om du kör CAM software för rgb/fläktar så är det känt för denna typ av problem.

Gällande för låg cpu-volt vid låg last så borde du kan testa o sätta cpu volt manuellt - du kanske tappar lite turbo boost, men om datorn funkar klockrent då, så vet du var du ska lägga krutet för felsökningen

// LZ

Nej, jag kör ingen RGB-mjukvara alls då de precis som du nämner har en rad problem, tar prestanda och är allmänt värdelösa. Bra tanke dock.

Ja, jag funderade på att sätta en positiv offset på vcore och se om det gjorde någon skillnad. Det borde dock egentligen inte behövas. Har också lite andra spänningar jag ska testa justera, exempelvis VDDG IOD, VDDG CCD, etc.

Skrivet av Veni:

Om inget har förändrats på hårdvaru- samt mjukvarumässig nivå den senaste tiden så skulle jag gissa på, baserat på felbeskrivningen, att det är någon spänningsregulator som inte gör som den skall vid låg last(ger för hög/låg spänning kanske?).

Jag misstänker att det är någon spänning eller liknande som är för låg i vissa lägen, alternativt minnesinställningarna som inte är helt stabila. Funderar exempelvis på om jag satt tRFC för lågt exempelvis. Hade dock räknat med en BSOD eller nåt då snarare, alternativt minnesfel i TM5.

Permalänk
Medlem

@blunden låter som att du ändrat andra inställningar på t.ex minnen? Min känsla är att marginalerna är sjukt små. Så kanske läge att köra en load defaults, slå på XMP och spara BIOS o se om maskinen rullar som den ska?

// LZ

Permalänk
Medlem
Skrivet av Tea42BBS:

@blunden låter som att du ändrat andra inställningar på t.ex minnen? Min känsla är att marginalerna är sjukt små. Så kanske läge att köra en load defaults, slå på XMP och spara BIOS o se om maskinen rullar som den ska?

// LZ

Det enda jag gjort är att ändra tRFC2 och tRFC4 från de inställningar jag hade förut med mitt tidigare X370-moderkort. Däremot kan diverse spänningar och subtimings som jag inte tillåts kontrollera kanske få andra standardvärden än tidigare.

Ja, det kan vara värt att backa till XMP-profilen ett tag ur felsökningssyfte. Jag har dock aldrig kört med den profilen tidigare, även när jag hade min 1800X så jag vet egentligen inte hur stabil den är heller. Förmodligen får jag helt enkelt testa diverse olika minnesinställningar, spänningsvärden etc. och se om det gör någon skillnad.

Permalänk
Medlem

Efter att ha experimenterat med en rad olika inställningar verkar det som att problemet kanske är löst. De ändringar som jag gjort sedan jag skrev här senast är att ställa tillbaka vissa drive strength-inställningar till Auto, vilket resulterade i att AddrCmdDrvStr och CsOdtDrvStr ökades från 20 Ohm till 24 Ohm, samt höjde tRFC (och lät moderkortet justera tRFC2 och tRFC4) från 345 till 351. Än så länge har datorn klarat sig bra i 3 dagar med blandad last utan omstarter.

Permalänk
Medlem
Skrivet av blunden:

Efter att ha experimenterat med en rad olika inställningar verkar det som att problemet kanske är löst. De ändringar som jag gjort sedan jag skrev här senast är att ställa tillbaka vissa drive strength-inställningar till Auto, vilket resulterade i att AddrCmdDrvStr och CsOdtDrvStr ökades från 20 Ohm till 24 Ohm, samt höjde tRFC (och lät moderkortet justera tRFC2 och tRFC4) från 345 till 351. Än så länge har datorn klarat sig bra i 3 dagar med blandad last utan omstarter.

Fint. Hoppas det håller i sig 👍

En sak många inte tänker på att kolla när sådan här fel händer är uppdateringar från Microsoft.
Det är alltid värt att kolla upp. Det och spänningsfall på cpu.

Permalänk
Medlem
Skrivet av SCORPIUS:

Fint. Hoppas det håller i sig 👍

En sak många inte tänker på att kolla när sådan här fel händer är uppdateringar från Microsoft.
Det är alltid värt att kolla upp. Det och spänningsfall på cpu.

Ja, OS-uppdateringar kan givetvis påverka men i detta fall visste jag att inga uppdateringar hade installerats efter bytet av moderkort men innan problemet uppstod. Jag testade dock att installera de senaste frivilliga uppdateringarna också utan att det gjorde någon skillnad.

Håller dock med om att det är värt att kolla upp generellt som en del av felsökningen.

Upptiden tickar strax över till 4 dagar så fortsätter att vara försiktigt optimistisk.