Ubuntu fryser slumpmässigt, Windows fungerar perfekt.

Permalänk
Medlem

Ubuntu fryser slumpmässigt, Windows fungerar perfekt.

Jag har en äldre burk som jag vill köra Ubuntu på. Har försökt med några års mellanrum, men oavsett vilken version av Ubuntu jag kör, verkar den frysa slumpmässigt.
Kör jag Windows på maskinen tuggar den på hur bra som helst, inga problem att få flera dagars uptime, så hårdvaran verkar det inte vara något fel på.

Jag blir inte klok på när den fryser heller. T ex, jag kan starta den och köra Rocket League en halvtimme, men fem minuter efter jag avslutat så fryser den. En annan gång fryser den bara ett par minuter efter inloggning. Det verkar inte alls relaterat till last.

När den fryser, då menar jag helfryser. Går inte att nå via ssh, tangentbordet ger ingen respons, muspekaren går inte att flytta.

Hårdvara:
Gigabyte P55-USB3 - Har prövat att uppgradera till senaste bios utan skillnad.
Intel i5 760
Geforce GTX 670 2GB
4x4GB 1600MHz DDR3 - Inga fel i memtest
2x Samsung 830 - En till Windows, en till Ubuntu
IDE DVD/RW

Har försökt köra tail på kernel-loggen, dmesg-loggen och sysloggen utan att se något särskilt.
Hade så gärna felsökt vad det är som händer, men utan att se något i loggarna eller något sätt att trigga felet är det väldigt svårt att felsöka.

Finns det någon mer logg jag skulle kunna titta i? Något bättre sätt att debugga vad som händer?

Visa signatur

Arch | 1440p 165Hz IPS | 7800X3D | 1080ti | 64GB@6GHz | SN850 2TB

Permalänk
Medlem

Det blir nog svårt att lista ut det, men skulle jag gissa på något så är det nog moderkortet som inte gillar Ubuntu. All annan hårdvara du listar ska fungera i Linux.

Har du prövat med en annan dist som inte är Ubuntu-baserad? Du skulle ju kanske testa Debian som Ubuntu är baserad på. Skulle du få samma fel i Debian kanske du skulle testa Arch eller Manjaro som inte bygger på Debian alls. Jag vet, det är jobbigt att byta dist, men det är nog det enda jag kan föreslå att testa med.

Visa signatur

ASUS ROG STRIX B450-F GAMING - AMD Ryzen 5 3600 3.6 GHz 35MB - Cooler Master - Hyper 212 Black Edition - Corsair 16GB (2x8GB) DDR4 3200Mhz CL16 Vengeance LPX - Kingston A2000 500GB M.2 NVMe - Fractal Design Define C Svart - 2 X Noctua NF-P14s redux-1200 140mm PWM - Corsair RM650X 650W v2 - ASUS GeForce GTX 1060 6GB DUAL OC - Raijintek Morpheus II Heatpipe VGA Cooler - 2 X Noctua NF-P12 120mm PWM - OS Debian 10 Stable

Permalänk
Medlem

@sniglom:
Har du testat en annan SSD/HDD ? Det är enda skillnaden mellan Windows och Ubuntu i hårdvara.

Fungerar den utan frysningar i Live-USB ?

Visa signatur

CPU: Ryzen 3600 | RAM: 16GB (2x8GB) Crucial | MB: Gigabyte B550M AORUS PRO-P | GPU: RX 6700XT MERC 319 | Chassi: FD Arc mini R2 | PSU: CM700V | SSD: Gigabyte NVMe 1TB | Monitor: LG 27GN800 | Input: CM Quick Fire TK, Roccat Kone Pure Optical, Steam Controller | OS: Garuda Linux

Steam Deck har tagit över datorn :)

Permalänk
Medlem
Skrivet av Lembritt:

@sniglom:
Har du testat en annan SSD/HDD ? Det är enda skillnaden mellan Windows och Ubuntu i hårdvara.

Fungerar den utan frysningar i Live-USB ?

Nej, har inte prövat med annan disk. Skulle så klart kunna pröva att köra live-usb och se vad som händer.

När jag körde smartmon-tools hittade jag ett intressant attribut, som är högre på disken med Linux.
"POR Recovery count" (Power Off Reset) alltså när disken plötsligt tappar ström, exempelvis genom att datorn stängs av vid strömavbrott.
Linuxdisken har 7011, medan Windowsdisken har mer normala 319.

Smart varnar inte, men över 7000 låter väldigt högt. O andra sidan har disken suttit i en väldigt välanvänd macbook i 5 år, så det skulle kunna vara från varje gång datorn öppnats och stängts. Jag får följa dessa värden över tid och se vad som händer. Är det så att Linuxdisken skenar iväg snabbare än Windowsdisken är det definitivt något skumt på gång där.

Edit:
Nej, det verkar inte vara det. Ett par hängningar senare så har båda diskarna ökat precis lika mycket i POR Recovery count.
För att provocera lite extra prövade jag att dra ut sata-kablarna under drift, det fick inte maskinen att hänga sig direkt heller.

Skrivet av Eazy:

Det blir nog svårt att lista ut det, men skulle jag gissa på något så är det nog moderkortet som inte gillar Ubuntu. All annan hårdvara du listar ska fungera i Linux.

Har du prövat med en annan dist som inte är Ubuntu-baserad? Du skulle ju kanske testa Debian som Ubuntu är baserad på. Skulle du få samma fel i Debian kanske du skulle testa Arch eller Manjaro som inte bygger på Debian alls. Jag vet, det är jobbigt att byta dist, men det är nog det enda jag kan föreslå att testa med.

Inte särskilt jobbigt att byta dist, det är en ren installation. Men det hade varit givande att hitta något bättre sätt att logga vad som händer.

Visa signatur

Arch | 1440p 165Hz IPS | 7800X3D | 1080ti | 64GB@6GHz | SN850 2TB

Permalänk
Medlem

Om du tänkt prova med en annan dist vill jag föreslå att du börjar med en minimal installation av Gentoo. Då får du bästa möjliga kontroll på vilka paket som installeras (utan att gå LFS) vilket ökar chanserna att identifiera något som strular. Dessutom kommer du få ett bra hårdvarutest på köpet. Kompileringen av paket är bra på att exponera eventuella fel i hårdvaran (jag har varit med om att memtest varit okej men fått slumpmässiga fel när jag kompilerat program för att minnet varit dåligt). Ytterligare fördel är att om något skulle misslyckas har du loggar du kan kolla på.

Kör en minimal installation från Live USB. Prova sen använda systemet lite endast i CLI, innan du installerar X och någon enklare fönsterhanterare. Förhoppningsvis ger det dig en bättre ide om vad som är fel.

Skulle allting funka kan du prova andra distar. Debian är kanske inte så dumt då det är likt Ubuntu men mer konservativt.

Permalänk
Medlem

Jag hade det motsatta problemet för många år sedan, d.v.s. Linux fungerade fint men Windows frös slumpmässigt. Lösningen den gången visade sig vara att byta ut nätagget, så hårdvarufel kan vara svåra att utesluta även fast ett av OS:en fungerar korrekt.

Permalänk
Medlem

Har börjat i änden med att utesluta hårdvara.

Kopplade ur dvd-enheten, samma sak.
Bytte från nvidia-driver till nouveau, samma sak.
Bytte nvidia-kortet till ett gammalt ati-kort, samma sak.
Hittade en tråd om att nätverkskortet frös systemet i äldre kernels, inaktiverade nätverkskortet, samma sak.

Nollställde bios och det verkar som den slutat hänga sig. Så jag håller på att gå igenom alla mina biosinställningar en och en nu, för att se när den börjar hänga sig igen. Förhoppningsvis är det något specifikt som får den att bete sig illa.

Visa signatur

Arch | 1440p 165Hz IPS | 7800X3D | 1080ti | 64GB@6GHz | SN850 2TB

Permalänk
Medlem

Utan loggar är allt svårt. Finns det några loggar/dumps från någon crash-dump i /var/crash?

https://help.ubuntu.com/lts/serverguide/kernel-crash-dump.htm...

Alternativt så skulle du kunna försöka använda Netconsole för att skicka logg-data över nätverket. Jag har med Netconsole lyckats identifiera instabilitet i ett gammalt överklockat system jag hade, som plötsligt efter flera år börja vara instabilt. Var ditt system överklockat innan du återställde BIOS-inställningarna?

https://wiki.ubuntu.com/Kernel/Netconsole

Sen skulle man kunna använda netdump.

https://linux.die.net/man/8/netdump

Permalänk
Medlem
Skrivet av Exry:

Utan loggar är allt svårt. Finns det några loggar/dumps från någon crash-dump i /var/crash?

https://help.ubuntu.com/lts/serverguide/kernel-crash-dump.htm...

Alternativt så skulle du kunna försöka använda Netconsole för att skicka logg-data över nätverket.

https://wiki.ubuntu.com/Kernel/Netconsole

Sen skulle man kunna använda netdump.

https://linux.die.net/man/8/netdump

Ligger ett par gamla kraschloggar där, för gnome och gdm, men ingen av dagens 10 krascher.
Netconsole kanske är mer effektivt än att taila kernel-log över ssh

Skrivet av Exry:

Var ditt system överklockat innan du återställde BIOS-inställningarna?

Ja, men väldigt lite. Original går turbo för CPUn till 3.33GHz, i Linux körde jag CPUn 3.6GHz. Oklockade ram-minnen. Cpun är god för 4.2GHz med hård last och många dagars uptime i Windows, så det borde finnas massor av marginal.

Det lurigaste är att den nästan aldrig hänger sig vid last, utan idlandes på skrivbordet.
Har provspelat Rocket League i 40 minuter vid 4GHz, men sen kan den hänga sig efter några minuter på skrivbordet.
De slumpmässiga hängningar verkar ske precis lika enkelt oavsett om den kör i 3.6GHz eller 4GHz. Så är den arg på något, verkar det inte vara kopplat till varken frekvens eller last, frågan är vad.

Med det sagt, var det mycket fler inställningar än bara överklockning som var ändrade från default. Så jag slår på en i taget och försöker få den att hänga sig igen.

Visa signatur

Arch | 1440p 165Hz IPS | 7800X3D | 1080ti | 64GB@6GHz | SN850 2TB

Permalänk
Medlem

Jag tror jag hittat felet!
Kollade /proc/cpuinfo och såg hur processorhastigheten rörde sig upp och ner, fastän C-states och turbo är inaktiverat från bios.

En sökning senare har jag lärt mig att i modernare kernlar finns det en drivrutin som heter intel_idle och den kör över vad bios/uefi har ställt för inställningar. Enligt kommentarer i källkoden ska detta både vara effektivare och säkrare mot ACPI-buggar. Det kan jag köpa, men det är frustrerande när man inte vet att detta sker. Detta är inte bara ett problem för överklockare, utan även för serverfarmar, där administratörer vill ha koll över hur processorerna beter sig.

Detta skulle förklara varför jag får problem vid idle men inte vid last. Och varför mina problem är de samma oavsett om jag kör 3.6 eller 4GHz, det är det ständiga hoppandet vid idle som ställer till det och detta sker inte från Windows.

För att kontrollera intel_idle-drivern får man skicka en kernelparameter, vilket jag gör genom /etc/default/grub:
GRUB_CMDLINE_LINUX_DEFAULT="quiet intel_idle.max_cstate=1"

Efter detta så håller sig CPUn sig till den hastighet som är satt och nu har datorn stått och snurrat stabilt på skrivbordet ett par timmar.

Visa signatur

Arch | 1440p 165Hz IPS | 7800X3D | 1080ti | 64GB@6GHz | SN850 2TB