Permalänk
Medlem

Data borta RAID 1

Körde en dator med två diskar (2TB) i RAID 1 och en tredje som system disk (Centos 6.5).
Men så började internet krångla och 300GB försvann, dessutom verkar internet ha fuckat (får ip address men kan inte pinga något, fick stoppa in ett nätverkskort).

Vad beror detta på? Ska jag bara skrota diskarna?
Anses 12000 respektive 19000 timmar drift ens mycket på diskar?

Permalänk
Medlem

Möjligen har du HW-fel på mobot - i varje fall på nätverkskretsen enl. din beskrivning - frågan är om det även finns HW-fel på annat håll. Kan möjligen bero på nätagget.

Permalänk
Hedersmedlem

Med tanke på spinup-fel på två helt olika diskar så hade jag också kollat nätagget först.

Visa signatur

W10, Intel 5820K, Asus X99-S, Crucial DDR4 2133MHz 32GB, Sapphire 290X Tri-X, Intel 730 SSD, WD Black+Green+HGST, Silverstone FT02, Corsair AX1200, Corsair K90, Logitech MX518, Eizo 2736w, Eaton 5115 UPS. Pixel 7 pro

Permalänk
Medlem

Ang diskarna, din 12k tim disk ser ut att ha misshandlats i sina dagar. Den är kanske inte helt pålitlig idag. Men den visar inga "jag håller på att krascha NU" syndrom.
Du kan se G-sense har enorma mängder "rapporteringar", samt den börjar får load retry/calibration retry och lite andra små fel. Program fail count indikerar att den fått problem att skriva ibland och fått göra om det (och då lyckats). Den kan hålla länge till, men kan också vara på väg att ge upp. Du bör hålla koll på dessa värden, om de ökar så är det dags att byta.

19k tim disken ser frisk ut dock.

finns hårddiskar som klarar 50k tim, men normalt idag brukar vara ca 20-25k timmar innan det är dags att se efter ett byte. Det som ofta sker med dessa är att de en dag bara slutar spinna (eller inte kan spinna i rätt RPM och disken försöker spinna upp och ner hela tiden). Motorn är helt enkelt sliten.
Dock litar jag mer på en disk som start/stoppats få gånger och bara kontant kört många timmar, än en disk som startat och stoppat 50000 gånger.

Ang felet i sig, eftersom det påverkar 2 olika diskar, är det nog en annan felkälla (som andra i tråden påpekat).

Permalänk
Medlem
Skrivet av jookeer:

Möjligen har du HW-fel på mobot - i varje fall på nätverkskretsen enl. din beskrivning - frågan är om det även finns HW-fel på annat håll. Kan möjligen bero på nätagget.

Skrivet av MultiMan:

Med tanke på spinup-fel på två helt olika diskar så hade jag också kollat nätagget först.

Skrivet av Paddanx:

Ang felet i sig, eftersom det påverkar 2 olika diskar, är det nog en annan felkälla (som andra i tråden påpekat).

Diskarna har väl suttit i en mängd olika datorer. Nätagget är Dell 80+ Gold (troligtvis gått 24/7 sedan 2011), skulle kunna byta till ett annat men dom andra har nog gått mer. Känns lite svårt att felsöka?

Felen på diskarna kan väl ha legat där länge? Båda har nog varit med på äventyr.

Permalänk
Medlem
Skrivet av spel565:

Diskarna har väl suttit i en mängd olika datorer. Nätagget är Dell 80+ Gold (troligtvis gått 24/7 sedan 2011), skulle kunna byta till ett annat men dom andra har nog gått mer. Känns lite svårt att felsöka?

Felen på diskarna kan väl ha legat där länge? Båda har nog varit med på äventyr.

Om du ska köra med begagnade diskar hade jag nog endast kört ZFS och FreeNas eller motsvarande i Linux med ZFS. Det tål ev udda fel på diskarna betydligt bättre och hanterar även läs/skriv fel utan att tappa RAIDen om du kör tex RAIDZ1 osv.

Permalänk
Medlem
Skrivet av Paddanx:

Om du ska köra med begagnade diskar hade jag nog endast kört ZFS och FreeNas eller motsvarande i Linux med ZFS. Det tål ev udda fel på diskarna betydligt bättre och hanterar även läs/skriv fel utan att tappa RAIDen om du kör tex RAIDZ1 osv.

Är det så överlägset över ext4 och xfs?

Permalänk
Inaktiv
Skrivet av spel565:

Är det så överlägset över ext4 och xfs?

Det ända vettiga valet idag om man bryr sig om sin data är ZFS och då RAIDZ2 eller hellre RAIDZ3 (RAIDZ är INTE säker med dagens storlekar på diskar). Checksum av all data är imponerande användbart då det skyddar mot alla sorters skumma fel på både diskar och kontrollers. Det man ska dock komma ihåg är att man bör (snarare SKA) köra med ECC minne. Fel i RAM som sabbar checksum som ligger i den kommer ge otrevliga resultat.

Det som oftast verkar döda diskar är power up coh spin up. Jag har diskar som har snurrat i 35k timmar men har bara 120 uppstarter. Fungerar utmärkt ( i för sig är det RE4 diskar). För lagring är det säkrast att bara låta skiten spinna 24/7.