Program för o bevaka hårddiskens hälsa?

Permalänk
Hedersmedlem

Program för o bevaka hårddiskens hälsa?

Jag har en hårddisk på 8TB där jag lagrar mina Plex filer, och vill gärna hålla koll på hårddiskens "hälsa". Finns det på något sätt man kan få reda på om en hårddisk börjar krascha så att man kan ta backup på det innan all data försvinner?

Observera att jag inte vill köra raid backups eller molnlagring etc, utan jag vill bara i god tid få reda på om hårddisken mår dålig, så att jag kan börja föra över filerna till en ny hårddisk och sedan ersätta den dåliga hårddisken.

Permalänk
Medlem

CrystalDiskInfo tycker jag funkar bra

Visa signatur

Desktop: | Win10 | InWin 303 | ASUS TUF X570 | AMD Ryzen 5 3600 | Noctua NH-U12S (PP) | Intel 600p 256GB | Gigabyte GTX 670 | 32GB DDR4 2400Mhz | Corsair RM650x | 3x 1080 Screens |
Datacenter: | 1x Physical | 1x Virtual |
Laptop: | 2x |

Dell Certified Technician

Permalänk
Medlem

varför inte skaffa 8TB-disk nr 2 redan nu och göra en spegelbackup?

SMART ger förvisso en hint när en disk är på väg att ramla - men långt ifrån 100% varning i förtid, närmare 50% snarare...

Sedan finns det andra felgrejor som kan ge sudden death - (disk)kontrollerfel som dyker upp en dag, du tappade disken i golvet när skivorna fortfarande snurrade - den typen av felen så kan förvisso en diskräddningsföretag läsa ut i flesta fall med mindre filförluster, men till en kostnad av flertal 8 TB-diskar. Bättre att skaffa en enda sådan 8 TB-disk redan idag och göra spegelbackup nu...

Permalänk

@Phat^Trance: Som @xxargs skrev så finns det inte något som kan ge dig varning i förtid, snarare berätta vad som inte fungerar när hårddisken kraschat. Enda sättet att skydda sig mot dataförlust är back-up, vare sig du vill eller inte

Visa signatur

Moderkort: ASUS ROG MAXIMUS X CODE CPU: i7 8700K @ 4.8 GHz Kylare: Phanteks PH-TC14PE Svart Minnen: Corsair Vengence LPX 4x8 GB GPU: Asus GeForce GTX 980 TI med EVGA Hybrid cooler PSU: Corsair AX 850W 80+ Gold Lagring: Samsung 960 EVO 500GB M.2 + 2 x 2 TB WD Green RAID0 Chassi: NZXT H2 Svart OS: Windows 10

Permalänk
Medlem

Skulle tro att du kan hitta något som kanske kan ge dig en hint om du har tur, men en disk kan rasa när som och jag tror inget program kan hjälpa dig att förutspå detta, samt om du har ett program som varnar för att disken är dålig så är det ju inte säkert att du kan rädda datan på denna om den redan blivit dålig.

Visa signatur

Main
MOBO: Gigabyte B550M DS3H, CPU: AMD Ryzen 5 5600, RAM: 2x16B @ 3600MHz, GPU: RADEON RX5700 Flashat till XT, SSD: WD BLACK SN750 SE 1TB nVME, 2x1TB Sata SSD Chassi, : Fractal Design Node 804, PSU: Corsair RM1000e, Skärm: Philips 27M1N3500LS.

Permalänk
Medlem
Skrivet av Phat^Trance:

Observera att jag inte vill köra raid backups eller molnlagring etc, utan jag vill bara i god tid få reda på om hårddisken mår dålig, så att jag kan börja föra över filerna till en ny hårddisk och sedan ersätta den dåliga hårddisken.

Om detta vore så enkelt så hade det inte funnits dussintals med backup-lösningar och recovery-företag som räddar diskars innehåll. Hade du hittat en lösning som med 99.999% säkerhet kunde säga "när" en HDD håller på att rasa, hade du kunnat sälja det till alla företag/personer för bra pengar, då de hade sparat miljoner på backuplösningar/RAID mm.

Du kan använda SMART info att övervaka och hoppas hitta problem innan de sker. Men även vid en enda sektorfel kan du mista data, även om disken i sig fungerar kanon i övrigt i 2 år till. Och det kan vara så att när du väl upptäcker att disken har mekaniska problem, är det försent att ens kopiera 8TB data, vilket trots allt tar lite tid (typ 20-25 timmar iaf med fullt fungerande disk), och HDDs kan dö på <1 dag från fullt okej, till "dead".

Så tänk om, tänk rätt.

Permalänk
Medlem

Visst finns det information som kan antyda om att något är på väg att gå fel, inget 100% givetvis. Exempelvis reallocated sectors count kan ge en ganska klar indikation om att något är på väg åt fel håll.

Du behöver inte krabba till det med raid för att få backup på det du har på disken. Sen så är väl raid bra i sig men då görs det bäst med hårdvara (hårdvarukontroller).

Exempelvis kan du köra windows inbyggda backupverktyg, välj det som ska sparas och vart det ska sparas så kan det göras automatiskt med jämna mellanrum. Eller så kan du säkert lägga till någon schemalagd aktivitet för samma sak, eller som är föreslagit en spegling av disken som även det görs i windows (vet inte riktigt vad skillnaden är mellan spegling och vanlig raid1).

Sen kan du ju köra veeam free för en lite mer seriös lösning, tror dock inte deras smutta backup av enbart det som förändrats ingår i free (kanske finns något annat verktyg som klarar det).

Köpa någon nas och köra något backup mot den är ju också ett alternativ.

Visa signatur

You have earned my respect and my friendship.

Permalänk
Medlem

backup, backup, backup - och dessa skall förvaras urkopplad och undanlagd mellan backuptillfällena - dvs inga sladdar alls inkopplade - helst skall man köra 2 diskar - typ varannan gång, aldrig samtidigt någonsin. då har man också en chans kvar om den sista backuppen råkade vara ransomware-krypterad och det upptäcks först efteråt..

Helst skall man ha filsystem på dem som möjliggör skrivskyddad snapshot mellan backuperna.
det skall tydligen gå men verkar bökigt att få till i windows:

https://cloud.google.com/compute/docs/instances/windows/creat...

om det går att göra multipla snapshot på samma disk och det bara fyller på med det som ändras på backudisken kan jag dock inte se av detta.

varför - åska och ransomvare är motivationen!

---

Med en RPI4 är förutsättningarna större att göra nätverksbasera lösning/NAS än med tidigare RPI och där använda bättre och tåligare filsystem än NTFS och med snapshot - men även här skall alla sladdar kopplas ut mellan backupperna - nätverkssladden också!!

Den som har sett hur det spottar decimeterlängder av ljusbågar i äldre vägguttagen utan petskydd vid åsknedslag på luftledningar (jag har gjort det) vet att förvaring bör läggas minst en halvmeter ifrån allt elektriskt och alla el-ledare...

Permalänk
Medlem

Hej
Självklart finns det massor av nyttiga programvaror och använda sig av för att övervaka sina diskar.
Sitter man fysiskt framför datorn, rekommenderar jag dessa program för windows.

HWiNFO64
CPUID HWMonitorPro
AIDA64 Extreme
CrystalDiskInfoDiskCheckup

Många av dessa program gör mer än bara kollar diskens hälsa.
Men jag antar här att de är över distans du vill ha kontroll över disken / diskarna?
Så t.ex. du åker till jobbet och disken stannar kvar hemma 😋 ?

Då kan jag varmt rekommendera Pulseway Manager.
Pulseway är helt gratis, krävs dock att du skapar konto.
Pulseway skickar notiser till mobilen så länge du har appen installerad.
Skulle något hända när du inte är hemma kan du stänga ner datorn via pulseway,
och ta hand om det allt när du kommer hem.
Du har väldigt stor kontroll över ditt windows med hjälp av pulseway.
Dom har även Two Factor Authentication 😁

Ser ut så här

Visa signatur

[ Fractal Design Define S Svart ] [ ASUS ProArt X670E-Creator WIFI ] [ Amd Ryzen 9 7950x3D ]
[ G.Skill Trident 64GB DDR5 6000MHz ] [ Noctua NH-D15 Chromax Black ]
[ Western Digital Black SN850X 1TB Gen4 ] [ Samsung 870 QVO 2TB MZ-77Q2T0BW ]
[ ASUS TUF GeForce RTX 3080 10GB Gaming OC ]
[ Corsair AX860 80 Plus Platinum ] [ Gigabyte 32" M32U IPS 4K 144 Hz HDMI 2.1 ]

Permalänk
Medlem

Har haft diskar som vägrar gå igenom smart tester men ändå är omöjliga att provocera fram fel på (läs / skrivfel eller fel cheksum i ZFS), andra diskar har lagt av ruskigt fort och då är det verkligen inte tid att göra backup.

Om disken dessutom börjar bli skum, hur vet du att datan du läser av inte är korrupt?

Smart är bra för att hålla reda på snurr timmar, temp, om disken börjar dumma sig, göra lite självtester etc men backup är det som gäller om data betyder något.

Edit: jag lagrar mina data på en liten filserver som har två diskar speglade, med ZFS. ZFS är ett filsystem som aktivt motverkar bitröta över tid då allt verifieras mot en cheksum. Maskinen har även ECC minne. Denna maskin får nån gång ibland (lägger inte så enormt mycket ny kritisk data på den) en backup på disk jag förvarar på annan fysisk/geografisk plats, även denna med ZFS för att kunna se om något blivit korrupt. Samt att jag har en disk sovandes i burken som jag kan kicka igång och mounta för att väldigt fort spara en extrakopia av något utan fysisk närhet. Filsystemet får snapshots gjorda då och då för att hindra bekymmer om jag skulle gå filer krypterade eller om jag själv är ett klantarsel.

Inte 100% säkert men mycket bättre än mina tidigare lösningar. Många filer finns även duplicerade på andra datorer. Skulle något så allvarligt inträffa att jag förlorar alla dessa kopior så är problemen i livet av sån karaktär att gamla foton är sekundärt från överlevnad.

Kostnad?

En "fådd" gammal workstation med 4gig ECC ram och nån gammal core 2 quad. Två seagate ironwolf diskar och lite pensionerade diskar för cold storage.

Visa signatur

En del av mina bildlänkar hostas på egen maskin, är bildlänkarna trasiga, ha tålamod.

Permalänk
Medlem

S.M.A.R.T. = Self-Monitoring Analysis and Reporting Technology.

Om smart börjar bete sig konstigt bör disken bytas ut direkt då disken är på väg och ge upp,
dvs den är inne på sina sista dagar. Använd denna tid till att flytta datan från disken.
Håller med dig ZFS är ett trevligt filformat, använder själv xfs mestadels då den större delen av min media finns på min linux server.
Dock spelar de ingen större roll vad för filformat disken använder sig av, börjar disken ge upp så behövs det en ny disk. Smart ger dig mycket nyttig diagnostik, och det som pulseway har i sin programvara är väldigt händigt och ha speciellt om man inte är hemma hela tiden, då programmet skickar ut notiser till dig om något skulle fela med disken, då kan man simpelt skicka ett kommand i pulseway att stänga av systemet, för att undvika ytterligare skada på disken / diskarna.
Backup är något alla som bör ha och det skall ej ersätta S.M.A.R.T.

stavning -.-"
Visa signatur

[ Fractal Design Define S Svart ] [ ASUS ProArt X670E-Creator WIFI ] [ Amd Ryzen 9 7950x3D ]
[ G.Skill Trident 64GB DDR5 6000MHz ] [ Noctua NH-D15 Chromax Black ]
[ Western Digital Black SN850X 1TB Gen4 ] [ Samsung 870 QVO 2TB MZ-77Q2T0BW ]
[ ASUS TUF GeForce RTX 3080 10GB Gaming OC ]
[ Corsair AX860 80 Plus Platinum ] [ Gigabyte 32" M32U IPS 4K 144 Hz HDMI 2.1 ]

Permalänk
Medlem

SMART har med statistiskt från bl.a google bara förvarnat i tid ca 50% av alla haverier (siffra ur minnet, har inte dubbelkollat) med andra ord finns det rätt många fall diskar bara försvinner plötsligt från systemet eller säger allt är finfint men egentligen söla ned systemet enormt genom att varje läsning helatiden måste rättas av RAID - utan att det registreras i SMART - andra fall inget står i SMART fast diskarna total-hänger sig när de stöter på skadad sektor och inget syns heller efter omstart och man kan upprepa det. Har haft 3 sådana fall.

Så nej, man kan inte lita på SMART att de tar alla fellägen, långt ifrån, man får också titta på ev. RAID har kastat ut disk och prestandatestmätning och titta på en disk är mer upptagen (busy) än vanligt och om det är skillnad från tidigare mha. statistisk kartläggning över längre tid.

Hängd disk brukar bli utkastade ur en RAID så det gäller att meddelandet når den som handhar server, disken som fördröjde alla diskaktiviteter med omskrivningar av datat hade kunna tagit på dess 'busy' avviker väldigt från de andra diskarna i RAID:n och att datatrafiken var låg trots konstant upptagen (det kan vara så med mycket sökningar men då bör alla diskarna inom RAID vara något så när lika i avseende 'busy' och inte bara en disk). Men då kräver man en högre ordning övervakning som med SMART och andra systemmässiga informations-källor inser att det är något lurt med systemet och bör flaggas.

Att bygga den regelverket utan att det ger falska positiv är inte helt enkelt och en av de mer säkra ställena i Linux är förmodligen att sila 'dmesg' (från linux-kärna) och titta efter när det börja dyka upp (S)ATA-relaterade saker som avviker från normala flödet då när jag hade disken som hela tiden hade läsfel och RAID hela tiden rättade (utan att något av det registrerades i SMART) så formligen välde det med texter med åtgärder som gjordes mot disken hela tiden och hade varit lätt att fånga upp den vägen.

Hur man gör motsvarande i windows - ja det får någon annan fundera över.

Permalänk
Medlem
Skrivet av xxargs:

SMART har med statistiskt från bl.a google bara förvarnat i tid ca 50% av alla haverier (siffra ur minnet, har inte dubbelkollat) med andra ord finns det rätt många fall diskar bara försvinner plötsligt från systemet eller säger allt är finfint men egentligen söla ned systemet enormt genom att varje läsning helatiden måste rättas av RAID - utan att det registreras i SMART - andra fall inget står i SMART fast diskarna total-hänger sig när de stöter på skadad sektor och inget syns heller efter omstart och man kan upprepa det. Har haft 3 sådana fall.

Så nej, man kan inte lita på SMART att de tar alla fellägen, långt ifrån, man får också titta på ev. RAID har kastat ut disk och prestandatestmätning och titta på en disk är mer upptagen (busy) än vanligt och om det är skillnad från tidigare mha. statistisk kartläggning över längre tid.

Hängd disk brukar bli utkastade ur en RAID så det gäller att meddelandet når den som handhar server, disken som fördröjde alla diskaktiviteter med omskrivningar av datat hade kunna tagit på dess 'busy' avviker väldigt från de andra diskarna i RAID:n och att datatrafiken var låg trots konstant upptagen (det kan vara så med mycket sökningar men då bör alla diskarna inom RAID vara något så när lika i avseende 'busy' och inte bara en disk). Men då kräver man en högre ordning övervakning som med SMART och andra systemmässiga informations-källor inser att det är något lurt med systemet och bör flaggas.

Att bygga den regelverket utan att det ger falska positiv är inte helt enkelt och en av de mer säkra ställena i Linux är förmodligen att sila 'dmesg' (från linux-kärna) och titta efter när det börja dyka upp (S)ATA-relaterade saker som avviker från normala flödet då när jag hade disken som hela tiden hade läsfel och RAID hela tiden rättade (utan att något av det registrerades i SMART) så formligen välde det med texter med åtgärder som gjordes mot disken hela tiden och hade varit lätt att fånga upp den vägen.

Hur man gör motsvarande i windows - ja det får någon annan fundera över.

@xxargs
Missförstår jag dig nu eller påstår du att en RAID skulle vara mer pålitligt än vad S.M.A.R.T. är?
Jag hoppas du känner till att RAID inte är något som används för stabilitet.
JBOD är mer stabilt än vad en RAID är, dock så fungerar SHR väldigt bra, körde med det ett par år.
Men man utgår inte om disksens hälsa eller stabilitet via vad en RAID ger för statistik ang disken.

Sen så om du läser vad TS skrev så ser du att jag gick efter det.
TS bad om disk översikt, ang hälsa på distans, dvs över internet inte enbart lokalt.
TS informerade även att han EJ ville använda nån form av RAID / molnlagring,
utan TS var ute efter att ha uppsikt över sin diskar, för att inte bli av med sin media.

Så varför gå vidare med något som TS inte är ute efter?

Och nej S.M.A.R.T. är inte kopplat till google 😑
S.M.A.R.T. kan användas utan att ens vara uppkopplad....

stavning
Visa signatur

[ Fractal Design Define S Svart ] [ ASUS ProArt X670E-Creator WIFI ] [ Amd Ryzen 9 7950x3D ]
[ G.Skill Trident 64GB DDR5 6000MHz ] [ Noctua NH-D15 Chromax Black ]
[ Western Digital Black SN850X 1TB Gen4 ] [ Samsung 870 QVO 2TB MZ-77Q2T0BW ]
[ ASUS TUF GeForce RTX 3080 10GB Gaming OC ]
[ Corsair AX860 80 Plus Platinum ] [ Gigabyte 32" M32U IPS 4K 144 Hz HDMI 2.1 ]

Permalänk
Medlem

@Zidincy

Kanske missförstånd

Jag hävdar inte att RAID på något sätt skulle vara bättre ä SMART, och Jbod är den formatet jag blivit av med stor mängd data (16TB) som förmodligen hade klarat sig om det hade varit i en RAID-array med paritet - nu var det backup men tar ändå tid att återställa

Mitt inlägg försöker utveckla att SMART tar inte upp alla fellägen som finns - det är rätt stora hål att det missas och man förlorar sin disk utan att det ger någon notis alls innan.

Dom diskarna som hängde sig satt förvisso i RAID, men hade dessa varit singel-diskar så hade jag förlorat datat utan en endaste liten varning innan.

Den disken som hela tiden gjorde fel hade som singeldisk inneburit förlorade data och ingenting alls hade synts i SMART som aldrig uppdaterades

Vad jag försökte få fram var att man inte kan lita på SMART och tror att de ta dom flesta felen utan man behöver input från fler källor som bedöms och sedan kan skickas.

Att skanna vad dmegs meddelar i linux gäller för alla (s)ata-diskar i nivån innan användning singeldisk eller RAID är bestämd

Skulle man kombinera SMART-värde och tex. en filtrerad dmesg då om en massa (s)ata events plötsligt dök upp så kanske man skulle få från 50% till 80% chans till förvarning om problem innan man står inför ett faktum.

Det var egentligen detta jag ville få fram.

Permalänk
Medlem

StableBit Scanner

Skickades från m.sweclockers.com

Permalänk
Medlem

Använd ett filsystem som kan övervaka data så som ZFS, använd SMART för att få en tidig indikation på havererande diskar men förlita dig inte på reaktiv backup. Ha redundans lokalt och i backup så att du klarar att förlora en disk utan att riskera data lokalt, och kontinuerlig backup så du klarar av att förlora all data lokalt. Beroende på hur redundant data är lokalt kan ”kostnaden” att hämta från backup göras högre med exempelvis låg bandbredd, fysiskt otillgänglig eller i rena pengar så som Amazon Glacier.

I stort handlar det om värdet AB datat.. är det ovärdeligt och ska lagras över väldigt lång tid eller något som är enkelt återskapat.. allt är en avvägning..

Skickades från m.sweclockers.com

Permalänk
Medlem

@xxargs
Det verkar som du har haft en väldig otur med de konfigs du har gjort.
Jag har själv aldrig haft något större problem med nån disk jag haft.
Jag har enbart behövt byta diskar pga dom blivit för små
Har en disk i min test server just nu som hängt med ett tag och den mår prima.
( gissa vart min statistik kommer ifrån 😁😋? )

Du kanske inte borde köra raid, om du får så mycket problem?
Jag har själv kört SHR, RAID0, RAID 5, aldrig haft nån disk / array som krashat.
Dock så gav min synology upp, och jag tappade ca 8TB, men jag tog hand om nasen efter ca 1 år.
Tröttnade på att vara 8TB fattig.
Så jag fick tillbaka min data, nu kör jag inte Synology längre ^^

Måste säga att de väldigt underligt att du ej fått ut rätt data från S.M.A.R.T.
Vad kör du, hård eller mjuk konfig för raids?

Visa signatur

[ Fractal Design Define S Svart ] [ ASUS ProArt X670E-Creator WIFI ] [ Amd Ryzen 9 7950x3D ]
[ G.Skill Trident 64GB DDR5 6000MHz ] [ Noctua NH-D15 Chromax Black ]
[ Western Digital Black SN850X 1TB Gen4 ] [ Samsung 870 QVO 2TB MZ-77Q2T0BW ]
[ ASUS TUF GeForce RTX 3080 10GB Gaming OC ]
[ Corsair AX860 80 Plus Platinum ] [ Gigabyte 32" M32U IPS 4K 144 Hz HDMI 2.1 ]

Permalänk
Medlem

Har varit mjuka RAID - men det beror på att diskarna helt enkelt inte hade förmågan att skriva till RAID och uppdatera och därför var situationen bortglömd igen vid nästa OFF/ON - på WD-RED kan det hända när den hamnar på sektorer den inte kan läsa (varför vet jag inte men kan ha samband med tidigare strömavbrott) - och haft det 2 ggr på 2 olika exemplar diskar vid olika tillfällen och den green som hela tiden läste fel men svarade korrekt vid varje rättningsskrivning (i RAID5) men läste fel igen vid nästa försök - hade förmodligen samma problem att den inte kunde skriv/uppdatera SMART och eventen bortglömd vid nästa strömcyckling

Men det fanns inget läsbart i SMART innan heller medans den slöade med hela RAID och det enda man såg var hur det kräktes ATA-event på dmesg och därför också vet exakt vad den gjorde med läsningar och skrivningar då det är i stort sett en löpande debug-beskrivning vad som exakt gjordes. därav har jag lärt mig SMART kan man inte lita på enbart i en diskövervakning - man måste ha multipla källor.

---

Har dock aldrig förlorat data i dessa fall - dels för att det satt i RAID1, och RAID5 och när det var den stora haveriet på Jbod så var det självförvållat, men efter detta så kommer jag alltid ha RAID med paritet (eller i dubbel separat upplaga) i någon form iom. att det väldans tid att ladda tillbaka 16 TB över nätverk... skall man köra RAID0 för snabbhet bör man tänka på att man kan hantera situationen när ena disken bestämmer sig för att fallerar, likaså i Jbod.

Men kan också säga att när jag slutade att köpa nya WD-diskar så har allt blivit lugnare (WD-RED och gamla WD-GREEN) när det gäller konstiga haverier som inte satte några som helst spår i och via SMART. Seagate och Toshiba har skött sig riktigt bra, faktiskt, likaså HGST fast en del av dem börja närma 4-5 årsgränsen i 24/7-drift