WD RED 3TB - SMART error

Permalänk
Medlem

WD RED 3TB - SMART error

Hallå på er alla sweclockerare,
Jag har en hårddisk som jag börjar bli orolig över, Raw read error rate + Current pending sector känns inte helt okej.
Bifogar en bild: https://i.imgur.com/z8afSWV.png

Är det här något som täcks av garanti, disken är strax över 2 år gammal och som jag fattar det så har WD Red diskarna 3 års garanti.
Hur orolig bör jag vara? (har börjat kopiera allt som är på disken)
Tack på förhand

Visa signatur

Define R4 | Asus z97-Pro Gamer| 4790K ~ 4.6Ghz | Gainward 1080 Phoenix | Corsair Vengeance 2x8GB 1600MHz | Phanteks PH-TC14PE | EVGA SuperNova G2 750W | Samsung 850 Evo 256gb

Permalänk
Medlem
Skrivet av 20kr:

Hallå på er alla sweclockerare,
Jag har en hårddisk som jag börjar bli orolig över, Raw read error rate + Current pending sector känns inte helt okej.
Bifogar en bild: https://i.imgur.com/z8afSWV.png

Är det här något som täcks av garanti, disken är strax över 2 år gammal och som jag fattar det så har WD Red diskarna 3 års garanti.
Hur orolig bör jag vara? (har börjat kopiera allt som är på disken)
Tack på förhand

Inte ovanligt att det dyker upp en eller annan dålig sektor med tiden.

Skriv över hela disken med nollor (eller så) och kör en smart long test och se ifall felet försvinner.

SATA-diskar allokerar inte om dåliga sektorer förrän man skriver till dem.

Dyker det sen upp fler dåliga sektorer inom kort så är det dags för garanti.

Permalänk
Medlem

Det tycker jag inte han ska göra.
Han ska lämna in den bums tillsammans med info från SMART och få en ny omgående.

Permalänk
Medlem

@SAFA @Spiffman Tack för er respons!
Jag har nu hunnit kopiera över allt som var på hårddisken och sen skrivit över all data.
Har precis partitionerat om den och kör nu ett grundligt test med 'Western Digital data lifeguard diagnostics', det tycks ta en stund så får stå över natten.

Visa signatur

Define R4 | Asus z97-Pro Gamer| 4790K ~ 4.6Ghz | Gainward 1080 Phoenix | Corsair Vengeance 2x8GB 1600MHz | Phanteks PH-TC14PE | EVGA SuperNova G2 750W | Samsung 850 Evo 256gb

Permalänk
Medlem

Nu verkar SMART-värdena vara under kontroll men frågan är om disken är pålitlig eller om jag ska försöka få en ny.
Inte helt 100 på hur jag ska tolka 'Warranty' kolumnen, där det flaggas på 3 rader.
https://i.imgur.com/aMOITgu.png

Visa signatur

Define R4 | Asus z97-Pro Gamer| 4790K ~ 4.6Ghz | Gainward 1080 Phoenix | Corsair Vengeance 2x8GB 1600MHz | Phanteks PH-TC14PE | EVGA SuperNova G2 750W | Samsung 850 Evo 256gb

Permalänk
Medlem
Skrivet av 20kr:

Nu verkar SMART-värdena vara under kontroll men frågan är om disken är pålitlig eller om jag ska försöka få en ny.
Inte helt 100 på hur jag ska tolka 'Warranty' kolumnen, där det flaggas på 3 rader.
https://i.imgur.com/aMOITgu.png

Vad jag hittar: Om värdet "value" är mindre än "threshold" på det attribut där det står "warranty" så gäller garantin. Men din disk ser OK ut.

Men håll koll på disken med smart (bör man göra med alla sina diskar då och då) och blir det inte fler dåliga sektorer så är det ok. Har själv ett par WD-red jag gjort ovanstående på och de går än.

Här är ett exempel på en SAS disk som ger upp, SAS diskar testar sig själva med visst intervall och mappar upp ev dåliga sektorer:

Disk-status-2018-09-09:
sdb: SMART Health Status: OK
sdb: Elements in grown defect list: 2725

Fortfarande frisk tycker den... men det ökar så jag vet att den kommer dö snart.

Disk-status-2018-10-21:
sdb: SMART Health Status: HARDWARE IMPENDING FAILURE TOO MANY BLOCK REASSIGNS [asc="5d, ascq=14"]
sdb: Elements in grown defect list: 4096

Permalänk
Medlem

Du har 140 trasiga sektorer och det kommer att växa. Byt den medans du har garanti.
Personligen accepterar jag inte ens "1" reallockerad sektor.

Permalänk
Medlem
Skrivet av Spiffman:

Du har 140 trasiga sektorer och det kommer att växa. Byt den medans du har garanti.
Personligen accepterar jag inte ens "1" reallockerad sektor.

Nej, han har inte 140 reallokerade sektorer, han kör WD Data Lifeguard som visar value/thresh/worst men inte rådata (antalet sektorer):

Så här ser det ut på en felfri 3TB WD disk med linux smartctl:

SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 437 3 Spin_Up_Time 0x0027 177 175 021 Pre-fail Always - 6141 4 Start_Stop_Count 0x0032 099 099 000 Old_age Always - 1402 5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 200 200 000 Old_age Always - 0 9 Power_On_Hours 0x0032 058 058 000 Old_age Always - 31131 10 Spin_Retry_Count 0x0032 100 100 000 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 212 192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 100 193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 1301 194 Temperature_Celsius 0x0022 101 090 000 Old_age Always - 49 196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0

Dold text

Som synes står det 200 200 140 på den också.

Permalänk
Medlem

Korrekt, slarvigt läst av mig.
Hade inte accepterat 14 pending heller

Permalänk
Medlem
Skrivet av Spiffman:

Korrekt, slarvigt läst av mig.
Hade inte accepterat 14 pending heller

Mådä, men TS har 0 pending också vad jag kan se.

Permalänk
Medlem

mystiska att första screenshot visar det men andra är ok... Fullagade wd den och mörkar för TS?

Permalänk
Medlem

Som @SAFA sa så måste du tvinga disken att skriva till sektorerna som är pending i fråga för att veta om dom är dåliga eller ej.

Kör du ett smart självtest brukar den fastna på den första dåliga sektorn och spotta ut sig vilken LBA detta är, det går sedan manuellt tex i linux att skriva till den sektorn och då uppdateras SMART värdena med.

I windows vet jag inte vilket program som är lämpligt. I bland så är sektorn hel ibland kass.

Dock skulle jag nog säga att nåt är fel med din disk för alla diskar läser "fel" hela tiden, enbart Seaget registrerar dessa korrekt under Raw Read Error rate, men även Seaget rapporterar hur många som korrigerades och på en hel disk är talen identiska.

På alla andra fabrikat så som WD rapporteras enbart Raw Read Error Rate OM ett fel ej kunde åtgärdas så det faktum att din disk läser fel och inte kan åtgärda felet tyder på att den är defekt.
Min WD Red 3Tb har inga läsfel efter 22047 timmar av drift.
Varför din är på väg att rasa vet jag inte, kan vara diskens fel eller andra faktorer som dålig nätdel, usel ström i kåken (igen UPS), vibrationer från omgivningen (andra diskar tex), för låga eller för höga temperaturer, det vet jag inte men den disken borde enkelt gå att göra en RMA på om garantin finns kvar.

Har skickat in diskar för mindre, bifogar bara SMART datan med disken.

Permalänk
Medlem

Current pending sector är sektorer som upplevs veka av någon orsak, dessa försvinner inte förrän SATA-disken skriver över dessa sektorer med ny data och är verifieringen OK så är allt glömt och förlåtet, men är området så pass skadat att det inte passerar verifieringen trots flertal försök så kommer sektorerna att reallokeras och position 5 i SMART att räknas upp med motsvarande antal.

Det som blir pending error kan vara saker som att disken knuffades till under skrivningen (eller av vibrationer från grann-diskar som samverkar - bättre NAS och serverdiskar försöker lära sig vibrationerna om det är regelbundet återkommande och försöker kompensera för detta vid skrivning) och skrivhuvudet svansade till (vi pratar om 10 - 100 nm) och gick in lite för långt på grannspåret och gjorde den smalare - detta upptäcker inte verifieringen eftersom läshuvudet sitter ett antal tiotal nm bakom skrivhuvudet och läser in datat som skrevs nyss direkt efter och ser förstås det spåret som skrivhuvudet skriver även om det ålar sig fram under skrivningen.

Vid en läsning senare så kan upplevas att signalen är vek men rättningsbar - både grannspåret som blev friserat i kanten och spåret som skrevs då den blev lite krokig och inte helt täcker läshuvudets område när det passerar senare, dom sektorerna blir markerade som 'pending' i räknaren för current pending sektors

Hade det varit en SAS-disk så hade detta rättats upp automagiskt inom kort tid - men nu är det SATA-disk och då görs inget sådan av sig själv - tacka WD och Tandon för denna ogina filosofi och bakades in i ATA-standarden och sedan kan man inte ändra på det av bakåtkompabilitets-skäl som det heter...

(Seagate och WD var som hund och katt under en period och det här med automatisk rättelse kanske var något som var skyddat i SCSI-standarden med olika patent från Seagates sida)

Seagate har annat sätt att rapportera felaktiga sektorer och raw-värdena läses där som bäst i HEX där de lägsta 4 byten (8 hexsiffror) är antalet sektorer som läst/skrivits (det är det värdet som är lika på flera poster i SMART och räknar upp i lika takt) och de 2 översta byten (4 högsta hexsiffror) är antal inträffade fel - med andra ord är dom 4 högsta sifforna 'noll' så är det inget fel (decimalt är värdena lika eller lägre än 4294967295 så är det inget fel).

Det är nog enormt många som trott att Segate-disken håller på att rasa i expressfart tills man ser orimligheten i siffrorna och att de ändras mycket vid läs och skrivning och mellan varje ny läsning av SMART-värden

Permalänk
Medlem
Skrivet av pa1983:

Som @SAFA sa så måste du tvinga disken att skriva till sektorerna som är pending i fråga för att veta om dom är dåliga eller ej.

Kör du ett smart självtest brukar den fastna på den första dåliga sektorn och spotta ut sig vilken LBA detta är, det går sedan manuellt tex i linux att skriva till den sektorn och då uppdateras SMART värdena med.

I windows vet jag inte vilket program som är lämpligt. I bland så är sektorn hel ibland kass.

Dock skulle jag nog säga att nåt är fel med din disk för alla diskar läser "fel" hela tiden, enbart Seaget registrerar dessa korrekt under Raw Read Error rate, men även Seaget rapporterar hur många som korrigerades och på en hel disk är talen identiska.

På alla andra fabrikat så som WD rapporteras enbart Raw Read Error Rate OM ett fel ej kunde åtgärdas så det faktum att din disk läser fel och inte kan åtgärda felet tyder på att den är defekt.
Min WD Red 3Tb har inga läsfel efter 22047 timmar av drift.
Varför din är på väg att rasa vet jag inte, kan vara diskens fel eller andra faktorer som dålig nätdel, usel ström i kåken (igen UPS), vibrationer från omgivningen (andra diskar tex), för låga eller för höga temperaturer, det vet jag inte men den disken borde enkelt gå att göra en RMA på om garantin finns kvar.

Har skickat in diskar för mindre, bifogar bara SMART datan med disken.

Vad menar du med "usel ström i kåken (igen UPS)". Menar du "ingen UPS" istället för "igen UPS"? Har nyligen fått fel på en disk och datorn sitter kopplad via en UPS. Menar du att en UPS avhjälper usel ström i kåken eller att UPS:en är boven i dramat?

Permalänk
Medlem

Jag tror det menas 'ingen UPS'

Hur eller hur - din disk verkar spinna upp och ned i 2 intervall om dagen (en på morronen, en på kvällen gissningsvis) - att tänka på att man 'spar' inte någon 'hållbarhet' genom att stänga av spindelmotorn - tvärt om, det ökar risken för haveri - varför, kan stavas i stora temperaturcykler.

Hade det varit 2 ggr i veckan så hade man nog kunna köpt det, men 2 ggr om dagen är lite för mycket IMHO.

UPS orsakar inte diskhaverier normalt sett, så länge UPS kan meddela OS och datorn stänger sig av automagiskt innan batteriet är helt slut.

Däremot plötsliga avbrott och medans disken arbetar så kan man - speciellt på WD-RED har jag noterat - få oläsbara sektorer som din scanning med hdtune visar. - så du har nog haft minst 1 'oavsiktlig' plötslig strömavbrott i historien av någon anledning. Den dåliga sektorn som HD-tune hittade nu behöver inte innebära att det finns någon giltig data på den positionen, men det märker du när du kopierar ut filerna - fryser det eller varnar för läsproblem så har du hittat stället...

WD-RED är en NAS-disk, det innebär att den försöker läsa en dålig sektor i mindre än 8 sekunder innan den ger upp då det förväntas att RAID-systemet kort därefter ger en skrivorder med den korrekta datat och disken uppdaterar den oläsbara sektorn till läsbar sektor igen

Desktopdisk är en annan sak - den försöker verkligen att läsa ut datat med många upprepande försök och olika angreppssätt under kanske långt över 30 sekunder eftersom disken är inte tänkt att hantera speglad data utan den är unik och därför måste skottas fram om det finns minsta möjlighet.

Att använda en WD-RED som desktop-disk eller som singeldisk för viktigare data är inte helt optimalt.

---

vad kan du göra:

töm disken och flytta all data till annan media - det skall inte finnas något alls kvar då det kommer att försvinna.

koppla ur alla diskar utom denna disk som du har problem (detta är för att undvika förödande användarmisstag som att man råkade skriva på fel disk och inte den man tänkte, om man är ovan med linux) - med koppla ur så är det samma sak att sladdarna kopplas ifrån diskarna rent fysiskt (eller jobbet görs via diskdocka) utom WD-RED i det här fallet.

Ladda hem en distrubition tänkt för just diskmeck som tex http://www.system-rescue-cd.org/ lägg på en USB eller en DVD-skiva och bota upp detta (det kommer att stanna upp en bit in i boot - skriv '32' för att få svensk tangentbord och det fortsätter)

väl uppstartad gör man först en 'lsblk'

och då får man upp en lista på vilka diskar och partitioner datorn har hittat.

USB-stickan kommer vara en av dem och förmodligen 'sda', din kvarvarande WD-RED förmodligen på sdb och under sdb så ser du förmodligen minst 1 partition och den heter sdb1.

matcha angivna storlek med disken storlek - den bör vara runt 3 TB

för den sista kollen innan man skriver över disken är att mounta disken ifråga med

mount /dev/sdb1 /mnt

sedan kan man starta 'mc' och får en norton/total-commanderliknande gränssnitt, gå ned i /mnt och sedan försäkra dig om att det inte finns några filer kvar som du vill ha kvar - för det är allra sista chansen nu!!

"F10" för att gå ur mc igen

cd /

umount /mnt

och disken är frisläppt igen.

nu kommer man till det som tar bort all gammal data och tvingar disken att skriva varenda sektor igen.

"dd if=/dev/zero of=/dev/sdb bs=1024k status=progress <enter>"

med detta så börjar den skriva från sektor 0 till sektor slut och fyller disken med '0' hela vägen till sista sektorn

Detta innebär att alla pending sektors forceras att skrivas med ny data och att skrivningen verifieras - är det problem så görs ett antal nya skrivförsök och går inte det heller så blir det en sektoreallokering (det är minst 8st 512-sektorer som reallokeras i stöten då alla moderna hårddiskar har 4k-sektorer internt som minsta enhet - hur det redovisas i SMART vet jag inte, om det är fysiska sektorer eller som logiska när det gäller antal)

när processen är klar ett antal timmar senare (typ 7-8 timmar)

smartctrl -a

och kika på smartvärdena.

Till närmast 100% av fallen så är dina 'pending' sektors borta och värdet 0 igen. har du tur så har det inte ökat på räknaren för reallokerade sektorer (pos 5) - vilket då tyder bara mjuka fel - felskrivning eller avbröts mitt under skrivning tex. av strömavbrott och sektorn är inte komplett och skiter sig på dess checksumma.

när det hela är klart så kan du stänga ned datorn - koppla in de andra diskarna så att det var som innan. Vid start så kommer windows hitta en tom disk i sin disk-manager - du får partitonera och formatera denna och sedan kan börja använda disken igen...

slutlig kommentar:

Med denna metod så 'räddar' man betydligt flera diskar och får dem användbara i kanske många år framöver än när man försöker med disktillverkarnas egna disk-diagnostiska mjukvaror (som gärna brukar fastna någonstans halvvägs in)

Varför?:

När man skriver på det sättet som ovan så läser inte disken vad som står på skivan innan man skrivet över - utan det är bara krash-bom rakt över och går det så går det.

När diskens egna diagnostikprogram startas på en disk med strul så försöker den läsa och analysera och det finns ett antal situationer som den inte reder ut och är dåligt avbuggat, vilket gör att disken blir ej responsiv och det enda vägen efter lång väntetid är att göra en power off/on innan den är kontaktbar igen.

skit i det - kör med 'dd' enligt ovan först och det kommer sparas med massor av tid - är det problem kvar - ja då kan man prova med disktillverkarnas egna verktyg (främst för att få 'ticket' för garantianspråk senare)

Det som också är utmärkade med WD-RED är att ingenting av det här och problemen kring detta kommer att synas i SMART - man låtsas inte om det - typ - trots att disken kanske har totalhängt sig hårt upprepande. klart som fan man får fina siffror i smart och driftsstatistik då, när man inte låtsas om de rejäla problemen och att de ens hände... - visst gamla värden av tidigare händelser kan vara kvar men om disken hänger sig eller knasar sig hårt på annat sätt så glöms det lika fort som när strömmen stängs av.

Permalänk
Medlem

@xxargs Du verkar vara en fena på det här med hårddiskar, har jag något att oroa mig för med min hårddisk eller är den helt okej nu?
Och om det är något knas med mina SMART-värden, täcks det möjligtvis av garanti?

Måste erkänna att jag har extremt dålig koll på hårddiskar och det här är min första WD Red disk.

Visa signatur

Define R4 | Asus z97-Pro Gamer| 4790K ~ 4.6Ghz | Gainward 1080 Phoenix | Corsair Vengeance 2x8GB 1600MHz | Phanteks PH-TC14PE | EVGA SuperNova G2 750W | Samsung 850 Evo 256gb

Permalänk
Medlem

Om du har 0 eller väldigt lågt värde på reallokerade sektorer och inga andra poster är under sin lägstanivå (och smart varnar) och det inte är andra typer av show-stopper (dvs disken fungerar dåligt och det registreras av disktillverkarens diagnostikprogram) så är det nog svårt att hävda garanti i förtid.

vissa tillverkare som tex Seagate kräver ofta att diagnostiprogrammet skriver en 'ticket' med ett nummer (från en massa interna tester som inte syns eller speglas av i SMART) utöver SMARTS:s värde för att de skall acceptera för vidare processning.

pending error är transienta fel och är ungefär att man spelade in en bit av kassetbandet med fel låt eller råkade trycka på inspelning kort stund av misstag - inte att det är bandskrynkel.

Är det felfritt vid en senare överskrivning och verifiering så är det inte ett problem längre eller kan hävdas att det är fel på diskytan.

---

Om SMART börja varna igen och 'pending error' inte försvinner trots full överskrivning och/eller med diskens egna diagnostiska tester (den stora fullständiga brukar också åtgärda pending error vilket oftast initieras av tillverkarens diskdiagnostik-program) och det är inom garantitiden - ja då kan du få disken utbytt.

Permalänk
Medlem

@xxargs Jag tackar och bockar.
<3 till alla som skrivit i tråden.

Visa signatur

Define R4 | Asus z97-Pro Gamer| 4790K ~ 4.6Ghz | Gainward 1080 Phoenix | Corsair Vengeance 2x8GB 1600MHz | Phanteks PH-TC14PE | EVGA SuperNova G2 750W | Samsung 850 Evo 256gb

Permalänk

Det borde vara optimalt med RED för Windows lagringsutrymmen? Förutsatt att man kör speglat, en -eller tvåvägs? Tänker högt här..

Visa signatur

i7 6700k @4,1 base - 4,4 Turbo | XFX 590X Fatboy | Gigabyte Z270 D3 | 2x16 GB Corsair Vengence 3200MHz Cl 16| Intel 750 400GB |EVO 970 1 TB Steamdrive| 64TB thin provision