En snurrdisk liksom SSD har massor av fel redan vid tillverkningen men är bortmappade reda default i dess certifierings-körning på fabrik (finns i P-list om man pratar SCSI/SAS-språk men i SATA är denna oftast dold och behöver fabriks-mjukvaror för att komma åt denna) och på mång-Terabyte-disk så handlar det om hundratusentals sektorer som är bortmappade och det förvånar mig inte att man kanske missat en av dem i gränslägesfall och det sedan blivit synlig på brukarsidan senare.
Det som räknas upp i post 05 i SMART är de sektorer som mappas om efter certifiering och denna lista kallas G-list (Growing list) på SAS/SCSI-språk och samma där är dold i SATA så att man inte kan se vilken LBA den hade tidigare (den har tappat sin LBA i och med att den är bortreallokerad och annan spare-sektor tagit över LBA-posten)
Får man 1-2 reallokerade sektorer i 05 i SMART ganska tidigt i diskens liv och det inte sedan stiger i antal över väldigt lång tid så är det inget jag skulle bekymra mig om, men om disken är +50000 timmar och det plötsligt stiger från '0' så skulle jag reagera och sätta disken under observation då när det väl börjar så kommer felen ofta i allt snabbare takt (men bara om disken skriver en massa filer hela tiden) .
En sak att tänka på är att '05' bara ökar för skrivningar som görs och resulterat sektor inte kunde skrivas felfritt och därmed reallokeras.
Vid läsning och den ser tveksamma sektorer som brister i signalstyrka eller nära sin kapacitet för ECC-rättning så ökas post 197 (C5h) "current pending sektors" i SMART men dessa räknas ned igen om sektorerna i fråga skrivs med ny data igen och skulle den skrivningen misslyckas så ökas post 05 igen med 1. Denna värde ökas bara om disken skannar sektorer så att veka sektorer upptäcks och görs typisk med en scrubbing-process i en RAID - så att kolla värdet på post 197 (C5h) då och då när scrubbing görs kan indikera om det är veka (men läsbara) sektorer på disken - men det görs inget åt dem i processen och de är fortsatt veka.
Samma sak om man läser genom fil för fil eller i RAW på undanlagda arkivdiskar - ökar post 197 (C5h) i antal så är det dags för en omskrivning av alla filer på disken då det inte går att få fram vilka sektorer som är svaga på SATA-diskar och skall man bli av med dem så måste hela disken skrivas om (det finns också program som 'diskfresh' som läser in en bunt sektorer på RAW-nivå och sedan skriver tillbaka samma data igen på samma plats och den vägen tvingar en nyskrivning av datat på snurrdiskar, dock gäller det inte alltid på SSD då kontrollern i SSD kan upptäcka att datat är samma som lästes nyss och inget görs)
- Tyvärr kan man inte få reda på vilken LBA-nummer som de problematiska sektorerna finns på disken för post 198 (C5h) och kan prova att läsa och och sedan skriva tillbaka just dessa sektorer igen - vilket görs automagiskt i SAS/SCSI-diskar allt eftersom de upptäcks tex. vid patrolling med läsning av samtliga sektorer på diskytan regelbundet, som i SAS-diskar kan programmeras att göra själv automagiskt i jämna intervaller när disken inte hanterar data - det som med SATA-diskar försöker efterlikna med 'scrubbing' med RAID-mjukvara men där är problemet att inget rättas förrän uppkomna riktiga läsfel och redundansen i RAID rättar sektorn med läsfelet. - medans i SAS-disk rättas den automatiskt innan sektorn i fråga har så många bitfel att den inte kan rättas - och det blir aldrig läsfel. - Med antal bitfel kan en SAS-disk mäta kvaliten på sektorer och ta dessa innan det är ett problem (dvs tappad data) men det finns ingen möjlighet att göra samma sak på SATA-diskar tyvärr.
Därav anledningen om man man har möjlighet med egenbyggd NAS/server och använda HBA i IT-mode (tex. LSI-SAS92xx-seriens diskkontrollerkort), köpa SAS-diskar istället för SATA-diskar då de ofta nu är i nära samma pengar som SATA-diskar med typiskt ett par hundralappar skillnad [1] - speciellt idag om man köper > 10TB diskar då diskarna börja bli så stora att göra scrubbing mjukvarumässigt mha. RAID-mjukvara börja uppta så stor andel av totala tiden att det vore bra att diskarna kunde sköta det själva och man har längre mellanrum för den externa scrubbingen.
[1]
Fast med Chia-miningens explosiva ökning och dammsugning av diskar sista 6 månaderna så kanske det har kullkastat reglerna prisbildsmässigt...