SMART har med statistiskt från bl.a google bara förvarnat i tid ca 50% av alla haverier (siffra ur minnet, har inte dubbelkollat) med andra ord finns det rätt många fall diskar bara försvinner plötsligt från systemet eller säger allt är finfint men egentligen söla ned systemet enormt genom att varje läsning helatiden måste rättas av RAID - utan att det registreras i SMART - andra fall inget står i SMART fast diskarna total-hänger sig när de stöter på skadad sektor och inget syns heller efter omstart och man kan upprepa det. Har haft 3 sådana fall.
Så nej, man kan inte lita på SMART att de tar alla fellägen, långt ifrån, man får också titta på ev. RAID har kastat ut disk och prestandatestmätning och titta på en disk är mer upptagen (busy) än vanligt och om det är skillnad från tidigare mha. statistisk kartläggning över längre tid.
Hängd disk brukar bli utkastade ur en RAID så det gäller att meddelandet når den som handhar server, disken som fördröjde alla diskaktiviteter med omskrivningar av datat hade kunna tagit på dess 'busy' avviker väldigt från de andra diskarna i RAID:n och att datatrafiken var låg trots konstant upptagen (det kan vara så med mycket sökningar men då bör alla diskarna inom RAID vara något så när lika i avseende 'busy' och inte bara en disk). Men då kräver man en högre ordning övervakning som med SMART och andra systemmässiga informations-källor inser att det är något lurt med systemet och bör flaggas.
Att bygga den regelverket utan att det ger falska positiv är inte helt enkelt och en av de mer säkra ställena i Linux är förmodligen att sila 'dmesg' (från linux-kärna) och titta efter när det börja dyka upp (S)ATA-relaterade saker som avviker från normala flödet då när jag hade disken som hela tiden hade läsfel och RAID hela tiden rättade (utan att något av det registrerades i SMART) så formligen välde det med texter med åtgärder som gjordes mot disken hela tiden och hade varit lätt att fånga upp den vägen.
Hur man gör motsvarande i windows - ja det får någon annan fundera över.