Anmäl dig till Roborock Challenge!

Hur länge är okey att köra samma hårddiskar?

Permalänk

Jag använder mina diskar tills de går sönder, på något sätt.

Och det var några år sedan man behövde byta disk på grund av haveri. Senaste gångerna har jag bytt för att dubblera lagringsutrymmet.

Permalänk
Medlem

Kom ihåg att RAID inte(!) är backup!

RAID är till för att hålla redundans så att informationen på diskarna hålls tillgänglig även vid hårdvarufel, men det är inte en ersättare till direkta kopior på oersättlig information

Två kopior på olika platser är minimum

Permalänk
Medlem

Jag har några WD RED som har en drifttid på strax över 74000 timmar, fungerar finfint! Ligger dock några cold spares på hyllan..

Permalänk
Medlem

Har en hårddisk från 2006 som på den tiden var svindyr 600gig använt den ca två tre gånger i veckan och varit resurs disk för Adobe och Zbrush och tidvis körts hårt, köpte ny 12 Tera för tre fyra månder sen för säkerhets skull flyttade filer och formaterade den igen och kollade hälsa (mycket god som ny) 18 bast låter som en moppe utan ljuddäpare..

Permalänk
Medlem

Jag brukar byta ut diskar i min NAS som snurrar 24/7 efter ca 7~8 år även fast de fungerar fint då ännu. Tar offline backup på data till en stor USB-disk då och då med SyncBackPro som kollar filintegriteten på samma gång och vad som ändrat sen sist. Uppstår skadade sektorer brukar jag byta ut i förtid också men bara hänt en gång hittills.

Jag kör hellre flere mindre diskar för att helst köra max 3-4 platters, just nu 3x 3TB (3x1TB platter diskar) och 1x 4TB (4x1.25TB platter), kör ingen RAID utan använder bara StableBits DrivePool för att joina ihop olika diskar till en stor disk, tyckte det var smidigast då det går att matcha olika storlekar och går att ta ur bruk närsomhelst och fortsätta använda diskarna sedan utan att behöva formatera osv. (visst kanske får sortera litegrann i värsta fall).

Visa signatur

Intel® Core i7-13700K @ 5.7/5.6GHz | ASRock Z690 Extreme | G.Skill Trident Z 32GB @ DDR4-3400 CL14 | Samsung EVO series M.2 + Sata SSDs 2TB | Intel Arc B580 | SuperFlower Titanium 1000W | Gigabyte M32Q 32"/1440p 165Hz | Arctic Freezer II 360 AIO | Phanteks P500A D-RGB

Permalänk
Medlem

Sedan 2010 byter ut mina diskar (RAID6) ungefär vart femte år och passar då på att typiskt dubblera kapaciteten. De pensionerade diskarna får sedan agera offline backup-diskar (i fem år, tills det kommer ett nytt gäng pensionärer). Så mina diskar får alltså tjänstgöra 5+5 år, där de under de första 5 åren ständigt snurrar medan de under de senare 5 åren bara sätts igång sporadiskt. Jag har haft diskar som börjat bete sig illa i aktiv tjänst (utvecklat dåliga sektorer etc) som då omdelbart bytts ut och kasserats (oftast som garantiärenden), men ingen disk i passiv tjänst har hittills haft problem. Dvs om de överlevde 5 år aktivt snurrande så funkar de också bra passivt med lågaktiv användning, i alla fall i minst 5 år.

Permalänk
Medlem

Jag har 2st HDDs på 320gb vardera tror jag de ligger på. Sitter i min dator jag använder och används dagligen. Tror de är ifrån 2006. Fungerar galant fortfarande.

Visa signatur

MSI B450 | Ryzen 7 5800X3D, Hyper 212 EVO | 32GB 3600MHz | GTX 1070 | Seasonic 750w | LG Ultragear 27GP850 | Sony MDR-1A

Permalänk
Medlem

Ett annat problem är väl tillgången på ersättningsdiskar om poolen är närmare 10år. Det kan vara en anledning att hålla allt uppdaterat.

Visa signatur

+++ Divide By Cucumber Error. Please Reinstall Universe And Reboot +++

"Real stupidity beats artificial intelligence every time." - Terry Pratchett, Hogfather

Permalänk
Medlem

De äldsta diskar jag har som fortfarande är i drift och fungerar utmärkt har drifttider på 111 856 timmar respektive 96 706 timmar. Många betydligt yngre diskar av samma modell har ju rasat innan dess så precis som andra sagt så kan jag bekräfta att det varierar mellan enskilda exemplar.

Innan någon frågar så kan jag bekräfta att jag har backup på datan på dessa diskar.

Visa signatur

Antec P280 | FSP Hydro Ti Pro 1000W | MSI X670E Carbon | Ryzen 7 9800X3D | Kingston Fury Beast 6000MT/s CL30 2x32GB | ASUS RTX 3080 TUF OC | 2x Samsung 990 Pro 4TB | Kingston KC3000 4TB | Samsung 970 Pro 1TB | 2x Samsung PM863a 3.84TB | 2x ASUS PG279Q

Permalänk
Medlem

3 st WD red 4TB i Raid5 som gick 90000 h sen vågade jag inte längre och uppgraderade. Men helt utan fel eller krångel. Tveksam om nya Seagate 18TB fixar det...

Permalänk
Medlem

Jag kör tills SMART säger till eller tills jag själv upptäcker ett problem... Har inte råd att köra raid.

Visa signatur

Case: Fractal Design Torrent Solid Black MOBO: ASUS ROG STRIX X670E-A GAMING WIFI CPU: AMD Ryxen 7 7800X3D CPU cooler: Noctua NH-D15 RAM: G.Skill Trident Z5 Neo DDR5 6000MHz CL30 32GB GPU: ASUS RTX 5080 16GB ROG Astral OC PSU: ROG Strix 1000W Gold Aura Edition M2: Kingston Fury Renegade 2TB Fans: 4x Noctua NF-A12x25
Monitor: ASUS ROG Swift PG27AQDM 27" 240Hz 1440p OLED QHD Mouse: Razer Viper v3 Pro Wireless
Mousepad:
Artisan Raiden Keyboard: Wooting 80HE Headset: Audeze Maxwell Mic: Blue Yeti X

Permalänk
Medlem

Äldsta jag kan påminna mig är i drift fortfarande är en Samsung 640GB från 2008, fungerar perfekt! Har inget viktigt på den.

Visa signatur

9950X3D ROG CROSSHAIR X870E HERO 96-6000c30 RTX5090 Gaming OC || 7950X B650 Gaming Plus WIFI 32-6000c30 RTX5080 TUF OC(450w) || 12900KF Z690 Tomahawk WIFI 64-3600c16 Gear1 RTX4080 Ventus 3X OC(400W) || 5900X(B2) B550-F 32-3800c18 RTX3080 TUF OC V2 || 5800X3D CH VIII EXT. 32-3600c18 RTX3080 Gaming OC || 3900X CH VIII Hero 32-3000c16 RTX2070 Super || Thinkpad P16s G2 PRO7840U 32-6400 780M 1TB 980Pro

Permalänk

Körde på WDC (Consumer 4x7; RAID1/10) där de flesta gick sönder redan efter 1-2 år.
Har nu 24 st HGST (Enterprise 24x7; RAID5/0) där ingen stannat även efter 12 år hittills.

Visa signatur

Apple MacBook Pro 16-inch | M2 Max with 12C CPU, 38C GPU | 64GB unified memory | 4TB SSD storage | 3x Thunderbolt 4 | HDMI | SDXC | MagSafe 3 | Touch ID | Liquid Retina XDR display | Force Touch Trackpad

Permalänk

Som tidigare nämnts så ska man inte ha villfarelser om att RAID = backup. Edit: RAID är för mitt användningsområde mer ett sätt att få motsvarande en stor JBOD-volym fast med ökad prestanda och viss extra trygghet/uptime, kör striped mirrors I ZFS och delar upp i datasets där jag anser det behövas.

Mitt svar på huvudfrågan är att man kör diskarna tills man får varningar om smart-status då de byts ut till en av de (flera) cold-spares man har liggandes bredvid servern. Sen ordnar man en ersättare till den coldspare som nu blivit "drift-disk".

Samt att all data som man inte tänker "meh" ifall den försvinner är backupad enligt 3-2-1.

Såklart så kommer inte alla vara på den nivån som privatperson men då data är viktigt idag så bör fler sätta sig in i en trygg och fungerande backupstrategi även privat med all ransomware och dylikt som komplicerar backupkedjan om man ska vara så nära 100% skyddad som man kan bli.

Permalänk
Medlem

Jag har en 1TB WD Green som jag fick av farsan när jag fyllde 15 eller 16 år 2009 som extern hårddisk. Efter några år tog jag ur den ur caset och satte in den direkt i datorn. Används fortfarande som Film och TV-serie disk. Har över 2000 dagars körtid enligt Hard Disk Sentinel och har inga fel rapporterade enligt SMART-datan

Visa signatur

Stationär PC: Chassi: Phanteks Enthoo EVOLV ATX MB: MSI B550 Gaming Plus CPU: AMD Ryzen 7 5700X Kylning: Noctua NH-U12S GPU: MSI GeForce GTX 1060 Gaming X 6 GB RAM: Corsair Vengeance LPX Black 32GB 3600MHz NVMe: 2st Kingston A2000 SSD: Intel 520 180GB och Intel 530 240GB HDD: WD Green 1TB, Toshiba 640GB samt fler HDD PSU: Corsair RM750X. Mobila enheter Mina Androidenheter och Dell Latitude 5400. Citera om du vill ha ett garanterat svar från mig

Permalänk
Medlem

Bytte nyligen ut en Seagate Barracuda från 2011. Fungerar fortfarande men kändes bra sätta in en helt ny hårddisk med 5 års garanti.

Permalänk
Medlem
Skrivet av Dinkefing:

Säger ingenting ge oss SMART-värdena istället.

vilken information tycker ni är värt att titta på?

sudo smartctl -a /dev/sdc smartctl 7.4 2023-08-01 r5530 [x86_64-linux-6.11.0-13-generic] (local build) Copyright (C) 2002-23, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: SAMSUNG SpinPoint F4 EG (AF) Device Model: SAMSUNG HD204UI Serial Number: S2H7JD1Z907832 LU WWN Device Id: 5 0024e9 004173d13 Firmware Version: 1AQ10001 User Capacity: 2,000,398,934,016 bytes [2.00 TB] Sector Size: 512 bytes logical/physical Rotation Rate: 5400 rpm Form Factor: 3.5 inches Device is: In smartctl database 7.3/5528 ATA Version is: ATA8-ACS T13/1699-D revision 6 SATA Version is: SATA 2.6, 3.0 Gb/s Local Time is: Mon Jan 6 09:35:52 2025 CET ==> WARNING: Using smartmontools or hdparm with this drive may result in data loss due to a firmware bug. ****** THIS DRIVE MAY OR MAY NOT BE AFFECTED! ****** Buggy and fixed firmware report same version number! See the following web pages for details: http://knowledge.seagate.com/articles/en_US/FAQ/223571en https://www.smartmontools.org/wiki/SamsungF4EGBadBlocks SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: (20100) seconds. Offline data collection capabilities: (0x5b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 335) minutes. SCT capabilities: (0x003f) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 0 2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0 3 Spin_Up_Time 0x0023 067 067 025 Pre-fail Always - 10054 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 76 5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0 8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 109689 10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 252 252 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 83 181 Program_Fail_Cnt_Total 0x0022 100 100 000 Old_age Always - 4954315 191 G-Sense_Error_Rate 0x0022 100 100 000 Old_age Always - 1 192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0 194 Temperature_Celsius 0x0002 064 059 000 Old_age Always - 30 (Min/Max 16/44) 195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0 196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 252 252 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0036 100 100 000 Old_age Always - 3 200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 0 223 Load_Retry_Count 0x0032 252 252 000 Old_age Always - 0 225 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 83 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t] SMART Selective self-test log data structure revision number 0 Note: revision number not 1 implies that no selective self-test has ever been run SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Completed [00% left] (0-65535) 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay. The above only provides legacy SMART information - try 'smartctl -x' for more

sudo smartctl -a /dev/sdd smartctl 7.4 2023-08-01 r5530 [x86_64-linux-6.11.0-13-generic] (local build) Copyright (C) 2002-23, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: SAMSUNG SpinPoint F4 EG (AF) Device Model: SAMSUNG HD204UI Serial Number: S2H7JD1Z907833 LU WWN Device Id: 5 0024e9 004173d15 Firmware Version: 1AQ10001 User Capacity: 2,000,398,934,016 bytes [2.00 TB] Sector Size: 512 bytes logical/physical Rotation Rate: 5400 rpm Form Factor: 3.5 inches Device is: In smartctl database 7.3/5528 ATA Version is: ATA8-ACS T13/1699-D revision 6 SATA Version is: SATA 2.6, 3.0 Gb/s Local Time is: Mon Jan 6 09:36:43 2025 CET ==> WARNING: Using smartmontools or hdparm with this drive may result in data loss due to a firmware bug. ****** THIS DRIVE MAY OR MAY NOT BE AFFECTED! ****** Buggy and fixed firmware report same version number! See the following web pages for details: http://knowledge.seagate.com/articles/en_US/FAQ/223571en https://www.smartmontools.org/wiki/SamsungF4EGBadBlocks SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: (20280) seconds. Offline data collection capabilities: (0x5b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 338) minutes. SCT capabilities: (0x003f) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 72 2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0 3 Spin_Up_Time 0x0023 068 067 025 Pre-fail Always - 9999 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 76 5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0 8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 109688 10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 252 252 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 83 181 Program_Fail_Cnt_Total 0x0022 100 100 000 Old_age Always - 2277462 191 G-Sense_Error_Rate 0x0022 252 252 000 Old_age Always - 0 192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0 194 Temperature_Celsius 0x0002 064 056 000 Old_age Always - 32 (Min/Max 17/46) 195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0 196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 252 252 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0036 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 5 223 Load_Retry_Count 0x0032 252 252 000 Old_age Always - 0 225 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 83 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t] SMART Selective self-test log data structure revision number 0 Note: revision number not 1 implies that no selective self-test has ever been run SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Completed [00% left] (0-65535) 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay. The above only provides legacy SMART information - try 'smartctl -x' for more

Visa signatur

chmod 775

Permalänk
Hedersmedlem
Skrivet av giplet:

Egentligen så länge SMART status ser bra ut. Men det man också ska tänka på när det kommer till äldre raids är att om en disk rasar så kan fler rasa. Denna risk ökar med åldern. Så risken är att när en disk börjar visa dåliga värden och du försöker byta den så går fler diskar sönder i processen. Att bygga om en raid sliter mer på diskarna än normal användning.

Eftersom det inte handlar om så mycket data hade jag gjort en backup på hela innehållet om du inte redan gjort det.
Sedan kan man fundera över varför man kör raid. Raid är ingen backup, utan ett sätt att höja tillgängligheten (undantaget raid 0). Dvs med raid kan du fortsätta ha tillgång till din data även om en disk rasar. När det kommer till privata användingsfall så behöver man ofta inte tillgång till datan precis alltid. Man kan vara utan den i tre dagar medan man väntar på att ny disk ska levereras så länge man har datan kvar (backup).

Så om du är orolig hade jag i ditt fall köpt en ny disk och pensionerat raiden. Har du inget bra sätt att göra backup idag hade jag satsat på att ordna det.

När det börjar bli dags att pensionera diskarna så brukar jag hoppa upp i storlek och bygga ny raid av de större diskarna. Går betydligt fortare än att återbygga, men visst då behöver man öka på investeringen och det är inte säkert att man behöver ner utrymme beroende på användningssyftet.

Edit: alltså inte totala tiden nödvändigtvis men tiden med hög belastning som riskerar informationen minskar betydligt.

Permalänk
Medlem
Skrivet av stoffe-2k:

vilken information tycker ni är värt att titta på?

sudo smartctl -a /dev/sdc smartctl 7.4 2023-08-01 r5530 [x86_64-linux-6.11.0-13-generic] (local build) Copyright (C) 2002-23, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: SAMSUNG SpinPoint F4 EG (AF) Device Model: SAMSUNG HD204UI Serial Number: S2H7JD1Z907832 LU WWN Device Id: 5 0024e9 004173d13 Firmware Version: 1AQ10001 User Capacity: 2,000,398,934,016 bytes [2.00 TB] Sector Size: 512 bytes logical/physical Rotation Rate: 5400 rpm Form Factor: 3.5 inches Device is: In smartctl database 7.3/5528 ATA Version is: ATA8-ACS T13/1699-D revision 6 SATA Version is: SATA 2.6, 3.0 Gb/s Local Time is: Mon Jan 6 09:35:52 2025 CET ==> WARNING: Using smartmontools or hdparm with this drive may result in data loss due to a firmware bug. ****** THIS DRIVE MAY OR MAY NOT BE AFFECTED! ****** Buggy and fixed firmware report same version number! See the following web pages for details: http://knowledge.seagate.com/articles/en_US/FAQ/223571en https://www.smartmontools.org/wiki/SamsungF4EGBadBlocks SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: (20100) seconds. Offline data collection capabilities: (0x5b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 335) minutes. SCT capabilities: (0x003f) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 0 2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0 3 Spin_Up_Time 0x0023 067 067 025 Pre-fail Always - 10054 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 76 5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0 8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 109689 10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 252 252 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 83 181 Program_Fail_Cnt_Total 0x0022 100 100 000 Old_age Always - 4954315 191 G-Sense_Error_Rate 0x0022 100 100 000 Old_age Always - 1 192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0 194 Temperature_Celsius 0x0002 064 059 000 Old_age Always - 30 (Min/Max 16/44) 195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0 196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 252 252 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0036 100 100 000 Old_age Always - 3 200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 0 223 Load_Retry_Count 0x0032 252 252 000 Old_age Always - 0 225 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 83 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t] SMART Selective self-test log data structure revision number 0 Note: revision number not 1 implies that no selective self-test has ever been run SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Completed [00% left] (0-65535) 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay. The above only provides legacy SMART information - try 'smartctl -x' for more

sudo smartctl -a /dev/sdd smartctl 7.4 2023-08-01 r5530 [x86_64-linux-6.11.0-13-generic] (local build) Copyright (C) 2002-23, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: SAMSUNG SpinPoint F4 EG (AF) Device Model: SAMSUNG HD204UI Serial Number: S2H7JD1Z907833 LU WWN Device Id: 5 0024e9 004173d15 Firmware Version: 1AQ10001 User Capacity: 2,000,398,934,016 bytes [2.00 TB] Sector Size: 512 bytes logical/physical Rotation Rate: 5400 rpm Form Factor: 3.5 inches Device is: In smartctl database 7.3/5528 ATA Version is: ATA8-ACS T13/1699-D revision 6 SATA Version is: SATA 2.6, 3.0 Gb/s Local Time is: Mon Jan 6 09:36:43 2025 CET ==> WARNING: Using smartmontools or hdparm with this drive may result in data loss due to a firmware bug. ****** THIS DRIVE MAY OR MAY NOT BE AFFECTED! ****** Buggy and fixed firmware report same version number! See the following web pages for details: http://knowledge.seagate.com/articles/en_US/FAQ/223571en https://www.smartmontools.org/wiki/SamsungF4EGBadBlocks SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: (20280) seconds. Offline data collection capabilities: (0x5b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 338) minutes. SCT capabilities: (0x003f) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 100 100 051 Pre-fail Always - 72 2 Throughput_Performance 0x0026 252 252 000 Old_age Always - 0 3 Spin_Up_Time 0x0023 068 067 025 Pre-fail Always - 9999 4 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 76 5 Reallocated_Sector_Ct 0x0033 252 252 010 Pre-fail Always - 0 7 Seek_Error_Rate 0x002e 252 252 051 Old_age Always - 0 8 Seek_Time_Performance 0x0024 252 252 015 Old_age Offline - 0 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 109688 10 Spin_Retry_Count 0x0032 252 252 051 Old_age Always - 0 11 Calibration_Retry_Count 0x0032 252 252 000 Old_age Always - 0 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 83 181 Program_Fail_Cnt_Total 0x0022 100 100 000 Old_age Always - 2277462 191 G-Sense_Error_Rate 0x0022 252 252 000 Old_age Always - 0 192 Power-Off_Retract_Count 0x0022 252 252 000 Old_age Always - 0 194 Temperature_Celsius 0x0002 064 056 000 Old_age Always - 32 (Min/Max 17/46) 195 Hardware_ECC_Recovered 0x003a 100 100 000 Old_age Always - 0 196 Reallocated_Event_Count 0x0032 252 252 000 Old_age Always - 0 197 Current_Pending_Sector 0x0032 252 252 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 252 252 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0036 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x002a 100 100 000 Old_age Always - 5 223 Load_Retry_Count 0x0032 252 252 000 Old_age Always - 0 225 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 83 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t] SMART Selective self-test log data structure revision number 0 Note: revision number not 1 implies that no selective self-test has ever been run SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Completed [00% left] (0-65535) 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay. The above only provides legacy SMART information - try 'smartctl -x' for more

Det är informationen under "SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:"
som är intressant

Visa signatur

Stationär PC: Chassi: Phanteks Enthoo EVOLV ATX MB: MSI B550 Gaming Plus CPU: AMD Ryzen 7 5700X Kylning: Noctua NH-U12S GPU: MSI GeForce GTX 1060 Gaming X 6 GB RAM: Corsair Vengeance LPX Black 32GB 3600MHz NVMe: 2st Kingston A2000 SSD: Intel 520 180GB och Intel 530 240GB HDD: WD Green 1TB, Toshiba 640GB samt fler HDD PSU: Corsair RM750X. Mobila enheter Mina Androidenheter och Dell Latitude 5400. Citera om du vill ha ett garanterat svar från mig

Permalänk
Medlem

Jag har gamla WD diskar ifrån 2009 i raid0 med en drifttid på 39407 timmar och 8580 uppstarter.
Den enda disk som kastat in handdukten var en 74gb Raptor disk.

Visa signatur

CITERA FÖR SVAR

Ah, MX Blues, the power of nuclear bombs at your fingertips!

13700KF / Gigabyte Z790UD / 32gb DDR5@6000mhz / Powercolor RX 6700 XT 12Gb / NZXT HALE90 750 / NZXT H2 White

Permalänk
Medlem

Min NAS som byggdes 2015 hade precis sitt första diskras. Den har stått på mer eller mindre 24/7 så ca 78 000 timmar. Min kompis byggde en samtidigt med identiska komponenter och han har haft 2 eller 3 pajade diskar sen dess, med första raset redan efter 3 år. Min andra server byggde jag med 6 gamla diskar, ca 30 000 timmar när jag köpte dem. En rasade efter 3 månader, resterande är fortfarande OK 4 år senare.

Jag har slutat köpa nya diskar, jag köper bara begagnade (till nätverkslagring dvs). Senaste bygget är bara 1 månad gammalt och byggdes med 6+1 begagnade 8TB SAS diskar. De kommer säkert gå sönder tidigare jämfört med nya, men jag kan inte räkna med att en ny håller så jag behöver ändå bygga en raidZ2 pool med en hot spare + backup offsite. Den poolen kostade strax över 8 000kr istället för de ~17k en pool med nya hade kostat. När en disk pajar ersätts den och jag köper helt enkelt en ny för de 10k jag sparade. Pengarna räcker nästan för ett helt speglat system! Så kort sagt:

Använd diskar tills de rasar, men se till att planera för att de rasar imorgon.

Därför har jag följande regler

  • Räkna med att de kan gå sönder när som helst

  • Viktig data skall överleva mer än bara diskras

  • Backup måste automatiseras, och minst en måste vara offsite

Permalänk
Medlem

Kör till ngn dör, har backup och spares på hyllan.

Visa signatur

WS: R7 5800X, 128GB, Suprim 4080 Super, Acer X38P+Acer XB271HU
FS: HPE ML110 Gen10 Xeon Silver, Qnap TS-h973AX
NW: Fortigate, Ruckus, Zyxel XS1930HP 10Gb

Permalänk
Medlem

Hårddiskhaverier brukar följa en badkarskurva. De flesta hårddiskar som kraschar gör det antingen när de är nästan nya (p.g.a. tillverkningsfel) eller efter många, många år p.g.a. åldern. Har hårddisken klarat de första 6-12 månaderna utan att krascha har den inga dolda tillverkningsfel och har visat sig vara tillförlitlig.

Därför är det också dumt att byta ut en fungerande hårddisk bara för att den har några år på nacken, man kanske byter ut den mot en som visar sig ha tillverkningsfel och går sönder efter ett par månader.

Dessutom om man är rädd om sin data har man backup så en hårddiskkrasch är bara ett irritationsmoment och inte en katastrof.

Visa signatur

Ryzen 9 5950X, Asus Prime X370 Pro, 32 GB DDR4 3600, RTX 3060 Ti

Permalänk
Medlem

69k

Permalänk
Medlem

Diskarna i min ZFS RAIDZ2 med 2 redundansdiskar har gått sen 2012 någon gång, ~90000h, jag har bytt ut en disk som rasat för ett par år sen.
Jag låter diskarna gå tills de är slut och byter ut dem.
Använder bara WD Green och WD Red+.

Visa signatur

R&D Elektronik & Radioingenjör

Permalänk
Medlem
Skrivet av Rebben:

Diskarna i min ZFS RAIDZ2 med 2 redundansdiskar har gått sen 2012 någon gång, ~90000h, jag har bytt ut en disk som rasat för ett par år sen.
Jag låter diskarna gå tills de är slut och byter ut dem.
Använder bara WD Green och WD Red+.

Jag kör liknande som du, med SHR-2 med 2 redundansdiskar. Är du inte rädd att när du syncar upp den nya disken att yttiligare 1 eller 2 diskar då rasar när de gamla diskarna jobbar max i ~50h för att bygga upp raiden igen?

Permalänk

Jag kör diskar tills dom går sönder. Har fortfarande diskar under 1TB som går utmärkt. I princip finns ingen anledning att tro att hårdvara går sönder efter viss tid. Det är att man hanterat det fel som orsakar felet.

Uttrycket att det inte är om utan när något går sönder är en filosofi att man är redo att agera när något går sönder.

När en disk gick för mig för några år sedan så hade jag två oberoende uppsättningar till av den. Var bara att byta på garanti. Behövdes inte räddas något från den eftersom två andra diskar hade minst 99% av innehållet. Det är då man har en fungerande backup.

Visa signatur

Server: Fractal design Define 7 XL | AMD Ryzen 7 5800X 8/16 | ASUS ROG CROSSHAIR VIII DARK HERO | 64GB Corsair @ 3000MHz | ASUS Radeon RX 460 2GB | Samsung 960 PRO 512 GB M.2 | 2x 2TB Samsung 850 PRO SSD | 6x Seagate Ironwolf Pro 10TB
WS: Phantex Entoo Elite | AMD Ryzen Threadripper 1950X 16/32 | ASUS Zenith extreme | 128GB G.Skill @ 2400MHz | ASUS Radeon HD7970 | 3x 2TB Samsung 960PRO M.2 | 6x Seagate Ironwolf Pro 10 TB
NEC PA301W 30" @ 2560x1600 | Linux Mint 21.3 Cinnamon

Permalänk
Medlem
Skrivet av atego:

Jag kör liknande som du, med SHR-2 med 2 redundansdiskar. Är du inte rädd att när du syncar upp den nya disken att yttiligare 1 eller 2 diskar då rasar när de gamla diskarna jobbar max i ~50h för att bygga upp raiden igen?

Jag har backup på det som är viktigt så det är ingen fara om det rasar.

Visa signatur

R&D Elektronik & Radioingenjör

Permalänk

Nu blev jag orolig över att läsa detta. Har en 2TB disk som är 20 år gammal med en hel del saker på. Tänk om den går sönder....

Permalänk
Medlem
Skrivet av Sveklockarn:

Nu var det så längesen jag jobbade med det att jag har glömt hur det var uppbyggt, men S.M.A.R.T-övervakning är ett av de enklaste sätten att fånga upp begynnande diskhaveri i ett tidigt skede. Problemen börjar ju alltid någonstans, och fallande S.M.A.R.T-hälsa (<100%) har varit det första tecknet på det trettiotal diskar jag bytte ut.

Någon enstaka av dem havererade utan föregående S.M.A.R.T-varning, alternativt så vidarebefordrades den inte korrekt, minns inte detaljerna längre.

Du kan ha 100% hälsa och så stannar motorn. Det är en grov uppskattning och inget du vill lita på.
Du kan också har stora varningar och rulla disken flera år till utan problem.

Det är som sagt en uppskattning satt på några parametrar, typ misslyckade skrivningar.

Visa signatur

CPU: 5800x3d
GPU: 3080
RAM: 32GB

Sluta gömma din identitet, skaffa en till istället