RAID5 (mdadm) + diskkrasch
Hej!
Så här ligger det till:
Jag kör Ubuntu 8.04 och mdadm på min server. Jag kör en mjukvaru-RAID5 i den med 5 stycken hårdddiskar. Ovanpå det kör jag kryptering med dm-crypt och sedan ext3 som filsystem. Jag kör 4 av diskarna på moderkortets SATA-kontroller och en av diskarna på ett separat kontrollerkort.
Jag hade tidigare 4 st Seagate 1TB-diskar i den. Jag köpte sedan en Samsung 1 TB-disk och utökade min RAID5 till att även innehålla denna disk. Så långt allt väl. Allt fungerade bra i månader, tills den nya Samsung-disken efter en reboot dök upp som spare. Det gick att assembla arrayen med de 4 övriga diskarna utan problem, som degraded, eller vad det kallas. Kikade runt lite grann men kom fram till att jag nog var tvungen att lägga till den nya disken igen som active och köra en reshape.
Det tuggade på i en dag tills jag hux flux såg att en av de 4 äldre Seagate-diskarna verkade helt död. Den hittades inte igen över huvud taget efter en reboot. Detta skedde innan reshapen var färdig.
Senare identifierades disken av datorn igen, och har gjort det sedan dess. Den klarar en SMART short self test OK. Kör jag ett extended self test får jag dock read error på disken, enligt följande:
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 90% 6066 2920998
Jag provade testa disken i SeaTools i servern med samma resultat, read error vid extended self test. Jag har även provat disken i min WS med SeaTools for Windows där ett extended self test också misslyckas.
Så det här är väl mina slutsatser:
1. Disken har gått sönder, det går inte att läsa vissa block från disken.
2. Det skedde under en reshape av min RAID5, vilket gör att jag inte kan återskapa arrayen. :'(
Då det är flera lager involverat med först mjukvaruraid, sedan kryptering och sedan filsystem så är jag väl rädd att all data på min RAID5 är förlorad. Då jag hade backup på det viktigaste är det ingen katastrof, men jag vill såklart göra vad jag kan för att försöka återskapa det som fanns på arrayen.
Då jag inte har jättebra koll på mdadm och RAID5, samt såna här hårddiskbekymmer i stort så vill jag gärna ha lite input
Då diskkraschen skedde under en reshape så vet jag inte riktigt vad man kan prova för nåt. Det jag har tänkt göra är väl att försöka läsa ut all data som går från disken och skriva det till en ny, fungerande disk.
För att sedan lägga till denna disk till arrayen och se om det går att fortsätta på reshapen med mdadm. Jag vet inte om detta är möjligt över huvud taget, någon som har koll på det? Kommer det att gå att återskapa arrayen även om vissa block från den här disken inte finns med?
Jag har inte full koll på hur en reshape går till, finns det någon chans att jag kan återskapa arrayen med bara de diskar som fortfarande fungerar, som degraded?
Disken ska väl mappa om bad blocks automatiskt, så om den inte gjort det nu så har den väl slut på lediga blocks?
Jag tar tacksamt emot alla förslag. Skiter det sig så får jag väl skicka in disken på garantin och bygga om min RAID5 och inse att jag förlorat all data på den.
Intel Core i7 920, Gigabyte GA-EX58-UD5, 6x2 GB Corsair XMS3 Twin3X DDR3 1333 MHz, XFX GeForce GTX 280 1 GB, Gigabyte GeForce 8600 GT 512 MB, Corsair TX650 650W
NileCity 105,6 Playlist