Permalänk

Problem med RAID

Jag sitter och försöker sätta upp en software RAID5 av 3st WD Green 3TB-diskar.
När jag satt upp RAIDen via webmin får jag ett RAID Error "1 disk have failed"

Vad som är fel framgår inte.
Jag har kört extended selftest på samtliga diskar och inga fel påträffas.
Finns det någon bra logg att läsa som kan avslöja vad som går fel?

En fundering jag har är om det kan ha med att göra att diskarna ligger på 2 olika SATA-controllers? Visserligen är båda monterade på moderkortet men läser man moderkortsspecen så verkar det som att portarna har olika controllers
http://www.asus.com/Motherboards/AT5NM10TI/#specifications

Permalänk
Medlem

Nu var det länge sedan jag körde mdadm. Det ser ju ut som den kör en rebuild, vad säger cat /proc/mdstat

Permalänk
Medlem

Din array kör en rebuild:

Redbuildning progress 92%

Jag antar att det löste sig, men om problemet kvarstår så får du mer information genom att öppna en terminal och köra (som root):

# mdadm --detail /dev/md0

Vilket borde ge en output i stil med:

/dev/md0: Version : 1.2 Creation Time : Tue Jun 19 14:01:12 2012 Raid Level : raid5 Array Size : 7812366336 (7450.45 GiB 7999.86 GB) Used Dev Size : 1953091584 (1862.61 GiB 1999.97 GB) Raid Devices : 5 Total Devices : 5 Persistence : Superblock is persistent Update Time : Thu Jan 9 11:56:48 2014 State : clean Active Devices : 5 Working Devices : 5 Failed Devices : 0 Spare Devices : 0 Layout : left-symmetric Chunk Size : 256K Name : xxxx:0 (local to host xxxx) UUID : 5e1e5c7a:031c7881:8b13177f:530d938d Events : 1461895 Number Major Minor RaidDevice State 0 8 17 0 active sync /dev/sdb1 1 8 49 1 active sync /dev/sdd1 2 8 65 2 active sync /dev/sde1 5 8 97 3 active sync /dev/sdg1 6 8 81 4 active sync /dev/sdf1

..och kolla vad det står vid STATE.

Permalänk

Tack för svaren.
Hur kunde jag missa att den gjorde en rebuilding? Klantigt av mig. Servern stängdes ner för natten så arbetet återupptogs nyss. Ska visst ta 9 timmar... Men ändå lite skumt. Är det normalt att den måste göra en rebuild när man just skapat arrayen?

Statusen ser ut såhär på diskarna när jag kör mdadm --detail /dev/md0.

Number Major Minor RaidDevice State 0 8 16 0 active sync /dev/sdb 1 8 32 1 active sync /dev/sdc 3 8 48 2 spare rebuilding /dev/sdd

Det är tydligen 3e disken som falerar. Inget fel på den men det tar död på mina misstankar om att felet berodde på att de ligger på olika SATA-controllers då disk 1 ligger på en controller och 2-3 på en egen.
Nu ska jag låta rebuildingprocessen gå färdigt och se vad som händer

Permalänk
Medlem
Citat:

Är det normalt att den måste göra en rebuild när man just skapat arrayen?

Nej, det är inte normalt. Tydligen så lär det ha uppstått ett fel på den tredje disken.
Låt den bara rebuilda färdigt så kommer det säkert att fungera fint sen.

Citat:

En fundering jag har är om det kan ha med att göra att diskarna ligger på 2 olika SATA-controllers?

Det ska inte spela någon roll att du har olika kontrollers eftersom du kör mjukvaruraid.

Ett tips är att konfigurera mdadm så att den automatiskt meddelar dig över mail om en disk failar. Kör du RAID5 så har du, som du säkert vet, bara råd att tappa en disk. Det är därför extra viktigt att få reda på eventuella failures så tidigt som möjligt för att inte förlora data.:)

https://wiki.archlinux.org/index.php/Mdadm#Mailing_on_events

Permalänk
Medlem

Kolla status på S.M.A.R.T på diskarna med smartctl.
Kolla efter felmeddelanden från kontrollern i kernelloggen.

Permalänk

Nu är servern på plats och min array fungerar som den ska! Mycket riktigt så fungerade den efter att den fått köra klart sin rebuild (förstår fortfarande inte varför den var tvungen att köra denna).

Citat:

Ett tips är att konfigurera mdadm så att den automatiskt meddelar dig över mail om en disk failar. Kör du RAID5 så har du, som du säkert vet, bara råd att tappa en disk. Det är därför extra viktigt att få reda på eventuella failures så tidigt som möjligt för att inte förlora data.

https://wiki.archlinux.org/index.php...ling_on_events

Låter som en god idé! Jag har gjort uppsättningen och försöker köra testet men får svaret "Only one autorebuild process allowed in scan mode, aborting". Hmmm...