Filserver som inte startar helt korrekt.

Permalänk
Medlem

Filserver som inte startar helt korrekt.

Tjenare,
Är så att jag sitter på en filserver som kör FreeNAS, har fem diskar i mjukvaru raid5. Den har tuggat på helt felfritt flera månader. Nu råkar det dock vara så att en klantig jävel ansåg att den korrekta metoden för att starta om en switch är genom att slå av strömmen från grendosan...

Nu när jag startar upp burken stöter jag på problem, den har precis sagt att raid5 är aktiverat och att det finns fem diskar. Sedan kommer följande meddelande:

GEOM_RAID5: Raid5: ad16(3) : Warning: removed while 3 is missing.
GEOM_RAID5: Raid5: ad16(3) : disk removed
GEOM_RAID5: Raid5: ad16(3) : first write at 0,00% (cause: valid disk count)

/dev/raid5/raid5pl : 1572870976 BAD I=451397636
/dev/raid5/raid5pl : Unexpected soft update inconsistency; run fsck manually.

Sedan säger den att den avbryter boot och går till singel user mode.

Genom att bara skriva fsck får jag upp en lista över 5 faser typ check blocks and size.

Nu skulle jag uppskatta hjälp om hur jag forskrider. Mina kunskaper om unix är inte bra för fem öre och därför behöver jag klara råd om hur jag ska göra. Att påpeka att jag inte vill förlora något på diskarna är väll onödigt att säga kanske...

Permalänk
Medlem

Nu har jag aldrig hållt på med raid men det verkar som att den bara vill att du ska köra fsck. När du säger att du bara skriver fsck, menar du bokstavligt talat då? Fsck ska köras som "fsck <partition som ska kollas>". Alltså ska jag kolla min partition /dev/sda1 kör jag "fsck /dev/sda1". Vilken device som bör anges vid raid vet jag tyvärr inte.

Permalänk
Medlem

Jag körde bara in fsck i brist på fantasi.

Nu har jag i alla fall skrivit "fsck /dev/raid5/raid5p1 (även utan den sista delen) och får tillbaka att den inte kan bestämma filsystem typ.
Känns ju inte helt skoj. =/

Permalänk
Medlem

Vad händer om du skriver "mount"?

Permalänk
Medlem

Får:
/dev/md0 on / (ufs, local)
devfs on /dev (devfs, local)
/dev/da0a on /cf (ufs, local, read only)
procfs on /proc (procfs, local)

Lite mer info som kan vara värt att ha är väll kanske att det förutom raid arrayen bara finns ett usb minne där systemet ligger så inga andra diskar.

Permalänk
Medlem
Skrivet av Evil_AnAnAs:

Får:
/dev/md0 on / (ufs, local)
devfs on /dev (devfs, local)
/dev/da0a on /cf (ufs, local, read only)
procfs on /proc (procfs, local)

Lite mer info som kan vara värt att ha är väll kanske att det förutom raid arrayen bara finns ett usb minne där systemet ligger så inga andra diskar.

Är OSet installerat på usb-minnet alltså? Vad händer om du kör "fsck /dev/md0"?

Permalänk
Medlem

fsck_ufs /dev/raid5/raid5p1

Ibland kan fsck inte själv hitta vîlket filsystem det är, men om du har en UFS-partition på raiden kan du säga åt den att använda ufs som default. Det kör dock ihop sig om det INTE är UFS.

Permalänk
Medlem

fsck /dev/md0 resulterar i:
Could not determine filesystem type

Och fsck_ufs /dev/raid5/raid5p1 ger:
Can't stat /dev/raid5/raid5p1 : No such file or directory

Tack för att ni tar er tid och hjälper mig i denna lite frustrerande situation.

Permalänk
Medlem
Skrivet av Evil_AnAnAs:

fsck /dev/md0 resulterar i:
Could not determine filesystem type

Och fsck_ufs /dev/raid5/raid5p1 ger:
Can't stat /dev/raid5/raid5p1 : No such file or directory

Tack för att ni tar er tid och hjälper mig i denna lite frustrerande situation.

Testa "fsck_ufs /dev/md0".

Permalänk
Medlem
Skrivet av Evil_AnAnAs:

Och fsck_ufs /dev/raid5/raid5p1 ger:
Can't stat /dev/raid5/raid5p1 : No such file or directory

Och utan raid5p1? raid5s1?

Permalänk
Medlem

fsck_ufs /dev/md0 ger:

/dev/md0 (NO WRITE)
Last mounted on /
Root file system
Sedan de 5 faserna om att kolla block osv
Sedan lite om antalet filer och block.

Efter fsck_ufs /dev/raid5 får jag fram:
Can't resolve /dev/raid5 to a character special device.
/dev/raid5 is not a disk device
Continue y/n

y ->
/dev/raid5 (no write)
Cannot read blk 128

Continue y/n

y ->
The following disk sectors could not be read: 128 (+n1) till 143
ioctl (GCINFO) : Unknown error : -3
fsck_ufs : /dev/raid5 : cant' read disk label

Så frågan nu är ju lite hur man bäst försöker laga dessa sektorer, eller är det kanske så att just disk 3 faktiskt är trasig även om det känns väldigt osannolikt och jag isf bara behöver smälla in en ny disk i dess plats och låta den laga sig själv? =/

Oavsett ska det sitta en UPS direkt till denna server efter detta...

Permalänk
Medlem
Skrivet av Evil_AnAnAs:

fsck_ufs /dev/md0 ger:

/dev/md0 (NO WRITE)
Last mounted on /
Root file system
Sedan de 5 faserna om att kolla block osv
Sedan lite om antalet filer och block.

Efter fsck_ufs /dev/raid5 får jag fram:
Can't resolve /dev/raid5 to a character special device.
/dev/raid5 is not a disk device
Continue y/n

y ->
/dev/raid5 (no write)
Cannot read blk 128

Continue y/n

y ->
The following disk sectors could not be read: 128 (+n1) till 143
ioctl (GCINFO) : Unknown error : -3
fsck_ufs : /dev/raid5 : cant' read disk label

Så frågan nu är ju lite hur man bäst försöker laga dessa sektorer, eller är det kanske så att just disk 3 faktiskt är trasig även om det känns väldigt osannolikt och jag isf bara behöver smälla in en ny disk i dess plats och låta den laga sig själv? =/

Oavsett ska det sitta en UPS direkt till denna server efter detta...

Nu vet jag väldigt lite om just FreeBSD och UFS, men att strömmen stängs av borde verkligen inte skada filsystemet på ett sätt som inte fsck lagar lätt. Jag tror vi helt enkelt får avvakta lite tills någon som kan FreeBSD / FreeNAS ordentligt ser tråden.

Permalänk
Medlem

Låter vettigt, tack återigen för att ni tar er tid och hjälper mig!

Permalänk
Medlem
Skrivet av Evil_AnAnAs:

Låter vettigt, tack återigen för att ni tar er tid och hjälper mig!

Ingen fara, det är synd att vi inte har lyckats lösa något bara. Jag tycker det ser ut som att "fsck_ufs /dev/md0" ändå borde vara rätt, eftersom han identifierar det som rotfilsystemet. Det är där du har själva operativsystemet installerat eller? Säger den inget om något fel där?

EDIT:
Finns vissa flaggor du skulle kunna prova, t ex "-f" som säger åt den att kolla även om det ser felfritt ut. Kolla "fsck --help" för fler.

Permalänk
Medlem

Jag har heller inte erfarenhet av FreeNas eller UFS, men enligt lite googlande hittade jag följande som kan vara av intresse.

faq:0001 [FreeNAS]

FreeNAS forum • View topic - FYI - fsck info

/dev/md0 är nog usb-stickan som bootar FreeNas.

Permalänk
Medlem

Jag är ganska säker på att raid5'or kan förlora data vid strömavbrott. Speciellt om något håller på att skrivas just då.

Därför sitter min filserver i en UPS

Permalänk
Medlem
Skrivet av Chimpen:

Jag har heller inte erfarenhet av FreeNas eller UFS, men enligt lite googlande hittade jag följande som kan vara av intresse.

faq:0001 [FreeNAS]

FreeNAS forum • View topic - FYI - fsck info

/dev/md0 är nog usb-stickan som bootar FreeNas.

Om det hade varit usb-stickan, hade den inte hetat sdX då? mdX är ju vanligtvis en raidenhet.

Permalänk
Medlem

Enheterna heter inte lika på FreeBSD sås om på Linux. När jag skapade en minnesdisk med malloc så hette den md. Min USB-pinne hette da och hårddiskarna ad eller ada. Verkar som att raidenheten heter /dev/raid5p1 av felmeddelandet att döma (det ska nog vara siffran ett och inte bokstaven lilla L, det brukar vara en siffra efter p som indikerar vilken partition det är).

Min tolkning av felet verkar vara att den inte kommer åt hårddisken ad16.
Den säger ju "Raid5: ad16(3) : disk removed"
Soft update är väl någon funktion i UFS filsystem. Verkar alltså vara någon inkonsekvens i filystemet och därför vill den att man ska kolla det manuellt med fsck.

I och för sig borde väl en raid5 fortsätta fungera även med en disk borta? Kanske dessutom blev något fel man måste fixa med fsck? Eller kan den ha förlorat flera hårddiskar: "Warning: removed while 3 is missing"?
Kolla att hårddiskarna snurrar (kablar och annat).

Permalänk
Medlem

Alla diskar snurrar igång, ska leta upp någon boot skiva och försöka testa diskarna efter fysiska fel. Känns mer och mer som att jag kommer få formatera allt.

Permalänk
Medlem

om du provar att montera din raid och sedan kör fsck på den, vad händer då?

Permalänk
Medlem

Kan testa, hur monterar jag den då? Antar att jag måste avmontera den först?

mount /dev/raid5/raid5p1 typ?

Permalänk
Medlem
Skrivet av Evil_AnAnAs:

mount /dev/raid5/raid5p1 typ?

mount -t ufs /dev/raid5/raid5p1 /mnt

Borde fungera, om det är en ufs partition dvs, annars får du ändra på -t switchen.

Permalänk
Medlem

mount -t ufs /dev/raid5/raid5p1 /mnt :
No such file or directory

mount -t ufs /dev/raid5 /mnt:
Block device required

Ska försöka leta rätt på den skäggigaste nissen på IT i morgon och se om han kan tänka sig att kolla på det så han får pengar till fin kaffe till tentaplugget.

Permalänk
Medlem

kan inte så mycket om "normala" raids, men jag tittade bara på din mount högre upp i postsen och raiden var inte monterad. du har väl något raidverktyg, typ mdadm eller liknande som du kan kolla status på din raid med?

Permalänk
Medlem

Du skrev ju /dev/raid5/raid5pl i början och mekar sedan med /dev/raid5/raid5p1

Rätt stor skillnad på L och 1

Permalänk
Medlem
Skrivet av tolle:

Du skrev ju /dev/raid5/raid5pl i början och mekar sedan med /dev/raid5/raid5p1

Rätt stor skillnad på L och 1

Jag är rätt övertygad om att jag alltid skrivit 1? =/

Permalänk
Medlem
Skrivet av Evil_AnAnAs:

Jag är rätt övertygad om att jag alltid skrivit 1? =/

Ser ut som "l" i OP.

Permalänk
Medlem

vad händer om du kör en "camcontrol rescan all" ?

Permalänk
Medlem
Skrivet av anatoxin:

vad händer om du kör en "camcontrol rescan all" ?

Trodde tråden självdött så jag såg inte ditt svar.

Kör jag det får jag:

Re-scan of bus 0 was successful
Re-scan of bus 1 was successful

Alltid skoj när något är successful men i detta läget inser jag inte vad det innebär.
Ska sätta mig ner och pilla vidare nu är planen.