Premiär! Fyndchans i SweClockers Månadens Drop
Permalänk
Medlem

Starta upp efter HDD fail?

Jag har Debian 9 server.
Har raidat 3 Hårddiskar, en disk paijade.
Bytte hårddisk nu.

Systemet vägrar starta upp
Dependency failed for /home/deivid/block
Dependency failed for local file systems

You are in emergency mode. After logging in type "journalctl-xb" to view system logs, "systemctl reboot" to reboot, "syustemctl default" or D to try again to boot into default mode.
Give root password for maintance '8or press Control-D to continue):

Får inte nmed default starta.
Körde in umount /home/deivid/block

då mountades det felaktiga bort, men systemet bägrar ändå starta.

Den verkar tro att det finns systemfiler på "/home/deivid/block" ?
Eller varför?

Hela systemet är på ett USB minne som har inget med hårddiskarna att göra!!!
Har tom en backup på en annan usb minne vilket gör precis samma sak!

Det enda jag haft är ftp server, Samba och torrent!
Måste jag stoppa även dom på nåt sätt?

Kommer inte in nånstans nu, tom ssh från min andra dator säger
ssh deivid@192.168.10.173
ssh: connect to host 192.168.10.173 port 22: Connection refused

Permalänk
Medlem

Var ligger /home/devid/block - på USB ??

har du lagat RAID-delen - dess dev-id (som systemet troligen efterfrågar) kanske inte dyker upp förrän RAID-delen är funktionell igen. - var ligger temp-areor etc. ligger den på RAID så blir det svårt för OS att jobba innan RAID är igång igen.

Gissar att du måste klia i MDADM för att ta bort den trasiga disken och få in ersättaren och göra den aktiv och sedan reparera/resynka sig (antar att du kör RAID5 på dessa diskar) - med andra ord läs manualen för mdadm!

tänker man inte igenom det hela så blir det lätt att man sågar av grenen man sitter på om tex. en disk havererar och RAID-systemet inte är igång.

Många köpe-nasar brukar lägga en liten partition på samtliga diskar i RAID1 som man kör systemet på (och gör att den kan starta på vilken disk som helst som sitter ansluten) och sedan större partitioner (resten av disken) som man sätter ihop till vald RAID-konfiguration för datalagringen.

USB-sticka anser jag är för osäker media för att ha det som boot och system-enhet i längden - man kan ha det som alternativ startup när ordinarie system inte fungerar - men systemet skall inte hänga på USB-stickan för sin funktion.

Permalänk
Medlem
Skrivet av xxargs:

Var ligger /home/devid/block - på USB ??

har du lagat RAID-delen - dess dev-id (som systemet troligen efterfrågar) kanske inte dyker upp förrän RAID-delen är funktionell igen. - var ligger temp-areor etc. ligger den på RAID så blir det svårt för OS att jobba innan RAID är igång igen.

Gissar att du måste klia i MDADM för att ta bort den trasiga disken och få in ersättaren och göra den aktiv och sedan reparera/resynka sig (antar att du kör RAID5 på dessa diskar) - med andra ord läs manualen för mdadm!

tänker man inte igenom det hela så blir det lätt att man sågar av grenen man sitter på om tex. en disk havererar och RAID-systemet inte är igång.

Många köpe-nasar brukar lägga en liten partition på samtliga diskar i RAID1 som man kör systemet på (och gör att den kan starta på vilken disk som helst som sitter ansluten) och sedan större partitioner (resten av disken) som man sätter ihop till vald RAID-konfiguration för datalagringen.

USB-sticka anser jag är för osäker media för att ha det som boot och system-enhet i längden - man kan ha det som alternativ startup när ordinarie system inte fungerar - men systemet skall inte hänga på USB-stickan för sin funktion.

Tack för svaret!

home/deivid
Är på USB.

block är raidade hårddiskarna!

Har kört raid 0 om jag nu inte minns fel.

Jag ville bara ha en stor hårddisk, är inget känsligt på diskarna så har inte brytt mig om backup så.
Har stort sett använt datorn till att tanka ner torrents och nu failade en av diskarna (tror jag iaf) för den failade disken hittas inte ens av bios och kommer och går där. Är en gammal wd disk på 80Gb så man ska inte lägga så mycket krut på det.

Anledningen varför jag har på usb minne os är just att jag ville ha själva os skyddat från dom gamla hårddiskarna!
Men antar jag då gjort något fel är det själva raiden som gjort det?

Jag menar lägger jag in os på en separat disk skall det ju inte spela nån roll om andra diskarna dör. Men det kanske är annorlunda när man kör raid på en server?
Eller har jag lyckats os göra ändå beroende av diskarna där jag endast skulle tanka torrents till?

Tycker det är märkligt, för när jag installerade webmin och andra program så har jag INTE kunnat utnyttja utrymmet på raiden, utan endast utrymmet på usb disken!

Har allt det här blivit när jag höll på mounta (Raid) disken till /home mappen?

Anledningen varför jag gjort som jag gjort är att jag har tagit det jag har här hemma gamla diskar och usb minnen jag ej behöver till annat. Är kul testa nya saker och inte få allt bara plug and play från fabrik och med deras begränsningar också som följd.
Läst om NAS som kräver registrering och windows program o tom internetanslutning för att komma åt den egna hemmaservern.

Permalänk
Medlem

Om det är RAID0 (JBOD) så är hela disksetet trasig eftersom en disk fallit ur (disksetet har ingen redudans) - mdadm kan inte sätta ihop RAID:en vid start och därmed inte åstadkommer förväntad rätt devid som dina startskript sitter och väntar på och systemet haltar/låser sig/ger felmeddelande under uppstartsprocessen.

Detta har inget att göra med om OS sitter på separat disk/USB eller är inflätat i egen RAID1 på diskarna utan det beror på hur den som lagt upp det hela har tänkt sig med sitt script-skapande/GUI-skapande - och det är inte alls ovanligt att man glömt bort att hantera fallen när det verkligen skiter sig och programmen/GUI/Script fastnar på vägen då den förväntar respons från någon del som aldrig blir färdig (i ditt fall sätts inte RAID ihop korrekt) och du får fellägen och kommer inte vidare.

det är en gissning på vad som händer.

Iom. att RAID0 saknar en disk för att den är trasig så kan du inte nå någon av filerna på hela RAID-setet och i det här läget är det bara att bygga om RAID-setet från början igen och ladda med nya filer då du har förlorat samtliga filer på NAS:en.

Det är nu sanningen kommer fram om alla filerna som låg på NAS:en verkligen var oviktiga - i sådana situationer är det alltid någon eller flera filer som är "ja visst faan..." och var inte så oviktiga som man först tänkte sig och nu är förlorade för alltid.

Man skall alltid mäta en disk/raid-förlust i hur mycket tid och kostnad det tar för att återställa allt - överstiger priset/jobbet/tiden att tanka ned allt igen av vad en extern USB backudisk kostar - så börja man med att göra backupper... - även om det mesta är 'oviktiga filer' då den enda viktiga filen i samlingen som råkade finnas där just då och nu förlorades - kan vara värt mer än både diskar och NAS om man har otur.

Permalänk
Medlem
Skrivet av xxargs:

Om det är RAID0 (JBOD) så är hela disksetet trasig eftersom en disk fallit ur (disksetet har ingen redudans) - mdadm kan inte sätta ihop RAID:en vid start och därmed inte åstadkommer förväntad rätt devid som dina startskript sitter och väntar på och systemet haltar/låser sig/ger felmeddelande under uppstartsprocessen.

Detta har inget att göra med om OS sitter på separat disk/USB eller är inflätat i egen RAID1 på diskarna utan det beror på hur den som lagt upp det hela har tänkt sig med sitt script-skapande/GUI-skapande - och det är inte alls ovanligt att man glömt bort att hantera fallen när det verkligen skiter sig och programmen/GUI/Script fastnar på vägen då den förväntar respons från någon del som aldrig blir färdig (i ditt fall sätts inte RAID ihop korrekt) och du får fellägen och kommer inte vidare.

det är en gissning på vad som händer.

Iom. att RAID0 saknar en disk för att den är trasig så kan du inte nå någon av filerna på hela RAID-setet och i det här läget är det bara att bygga om RAID-setet från början igen och ladda med nya filer då du har förlorat samtliga filer på NAS:en.

Det är nu sanningen kommer fram om alla filerna som låg på NAS:en verkligen var oviktiga - i sådana situationer är det alltid någon eller flera filer som är "ja visst faan..." och var inte så oviktiga som man först tänkte sig och nu är förlorade för alltid.

Man skall alltid mäta en disk/raid-förlust i hur mycket tid och kostnad det tar för att återställa allt - överstiger priset/jobbet/tiden att tanka ned allt igen av vad en extern USB backudisk kostar - så börja man med att göra backupper... - även om det mesta är 'oviktiga filer' då den enda viktiga filen i samlingen som råkade finnas där just då och nu förlorades - kan vara värt mer än både diskar och NAS om man har otur.

Håller med att backup är viktigt!

Men jag har mina backup på externa diskar, dvd och tom flera uppsättningar.
Sedan har jag tom en del lagrat på google molnet.

Det jag nu förlorat är lite ratio på en torrent sida (då jag måste tanka om några saker på nytt).

Har nu försökt radera md0.
Men lyckas ej av nån anledning.

Mycket hjälp hittar man också till Ubuntu och BSD.
Men inte så mycket direkt till Debian även om Ubuntu är ju debian baserad, fått mycket hjälp av ubuntu support.

Men just den här raiden.

Körde
mdadm --stop /dev/md0

Inga fel blev det med commandot.

sudo umount /dev/md0

No such file or directory...

och umount home/deivid/block

fungerar ej längre, tog bort mappen "block", då jag inte visste vad göra.

Kört in
mdadm -S /dev/md0

fungerar ej.

Enligt F-disk står det inget om raid, som det enligt vissa skall stå där.

mdadm /dev/md? --fail detached --remove detached

Fungerar ej

o sen körde jag nåt commando som skall radera all raid info

Commandot sade inga fel och bootade om, men den gnäller fortfarande om device md0.

Hade kanske gått fortare ominstallera hela systemet, men förstår inte vad jag gjort för fel.

Permalänk
Medlem

[ 2.885010] sd 4:0:0:0: [sdd] No Caching mode page found
[ 2.885069] sd 4:0:0:0: [sdd] Assuming drive cache: write through
/dev/sdd1: recovering journal
/dev/sdd1: clean, 84692/97728 files, 356495/390400 blocks
[ 10.679841] MPU-401 device not found or device busy
[ TIME] Timed out waiting for device dev-md0.device.
[DEPEND] Dependency failed for /home/deivid/block
[DEPEND] Dependency failed for Local File Systems

Testade köra
Umount /dev/sdd1

umount: /: target is busy
(In some cases useful info processes that use the device is found by Isof(8) or fuser(1).)

Vill alltså nollställa hela raiden, men slippa ominstallera precis allt från början.
Nollställa så att jag åtminstone får ssh fungera, känns segt sitta på golvet o konfa en dator

Själva raiden var ju så enkel göra via webmin.
Men nu vägrar ju webmin ens starta då datorn är i nån panic mode.

Permalänk
Medlem

I mina ögon så verkar den som skrivit paketet inte tänkt på detta fall och nu fastnar du i ett startuppskript hela tiden där den 'måste' ha en fungerande RAID-device innan den går vidare, och kräver det innan några ssh-service eller annat har startat upp.

Att du tar bort md-0 mm. på annat sätt innebär inte att startupskriptet slutar att fråga efter denna och blockerar sig till allt är rätt enligt dess programmering och du kommer aldrig till det läget så att du kan ändra på det hela eftersom du aldrig kommer dit.

i din USB-sticka[1] så bör den innehålla scriptet - där handlar det om att hitta denna och kanske kommentera bort dom delarna som hanterar md-devicet för att komma vidare - men det beror också på hur mycket mera beroenden det finns inbyggt för den nu icke existerande RAID och kan stoppa på flertal ställen till under uppstarten.

Hur man skall kringgå detta vet jag inte eftersom jag inte känner till applikationen/programmet du använder, men det är klart en oönskad läge som man egentligen aldrig skall fastna i om man skall kunna administrera ett system som en dag inte fungerar om det skall.

en väg är att kontakta development-teamet som skapar programmet och se om de har förslag

alternativ är att skrota produkten och välja något annan programpaket eftersom du troligen får sätta upp det hela från början ändå.

[1] gör en diskimagekopia på hela USB-stickan innan du börja rota i denna!!

Permalänk
Medlem
Skrivet av xxargs:

I mina ögon så verkar den som skrivit paketet inte tänkt på detta fall och nu fastnar du i ett startuppskript hela tiden där den 'måste' ha en fungerande RAID-device innan den går vidare, och kräver det innan några ssh-service eller annat har startat upp.

Att du tar bort md-0 mm. på annat sätt innebär inte att startupskriptet slutar att fråga efter denna och blockerar sig till allt är rätt enligt dess programmering och du kommer aldrig till det läget så att du kan ändra på det hela eftersom du aldrig kommer dit.

i din USB-sticka[1] så bör den innehålla scriptet - där handlar det om att hitta denna och kanske kommentera bort dom delarna som hanterar md-devicet för att komma vidare - men det beror också på hur mycket mera beroenden det finns inbyggt för den nu icke existerande RAID och kan stoppa på flertal ställen till under uppstarten.

Hur man skall kringgå detta vet jag inte eftersom jag inte känner till applikationen/programmet du använder, men det är klart en oönskad läge som man egentligen aldrig skall fastna i om man skall kunna administrera ett system som en dag inte fungerar om det skall.

en väg är att kontakta development-teamet som skapar programmet och se om de har förslag

alternativ är att skrota produkten och välja något annan programpaket eftersom du troligen får sätta upp det hela från början ändå.

[1] gör en diskimagekopia på hela USB-stickan innan du börja rota i denna!!

Jag har gjort en image av systemet till en annan usb sticka.
Detta gjorde jag då allt fungerade.
Borde kanske gjort det innan raiden för raid konfigen finns med i den andra minnet som inte ens har suttit i datorn men felar om samma sak.

Vet att image kopian på den andra usb minnet har fungerat felfritt, men det var ju då raiden var hel.
Så kan ju inte vara några systemfiler på hårddiskarna.
Men systemet saknar ändå raiden och kan inte av nån anledning inte acceptera den utan den.

Så ja jag kan ju experimentera fritt, känns bara surt när inte ens ssh fungerar.

Frågan är att var det fel mounta diskarna till användaren deivid.
Borde kanske ha mountat dom nån annanstans?

Varför det blev hemma mappen var pga att det var mycket tjafs få till bla samba servern.

Men som root inloggning borde man väl kunna komma åt saker man gjort till en icke root användare?

Verkar ibland som att det bättre köra raid hårdvarumässigt....utan att blanda in os i det.

Permalänk
Medlem

Nu har jag helt enkelt kört commandot

/etc/webmin/start

Webmin startade!

Har inne i webmin varit och raderat raiden och nu startar systemet som vanligt.

Men nästa problem blev att jag kan inte göra ny raid.

Failed to save mount : Mount failed :

mount: wrong fs type, bad option, bad superblock on /dev/md0,
missing codepage or helper program, or other error

In some cases useful info is found in syslog - try
dmesg | tail or so.

Permalänk
Medlem

Startade upp min backup kopia av os från den andra stickan.
Startade webmin from kommandotolken.

Innme i webmin utan att jag gjort nåt står det på raid

/dev/md127 clean RAID0 (Striped) 531.49 GB /dev/sdb | /dev/sdc | /dev/sda

Allt stämmer in... dock ser jag md127.

Alla instruktioner och försökte även jag göra en ny raid på md0.

Ska se om jag blir klokare nu.

Startade även samba och min bärbara dator säger där att jag bara har 187 MB utrymme, vilket stämmer bra in på minnestickan.
Dvs raiden är helt åẗ skogen och inte mountad.

Tänkte bara mounta rakt av
Failed to save mount : The directory '/home/deivid/block' is already mounted

Inne i mounten står det
Other device md0

Ska testa att ändra till
RAID device 127
---------------------------------------------------------
hmmm...same problem

Failed to save mount : Mount failed :

mount: wrong fs type, bad option, bad superblock on /dev/md127,
missing codepage or helper program, or other error

In some cases useful info is found in syslog - try
dmesg | tail or so.
--------------------------------------------------------------
Nu tar jag create filesystem

Får vi se vad som händer.

---------------------------------------------------------------------

Jajjamensan, nu fungerar det.
Systemet bootade upp normalt och det står att jag har 560GB ledig enligt Samba.
Allt stämmer, ska se om torrenterna hoppar igång.

Som sagt kan vara bra starta upp webmin manuellt för där ser man allt i klartext och så tydligt utan krumeduler eller att om man råkar felstava i kommandotolken.

Visst hade säkert även ssh startat och livet också lättare än en halvdöd maskin som vägrar starta upp dem automatiskt.

--------------------------------------------------------------------------
Som en PS.
Fick problem med Transmission.
Men var pga att det saknades mappen Torrent.

Ändrade lite regler i webmins filhanterare för just "block" och nu fick jag tom skrivrättigheterna för Samba att fungera som tidigare strulat även när det gamla fungerade.