servern hittar inte de nya diskarna

Trädvy Permalänk
Medlem
Registrerad
Apr 2005

servern hittar inte de nya diskarna

Jag hjälper en vän som har en HP ProLiant DL360p Gen8 med plats för 8 diskar.

När vi gjorde om datorn första gången så byta han ut 4 diskarna mot SSD diskar och allt fungerade som det ska.
Nu när vi gjorde om den igen och så hade han köpt in andra 4 SSD för att byta ut så hittar inte OS eller den inbyggda RAID systemet de nya diskarna. Nu vet jag inte om det är samma med de gamla diskarna men det är något vi kan titta på men det borde ju gå med de nya SSD diskarna eller är det någon inställning man ska göra??

Trädvy Permalänk
Medlem
Registrerad
Aug 2016

Kollat att era nya SSD är kompatibel med använda diskkontrollerkort? - om inte så brukar det belönas med att alla fläktar i servern varva upp för att lätta och försöka flyga iväg och det går inte att trixa runt...

Vad är det för kontroller - P410, P420 - är de satta i IT-mode för alla slottar om du kör mjukvaru-RAID (P400 går ej att sätta i IT-mode utan man får sätta diskar i varsin volym - med påfallande liten prestandaförlust faktiskt...)

(med P400 går inte att byta under drift om man har varje disk som egen volym utan kräver en omstart för att hittas och konfigurering i dess BIOS för att bli en volym som syns utåt igen)

Kör du dess HW-RAID med flera diskar i samma volym så vill dom att diskarna helst skall vara lika stora (en del accepterar dock större diskar) och samma typ - dvs. SATA eller SAS inom hela logiska RAID-volymen.

Om du plugga in de nya SSD för diskplats 5-8 utan att ersätta de gamla SSD så måste du gå in i BIOS och rota och förhoppningsvis kan få RAID:en att växa till att inkludera de nya SSD:n i volymen - är det P400 så är max volymstorlek 2TB och går inte att ta sig förbi, utan man får göra fler volymer och köra mjukvaru-RAID. - givetvis backup på allt innan sådana övningar.

Du behöver också i BIOS bestämma vilken av volymerna som skall vara startvolym och där OS skall installeras. Traditionell brukar man ha 1 diskpar av inte så stor storlek (traditionellt 146GB SAS-diskar av 10 eller 15 krpm-typ) i RAID1-volym som start och OS-volym medans de andra 6 diskplatserna konfigureras som lagrings-RAID i RAID5 eller RAID6.

När du tar ur alla gamla diskar så är denna information borta då dessa ligger i de första sektorerna på diskarna (detta för att man skall kunna flytta diskarna till en annan kontroller av samma typ ifall den gamla havererat och startas upp precis med samma konfiguration som med den gamla kontrollern)

Det är _inte_ automatiskt på samma sätt som köpeNAS med mjukvaru_RAID och md-adm RAID i botten. HW-RAID-kort kan vara bestar att hantera och griniga med vilken typ av diskar som ansluts...

---

Slutligen - är det HW-raid-kontroller av P400, P410, P420 - se för sjuttsingen till att batteribackup/Flashminnes-backup för diskkontrollerns RAM-minne att batteridelen/kondensatorpaketet verkligen fungerar - det har enorm påverkan på prestandan om den inte fungerar (dvs. skriv-cachen ej aktivt) och blir frusen sirap-slött och med denna fungerande och om man ser på en maskin med P400-kontroller så är SSD extremt tveksam förbättring gentemot kostnaden i jämförelse med bunt 10 krpm SAS-diskar och maxad RAM-minne på moderkortet (och vettig OS förstås med rejäl diskcache) då man också tappar halva SAS-bandbredden när man går över till SATA - samt NCQ-kön blir väldigt liten (går från 255 steg i djup till 32 steg i djup) och att det inte längre kör duplex i trafiken till/från diskarna påverkar också prestandan till det sämre.

När jag blandade 5 SAS-diskar med 1 SATA-disk med på pappret inte så olika rå-prestanda i samma mjukvaru-RAID, så tappade RAID ungefär 75% av sin skriv och läshastighet och man verkligen såg hur alla SAS-diskar satt och väntade på att SATA-disken skulle bli klar någon gång - här tror jag inte var någon problem med rå-hastigheten eller söktider - utan flaskhalsen var nog på just på NCQ-sidan och hur mycket RAM-minne disken hade internt. Har _inte_ prova med någon SSD då jag inte har tillräcklig stor SSD som matchar SAS-diskarna i storlek.

Är det gamla sorten BBWC batteri-pack så kan dess batterier (som är NiMh) ersättas av 1000 mA R06/R003-celler (köpta på Ikea...) i lämplig batterihållare, som löds fast på kretskortet som höll batteriet tidigare - vad noga med inkoppling av + och - är rätt då en felkoppling - även om det bara snuddar - troligen förstör både BBWC och inkopplade cache-RAM på diskkontrollerkortet.vrite-chasen på diskkontrollerkortet slås inte på förrän BBWC-modulen tycker att batterierna är tillräckligt laddad - vilket kan ta ett par timmar, och bedöm inte diskkontrollerkortets prestanda förrän den har BBWC-laddad då dessa kort är inte ett dugg roliga i prestanda om BBWC inte fungerar...

Trädvy Permalänk
Medlem
Registrerad
Apr 2005

oj vad mycket bra info man fick.

Det är en 410 eller 420, har inte tillgång till maskinen just nu men en sak när du säger det så varvar inte fläktarna upp utan han har sagt "Vad tyst servern är nu mot innan"

Så det kanske inte går att köra med de diskarna utan vi ska nog först prova med de gamla diskarna.

Hmm batterierna på RAID så man kan se så det inte är något sirap, hur ser man sådant??

Trädvy Permalänk
Medlem
Registrerad
Aug 2016

HPE:s smartstart cdskiva så kan du se och konfigurera din raid och även se om write-cache är aktiv (slås av automatiskt om inte fungerande BBWC finns till RAM-cachen) - det går att tvångsinkoppla skrivcache men det kan ge totalhavererad RAID om du får strömavbrott och det är data under skrivning mot diskarna.

[det är HW-RAID-diskarna stora fördel gentemot de flesta mjukvarubaserade RAID-lösningar - att integriteten på RAID-arrayen hålls intakt även vid strömavbrott med hjälp av BBWC då en mjukvaru-RAID tappar all aktuell status och pågående transaktioner över sina RAID-diskar och riskerar att gå korrupt.

Filsystem som ZFS har lagt ned rätt mycket krut på journaler, specielle loggdiskar etc. för att just hantera 'plötslig strömavbrott' och all data i RAM-förvinner när som helst i olika läs och skrivprocessen utan att tappa tråden - medans de flesta andra mjukvaru-RAID just bara hoppas att det inte skrevs något tvetydigt och man inte vet vilket som är rätt vid en senare läsning.

BTRFS bygger mycket på transaktionshantering med ofta 'commit' och är det inte 'commit' gjord så är det inte klart och vid nästa uppstart efter en strömavbrott och korrektheten inte kan redas ut mha. checksummor så backar man till den föregående färdiga commit och utgår därifrån och tillsammans med checksummor på filer har koll vilket som gäller om man i tex en RAID1 ger olika data från resp. disk för att filerna inte skrevs/uppdateras exakt samtidigt och det bröts mitt under skrivningen.

md-adm RAID i linux kan också slå på journalföring (är väl fortfarande lite på beta-stadie) men default avstängd då sådana saker drar ned prestandan mycket.

moderkorts RAID1 brukar vid dessa tillfällen med konflikt med olika värden på samma LBA-adress på resp disk, dela upp RAID-volymen till två separata diskar och användaren själv får sedan avgöra vilken disk som hade den mest korrekta datat...]

---

Gamla skrytdokument om hur mycket mer prestanda det ger med write-cache aktivt - lite utdaterad men ändå

https://community.hpe.com/hpeb/attachments/hpeb/itrc-264/1027...

---

Det finns LED-indikatorer på sjäva BBWC som berättar status om den är aktiv, om det finns aktiv data i disk-cachen som ännu inte hunnit skrivas ut på diskarna (tex. blev strömavbrott mitt under skrivningen) etc. - det är tänkt att man skall kunna slita loss controllerns cache-minne (med batteribackup ansluten då) och trycka på en annan P4Xx-kort - flytta med diskarna - slå på strömmen så att diskarna varvar upp och skrivningarna slutförs på diskarna.

Sidan 33 i https://community.hpe.com/hpeb/attachments/hpeb/itrc-264/1003... beskriv hur lysdioderna skall tolkas

när det gäller byta trasig batteri i BBWC, kika på: http://opensource.wrenhill.com/?p=63

tillägg man behöver inte bryta sönder plasthållaren för batterier utan kretskortet går att ta ur ändå då det bara hålls med plastsnäppen.

tänk på att för P410(i) och uppåt så finns också flash-minnesbaserade cache-minne för diskkontrollern och då är det kondensatorbank istället för batteri med energi lagom att överföra innehållet i RAM-cachet till flashminne vid plötslig strömavbrott.

lite länk till dokument man kan gräva vidare i https://support.hpe.com/hpsc/doc/public/display?docId=emr_na-... - troligen kan du hitta smartstart-ISO:n även den vägen, men jag orkar inte leta fram den åt dig då det är hur mycket som helst att leta i...

---

Slutligen - servrar är helt annan best att hantera än vanliga kontors-PC och Gamer-riggar - för servrar så är fokus, förutom att allt skall kunna fjärrstyras över nätverk inklusive slå av och på strömmen, pilla i BIOS, installera från iso-avbilder etc., driftsäkerhet och räddningsbarhet vid disk och RAM-minnes fel/haveri. - Därför självrättande ECC-minne på allt inklusive cacheminne till diskkontrollerna, batteribackup på sistnämnda, kan konfigurera upp olika RAID-strukturer inklusive hot spare och cold spare diskar som kan ta över och synkas upp vid minsta strul på någon av de ordinarie diskarna.

på G7-servarar och uppåt har även RAM-minne med en extra slot för extra minnes-modul som hot spare och kan ta över ifall någon minnes-modul skulle börja generera för mycket ECC-event och därmed anses osäker.

Enterprise-SSD har också rätt omfattande arrangemang med kondensator-banker för att säkra att SSD:s innehåll som fortfarande ligger i RAM i SSD diskkontrollern, flyttas till flash vid strömavbrott och ej hamna i icke startbara lägen eller korrupta sektorer.

Konsument SSD har inte sådana skyddsmekanismer utan fungerar lite på samma sätt som mjukvaru-RAID - man hoppas på det bästa och kanske klarar 19 ggr av 20 tillfällen och när det inte klarar sig så är det skit på riktigt. Enterprise-prylar får inte göra så och chansa, utan datat skall säkras - varje gång! vid tex. strömavbrott eller plötslig oförberedd avstängning.

Trädvy Permalänk
Medlem
Registrerad
Nov 2016

@TheCazz: Finns bara ett svar. Följ guiden och listan på denna sida: http://dascomputerconsultants.com/HPCompaqServerDrives.htm
Alla diskar som listas där fungerar med hp servers. De testar konsument SSD kompatibiliteten i servers. De SSD som inte fungerar och vad som händer står också med i listan. Vad jag förstått skall man alltid satsa på Intel SSD konsument och då får man inte heller några problem i just HP servers. HP servers är mer kräsna mot konsument SSD än Dell servers. Vad jag läst mig till i diverse forum är att just Dell servers sväljer allt i konsumentväg beträffande SSD disk. Dells begagnade servers är dock oftast också dyrare då det är större efterfrågan på de av just denna orsak. Begagnade HP servers är billigare, då deras hemsida med drivrutiner/bios är helt nedlåst idag och kräver serviceavtal för att få tillgång till detta medans Dells hemsida för servers, uppdaterar drivare bios och släpper det gratis än idag. Det finns även en del Samsung SSD som fungerar, men överlag är det just Intel SSD konsument diskar man skall satsa på. Även Intel företags(enterprise) SSD diskar fungerar bäst i både HP servers samt Dell servers.

Trädvy Permalänk
Medlem
Registrerad
Apr 2005

Jo troligtvis så får vi sätta in hans gamla diskar i enheten igen men det som jag måste kolla upp varför den är EXTREMT seg RAID och fick tipset av xxargs här ovanför att kolla upp för den var inte så seg innan när den körde på ett OS och nu kör den på vmware esxi 6.7