Exempel Gällivare: hur säker är kommunal IT-drift?

Permalänk
Medlem

Jag ska köra en snabb genomgång hur det fungerar i en kommun:

Kommunen eller en förvaltning behöver ett nytt system, beroende på om det är kommun-gemensamt eller förvaltningsspecifikt. Då ska en upphandling göras.

Du vänder dig till kammarkollegiet eller Kommentus och ser hur ramavtal ser ut, vilka leverantörer får du lov att gå ut med ett underlag till direkt eller om alla kan lämna anbud. Finns det i någon av dessa är det oftast prispressat.

Anbudsunderlaget författas av ansvarig för upphandlingar på din kommun oftast med hjälp av (får man hoppas) IT-avdelningen som kan se över de tekniska kraven. Denna går ut till olika leverantörer som kan välja att lämna anbud.

Det finns en anledning till att man mest ser Dell, HP och IBM ute. Ingen kan konkurrera med dem i volymer och pris. Ingen kan erbjuda lika snabb hjälp vid ett haveri.

En kommun är inte himpavimpa vi gör som vi känner vi testar detta eller detta. Det ska funka 24/7 annars försvinner samhällskritiska funktioner.

När det dock BLIR problem så är det oftast för att snålheten varit framme, har man en offsite? Har man dubbla SAN med replikering och HB? Dubbelt av allt är ju så klart alltid att föredra. Fast då gnäller folk för att de måste betala skatt...

Visa signatur

Who dosen´t love gadgets?

Permalänk
Medlem
Skrivet av Pie-or-paj:

För att en disk ska dö ungefär samtidigt som när en annan disk med exakt samma driftförhållanden under exakt samma tid av exakt samma modell och batch dog, när den dessutom upplever den största belastningen under hela sin livstid?

Jag skulle gärna spela på hans lotteri!

RAID 5 är inte en stabil konfiguration http://www.zdnet.com/article/why-raid-5-stops-working-in-2009...

och hot spares btw? why? just why? har du plats för att koppla in ytterligare en disk ska den också användas för paritet.

Vet inte vad du far efter, alla diskar bär paritet. Har du reservdisk så börjar den göra rebuild direkt, inte när IT-ansvarige (ährmmm...) behagar komma tillbaka efter semestern och ser att två diskar börjar ge med sig.
RAID 5 är en stabil konfiguration, men inte förstahandsvalet idag.

Permalänk
Medlem
Skrivet av IuZ:

Du vänder dig till kammarkollegiet eller Kommentus och ser hur ramavtal ser ut, vilka leverantörer får du lov att gå ut med ett underlag till direkt eller om alla kan lämna anbud. Finns det i någon av dessa är det oftast prispressat.

Anbudsunderlaget författas av ansvarig för upphandlingar på din kommun oftast med hjälp av (får man hoppas) IT-avdelningen som kan se över de tekniska kraven. Denna går ut till olika leverantörer som kan välja att lämna anbud.

Det finns en anledning till att man mest ser Dell, HP och IBM ute. Ingen kan konkurrera med dem i volymer och pris. Ingen kan erbjuda lika snabb hjälp vid ett haveri.

Ungefär precis här, har vi orsaken till att det blir få open source lösningar i svensk kommun, och stats-infrastruktur. Mellan tumme och pekfinger är det precis noll och intet över, till alternativ.

Skrivet av Dunde:

Vet inte vad du far efter, alla diskar bär paritet. Har du reservdisk så börjar den göra rebuild direkt, inte när IT-ansvarige (ährmmm...) behagar komma tillbaka efter semestern och ser att två diskar börjar ge med sig.
RAID 5 är en stabil konfiguration, men inte förstahandsvalet idag.

"Problemet" är att en array i dag är så stor, tack vare diskarnas storlek, att sannolikheten för att ett slumpmässigt fel ska inträffa under en rebuild, i princip är garanterad. Det blir inte bättre av att diskarna ju är precis lika gamla, och därmed lika "felbenägna" som disken som packade ihop till att börja med.
Hot-spare var ett bra alternativ när man kunde vara rimligt säker på att en rebuild kunde ske utan problem. I dagsläget är jag inte direkt något gigantiskt fan. Jag har konfigurerat alla system med hot spare, om de inte kan köra med RAID6, men samtidigt sett till så att en rebuild inte är automatisk, utan måste triggas manuellt.

Visa signatur

Allting jag skriver är om inget annat uttrycks, min åsikt! Ingenting måste vara dagens sanning enligt din åsikt, och gör du antaganden baserade på mina åsikter hoppas jag att du övervägt mer än bara just min åsikt.

Permalänk
Medlem
Skrivet av IuZ:

Nu är ju Tyskland Linux-land. De kör det på de flesta ställen. Ge mig nu ett exempel på ett storföretag som kör Open source.

När det sen gäller OpenStack så är väl det cloudbased och ceph känns inte helt färdigt.

Som sagt exempel på buiness som gått över till det i sin helhet.

Roligt hur du avfärdar mina argument när de inte passar in i din bild. Flera av de tyska kommunerna kan ses som storföretag,
både till omsättning och antal anställda.

Flera av dessa har visioner och är inte rädda att prova nya vägar. Kanske något som Sverige skulle behöva lära sig?
Dessutom kan du google fortune 500 och open source så får du mera läsning.

Visa signatur

| Citera för svar! | Gilla bra inlägg! |

Permalänk
Medlem

@BrusE: Vi använder oss självklart av Linux där jag jobbar men det är ett fåtal maskiner där vi behöver dra nytta av just Linux. Dock inte inom lagringsbiten. Det finns en anledning till att IBM Storwize och HP 3part är populära, det är bra grejer.

Visa signatur

Who dosen´t love gadgets?

Permalänk
Medlem

@-=Mr_B=-: Det må så vara men man har inte möjligheten att pilla runt och leka med open source-lösningar i samma utsträckning. Det är andra behov, driftsäkerhet och support framförallt.

Att det sedan i detta fall gått fel, ja så kan det vara men jag tror inte att det beror på att man inte körde open source.

Visa signatur

Who dosen´t love gadgets?

Permalänk
Medlem

Jag skulle vilja lägga till en sak till. Vet alla vad en IT-strateg gör eftersom hens kompetens attackeras? Vad är hens arbetsuppgifter?

Visa signatur

Who dosen´t love gadgets?

Permalänk
Medlem
Skrivet av Söderbäck:

Nä men nu är det många i formet tolkar situationen som fan läser bibeln (verkar det som).

Som jag tolkar den nyheten så har kommunen inte misstagit RAID för backup.
@FatherOfThree jag är inte med på hur du kommit fram till att backup saknats?

Det som har hänt som jag förstår det är att deras system för att garantera uptime inte varit tillräckligt utbyggt. Det i sig är trist, ja. Däremot står det inget i nyheten om att data gått förlorad för alltid utan informationen har inte varit tillgäng ett tag men allt ska vara igång och åtkomligt igen inom en tid efter driftstoppet.

Som jag ser det har de alltså haft backup som de har kunnat ta fram igen men när driftservern varit nere för underhåll medan man återställt data så har det inte gått att sätta igång ordinarie drift igen. Just för att de inte tagit höjd för att det ska behövas. Uptime trodde de skulle vara säkrat av raid5 vilket inte verkade fungera enligt plan. Men att backup skulle ha saknats helt ser jag inte att nyheten ger belägg för.

Eller är det här helt uteslutet?

Så som jag tolkar det är det alltså snarare många i forumet som i ren iver över att få berätta att raid minsann inte är backup (vilket visserligen är sant) inte läser nyheten ordentligt och själva drar en del ogrundade slutsatser.

Ja OK, det är inte fullständigt klart i artikeln om "backup" fanns eller inte.
Men det löjeväckande "Lotto-vinst-försvaret" av RAID-systemet ger mig klart dåliga vibbar.

När man efter 10-11 dagar endast har fått igång mailsystemet, samt att "livsviktiga" system fortfarande inte är återställda:
Då är min tolkning att backupen saknades, eller en snäll tolkning, "inte var tillfyllest".

Visa signatur

“There will be people that are burdened by only having the capacity to see what has always been instead of what can be.
But don’t you let that burden you.”

Permalänk
Hedersmedlem
Skrivet av FatherOfThree:

Ja OK, det är inte fullständigt klart i artikeln om "backup" fanns eller inte.
Men det löjeväckande "Lotto-vinst-försvaret" av RAID-systemet ger mig klart dåliga vibbar.

När man efter 10-11 dagar endast har fått igång mailsystemet, samt att "livsviktiga" system fortfarande inte är återställda:
Då är min tolkning att backupen saknades, eller en snäll tolkning, "inte var tillfyllest".

Allt ska ju vara återställt om ett tag. Det går inte utan en fungerande backup. Det är deras uptimesystem som inte har levererat den här gången. Ja och hur lång tid det tar med återställning kanske.
Oavsett låter det inte som att någon blandat ihop raid med backup i det här fallet tycker jag.

Skickades från m.sweclockers.com

Visa signatur

💻 → Lenovo Yoga slim 7 pro 14" Oled
🎮 → Steamdeck

Permalänk
Medlem

Ursäktar på förhand då nedan blev mer av en krönika än ett inlägg....

Jag lär låta som en pessimist och domedagsprofet nu men... ja, artikeln är på många sätt skrämmande.

Nu har Gällivare hamnat i blåsväder för denna fadäs, men den lite brinnande frågan är hur många övriga myndigheter som sitter på en liknande RAID5/RAID6 lösning, troligtvis inköpt från leverantör anno 2005-2007, hålls fortfarande rullande idag, underpresterande, och kostar antagligen multum i underhåll och förlängda supporta avtal, -om ens det finns sådana tillgängliga.

Att vara leverantör åt SKL måste således vara ett fantastiskt lukrativt läge för att kunna bada i skattepengar von Anka-style.

Det finns säkerligen fler sjukhus och myndigheter som sköter "backup" på det här sättet inom Sveriges gränser.
Allt för mycket lämnas åt slumpen p.g.a. bristande kompetens och interna omplaceringar "förändrade arbetsuppgifter" där man ej tillämpar rätt person(baserat på kompetens, -inte kön mm.) på rätt plats(roll).
Ovan i kombination med regeringens oengagemang att ta fram en nationell rikstäckande IT-agenda eller standard för lägsta-nivå om hur man ska få implementera och hantera viktiga journalsystem som dessa.
Man kan inte halvsatsa i sådana lägen och sedan gråta över spilld mjölk.

Transportstyrelsen är ju bara en myndighet i ledet där den bristande hanteringen/kompetensen för outsourcing så smått bubblat upp till ytan i efterhand. Antalet ID-stölder bara ökar. -Beror det på en läcka? Förmodligen lär vi aldrig få veta det fullt ut men snart kanske "försäkring mot ID-kapning" blir till den största inkomstkällan för försäkringsbolagen...

Denna ekonomiska (och tekniska) inkompetens och misskötsamhet banar till slut väg för ytterligare beslut om idiotiska outsource:ade lösningar, i hopp om att det i slutändan skall bli billigare och mera mobilt/bättre åtkomligt. -Avtal som snarare lär bli mycket dyra i slutändan då man i det läget även måste planera för nätavbrott när det berör samhällskritiska inrättningar såsom sjukhus och vårdcentraler.

Slumpen är alltså det som avgör om något fungerar eller inte för nästa 10 års period.

Visa signatur

Tower: ace Battle IV | CPU AMD Phenom II X2 BE unlocked 4cores@3,2GHz | RAM 8GB DDR2@800MHz | MB ASUS M4A785-M | GFK AMD Radeon HD 6850 1GB | HDD Kingston SSD Now 60GB (/) Seagate 2TB(/home) | OS Ubuntu 20.04 LTS
-Numera titulerad: "dator-hipster" då jag har en AMD GPU och dessutom kör Linux.

Permalänk
Medlem
Skrivet av IuZ:

Nu är ju Tyskland Linux-land. De kör det på de flesta ställen. Ge mig nu ett exempel på ett storföretag som kör Open source.

När det sen gäller OpenStack så är väl det cloudbased och ceph känns inte helt färdigt.

Som sagt exempel på buiness som gått över till det i sin helhet.

Ett exempel: Red Hat?

Ursäkta min lustighet...

Visa signatur

Tower: ace Battle IV | CPU AMD Phenom II X2 BE unlocked 4cores@3,2GHz | RAM 8GB DDR2@800MHz | MB ASUS M4A785-M | GFK AMD Radeon HD 6850 1GB | HDD Kingston SSD Now 60GB (/) Seagate 2TB(/home) | OS Ubuntu 20.04 LTS
-Numera titulerad: "dator-hipster" då jag har en AMD GPU och dessutom kör Linux.

Permalänk
Inaktiv
Skrivet av Ridder:

Sannolikheten att en till disk kraschar vid återbildning är hög. Då diskarna ofta är använda lika länge. En rebuild sliter rejält på hårddiskarna som finns kvar.

Helt sjukt att skattepengar går till dessa superstjärnor alltså :S

Oberoende av det så är felfrekvensen på dagens diskar sådan att du har typ 30% chans, beroende på disk storlekar och fel frekvenser) att det felar medan arrayen återuppbyggs. Det är därför som ingen vettig använder RAID5 längre. Det är att be om problem.

Permalänk
Inaktiv
Skrivet av krigelkorren:

Ursäktar på förhand då nedan blev mer av en krönika än ett inlägg....

Jag lär låta som en pessimist och domedagsprofet nu men... ja, artikeln är på många sätt skrämmande.

Nu har Gällivare hamnat i blåsväder för denna fadäs, men den lite brinnande frågan är hur många övriga myndigheter som sitter på en liknande RAID5/RAID6 lösning, troligtvis inköpt från leverantör anno 2005-2007, hålls fortfarande rullande idag, underpresterande, och kostar antagligen multum i underhåll och förlängda supporta avtal, -om ens det finns sådana tillgängliga.

Att vara leverantör åt SKL måste således vara ett fantastiskt lukrativt läge för att kunna bada i skattepengar von Anka-style.

Det finns säkerligen fler sjukhus och myndigheter som sköter "backup" på det här sättet inom Sveriges gränser.
Allt för mycket lämnas åt slumpen p.g.a. bristande kompetens och interna omplaceringar "förändrade arbetsuppgifter" där man ej tillämpar rätt person(baserat på kompetens, -inte kön mm.) på rätt plats(roll).
Ovan i kombination med regeringens oengagemang att ta fram en nationell rikstäckande IT-agenda eller standard för lägsta-nivå om hur man ska få implementera och hantera viktiga journalsystem som dessa.
Man kan inte halvsatsa i sådana lägen och sedan gråta över spilld mjölk.

Transportstyrelsen är ju bara en myndighet i ledet där den bristande hanteringen/kompetensen för outsourcing så smått bubblat upp till ytan i efterhand. Antalet ID-stölder bara ökar. -Beror det på en läcka? Förmodligen lär vi aldrig få veta det fullt ut men snart kanske "försäkring mot ID-kapning" blir till den största inkomstkällan för försäkringsbolagen...

Denna ekonomiska (och tekniska) inkompetens och misskötsamhet banar till slut väg för ytterligare beslut om idiotiska outsource:ade lösningar, i hopp om att det i slutändan skall bli billigare och mera mobilt/bättre åtkomligt. -Avtal som snarare lär bli mycket dyra i slutändan då man i det läget även måste planera för nätavbrott när det berör samhällskritiska inrättningar såsom sjukhus och vårdcentraler.

Slumpen är alltså det som avgör om något fungerar eller inte för nästa 10 års period.

Lösningen är att staten har en egen IT drift myndighet som sköter IT driften åt alla myndigheter och annat som ska vara säkert. Det kan vara att de sköter det lokalt eller centralt (privat moln) men att det sköts av kompetent folk. Visst det går inte att stjäla lika mycket pengar jämfört med privatisering till sina polare men det leder till system som fungerar och inte läcker information som ett såll.

Permalänk
Hedersmedlem
Skrivet av krigelkorren:

Ursäktar på förhand då nedan blev mer av en krönika än ett inlägg....

Jag lär låta som en pessimist och domedagsprofet nu men... ja, artikeln är på många sätt skrämmande.

Nu har Gällivare hamnat i blåsväder för denna fadäs, men den lite brinnande frågan är hur många övriga myndigheter som sitter på en liknande RAID5/RAID6 lösning, troligtvis inköpt från leverantör anno 2005-2007, hålls fortfarande rullande idag, underpresterande, och kostar antagligen multum i underhåll och förlängda supporta avtal, -om ens det finns sådana tillgängliga.

Att vara leverantör åt SKL måste således vara ett fantastiskt lukrativt läge för att kunna bada i skattepengar von Anka-style.

Det finns säkerligen fler sjukhus och myndigheter som sköter "backup" på det här sättet inom Sveriges gränser.
Allt för mycket lämnas åt slumpen p.g.a. bristande kompetens och interna omplaceringar "förändrade arbetsuppgifter" där man ej tillämpar rätt person(baserat på kompetens, -inte kön mm.) på rätt plats(roll).
Ovan i kombination med regeringens oengagemang att ta fram en nationell rikstäckande IT-agenda eller standard för lägsta-nivå om hur man ska få implementera och hantera viktiga journalsystem som dessa.
Man kan inte halvsatsa i sådana lägen och sedan gråta över spilld mjölk.

Transportstyrelsen är ju bara en myndighet i ledet där den bristande hanteringen/kompetensen för outsourcing så smått bubblat upp till ytan i efterhand. Antalet ID-stölder bara ökar. -Beror det på en läcka? Förmodligen lär vi aldrig få veta det fullt ut men snart kanske "försäkring mot ID-kapning" blir till den största inkomstkällan för försäkringsbolagen...

Denna ekonomiska (och tekniska) inkompetens och misskötsamhet banar till slut väg för ytterligare beslut om idiotiska outsource:ade lösningar, i hopp om att det i slutändan skall bli billigare och mera mobilt/bättre åtkomligt. -Avtal som snarare lär bli mycket dyra i slutändan då man i det läget även måste planera för nätavbrott när det berör samhällskritiska inrättningar såsom sjukhus och vårdcentraler.

Slumpen är alltså det som avgör om något fungerar eller inte för nästa 10 års period.

Pessimism och domedagsprofetior åsido.
Artikeln verkar inte ha belägg för att sjukhuset har haft RAID som backuplösning. Även om det inte är helt uteslutet så är det mindre troligt att det rörde sig om fallerad backup. Alla data är ju på väg att återställas vilket vanligen kräver en fungerande backup ;).

Lärdomen jag drar från denna tråd är väl snarare hur folk tagit fram högafflarna samt skrivit långa inlägg om hur driftansvarigas kompetens är undermålig när de misstagit raid för backup. Men det finns det inte belägg för in nyheten. I själva verket verkar det i det här fallet handla om bristande kompetens i källtritik (eller bristande vilja att bry sig längre än rubriksättningen) bland en del skribenter i tråden.
Tänkvärt minst sagt.

Visa signatur

💻 → Lenovo Yoga slim 7 pro 14" Oled
🎮 → Steamdeck

Permalänk
Hedersmedlem
Skrivet av IuZ:

@BrusE: Vi använder oss självklart av Linux där jag jobbar men det är ett fåtal maskiner där vi behöver dra nytta av just Linux. Dock inte inom lagringsbiten. Det finns en anledning till att IBM Storwize och HP 3part är populära, det är bra grejer.

Nu blandar du lite äpplen och päron då dina exempel gäller en produkt som är lika mycket hårdvara (skulle kanske ha varit ett "e" extra, som HPE 3PART?). Det här drivs inte av några generella operativsystem och mjukvaror, utan har en mycket specifik och begränsad tillämpning, något som kan fungera väl att utveckla och underhålla. Vilken host som ansluter till dessa är en intressantare fråga.

(Kanske återkommer med något annat inlägg om jag får tid.)

Permalänk
Medlem
Skrivet av Söderbäck:

Pessimism och domedagsprofetior åsido.
Artikeln verkar inte ha belägg för att sjukhuset har haft RAID som backuplösning. Även om det inte är helt uteslutet så är det mindre troligt att det rörde sig om fallerad backup. Alla data är ju på väg att återställas vilket vanligen kräver en fungerande backup ;).

Lärdomen jag drar från denna tråd är väl snarare hur folk tagit fram högafflarna samt skrivit långa inlägg om hur driftansvarigas kompetens är undermålig när de misstagit raid för backup. Men det finns det inte belägg för in nyheten. I själva verket verkar det i det här fallet handla om bristande kompetens i källtritik (eller bristande vilja att bry sig längre än rubriksättningen) bland en del skribenter i tråden.
Tänkvärt minst sagt.

Försvarar du oklara katastrofrutiner utifrån principer?

För det första handlar det här om Gällivare Kommun, och inte om något sjukhus.

För det andra använder IT-strategen ordet återskapa (inte återställa), men det kan ju vara en tillfällighet...

Visa signatur

“There will be people that are burdened by only having the capacity to see what has always been instead of what can be.
But don’t you let that burden you.”

Permalänk
Medlem
Skrivet av KimTjik:

Nu blandar du lite äpplen och päron då dina exempel gäller en produkt som är lika mycket hårdvara (skulle kanske ha varit ett "e" extra, som HPE 3PART?). Det här drivs inte av några generella operativsystem och mjukvaror, utan har en mycket specifik och begränsad tillämpning, något som kan fungera väl att utveckla och underhålla. Vilken host som ansluter till dessa är en intressantare fråga.

(Kanske återkommer med något annat inlägg om jag får tid.)

Ja nu mera har de ju styckat upp HP så jag lever kanske i det förgångna där Frågan handlade ju generellt om back-up och vad man skulle köra för SAN-lösning. Visst är det så att du med open source kan köra vilket hopplock av hårdvara som helst.

Men i tråden diskuterade vi huruvida open source hade förhindrat det inträffade på Gällivare kommun och generell driftsäkerhet på lagring.

Visa signatur

Who dosen´t love gadgets?

Permalänk
Medlem

När det gäller kommunala system kan jag utifrån egen erfarenhet säga att IBM Tivoli fungerar alldeles utmärkt som back-up. Det är inte billigt men det är bra.

Att en kommun inte skulle ha en back-up lösning är uteslutet. Däremot kan nertiden vara ganska lång beroende på hur avancerad återläsningprocessen är.

Visa signatur

Who dosen´t love gadgets?

Permalänk
Hedersmedlem
Skrivet av FatherOfThree:

Försvarar du oklara katastrofrutiner utifrån principer?

För det första handlar det här om Gällivare Kommun, och inte om något sjukhus.

För det andra använder IT-strategen ordet återskapa (inte återställa), men det kan ju vara en tillfällighet...

Näe ;).
Jag försvarar inte något.
Men ser på det här med lite andra ögon än vissa andra tror jag.
Det jag därmeot gör är att ifrågasätta om kritiken som tas upp i tråden är rimlig och faktaförankrad i alla lägen. Det är offensivt av mig, i know så jag förstår om det kommer lite raka motfrågor till mig.
Men jag tycker inte frågeställningarna jag har är orimliga.
Jag vet för lite om situationen för att kunna ha starka åsikter i frågan om de i kommunen gjort rätt eller ej. Den analysen är inte helt orimlig när vi inte vet vilket system som havererat eller hur det har gått till.

Den delen som oavsett verkar vara problematisk är väl återställningstiden. Fast även där kan det vara komplexa omständigheter som gör att det tar tid. Eller så var det inte så alls utan det saknades kanske vettiga rutiner för återställning? Så länge jag inte kan det där så kommer jag inte dra långtgående slutsatser.

Angående återställa eller återskapa, ja det är intressant. Jag uppfattade det innan som att allt skulle återställas. Här väljer jag nog vägen nu att jag saknar insikt att dra några längre slutsatser i frågan.

Visa signatur

💻 → Lenovo Yoga slim 7 pro 14" Oled
🎮 → Steamdeck

Permalänk
Medlem
Skrivet av Söderbäck:

Pessimism och domedagsprofetior åsido.
Artikeln verkar inte ha belägg för att sjukhuset har haft RAID som backuplösning. Även om det inte är helt uteslutet så är det mindre troligt att det rörde sig om fallerad backup. Alla data är ju på väg att återställas vilket vanligen kräver en fungerande backup ;).

Lärdomen jag drar från denna tråd är väl snarare hur folk tagit fram högafflarna samt skrivit långa inlägg om hur driftansvarigas kompetens är undermålig när de misstagit raid för backup. Men det finns det inte belägg för in nyheten. I själva verket verkar det i det här fallet handla om bristande kompetens i källtritik (eller bristande vilja att bry sig längre än rubriksättningen) bland en del skribenter i tråden.
Tänkvärt minst sagt.

Jag fortsätter lite på min inslagna domedagsprofetia...

Nu beror det ju lite på hur man tolkar ordvalet "Backup" i sammanhanget.
Backup kan även användas i sammanhang då man egentligen ämnar referera till redundans vilket just RAID är ämnat för i grunden.
Nu kan det ju vara så att deras redundanslösning varit för klen i drift, om två kraschade diskar kan sätta den ur spel under en replikering -vilket är sällsynt men långtifrån otänkbart-, sedan kan man givetvis sia om vilken RAID-nivå den redundanslösningen varit baserad på.
"Alla diskar har en del av den andras data och när en disk går sönder finns det en extra disk som kopplas in och tar över arbetet"
Tyder på att det kan röra sig om en RAID5+ ev. Hot spare.
Man brukar ju välja backuplösning utifrån behov och för sammanhanget kan avbrott bli ödesdigra, alltså kan man utgå från att nuvarande lösning inte har täckt behovet på ett bra sätt.

Källkritik är givetvis alltid en viktig ingrediens i sådana här sammanhang.
Men jag tvivlar starkt på att vi får något mer än artikeln att vila på, sedan vill man ju sällan basunera ut nyheter som dessa.
Tror dock att det varit nyttigt då kritik ofta få bättre verkan om den kommer utifrån.
Även myndigheter har ju ibland svårt att ta till sig av kritik, framförallt intern sådan.

Visa signatur

Tower: ace Battle IV | CPU AMD Phenom II X2 BE unlocked 4cores@3,2GHz | RAM 8GB DDR2@800MHz | MB ASUS M4A785-M | GFK AMD Radeon HD 6850 1GB | HDD Kingston SSD Now 60GB (/) Seagate 2TB(/home) | OS Ubuntu 20.04 LTS
-Numera titulerad: "dator-hipster" då jag har en AMD GPU och dessutom kör Linux.

Permalänk
Hedersmedlem
Skrivet av IuZ:

Men i tråden diskuterade vi huruvida open source hade förhindrat det inträffade på Gällivare kommun och generell driftsäkerhet på lagring.

Det är inte den frågeställningen jag ser i tråden och en sådan frågeställning tycks inte ens rimlig eller logisk. Om det är öppen källkod eller inte avgör ju inte mer än huruvida du är bunden till ett företag/tillverkare eller inte, eller eventuellt prisnivån på serviceavtal.

Om rätt kombination av kunnande och pengar finns, hade vilketdera fungerat.

Permalänk
Medlem

@KimTjik: Så kan det absolut vara. Min erfarenhet av open source är att det sällan är en komplett produkt utifrån specificerade behov. Det har säkert hänt en del på området, men jag har sett en del mindre bra produkter som möjligen har blivit bra idag.

Jag tror att en stor del av problematiken är just det att när man som stor organisation köper in en produkt så vill man ha den komplett med alla funktioner. Sen är detta också en fråga huruvida kravspecifikationen är tillräckligt väl skriven vid upphandling.

Visa signatur

Who dosen´t love gadgets?

Permalänk
Hedersmedlem
Skrivet av krigelkorren:

Jag fortsätter lite på min inslagna domedagsprofetia...

Nu beror det ju lite på hur man tolkar ordvalet "Backup" i sammanhanget.
Backup kan även användas i sammanhang då man egentligen ämnar referera till redundans vilket just RAID är ämnat för i grunden.

Jag kan inte annat än le här. Jag håller med, men det krävs en del mod att likna backup med RAID i just denna tråd ;).

Skrivet av krigelkorren:

Nu kan det ju vara så att deras redundanslösning varit för klen i drift, om två kraschade diskar kan sätta den ur spel under en replikering -vilket är sällsynt men långtifrån otänkbart-, sedan kan man givetvis sia om vilken RAID-nivå den redundanslösningen varit baserad på.
"Alla diskar har en del av den andras data och när en disk går sönder finns det en extra disk som kopplas in och tar över arbetet"
Tyder på att det kan röra sig om en RAID5+ ev. Hot spare.
Man brukar ju välja backuplösning utifrån behov och för sammanhanget kan avbrott bli ödesdigra, alltså kan man utgå från att nuvarande lösning inte har täckt behovet på ett bra sätt.

Källkritik är givetvis alltid en viktig ingrediens i sådana här sammanhang.
Men jag tvivlar starkt på att vi får något mer än artikeln att vila på, sedan vill man ju sällan basunera ut nyheter som dessa.
Tror dock att det varit nyttigt då kritik ofta få bättre verkan om den kommer utifrån.
Även myndigheter har ju ibland svårt att ta till sig av kritik, framförallt intern sådan.

Ja det verkar inte som att de valt en tillräckligt säker lösning för att säkra uptime. Den delen känns mer rimlig att fokusera kring. Kanske dubbla huvudkärror hade löst en del, men så ska det finansieras också. Den delen behandlas väl delvis i artiken där gemensam drift med andra kommuner eftefrågas för att spara pengar och kunna bygga mer säkra lösningar.

@KimTjik skrev ett bra inlägg i tråden kring svårigheterna på kommunal nivå med ITdriften också:
#16943042

Visa signatur

💻 → Lenovo Yoga slim 7 pro 14" Oled
🎮 → Steamdeck

Permalänk

Det står ju dock att de håller på att återställa all data från en backup. Det tar bara en dag eller två att göra det, och under tiden hinner lokaltidningarna löpa amok.

Visst, de kunde ha kört raid6 eller raid1 i stället, men oavsett vilken raid du kör är du aldrig 100% säker.

Det enda dumma jag ser i artikeln (förutom fördumningen av språket för att Greta 82 ska tro sig förstå) är jämförelsen med lotteriet. Det är som många säger väldigt sannolikt att en till disk dör när man rebuildar en array efter att en första disk har gett upp. De kunde bara ha sagt "en disk gick sönder, sånt händer, det är lungt för vi har backup, vi är up and running igen i morgon".

Edit: Kan nästan förstå varför man med lokaltidningens mikrofoner upptryckta i näsan skulle hosta ur sig en lottoliknelse för att slå från sig ansvaret. Folk blir så _fruktansvärt_ arga när en dator eller ett datasystem inte fungerar exakt som de har tänkt sig. Har själv sommarjobbat på IT-avdelningen på en industri.

Går en truck sönder kör man den till verkstaden och det är inget mer med det. Sliter man ut kläder går man till förrådet och får nya. Gör man sönder ett verktyg skäms man lite när man går och ber om ett nytt. Men om en hårddisk kraschar eller laptopens batteri tar slut (efter ett par varningar) och man inte har sparat sitt arbete, då jävlar.

Man förstår att alla verktyg och redskap går sönder om man använder dem fel, eller helt enkelt slits ut med tiden. Men att hårddiskar inte snurrar i all evighet är tydligen extremt upprörande och nästan kränkande.

Permalänk
Medlem

TLDR;
Ser ingenting som tyder på att Gällivares IT-Drift har gjort ett dåligt jobb, dom har troligen gjort det bästa dom kunnat med den budget dom fått.
Det finns inget i artikeln som indikerar att dom inte har backup eller tror att raid är en ersättning för backup. Vidare så står det i klartext att dom just nu håller på och återskapar datan och beräknar vara klara med detta innan semesterns slut, någonting som hade varit helt omöjligt utan backup.

Full version:
Som allt i världen så styrs IT avdelningarna av den budget som sätts, denna innehåller sällan tillräckligt mycket pengar för att bygga en driftsäker lösning med fysiskt åtskilda platser eller High Availability (Samma server aktiv på 2 platser, utifall en av platserna/servrarna blir otillgänglig) och lösningarna designas dessutom oftast för minst 5 år i taget, vilket innebär att nya tekniker och funktioner som introduceras under denna tidsperiod ofta inte kan nyttjas, utan man får planera för dessa i nästa 5 års design.
Dessa är några av anledningarna till att kommuner och företag i ökande takt väljer att gå samman med sin IT drift eller att outsourca den till externt företag.

I detta fall så tolkar jag kommunens utlåtande i frågan så här:

Kommunen har en egen serverhall där man på ett antal fysiska servrar kör en större mängd virtuella servrar.
Lagringen för detta har troligen varit gemensam i form av ett disksystem, en redundant lösning med dubblering av alla kritiska delar förutom själva diskarna, där man i botten kört RAID5.

Moderna disksystem använder sig utav lagringsvirtualisering, vilket innebär att disksystemet har en mängd raid arrayer i botten och sedan stripear mjukvaran i systemet ut all data över samtliga arrayer i systemet. (tänk en raid 0:a bestående av en mängd underliggande raid arrayer)
Fördelen med detta är att all prestanda i systemet kan nyttjas av en enda liten utdelad disk, men nackdelen är att en rasad array gör all data i hela disksystemet oanvändbar.

Det finns ingenting i artikeln som indikerar att kommunen saknar backup, tvärt om så står det att data håller på att återskapas (från backup).

Det kommunen saknar är där emot ett par saker som skulle kunnat eliminera driftstopp vid detta fel eller åtminstone minskat påverkan av detta problem.

* Man har inte spegling av all sin produktionsdata till ett andra disksystem utifall ett system blir otillgängligt, detta nämner man som en möjlig lösning för att inte detta skall ske igen i framtiden.

Detta är en ganska kostsam metod då man behöver dubbelt så mycket lagring och det ofta är lagringen som är den största kostnaden i serverhallen.
För de organisationer jag jobbar med så ligger snittet på runt 30% tillväxt per år i både lagring och backup systemen.
Tyvärr så är det långt ifrån lätt att övertyga ledningen varför man behöver köpa ett 400TB stort lagringssystem för att klara de kommande 5-åren, när man endast har 100TB data just nu.
Att förklara att man behöver 2st 400TB lagringsystem är... mindre lätt.
Men klart lättare nu när en katastrof inträffat.

* Man saknar troligen en DR lösning för sin miljö, utan har endast en backuplösning.
(Baserar detta antagande på tidsåtgången för att återställa miljön, den är för lång för att vara från DR och för kort för att sakna backup.)
Generellt så är backuplösningar mycket bra på att hålla information säker i många versioner och under lång tid, men mindre bra när det kommer till många samtidiga återläsningar och återläsningar av hela servrar.

Därför så är det nu för tiden vanligt att företag och organisationer investerar i DR (Disaster Recovery) lösningar som specialiserar sig på att erbjuda snabb återläsning av en eller flera hel serverar, med så lite mänsklig handpåläggning som möjlig, generellt så bör dessa lösningar dock inte ses som en ersättning för traditionell backup utan som ett komplement.

Visa signatur

Desktop 386 16/SX, 16MB RAM, 160MB Quantum HDD, 3,5" HD FDD, Colorful Soundblaster 16 Compatible, DOS 6.22/Windows 3.11, AOC 14" VGA skärm (Skiftar mot gul tills man slår till den rätt), Keytronic tangentbord, 2 knappars mus

Permalänk
Medlem
Skrivet av Söderbäck:

Jag kan inte annat än le här. Jag håller med, men det krävs en del mod att likna backup med RAID i just denna tråd ;).

Ja det verkar inte som att de valt en tillräckligt säker lösning för att säkra uptime. Den delen känns mer rimlig att fokusera kring. Kanske dubbla huvudkärror hade löst en del, men så ska det finansieras också. Den delen behandlas väl delvis i artiken där gemensam drift med andra kommuner eftefrågas för att spara pengar och kunna bygga mer säkra lösningar.

@KimTjik skrev ett bra inlägg i tråden kring svårigheterna på kommunal nivå med ITdriften också:
#16943042

Ja det var ett bra inlägg av @KimTjik som nog stämmer allt för väl in på verkligheten är jag rädd.

När det gäller artikeln tror jag tyvärr inte att de kommer så långt med kommunala samarbeten.
Det tar lång tid att mobilisera, genomföra, hög ekonomisk press, drivs av alldeles för många kockar samt att man enbart löser problemen för dem som är med och startar samarbetet, -kortsiktigt bör tilläggas.
-Kommer man ha med skalbarhet mm. i sin kalkyl om fler skulle vilja haka på samarbetet?
-Kommer man kunna uppskatta datamängden som omfattas på ett verklighetsanknutet sätt?

Nej, min åsikt grundar sig i att problemet behöver angripas på en mycket högre instans, det behövs något slags grepp på nationell nivå, staten får ta det ansvaret då de hållit sig undan ritbordet allt för länge.
Dem bär det yttersta ansvaret gentemot skattebetalare och medborgare.

Kom fram till en standard som gäller för samtliga kommuner i Sverige.
Standarden får gärna vara öppen så att fler kan ta del av den (den lär ju trots allt bli skattefinansierad) föreslå förbättringar samt peka på fel och brister, då kontinuerlig uppföljning och omvärldsbevakningen är av stor vikt.
Då blir det också lättare för företag att slåss om att vinna upphandlingar av support och utveckling av standarden. Just för att den definieras/dokumenterats som en "standard". Det handlar om rätt mycket pengar sammantaget så jag tror motivationen redan finns där för företagen och därmed lusten att leverera.
Idag är det en djungel av olika leverantörer med sina egna standarder för ex. journalsystem inom vården, vilket gör att man hellre tar till faxen för hemligstämplade patientjournaler än att man sköter det på rätt? sätt, d.v.s. troligtvis via någon jobbig konverterare som producerar tveksamma journalkopior till något välanvänt format, som sedan måste levereras till- samt importeras av mottagaren i deras journalsystem för att kunna behandlas.

Med tanke på vad historien lärt oss om IT-marknaden tolkar jag det som att det fortfarande kommer vara hyggligt svårt med journalutbyte mellan 2 konkurrerande leverantörers system. Så där tror jag absolut att en nationell standard hade varit välkommet.

Nepp, nu får det vara bra med krönikor för idag!

Visa signatur

Tower: ace Battle IV | CPU AMD Phenom II X2 BE unlocked 4cores@3,2GHz | RAM 8GB DDR2@800MHz | MB ASUS M4A785-M | GFK AMD Radeon HD 6850 1GB | HDD Kingston SSD Now 60GB (/) Seagate 2TB(/home) | OS Ubuntu 20.04 LTS
-Numera titulerad: "dator-hipster" då jag har en AMD GPU och dessutom kör Linux.

Permalänk
Medlem

Helt sjukt vad människor ser ner på kommuner som om det skulle vara nån himpavimpa organisation. Ni har uppenbarligen en ganska gammal och förlegad syn. Det är inte så det ser ut idag. Möjligen i de mindre men absolut inte i de större. Där är det en mycket komplex infrastruktur som kräver sin tekniker för att inte tala om alla lagar och regler man måste rätta sig efter.

Visa signatur

Who dosen´t love gadgets?

Permalänk
Hedersmedlem

*** rubrik ändrad ***

Jag har ändrat rubriken då den skulle kunna vilseleda de som söker forumet för information. Rubriken bör korrekt beskriva diskussionsunderlaget.

/KimTjik

Permalänk
Avstängd

Har nyligen haft en hårddisk hemma som kvaddat. Fick köpa en ny och ladda ner backupen. Det gick att välja så att vissa filer kom först men totalt tog det 3 - 4 dygn innan allt var laddat.
Antar att kommunen har lite mer data och också behöver ta hem nya diskar så saker och ting tar sin tid.

Permalänk
Medlem
Skrivet av abki:

Har nyligen haft en hårddisk hemma som kvaddat. Fick köpa en ny och ladda ner backupen. Det gick att välja så att vissa filer kom först men totalt tog det 3 - 4 dygn innan allt var laddat.
Antar att kommunen har lite mer data och också behöver ta hem nya diskar så saker och ting tar sin tid.

Det är för just sådana här saker som man ska kombinera en backup med RAID. Det är nämligen väntetiden som kommer vara problemet. Att behöva stänga av datorn för att man saknar hotswap när man ska byta disken (åtminstone för privatpersoner) kommer vara löjligt kort i jämförelse mot den tid det tar att återskapa den felande disken.

Det är här man ska se hur man kan hålla systemet vid liv utan att behöva vänta på en backup. Sedan är nästa steg att man sprider riskerna på ett sådan sätt att man inte lägger alla ägg i samma korg och snabbt kan återställa systemet.

Visa signatur

Server: Fractal design Define 7 XL | AMD Ryzen 7 5800X 8/16 | ASUS ROG CROSSHAIR VIII DARK HERO | 64GB Corsair @ 3000MHz | ASUS Radeon RX 460 2GB | Samsung 960 PRO 512 GB M.2 | 2x 2TB Samsung 850 PRO SSD | 6x Seagate Ironwolf Pro 10TB
WS: Phantex Entoo Elite | AMD Ryzen Threadripper 1950X 16/32 | ASUS Zenith extreme | 128GB G.Skill @ 2400MHz | ASUS Radeon HD7970 | 3x 2TB Samsung 960PRO M.2 | 6x Seagate Ironwolf Pro 10 TB
NEC PA301W 30" @ 2560x1600 | Linux Mint 21.3 Cinnamon