Bästa kompressionsformat för långtidslagring av project?

Permalänk
Medlem

Bästa kompressionsformat för långtidslagring av project?

Söker efter bra komprimerat filformat, för långtidslagring av gamla projekt.
Vill "zippa" ihop hela mappstrukturer (med filer i) till komprierat filformat.

Tidigare har jag kört zip, men ville hitta bättre format. Jag valde zip först, pga A) bäst kompatibilitet, B) kan ha lösenordsskydd.
Sen upptäckte jag hur läskigt lätt det är att knäcka zip-lösenord. Man kan använda en äldre variant som krypterar hela arkivet med AES256, men då är det formatet betydligt mindre kors-kompatibelt med olika system. Och ovanpå det så insåg jag att man behöver ha recovery records, för bättre återställning och reparation ifall arkivet blir korrupt.

Så då hittade jag RAR, som har bra stöd för recovery, men jag är osäker på hur pass säkra lösenorden i RAR är gentemot ZIP, och inget operativsystem kan extrahera RAR-filer utan att först installera extern mjukvara. Jag kollade på 7-zip med, som verkar ha bra lösenordsskydd men ingen recovery record.

Tänkte lägga ut en fri fråga och se vad vilka åsikter som kommer:

Om det finns bra komprimeringsformat, som tillåter säkert lösenordsskydd, och bra recovery records, vilket av dom formaten är det mest kors-kompatibla över alla system? mac, linux, windows osv.

Tackar

Permalänk
Keeper of the Bamse

RAR är proprietärt så det går bort i min bok.

Jag hade kört 7z med AES-256, det brukar klara dom flesta audits när det gäller "Data at rest". Använd ett svårt autogenererat lösenord med gemener, versaler, siffror och specialtecken, typ 16 tecken eller så.

PS: om din "äldre variant" av zip täcks av detta så ska du nog inte använda det heller:

Citat:

When WinZip 9.0 public beta was released in 2003, WinZip introduced its own AES-256 encryption, using a different file format, along with the documentation for the new specification.[45] The encryption standards themselves were not proprietary, but PKWARE had not updated APPNOTE.TXT to include Strong Encryption Specification (SES) since 2001

Visa signatur

i7 10770K, NH-D15. 16GB corsair. RTX 3080. 3TB nvme. Samsung G9. Fractal Torrent Compact. Corsair RM850.
Logitech G pro wireless mouse. Logitech TKL915 wireless. Logitech Pro X Wireless.
Macbook M3 (16GB, 512GB). HP Reverb G2.
www.bamseclockers.com

Permalänk
Medlem
Skrivet av Printscreen:

RAR är proprietärt så det går bort i min bok.

Jag hade kört 7z med AES-256, det brukar klara dom flesta audits när det gäller "Data at rest". Använd ett svårt autogenererat lösenord med gemener, versaler, siffror och specialtecken, typ 16 tecken eller så.

PS: om din "äldre variant" av zip täcks av detta så ska du nog inte använda det heller:

Tackar för åsikt o tips

Varför tycker du proprietära format är att avstå från? Inte lika framtidssäkert som open-source, eller som delade format som zlib eller deflate eller så?

Permalänk
Medlem

Att köra med en separat, standardiserad kryptering av arkivfilen är inte ett alternativ? Tänker på GPG/PGP som hade varit mitt förstahandsval.

Permalänk
Medlem
Skrivet av Dooley:

Tackar för åsikt o tips

Varför tycker du proprietära format är att avstå från? Inte lika framtidssäkert som open-source, eller som delade format som zlib eller deflate eller så?

Precis, om 20 år vet du att du kan få igång något som följer en öppen standard men du är inte säker på att ett visst program finns för den miljö som då är din dagliga.

Permalänk
Medlem
Skrivet av blackcoffee:

Att köra med en separat, standardiserad kryptering av arkivfilen är inte ett alternativ? Tänker på GPG/PGP som hade varit mitt förstahandsval.

Jo, det hade man kunnat köra. Men jag försöker göra det så 'idiot-säkert' jag kan.
Om man kör tredje-part kryptering så måste en användare av arkivet känna till både kryptering och PGP-varianten av kryptering, samt förstå hur denne ska göra för att packa upp PGP-kryptering - och troligast även installera/ha PGP installerat för att kunna dekryptera? Tanken med dom här arkiven är att vanlig 'okunniga' kontors-människor ska kunna använda dom rakt av, och utifall arkiven skulle blivit korrupta så ska det ligga återställningsdata i samma mapp så att kunniga personer ska kunna använda det för att reparera.
Optimalt vore om någon vet vad arkivet innehåller, men inte är 100 på hur dom ska använda det. Dom chansar på dubbelklicka, och får då en fråga om lösenord (vilket dom har). Dom anger lösenordet och vips så dyker alla filer upp i fönstret framför dom. Det scenariot tror jag funkar bäst. Jag tror inte PGP kan packa upp själv, på alla plattformar, utan att användaren måste ha tredjepartsmjukvara för-installerad?

Permalänk
Medlem
Skrivet av Dooley:

Jag tror inte PGP kan packa upp själv, på alla plattformar, utan att användaren måste ha tredjepartsmjukvara för-installerad?

Det var ett lite annat användningsfall än jag tänkte mig, ja. Trodde det var för egna projekt som du hade koll på själv. Vet inte heller vad du räknar som "lång tid" så att man vet om du kan räkna med att Windows 10 och MacOS fortfarande är rimtligt troliga att räkna som existerande.

Om man ska lagra något i decennier är kanske krytpering en dålig idé generellt, bättre att lägga det på offline-media som låses in fysiskt istället.

Nej, vad jag vet har inte t.ex. Windows PGP/GPG förinstallerat men en Ubuntu har det. Certifikathanteringen gör det ju säkrare men lite mer komplicerat för den oinsatte.

Permalänk
Medlem

Jag skulle gå på 7-zip (7z) istället för 'zip' om det skall skyddas för otillbörlig insyn - det oavsett nuvarande och framtida svagheter i krypteringen av den faktum att zip inte krypterar filkatalogen - bara filkropparna medans 7-zip skyddar även filkatalogen och därmed vilka filnamn och dess storlek den innehåller, om man bockar för den alternativet (dock lätt att missa första gången) eller får med flaggan -mhe och -t7z för att vara säker att 7z-formatet används då 'zip'-formatet inte har möjlighet att kryptera filnamns-tabellen.

typisk kommando kan då se ut som "7z a -p -mx=9 -mhe -t7z webservers.7z webservers" skriven i consol

---

Är det nödvändigt att det packas i en enda stor fil eller accepteras en repositorie med en filträd av 'chunk' under sig ???

Som arkiveringsformat och hantering av generationer av backupper (och backupsessioner kan sedan tas bort utan beroende av inbördes ordning) som kan vara samma med små skillnader eller helt olika så kan man titta på deduplicerade arkivering som borgbackup ('borg'), restic (båda open source) och duplicacy (betalprogram) - dock rena CLI-program för borgbackup och restic, men GUI i webbmiljö finns för duplicacy även om det där är mest riktat för just backupfunktion och främst tänkt mot molntjänster

Alla nämnda har kryptering i sig och de två senare också API mot en rad molntjänster - även metadata som skapas för dess databaser i samband med deduplicering mm. är krypterat, så har man ingen lösenord så går det inte att ta reda på något av värde även om man försöker gräva i metadatat som kan lämnas kvar i sin burk efter arkivering (dvs. inga synliga filnamn mm) metadata är inte nödvändigt och återskapas om den saknas - men har stor betydelse för snabbhet vid nästa session av tex körning med borgbackup då den inte tuggar igenom och hashar filer som inte har ändrat sig sedan förra backupsvängen (går på tidstämplar mm)