Duplicate cleaner och hashsumma

Permalänk

Duplicate cleaner och hashsumma

Hej.

Jag använder duplicate cleaner (dc) för att hitta dubbletter i min dator. Är dock lite fundersam hur det fungerar med sökningen då jag kör med hashsumma.
Jag tar bort de filer DC hittar som har samma namn och tid, men den anser att även filer med annat namn och/eller annan tid är samma. Min fundering är om det stämmer. Kan jag lita på att en sökning med hashen MD5 verkligen hittar filer som är exakt samma. Det är innehållet i filen som är viktigt inte namnet eller tiden.
Alternativen som är valbara är MD5, SHA-1 och SHA-256 samt byte-to-byte. Har ännu bara testat MD5 och förstår att det sista alternativ verkligen hittar exakt likadana filer. Men misstänker att en sökning då tar enorm tid.

Så kan jag fortsätta med MD5 och bara behålla en fil där DC hittar flera?

//Freezer

Visa signatur

Cooler Master Silencio S600, MSI x99A SLI Plus, i7-5820, Hyper 212 Evo, Geforce GTX 770, 16 GB Corsair Vengeance, Kingston SNV2S1000G, HDD *6, EVGA G2 750W, Windows 10 Pro 64bit.
Dell Latitude 5490, Win 11 Pro 64bit. Synology DS413j.
*Citera om du vill ha svar*

Permalänk
Medlem

Kan du köra MD5, AH1 och SHA256 samtidigt och får matchning kan du vara tillräckligt säker på att två filer är identiska.

Visa signatur

Citera om du vill ha svar.

Permalänk
Inaktiv

MD5 räcker gott och väl för att hitta om 2 filer skiljer sig från varandra. SHA varianterna är till för att ha väldigt svårt att hitta kollisioner vid hashning av lösenord.

Jag vet dock inte vad det är DC hashar, är det hela filinehållet är du safe

Permalänk
Skrivet av muppens:

Kan du köra MD5, AH1 och SHA256 samtidigt och får matchning kan du vara tillräckligt säker på att två filer är identiska.

Nej det är en i taget.

Skrivet av Killbom:

MD5 räcker gott och väl för att hitta om 2 filer skiljer sig från varandra. SHA varianterna är till för att ha väldigt svårt att hitta kollisioner vid hashning av lösenord.

Jag vet dock inte vad det är DC hashar, är det hela filinehållet är du safe

Det är just det, jag vet inte hur DC kollar. Men checksumman med MD5 är lång (20+ tecken lång) om det kan hjälpa. Hur SHA fungerar har jag ingen aning om. Får ta och testa på någon liten mapp.

//Freezer

Visa signatur

Cooler Master Silencio S600, MSI x99A SLI Plus, i7-5820, Hyper 212 Evo, Geforce GTX 770, 16 GB Corsair Vengeance, Kingston SNV2S1000G, HDD *6, EVGA G2 750W, Windows 10 Pro 64bit.
Dell Latitude 5490, Win 11 Pro 64bit. Synology DS413j.
*Citera om du vill ha svar*

Permalänk
Inaktiv
Skrivet av Freezer64Pro:

Nej det är en i taget.

Det är just det, jag vet inte hur DC kollar. Men checksumman med MD5 är lång (20+ tecken lång) om det kan hjälpa. Hur SHA fungerar har jag ingen aning om. Får ta och testa på någon liten mapp.

//Freezer

Checksumman som returneras är ALLTID lika lång. Poängen är att
md5(hej1) = 771ec3328c29d17af5aacf7f895dd885
hd5(hej2) = 6c2479dbb342b8df96d84db7ab92c412

Det är alltså väldigt stor skillnad trots liten ändring. SHA1 och SHA256 tar längre tid att beräkna så det blir svårare att med datorkraft hitta exempelvis ett x' och ett x så att sha(x) = sha(x'). Secure Hashing Alorithm.

DC gör antingen så att den tar hela filen som input till algoritmen eller så tar den filnamn + fil eller filnamn + några av de första bytsen eller något av det. Beroende på vad det är så kan filer med olika namn men samma inehåll ses som duplicerade filer. Prova att maila utvecklaren så skall du nog se att du får svar på tal