Jag har ju skrivit om det i en annan tråd men kan skriva det här också. Har inte kollat om någon annan redan har svarat på detta dock så sorry om det blir upprepning.
Just angående chat control och hash,
Vilken hash den ska reagera på är styrt från något. När den får en träff ska materialet skickas till ett EU-center som kollar om det ska skickas vidare till berörda myndigheter (kedjan extra bruten). Den här hashen bestämmer någon och eftersom jag misstänker att chatt-appsföretagen inte kommer få tillgång till materialet som hashen kommer ifrån ursprungligen (då det är sjukt olagligt) så kommer de inte heller veta om hashen verkligen kommer från övergreppsmaterial. På så sätt kan du ta reda på om någon delar en viss bild eller text som har en viss hash. Även Ylvas yrande om att upptäcka nytt material kräver att datan processas på något sätt för att liknande bilder ska få samma eller liknande hash och hur ska bilderna jämföras mot något om databasen inte uppdateras löpande eller hashar skickas löpande till... något som gör jämförelsen och vem kontrollerar det? EU? Mjo. Ska ai-modellen köras lokalt för varje app och hur uppdateras modellen? Då snackar vi stora resurser i mobilen.
Se det som när databaser med hashade lösenord läcker ut. Det är oftast envägskryptering (hash är/ska vara envägs) men genom att känna till vilken kryptering/algo som används så kan du plocka fram lösenorden genom att hasha miljarder med kombinationer och jämföra med de hashar som läckt från databasen. Det finns enorma färdiga, fullt lagliga databaser att tanka hem med lösenord i klartext och dess motsvarande hash i alla möjliga former av envägskryptering (rainbow tables). "Lätt" tillgängliga för att köra mot läckt databas och det drar betydligt mindre resurser jämfört med brute force. Nu saltar de flesta lösenorden (med unikt salt, typ inkludera användarens unika id eller nåt i lösenordet, för varje användare så att alla hashar är unika, även om många har samma lösenord) innan de hashas och lagras i databasen (saltet sparas inte i databasen) men läcker db och salt ut så ligger ditt lösenord risigt till, om det är relativt svagt. Är det saltat så tar det dock mycket längre tid för man måste framställa nya hashar att jämföra med men då kan man nog lika gärna köra brute force direkt. Tekniken går dock snabbt framåt så antalet lösenord man kan hasha och testa per sekund ökar kraftigt. Notera att salt och eventuell unikhet hänger helt på om programmerarna kan och bryr sig något om säkerhet.
När du loggar in så vet systemet hur det ska räkna ut just ditt salt (det finns i koden), inkluderar det på något sätt i det lösenord du skriver in eller i funktionen, hashar det och sen jämförs hashen med vad som är sparat för din användare i db. Någon kommer ju alltid känna till eller kan "räkna ut" just din unika hash (men det kommer ta lång tid idag om man inte har ditt starka lösenord i klartext, även för de som vet). En hash är något man kan räkna ut för att till exempel kunna verifiera att ett innehåll i en fil är en exakt kopia, ändra en byte och hela hashen ändras. Det är en checksumma helt enkelt. Med ai/ml kan man räkna ut en hash som är samma eller liknande för bilder som LIKNAR varandra (ai måste alltså "titta" på bilden/texten), men det kräver förstås en modell som är tränad på stora mängder material så att den vet om ungefär hur till exempel en bil ser ut.
Exempel på kalkulerade hashar, SHA256-algoritmen
bananer:
6edcb8e2b2a47fa57ec351ae3d85f5c1a708241f9e371d4cab5cd594e80ff8ea
banarne:
07153d4212b2ec78121e01816eee2655c0c9ca01bd4c7d82ad0d3d17f33a0971
chatcontrol:
fb5382faf4d3abef0e28885eb0850ed7094f34fe8d86e219771c9bcddf781841
Hasharna är (för denna algo) alltid 64 tecken och går inte (än?) att köra åt andra hållet, dekryptera så att säga. Du kan inte stoppa in en hash och få fram ordet om det inte redan finns en kalkylerad hash att jämföra med. "Verktyg" på nätet som "dekrypterar" eller "avkodar" till exempel SHA256 har redan mängder med färdiga, förkalkylerade hashar att jämföra mot.
Just du, Söderbäck kanske vet om typ allt detta redan men det är ett försök till förklaring för andra som kanske inte har någon större koll på vad hash (say no to drugs!) är för något. Med reservation för att jag är dålig på att förklara eller att jag inte har alla termer och tekniker 100% klara för mig.