Lär Dina Nära & Kära om Dagens AI!!!
Jag fick "digitala gräsrotskänslor" inom mig efter att jag sett denna video "Can We Teach our Moms to Spot Fake AI Videos?":
YT-klippet behandlar följande punkter vilket tillsammans kan ge dig rätt magkänsla huruvida något är AI-genererat eller ej (varje punkt avhandlas i respektive underrubriker därpå):
När påstås videon laddats upp? - Uppladdningsdatum
Räkna sekunderna! - Videoklippets längd
Går texter att läsa? - Texter i videoklippet
Kontinuitet: Tänderna! - Ser de alltid lika ut?
Kontinuitet: Miljön - Aldrig sömfritt byte?
Kontinuitet: Miljön - Subjektet lite annorlunda varje gång?
Kontinuitet: Miljön - Subjektens verkan över tid/mellan klipp?
Kontinuitet: Miljön - Hur ser saker & ting ut ut över tid?
Kontinuitet: Verkar klippen sammanhängande?
Trådskaparens tips: Bekräfta från flera källor när du får något som påstås vara "akut"
Nu sammanfattas kort de olika punkterna ovan vilket är baserade på YT-klippet ovan såväl som trådskaparens egna erfarenheter med så kallad "generativ AI".
Kom ihåg att när du ska analysera huruvida något är AI-genererat eller ej så
(OBS: När du läser "01:28", "02:30", "04:20", och så vidare så är det tidsstämplar till YT-klippet ovan!)
När påstås videon laddats upp? - Uppladdningsdatum
Vid 01:27 så berättar YT-klippet att Du ska börja med att kontrollera när något laddas upp. Det vill säga, när lades det upp på YouTube, Twitter/X, Facebook, Instagram, TikTok, webbplatser, med flera. Vi utgår ifrån att publiceringsdatumen inte har ändrats i efterhand utan är äkta.
Om något publicerades före december 2022 så är det sannolikt att det inte är AI-genererat då denna generativa teknologi inte var tillräckligt bra då. Allt efter det så kan det vara AI-genererat trots att det till synes kan verka så fotorealistiskt ut. Vid 01:52 så visas exempel på 2023 mot 2025 generering av klassiska "Will Smith käkar pasta" vilket blivit ett skämtsamt mått på hur bra AI är på att generera videoklipp.
Räkna sekunderna! - Videoklippets längd
Vid 02:18 berättar YT-klippet att du ska räkna sekunderna, alltså hur långt/kort videoklippet är. Det tar tid att generera videoklipp och även dagens videogenereringstjänster har begränsningar på hur långa klippen kan vara.
Detta innebär att videoklipp som är mellan 1-10 sekunder långa kan vara AI-genererade i skrivande stund. Varför i skrivande stund (2025-06-29)? Jo, i framtiden så kanske det går att generera fler sekunder för samma videoklipp med samma hårdvara.
En konsekvens utav att klippen är begränsade till 1-10 sekunder i skrivande stund är att ihopklippta AI-genererade klipp alltid ser lite annorlunda ut. För det är så generativ AI fungerar i princip: den försöker återskapa något (oftast baserat på en text-prompt och/eller en utgångsbild) och "kryddar" med slumpen för att du inte alltid ska få samma resultat.
Således brukar AI-klipp som är längre än 10 sekunder alltid vara lite annorlunda i subjektet (personen/sakerna du ser i klippet) och bakgrunden (miljön där personen/sakerna befinner sig i). Givetvis är det möjligt att hela klippet är äkta och de olika klippen bara är så korta. Men kombinera alltid flera punkter när du använder ditt kritiska tänkande och innan du drar din första slutsats!
Går texter att läsa? - Texter i videoklippet
På tal om flera sammanslagna klipp och deras längd så kanske du har märkt i många AI-klipp (och många AI-bilder för redan bara något år sedan) hade enormt dålig text? Vid 03:01 berättar YT-klippet om att text i AI-genererade video oftast är felstavade eller inte ens riktiga bokstäver!
Så, titta runt i det möjliga AI-videoklippet och se om vanliga ord ser felstavade ut eller knappt går att läsa riktigt. Felstavade och/eller oläsbara bokstäver eller andra vanliga skrivtecken tyder oftast på AI-genererat innehåll!
Detta gäller även AI-genererade undertexter i vissa videoklipp vilket då är helt felstavade (eller icke-existerande ord från det språket ifråga) även om grammatiken kan vara korrekt. Se exempel vid 03:37 från YT-klippet.
Kontinuitet: Tänderna! - Ser de alltid lika ut?
("Kontinuitet" betyder att något ser likadant/logiskt ut över tid och/eller rymd!)
Vid 04:52 så tas tänderna upp för det likt fingrar i AI-bilder har en tendens att vara väldigt svårt för generativ AI i skrivande stund att få till korrekt. Alltså, om du ser i videoklipp att tänderna ser utsmetade ut eller verkar se annorlunda ut varje gång ett subjekt öppnar och stänger munnen så kan det tyda på AI-videoklipp!
Det är ju oftast högst orealistiskt att någons exempelvis framtänder helt plötsligt får ett glapp ena sekunden medan andra sekunder så de ihop igen? Generativ AI saknar i skrivande stund den faktiska "intelligens" som behövs för att få rätt antal fingrar på människor såväl som tänder med rätt kontinuitet.
På grund av det så kommer tänderna hos majoriteten av AI-genererade videoklipp idag att ha varierande utseende över de få sekunder som de kan generera med dagens hårdvara. Granska därför tänderna noga. Det kan i vissa fall vara rätt så avgörande detaljer för huruvida något är AI-genererat eller ej likt antalet fingrar i händer i AI-genererade bilder.
Kontinuitet: Miljön - Aldrig sömfritt byte?
Vid 08:10 till 08:39 i YT-klippet så handlar det om faktumet att AI-genererade videoklipp extremt sällan lyckas med att få till sömfria byten i miljön! Det vill säga: om du ser vad som kan vara ett subjekt som talar framför kameran och sedan ser du vad som verkar vara samma subjekt men nu är i en helt annan miljö (och tänk på den korta tiden: högst 10 sekunder per "miljöbyte") så får du i princip aldrig se det "sömfria bytet".
Tänk så här: Om Du filmar dig själv i en lägenhet så kan du gå från ett rum till ett annat, alltså ett miljöombyte. Detta klarar i skrivande stund inte dagens generativa AI för videoklipp. Utan istället ser du hur de kanske försöker gå till nya miljöer och det blir i princip alltid "fel" någonstans vid miljöombytet.
YT-klippet från 08:10 till 08:25 visar hur samma påstådda subjekt är i olika miljöer men du ser aldrig personen gå från ena miljön till andra utan bara hur de plötsligt är i en ny miljö. Ungefär som om du inte skulle kunna filma när du går in till toan och sedan ut från den. Hade du gjort som AI hade du behövt filma dig själv först utanför toan och sedan börja filma igen när du helt plötsligt står inne på toan.
YT-klippet mellan 08:10 till 08:25 ber dig även att titta noga på samma subjekt vars keps inte ser likadan ut. (Trådskaparens egen anmärkning: Ta även en titt på dinosaurien i ett av AI-klippen - notera hur dess hud ser "utsmetad" ut. Detta är extremt vanligt även i så kallade fotorealistiska AI-bilder. Det saknas textur, finkornighet och sådant som verkligheten oftast innehåller. Åtminstone ser det ofta väldigt "retuscherat" ut!)
Så, denna punkt handlar om att längre videoklipp där du alltid ser en eller olika subjekt i olika miljöer per klipp men aldrig övergången mellan dessa miljöer kan starkt tyda på AI-genererat innehåll! Detta är helt enkelt på grund av begränsad hårdvara och/eller dagens generativ video-AI i skrivande stund.
Kontinuitet: Miljön - Subjektet lite annorlunda varje gång?
YT-klippet tar denna punkt i en annan ordning än Trådskaparen för du såg från 08:11 och framåt att det verkade vara relativt nästan samma subjekt men det saknades övergång mellan miljöerna för subjektet, eller hur?
Tittar du från 06:49 i YT-klippet så visas fram till 07:35 hur det är olika subjekt (och ja, rätt så lika långa/korta klipp på grund av hårdvarubegränsningar i skrivande stund!) i relativt likartad miljö. Men varför är det olika subjekt och varför tycks de ha helt olika mikrofoner?
Om du ser olika subjekt i relativt likartad miljö men subjekten skiljer sig avsevärt i saker och ting som (biologiskt) kön, klädsel, relevanta saker och ting de har med sig i miljön, och så vidare, så kan det tyda på AI-videoklipp!
Självfallet måste du återigen kombinera denna punkt med flera andra för så klart skulle det kunna vara flera olika personer som intervjuar på samma plats under ett och samma videoklipp. När kanske sammanslagna klipp alltid är lika långa/korta eller varierar mellan 1-10 sekunder och det är olika subjekt och de inte står på exakt samma plats i miljön så är det mycket möjligt AI-genererat. Varför skulle två olika personer inte kunna befinna sig på samma plats om den nu var på riktigt?
Kontinuitet: Miljön - Subjektens verkan ut över tid/mellan klipp?
Denna punkt visas från 08:49 i YT-klippet och handlar om "action" vilket Trådskaparen valt att översätta till "verkan" då det handlar om hur olika subjekt i videoklipp och mellan dessa tycks se ut när de gör något, alltså "när de verkar".
Detta går tillbaka till faktumet att generativ AI i skrivande stund saknar "intelligensen" nödvändig för att skapa konsekventa ("kontinuitet") övergångar mellan klipp. Därför du i princip alltid antingen ser liknande subjekt i helt annorlunda del av en miljö och/eller helt nya subjekt i annan del av den påstådda samma miljön.
Om du tittar på något där något ska visas från två olika håll (tänk två olika kameror som ska ha filmat samma händelse samtidigt) så bör det hela framstå konsekvent från ena sekvensen till andra, eller hur? Se från 09:39 till 09:44 i YT-klippet där du kan se hur det inte ser logiskt ut mellan sekvenserna. (Du kanske även ser återigen det klassiska "utsmetsade" i hudtonerna hos subjekten)
Anta att du kastar upp en boll rakt upp i luften inomhus, bör bollen se helt annorlunda ut och/eller verka kastats snett om du helt plötsligt hade sett den från en annan kamera om du filmade den samtidigt med två kameror då?
Precis! Det bör den inte och det är saker du vill se när du analyserar vad som verkar vara flera olika klipp i samma klipp: Ser subjekten och/eller deras verkan annorlunda ut mellan klippen eller ser det hela "logiskt" ut?
Kontinuitet: Miljön - Hur ser saker & ting ut ut över tid?
Från 07:48 och en bit framåt så berättar YT-klippet om hur majoriteten av AI-videoklipp skapas idag. De genereras från slumpartat brus och detta sker för varje bild i ett videoklipp. Om en bild kanske tar en minut att generera i en viss upplösning, tänk då på att ett videoklipp på 10 sekunder innebär 300 bilder om varje sekund ska motsvara 30 bilder (vanligaste bildfrekvensen i YT-videoklipp).
Varje ny bild då som ändå ska vara konsekvent med tidigare bild (precis som när du i verkligheten filmar något) så finns det alltid en sannolikhet att en eller flera bilder ser smått annorlunda ut. Vanligen är detta när det gäller geometri eller människors handrörelser som omfattar komplexa fingerrörelser (istället kommer du se overkliga rörelser och/eller att de "smetas samman").
Något annat här är att nu måste du analysera den rörliga bakgrunden och se hur saker och ting antingen försvinner och aldrig syns igen över tid. Om så är fallet så är det troligen - kombinerat med alla övriga punkter hittills - AI-genererat.
Titta från 11:11 i YT-klippet så visas det hur genererade människor dyker upp från ingenstans och försvinner från ingenstans efter att de går bakom subjektet (samma för fordonen). Detta är återigen delvis på grund av den så kallade "intelligens" dagens generativa AI - i skrivande stund - besitter då de inte förstår logisk fysik i verkligheten såsom vi verkliga människor gör.
Kontinuitet: Verkar klippen sammanhängande?
Den näst sista punkten går lite ihop med ovanstående då geometri är något som dagens generativa AI i skrivande stund också brukar ha problem. Se från 12:35 i YT-klippet så visar de hur något ser fel ut i ett kök, hur Jurassic Park-dörren förvrängs när "kameran" i videoklippet försöker följa med i miljöombytet.
Denna punkt blir så klart klurigare om det är ett väldigt kort klipp med bara ett subjekt, en icke-rörlig ("statisk") miljö/bakgrund vilket betyder att du måste kombinera punkten med de övriga punkterna! Detta bör du alltid göra när du ska analysera något du misstänker skulle kunna vara AI-genererat.
Trådskaparens tips: Bekräfta från flera källor när du får något som påstås vara "akut"
Det sista tipset är från Trådskaparen själv. Majoriteten av bedrägerier mot dig och/eller dina nära & kära kommer att röra sig om att bedragaren snabbt vill få något från dina nära & kära och/eller dig.
Om du får ett mejl, ett sms, eller till och med ett samtal - med eller utan video - som du upplever ganska fort är "akut" så måste du ta ett djupt andetag och ta ett steg tillbaka först. Du måste nu ha is i magen och göra följande:
Börja med att kontakta någon annan för att se om de också fått samma "påstådda akuta meddelande". Om inte, så kan det hela möjligtvis vara "ett inriktat bedrägeriförsök", ibland kallat för "fiske" (då bedragaren försöker "fiska" dig på pengar och/eller annat bedragaren anser sig vara värt).
Sedan ska du helst försöka genast kontakta personen som påstås ha kontaktat dig (kanske det var ditt barn, någon förälder eller förälders förälder, eller någon bästa vän, eller liknande) för att verifiera åt båda håll: "Var det verkligen Du som kontaktade mig eller var det helt enkelt bara ett bedrägeriförsök?".
Om du verkligen vill göra det jobbigt för bedragare så kan du och dina nära & kära bestämma för vilka som måste kontaktas samtidigt och kanske även till och med i vilken ordning vid akuta ärenden. Detta blir då ytterligare "bekräftelse-steg" som bedragare först måste ta reda på och nyttja i rätt ordning.
(OBS: Ju svårare du gör det för bedragaren, desto svårare kanske du också gör det för dig och/eller dina nära & kära - så försök hålla det simpelt men effektivt! Om Du och/eller din nära/kära blir kontaktad där det verkar "akut" så kontakta den påstådda kontaktpersonen med hjälp av de officiella kontaktuppgifterna som du har för just den kontaktpersonen och aldrig via de kontaktuppgifter som har angetts i mejlet/sms:et/röstbrevlådan/videoinspelningen!)
Här är några andra tips från Trådskaparen vilket kan användas för att i princip "bekräfta" att kontaktförsöket är från en riktig människa som du eller din nära/kära vill kunna bli kontaktad av:
Om Du hamnar i ett Videosamtal med någon så kan Du be personen visa sina tänder och dra kameran framåt och bakåt för att kontrollera att tänderna ser konsekventa ut (kom ihåg: kontinuitet!) Alternativt be dem göra "kodordet" du och din nära & kära har kommit överens om. Detta kan alltså vara någon unik rörelse framför kameran som bedragaren då måste ha tagit reda på först.
Om Du hamnar i ett Röstsamtal med någon så kan Du be personen göra ett plötsligt ljud som inte använder sig av bokstäver eftersom detta är något ljudbaserad generativ AI i skrivande stund inte alls är bra på. Alternativt be dem säga "kodordet" och/eller "kodfrasen" du och din nära & kära har kommit överens om.
Om Du får ett SMS/mejlet så ska du genast kontakta den påstådda personen med hjälp av deras officiella kontaktuppgifter istället för det som anges i SMS:et/mejlet. När det just gäller SMS så är det tyvärr så att du kan "spoofa"/"förfalska" avsändarnumret så du kan i princip aldrig till 100 % lita på den påstådda avsändaren vid SMS. Bekräfta som sagt var genom att kontakta den påstådda kontaktpersonen via officiella kontaktuppgifter som du har för just den kontaktpersonen och aldrig via de inuti SMS:et/mejlet!
Avslutningsvis - hjälp dig själv & andra!
Dela YT-klippet och/eller denna tråd till nära & kära så att de får en snabb genomgång om "Dagens AI" och hur de kan skydda sig och andra mot potentiella framtida AI-baserade bedrägerier.
Dela även gärna med dig om dina tips att upptäcka "huruvida något är AI-genererat eller ej"!
Tack så mycket om Du orkade läsa hela vägen hit!
På återseende!
Mvh,
WKF.
P.S. Så klart kan du kopiera&klistra in hela inlägget i valfri språkmodell/LLM (chatGPT/Gemini, med flera) och få en sammanfattning om Du inte orkar läsa allt men ändå vill ta del av de praktiska handlingarna du kan vidta!
(V)ulnerabilities
(I)n
(B)asically
(E)verything
Programming