Den här meningen döljer ett h󠄸󠆳󠆔󠅜󠅣󠅞󠅙󠅞󠅗󠅑󠅢󠄐󠅖󠅢󠆳󠆕󠅞󠄐󠅃󠅧󠅕󠄳󠅜󠅟󠅓󠅛󠅕󠅢󠅣󠄑emligt budskap. En av de till synes vanliga bokstäverna innehåller nämligen ett antal dolda tecken som inte renderas, men som följer med om du kopierar och klistrar in texten på ett nytt verktyg som utvecklaren Paul Butler har publicerat för att visa upp en upptäckt han har gjort i Unicode-standarden.

Unicode-tecken består av en eller flera så kallade kodpunkter, som normalt skrivs ut U+XXXX, till exempel kodpunkten U+0068 för bokstaven h eller U+1F62E för emojin 😮.

Unicode-standarden har plats för över en miljon möjliga tecken, även om långt ifrån alla hittills har tilldelats några tecken. Några kodpunkter är reserverade för särskilda ändamål, bland annat 256 stycken som kallas ”variationsväljare”, som används med exempelvis emoji där användaren kan välja mellan olika hudfärg eller kön.

Vad Paul Butler har upptäckt är att det går att lägga på flera sådana variationsväljare i rad efter ett tecken utan att påverka renderingen av texten. Trots att de dolda ”bilagorna” inte syns följer de snällt med om texten kopieras och klistras in någon annanstans.

Genom att använda ett program som kan visa rådata (en så kallad hex dump) går det att se att tecknet i fråga består av mycket mer data än det borde. Paul Butlers verktyg kan både koda in ett dolt meddelande i ett tecken och avkoda eventuella dolda meddelanden i inklistrad text.

Utvecklaren skriver att han inte kan komma på några praktiska användningsområden, men däremot ett par lömska: För att lura sig förbi en mänsklig granskning av en text och som ett sätt att vattenmärka text för att till exempel kunna spåra läckor.