Svartlista på olämpliga användarnamn

Permalänk
Medlem

Svartlista på olämpliga användarnamn

Hej Sweclockers,

Sitter med en spännande uppgift nu på morgonkvisten som någon kanske någonsin stött på och har lite vägledning till.

Vi ska automatgenerera användarnamn med FFEE123 där FF är 2 första initialerna i förnamn och EE är initialerna i efternamnet. Det kom då på tal i ett möte igår att det kan hända att denna kombination inte alltid är lämplig och att vi bör sträva efter att black lista vissa kombinationer, helst på både svenska, engelska och om möjligt hindi (dock är det nog inte jätteviktigt).

Idag sköts det manuellt så då brukar de kasta om det så att det blir EEFF, men scriptet kommer inte kunna veta att Annika Alqvist inte genererar den mest lämpliga kombinationen.

För att slippa brainstorma fram alla olämpliga kombinationer så tänker jag att det borde finnas resurser att använda. Hittar lite grejer när jag googlar men lite begränsat med resultat tycker jag. Hittade en lista på 1300 engelska ord varav 170 matchar 4-bokstäver men jag hittar inget på svenska.

Någon som har varit med om liknande utmaning eller har vägledning?

EDIT:

Lösning:

function getUserName(firstName, lastName) { var regex = /[AEIOUYÅÄÖ]/gmi; firstName = firstName.replace(regex, '').toUpperCase(); lastName = lastName.replace(regex, '').toUpperCase(); while (firstName.length < 2) firstName += 'X'; while (lastName.length < 2) lastName += 'X'; return firstName.substring(0, 2) + lastName.substring(0, 2); }

Permalänk
Medlem

Varför inte det klassiska man hade i skolan förut?
FFEEE123

Analq001 för Annika Alqvist
Analq002 för Anders Alqvist

Permalänk
Medlem
Skrivet av Donhoz:

Varför inte det klassiska man hade i skolan förut?
FFEEE123

Analq001 för Annika Alqvist
Analq002 för Anders Alqvist

Det är ju absolut en lösning, men det jag är ute efter är att veta vilka kombinationer som är olämpliga, ANAL är ju en självklarhet.

Permalänk
Medlem

Daniel Segermark? Olga Larsson?
Jag har slut på namn nu... 🤔

Visa signatur

Any machine is a smoke machine if you use it wrong enough - AvE

Permalänk
Medlem

Det är utmanande om det inte redan finns en.

Det är väl bl.a en kombination av
Svärord / glåpord
Religösa ord? (Gud)
Könsord (kanske rymms inom svärord)

Det kanske räcker?

Men om man tänker på att det räcker ibland med 4 bokstäver av ett längre ord för att man själv fyller i resten i huvudet. T.ex fitt-a. Så även en de första 4 på ett ord borde exkluderas i min mening. Fita kanske också påminner :). Qkn?

Visa signatur

Hur många datorer är för många?

Permalänk

Det finns en doldakamera skämt om hur det kan bli:
https://www.youtube.com/watch?v=0-Bqs9QPLjw

I praktiken så är det lämpligt att filtrera bort de ord som är mest självklara. Storlek på organisation gör både att man kan lägga mer tid på det och det mer kan bli ett skämt. Jag själv har några gånger fått ett ord som betyder något, inget speciellt. Låt oss antal att ordet var stol. Och så i mitt fall kallade de mig för stolen på möten lite skämtsamt då det stog att stol86 hade ändrat.
Såklart att man kan bli kränkt för detta, men det är lite väl mycket att filtrera ut på många olika språk.
Sedan finns det fraser ta MAGA. I en viss tid så var det en Donarld Trump fras. Men att någon ska bli kränkt p.g.a. att användarnamnet just då råkar vara förkortning till en fras som någon hittar på. Ja då är det nog kört med korta användarnamn.

Permalänk
Medlem

Kurt Karlsson

Permalänk
Hedersmedlem

Rektorn på högstadiet hette Rune Karlsson.

Vi körde inte med FFFEE där

Lite roligt kan det ju få bli ändå, men man kan ju försöka sortera ut de värsta namnen.

Visa signatur

|| SWECLOCKERS.COM || oskar@sweclockers.com || OSkar000.se || Fototråden ||
|| Gundeman || Bartonofix || GundemanX2 || Obelinux || Nexofix || Filofix || Ircofix ||
|| Tillse att hjärnan är inkopplad innan fingrarna vidrör tangentbordet ||
|| D300 | D700 | 24/2,8 | 28/2,8 | 35/2 | 50/1,8 | 55/2,8 | 85/1,8 | 105/2,5 | 200/4 | 300/4,5 | 10-20 | 24-70/2,8 | 75-150/3,5 | 80-200/2,8 ||

Permalänk
Medlem

Annars kan man ju hindra ordbildning genom att istället använda exempelvis formatet FF123EE.

Visa signatur

Laptop: Dell Latitude E7270 | 12,5" FHD IPS | i5-6300U | 16GB RAM | 500GB SSD
Laptop: MacBook Air 13"
NUC: Intel i5-4250U | 8GB RAM | 250GB SSD

Permalänk
Medlem

Om det inte existerar en sådan lista så finns det väl bara fyra alternativ:

1) Brainstorma.
2) Generera alla bokstavskombinationer och gå igenom dem manuellt.
3) Filtrera ord med rätt längd från en gratis ordlista och gå igenom dem manuellt.
4) Ta problemen i takt med att folk klagar.

Om du skapar en lista så är det nog uppskattat om du publicerar den på github.

Permalänk
Medlem

Är kanske inte en komplett lösning, men om det går att förgenerera listan så kan ni ju klistra in samtliga förkortningar i ett word-dokument (eller liknande) och se vilka namn som inte blir rödmarkerade som ett felaktigt ord?
Får ni ut en massa FEEN, KUAS etc. så borde word markera dessa som ej ord.

Det lär ju underlätta att filtrera ut de ord som åtminstone finns med i ordlistan
Hanterar inte nödvändigtvis slang, men vissa "fula" ord kan nog fångas upp.

Visa signatur

CPU [Ryzen 7 3800XT] GPU [Red Devil RX 5700 XT 8GB]
PSU [Antec HCG Gold 750W]
MOBO [MSI B550-A Pro]
Chassi [Phanteks Entoo Pro M]

Permalänk
Medlem
Skrivet av PeCe:

Annars kan man ju hindra ordbildning genom att istället använda exempelvis formatet FF123EE.

Vi vill bibehålla en gammal och etablerad standard (som visserligen bryts ibland pga detta).

Skrivet av ducedo:

Om det inte existerar en sådan lista så finns det väl bara fyra alternativ:

1) Brainstorma.
2) Generera alla bokstavskombinationer och gå igenom dem manuellt.
3) Filtrera ord med rätt längd från en gratis ordlista och gå igenom dem manuellt.
4) Ta problemen i takt med att folk klagar.

Om du skapar en lista så är det nog uppskattat om du publicerar den på github.

Tack, det var jättebra input. Tror nog att jag får ge upp hoppet om att något gjort detta åt mig. Jag gav mig inte in i IT för att uppfinna hjulet själv, men någon gång så måste man väl

Lägger in på github i så fall!

Skrivet av iFerz:

Är kanske inte en komplett lösning, men om det går att förgenerera listan så kan ni ju klistra in samtliga förkortningar i ett word-dokument (eller liknande) och se vilka namn som inte blir rödmarkerade som ett felaktigt ord?
Får ni ut en massa FEEN, KUAS etc. så borde word markera dessa som ej ord.

Det lär ju underlätta att filtrera ut de ord som åtminstone finns med i ordlistan
Hanterar inte nödvändigtvis slang, men vissa "fula" ord kan nog fångas upp.

Smart! Tack för input.

Permalänk
Medlem

Blir väl en jättebra AW med lite öl och sen spåna fram snuskiga ord på fyra bokstäver!

Permalänk
Medlem

Är ju bara 614656 kombinationer om jag inte tar fel. (28x28x28x28)

Bara kavla upp ärmarna och börja gå igenom samtliga

Brute force, så att säga.

Visa signatur

5700x3D | RTX 2060 Super | 2 TB M.2 | 32 GB RAM | Gigabyte DS3H| 750 WATT

Permalänk
Inaktiv

Slumpmässigt kombinerade olämpliga ord är roliga och bygger karaktär. Varför ska man gå så långt för att dalta för överkänsliga individer

Permalänk
Medlem

Kanske lättast att blockera alla användarnamn som utgör ett ord?

Här finns en ordlista som verkar ganska omfattande: http://runeberg.org/words/ss100.txt

Permalänk
Medlem

u för user följt av ett löpnummer = win!
Tanken är bra med FFEE eller liknande, för i små bolag kan man snabbt identifiera användaren. Men sen byter folk efternamn, företaget växer och helt plötsligt finns det 4 Magdalena Andersson, så man måste börja trixa FFEE.

Visa signatur

SHEPERD S HEPAURD SHEPARUD!!!

Permalänk
Medlem

Jag hoppas på följande situation:

En heter Dick Ckerzy å en heter Disa Ckarry. Dick blir kränkt om han inte får ha DICK som användarnamn medans Disa blir kränkt om hon måste ha DICK

Permalänk
Medlem

Lättast är väl att ha en lista med olämpliga ord som du kan matcha mot?

För svenska ord så finns alltid fula ordboken: http://www.fulaordboken.se
För engelska ord så finns "Offensive/Profane world list" på den här sidan: https://www.cs.cmu.edu/~biglou/resources/ (Gissningsvis den du själv redan hittat).

Skulle det slinka igenom något så får väl berörd användare klaga så du kan lägga till det själv?

Permalänk
Medlem

Då denna post låg på framsidan, så trodde jag att ni skulle implementera detta på Sweclockers.
Jag blev inte klok på varför och tyckte att det lät väldigt konstigt.

Visa signatur

It’s more fun to compute.

Permalänk
Expertgissare

Ett lite Star Wars inspirerat förslag, F1E2.
Första bokstaven i förnamnet, en slumpad siffra, första bokstaven i efternamnet och en slumpad siffra igen.
Tänk vad coolt att få möta en R2D2 eller C3P0

Visa signatur

FD Meshify C -|- X570 AORUS ELITE -|- Ryzen 7 3700X -|- FD Celsius S24 -|- Crucial Ballistix Sport 32GB -|- Radeon R9 380X -|- WD Black SN750 1TB

Permalänk
Medlem

Jag hade gjort

FFEE
EEFF
Sen alla andra permutationer av FF och EE (FEFE etc)
Sen alla permutationer av längd 4 av bokstäverna i förnamn + efternamn
Sen 4 slumpade bokstäver

Tills du hittar något som inte finns i någon av dina ordlistor. Ta inte ställning till vad som är känsligt för vem, det blir ett evighetsprojekt med klagomål på diverse specialfall hit och dit…

Permalänk
Inaktiv
Skrivet av Dreijer:

Då denna post låg på framsidan, så trodde jag att ni skulle implementera detta på Sweclockers.
Jag blev inte klok på varför och tyckte att det lät väldigt konstigt.

Hade inte varit konstigt alls, SweC drivs av ett gäng fisförnäma (men trevliga) prickar som blev alldeles förskräckta av iden att jag ville ha användarnamnet Perkele.

Så därför valde jag herkkä istället, som jag tyckte var passande nog.

Permalänk
Medlem

Putin borde vara instaban!

Visa signatur

r_wateralpha 0.3

Permalänk
Medlem

Ha en ordlista, implementera sök som kan ge resultat med olika levenshtein distance. (närmsta träff)
https://en.m.wikipedia.org/wiki/Levenshtein_distance
https://en.m.wikipedia.org/wiki/Approximate_string_matching

Filtrera bort namn som träffar tillräckligt nära. Vill man vara lite finurlig kan man ju räkna t.ex. 3 och e som 0 i avstånd.

Permalänk
Medlem

jag lägger min röst på uXXXXX, blir inga krockar. Inte svårt att lära sig uXXXX(om 9999 räcker)

Slipper onödigt muppande om olämpliga kombinationer.

mvh Lazze

Permalänk
Medlem

Varför inte låta användaren meddela om man fått ett dumt namn, så byter man då enkelt.

Permalänk
Medlem

På mitt förra jobb hade vi ett internt verktyg som skannade filer för att hitta olämpliga ord i dem. Användes i builds osv för att skanna kod o labels, skapa rapporter och buggar av resultatet så vi kunde åtgärda olämpliga ord. Tror även all publik text i dokumentation, hemsidor osv skannades innan publicering. Minns att den inte alls gillade kod som hade med vibration att göra, vilket man ibland behöver vid mobil utveckling...

Visa signatur

| Fractal Design Compact 7 Vit - MSI Tomahawk x570 - Ryzen 5600X - PNY 4070Ti Super - 32GB Corsair 3200Mhz CL16 | ASUS MG279Q - 2560x1440, 144Hz, IPS, Freesync |

Permalänk
Medlem

I skolan hade vi 6st bokstäver.
Första två bokstäverna och sista i för och efternamn.
Anders Andersson = ansann
Petter Karlsson = perkan

Visa signatur

hellre mer fps på skärmen än pengar på banken

Permalänk
Medlem

Kolla med @Gargz hur han fick tag i hela SAOL listan för 5/6 bokstäver, scriptet kan sen kolla efter en träff och flagga dessa (kanske helt enkelt blockera alla träffar?). Den är det bara att manuellt gå igenom de som failar för andra gången (i omvänd ordning)