åäö i URL:er - Fungerar det bra i praktiken?

Permalänk
Medlem

åäö i URL:er - Fungerar det bra i praktiken?

Har förtillfället åäö i mina url:er när man t.ex. skriver ett blogginlägg. I domäner är det inte att föredra om jag tolkat det korrekt. Men i URL:er t.ex. domain.com/blogg/detta-är-test/

Bör jag på något sätt skapa en funktion som ersätter åäö med a och o istället i urlerna?

Permalänk
Medlem

Bra fråga, man brukar inte ha det (tex kolla URL:en till denna tråd) men är osäker på om det faktiskt finns några problem med det idag.

Domännamn går också att registrera med ÅÄÖ, största problemet jag stötte på med det var att många mail program inte klarade av ÅÄÖ i mailen (tex hej@mittföretag.se). Då måste man istället maila hej@xn--mittfretag-icb.se vilket ser väldigt skumt ut, så då får man lösa det genom att också köpa mittforetag.se och ha hej@mittforetag.se. Och då kunde man nästan lika gärna enbart ha mittforetag.se för alla användare är ändå så vana att göra om ÅÄÖ till AAO.

Visa signatur

Programmerare -> PHP | HTML | CSS | JS | Java.

Permalänk
Medlem

Ett stort problem med svenska tecken i urler är att utländska besökare inte kan skriva in dem.

Praxis brukar vara att man byter ut dem mot AAO.
Och ska man vara petig med att följa standarder så ska man undvika dem.

https://en.m.wikipedia.org/wiki/Percent-encoding#Types_of_URI...

Skickades från m.sweclockers.com

Visa signatur

Intel Core i7 6700K | Gigabyte Z170X-UD3 | Corsair Vengeance LPX 16GB DDR4 2400Mhz | EVGA GTX 980Ti Hybrid | Samsung 950 PRO 256GB | Noctua NH-D15 | EVGA G2 750 | Fractal Design Define R5

Permalänk
Medlem
Skrivet av Zajin:

Ett stort problem med svenska tecken i urler är att utländska besökare inte kan skriva in dem.

Praxis brukar vara att man byter ut dem mot AAO.
Och ska man vara petig med att följa standarder så ska man undvika dem.

https://en.m.wikipedia.org/wiki/Percent-encoding#Types_of_URI...

Skickades från m.sweclockers.com

Jo, men nu är det URL:er som förmodligen inte ska skrivas in manuellt.

Permalänk

Jag använder det till en hemsida jag hostar. Ser inga problem alls så länge den inte behöver nås från utlandet.

Visa signatur
Permalänk
99:e percentilen

@Biberu har garanterat matnyttig input i detta ämne, med tanke på att han har valt trad istället för tråd osv i URL:erna här på SweClockers.

Visa signatur

Skrivet med hjälp av Better SweClockers

Permalänk
Medlem
Skrivet av Zajin:

Ett stort problem med svenska tecken i urler är att utländska besökare inte kan skriva in dem.

När är det ett stort problem, använd en sökmotor för att komma till rätt sida.
Annars är det inte så svårt att hitta ett tecken som inte finns på tangentbordet heller

Ϋάέήίΰαβγδεζηθικλμνξοπ

Permalänk
Medlem
Skrivet av Alpha77:

När är det ett stort problem, använd en sökmotor för att komma till rätt sida.
Annars är det inte så svårt att hitta ett tecken som inte finns på tangentbordet heller

Ϋάέήίΰαβγδεζηθικλμνξοπ

Målet är väl att göra det så lättillgängligt som möjligt och att då använda tecken som kan orsaka problem är ju i det avseendet onödigt.

Skickades från m.sweclockers.com

Visa signatur

Intel Core i7 6700K | Gigabyte Z170X-UD3 | Corsair Vengeance LPX 16GB DDR4 2400Mhz | EVGA GTX 980Ti Hybrid | Samsung 950 PRO 256GB | Noctua NH-D15 | EVGA G2 750 | Fractal Design Define R5

Permalänk
Legendarisk

@Alling: Formatet för en URI definieras i RFC 3986, och får endast använda ASCII. Internationella tecken i t.ex. domännämn eller path måste kodas om; i pathsegment eller querysträngar måste otillåtna oktetter "procentkodas" i formen %XX (for domännamn används Punycode), men länken bär ingen information som berättar för klienten vad det är för typ av data. Det kanske inte ens är text, och om det är det så vet vi inte vilken teckenkodning som använts för att kunna presentera den i läsbar form för användaren.

Att använda "nakna" internationella tecken i länkar ger det motsatta problemet: klienten vet inte nödvändigtvis vilken teckenkodning mottagarservern förväntar sig. Vill man t.ex. besöka example.com/bäver så är det oklart om pathen ska se ut som b%e4ver (Windows-1252), b%c3%a4ver (UTF-8) eller %82C%A5%85%99 (EBCDIC 1047, observera hur vårat "ä" ser ut som ett "C" i ASCII).

I praktiken används dock ofta UTF-8, det kan gå att gissa eller härleda utifrån sammanhanget hur en länk ska presenteras i läsbar form eller kodas om för att skickas till en server, och man kan göra dessa tolerantare för misstag. I @Crqu:s fall kanske det vore rimligt att låta domain.com/blogg/detta-ar-test, domain.com/blogg/detta-%c3%a4r-test, och om han har användare som vill skriva in adressen manuellt i IE8:s adressfält, domain.com/blogg/detta-%e4r-test, leda till samma resurs.

Visa signatur

Abstractions all the way down.