Teckenkodningsproblem i Ubuntu
Har pillat med teckenkodning i Ubuntu på en dator där Ubuntu installerades för länge sen (Ubuntu 5.04 var första versionen som installerades, tror jag) och som jag inte haft tillgång till/intresse av förrän nu.
Ett tag gick det inte att köra t ex `apt-get` då det klagade på något som tydligen var relaterat till teckenkodningen då det funkat efter att jag lagt till filen `/var/lib/locales/supported.d/sv` med innehållet "sv_SE UTF-8" och sedan kört `locale-gen`. Numera fungerar det att köra, men svenska tecken i outputen ser ut som följer:
$ sudo apt-get update
...
Hämtade 51,1kB på 0s (97,2kB/s)
Läser paketlistor... Färdig
Svenska tecken ser alltså inte rätt ut.
Ett annat exempel:
$ touch test-åäö
$ ls
test-???
$ rm test-åäö
$ ls
$
Filer som skapades innan `sv_SE UTF-8` installerades ser i stället ut som `test-ööö` (om filen var tänkt att heta `test-ÖÖÖ`).
Problemet är att om jag t ex vill köra OpenOffice från kommandoraden och öppna en fil som innehåller åäöÅÄÖ så vill den inte med motiveringen att den inte hittar filen, t ex:
$ oowriter test-åäö
[dialogruta] test-[tre stycken diamanter med frågetecken i] does not exist.[/dialogruta]
Innan hade `LANG`-variabeln i skalet värdet `en_US.UTF-8`; har testat att ändra i `/etc/environment` så att det haft värdet `sv_SE.UTF-8` och bara `sv_SE` med samma resultat som innan.
Lite output:
$ cat /etc/lsb-release
DISTRIB_ID=Ubuntu
DISTRIB_RELEASE=7.04
DISTRIB_CODENAME=feisty
DISTRIB_DESCRIPTION="Ubuntu 7.04"
$ locale
LANG=en_US.UTF-8
LC_CTYPE="sv_SE"
LC_NUMERIC="sv_SE"
LC_TIME="sv_SE"
LC_COLLATE="sv_SE"
LC_MONETARY="sv_SE"
LC_MESSAGES="sv_SE"
LC_PAPER="sv_SE"
LC_NAME="sv_SE"
LC_ADDRESS="sv_SE"
LC_TELEPHONE="sv_SE"
LC_MEASUREMENT="sv_SE"
LC_IDENTIFICATION="sv_SE"
LC_ALL=sv_SE
$ locale -a
C
en_AU.utf8
en_BW.utf8
en_CA.utf8
en_DK.utf8
en_GB.utf8
en_HK.utf8
en_IE.utf8
en_IN
en_NZ.utf8
en_PH.utf8
en_SG.utf8
en_US.utf8
en_ZA.utf8
en_ZW.utf8
POSIX
sv_SE
sv_SE.utf8
Vad ska jag göra för att output från exempelvis `apt-get` och `ls` att se rätt ut och få allmän ordning på allt teckenkodningsrelaterat?
Nu med kortare användarnamn, men fortfarande bedövande långa inlägg.