Permalänk
Medlem

Teckenkodning

Hejsan

Hur vet man vilken teckenkodning (utf8/iso59xx?) man använder och hur ändrar man det i ett linux system? Jag sitter och försöker föra över en perl script mellan två linux maskiner men på dator nr2 så blir alla åäö oläsbara om man öppnar filen i nano, och scriptet går inte att köra utan fel.

Permalänk

Tror kommandot "locale" finns på linux också, berättar vad du kör för teckenkodning i din terminal. För att ändra vilken teckenkodning en fil är i kan du använda "iconv". Dock skulle jag råda dig att köra på en enda. Leta upp någon guide för din linux dist om hur man ställer in vilken teckenkodning som ska användas. Se då till att båda maskinerna kör utf-8!

Det här med teckenkodning och dess vänner är ett härke, välkommen. Det kommer ta oerhört lång tid, om vi någonsin lyckas, att komma ur och använda en så att vi slipper alla de problem det innebär med flera kodningar.

Visa signatur

Permalänk
Avstängd

Linux och Windows fick Unicode (UTF-8) i efterhand.

Plan 9 from Bell Labs använder Unicode överallt, det var det operativ systemet som först kom med Unicode, dom uppfann det.

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av rastersize
"locale"

Jag får tacka så jätte mycket för den hjälpen, det löste alltihop tillslut :D. tydligen var det så att mina maskiner körde utf-8 medans skolans datorer körde ISO/IEC 8859-15, därutöver så hade jag en text fil som var sparad i windows så radbrytningarna var helt fel. det var välldigt nära att man bröt ihop där.

Citat:

Ursprungligen inskrivet av Silverknife
Linux och Windows fick Unicode (UTF-8) i efterhand.

är utf och unicode samma sak? jag har nämligen en texteditor (textpad 5) som kan spara i både DOS,ANSI,UTF-8, unicode och unicode (big ending).

Permalänk
Medlem
Citat:

Ursprungligen inskrivet av petabyte.se
är utf och unicode samma sak?

Nej. För en utförlig beskrivning rekommenderar jag Wikipedia men kortfattat kan man säga att Unicode är kartan över tecknen medan UTF-8/16/32 är olika sätt att beskriva "vägen" på kartan. De skiljer sig i antalet bytes som används, huruvida teckenkoderna är av fast eller variabel längd samt byte order.

Permalänk
Medlem

annars kan du alltid konvertera filen....
cat filnamn | iconv -f iso-8859-1 -t utf-8 > nyttfilnamn

Om du t.ex. vet att orginalkodningen är i ISO-8859-1
eller om du bara vill printa ut det på skrämen eller testa olika teckenkodningar
cat filnamn | iconv -f iso-8859-1 -t utf-8

För mer hjälp:
man iconv