conio, du har ju rätt angående encoding och unicode, men har du använt XML någon gång?
Mitt uttalande "UTF-8 får inte innehålla å, ä, ö." var kanske då inte helt korrekt formulerat utan borde vara "UTF-8 kodade XML dokument får inte innehålla teckenen å, ä, ö.".
Så, visst får ett XML dokument i UTF-8 innehålla Svenska tecken, men de får inte skrivas som t.ex. "ä" utan måste då "översättas" till hex-koden, "ä", vilket blir synnerligen jobbigt och rörigt att läsa. Ta en titt på några RSS feeds t.ex. för Aftonbladet, IDG eller SVD så ser du att de kör ISO-8859-1...
För att illustrera problemet, ta denna XML, spara den på din burk och öppna den i valfri XML parser (Internet Explorer duger):
<?xml version="1.0" encoding="UTF-8"?>
<utf8_xml>
<swe_chars>Detta är svenska tecken, å ,ä ,ö ,Å ,Ä ,Ö</swe_chars>
</utf8_xml>
Vad ser du då?
Jo, att den har encoding UTF-8 och följande fel "invalid character was found in text content".
Så, ta denna då istället med ISO-8859-1 kodning:
<?xml version="1.0" encoding="ISO-8859-1"?>
<utf8_xml>
<swe_chars>Detta är svenska tecken, å ,ä ,ö ,Å ,Ä ,Ö</swe_chars>
</utf8_xml>
Vad händer då?
Hmmm... Inget felmeddelande, hur kommer det sig?
Kan du ha fel i dina uttalanden?
Nä, troligtvis har XML Spy och Microsoft med flera inte testat av sina grejer och gjort fel vad det gäller användandet av teckentabeller... eller...?
/Anders