vbscript och charset ger �����

Permalänk
Medlem

vbscript och charset ger �����

Vill loopa igenom en fil, och hitta relevant text mellan STX och ETX

Öppnar jag med notepad++ får jag ut "Font Typ [NUL] [NUL] [NUL] [STX] [NUL] T [NUL] E [NUL] X [NUL] T [ETX]. Allt inom [] är svartmarkerat så vet inte om det är en översättning eller symboler när jag väljer UTF-8?
Öppnar jag med notepad så är det grekiska
Via debuggern (se kod nedan) får jag ut � för alla kontrollkoder/http://en.wikipedia.org/wiki/C0_and_C1_control_codesex (exvis STX/ETX) , vanliga tecken kommer ut som klartext

Tanken var att köra regexp men då jag inte kan göra skillnad på � och � så ??? Några ideer.
Är låst till denna debugger tyvärr, tänkte om det går att få fram innehållet i � på något sätt

Set objStream = CreateObject("ADODB.Stream") With objStream .Charset = "utf-8" .Open .LoadFromFile(file) strData = objStream.ReadText() End With

Permalänk
Medlem

Det här är ju sjukt

Tänkte att konvertering till ASCII borde ge mig rätt kod

Alla � ger mig 63 vilket motsvarar ? och är helt fel. Så något tappas någonstans, kör jag ingen charset alls så är det massa junk och japanska tecken, iso-nånting ger mig massa skräp som inte går att tyda. Och notepap++ med UTF-8 ger mig ju inte � utan symbolerna för stX, etX, NUL med mera :x gaaaah

Permalänk
Medlem

Det kanske blir lättare att hjälpa om du laddar upp filen någonstans, exempelvis http://www.mediafire.com/ eller https://mega.co.nz/.

Annars får du ta reda på vilken teckenkodning filen använder, jag misstänker att den är sparad av något program?

Visa signatur

Citera eller nämn gärna mig (@ToJa92) om du svarar på något jag skrivit.
Uppskattar du eller blir hjälpt av ett inlägg jag skrivit är jag tacksam om du gillar det.