Linuxnewbie som önskar hjälp med övningar på kurs jag går

Permalänk
Medlem

Linuxnewbie som önskar hjälp med övningar på kurs jag går

Hej alla hjälpare,

Jag är helt ny på Linux, har aldrig skrivit i terminal osv. Har installerat Linux Mint och Visual Box på min iMac härhemma.

Just nu sitter jag med en fråga angående "Representing Text" och undrar om jag kan få ställa den här?

1.The following represents basic ASCII encoded text:

5468 6973 2069 7320 656e 636f 6465 6420
7573 696e 6720 6261 7369 6320 4153 4349
4921 0a

What does it mean?

2. The following represents ISO 8859-1 encoded text:

56e6 7220 73e5 2067 6f64 21

What does it mean?

3. The following represents UTF-8 encoded text:

56c3 a672 2073 c3a5 2067 6f64 21

What does it mean?

4. Encode ø in UTF-8.

Vad jag förstår ska jag använda basic ASCI Table men jag förstår inte hur jag ska lösa uppgiften. Hur använder jag tabellen? Var ska jag skriva in min fråga i tabellen? Hur räknar jag ut code point? Jag fattar liksom inte HUR jag ska göra för att komma fram till svaret, steg för steg.
Är det någon som vill hjälpa mig tar jag tacksamt emot hjälp. Jag har flera frågor till men jag börjar med dessa så får jag se om ni vill hjälpa mig.

https://unicode-table.com/en/#control-character

Permalänk
Medlem

Googla på det så hittar du tabeller, ASCII 54 är t.ex stort T.
Det du behöver ha koll på är hexadecimala tal, antal bitar/siffor per bokstav och hur UTF-8 fungerar i det avseendet.

Permalänk
Medlem

@pacc: Tack så jag ska dela upp talen i två, så får jag mer svar?
Jag har googlat men jag fattar inte hur jag ska skriva i den medföljande länken jag sände med.

Permalänk
Hedersmedlem

För att svara på fråga 4 behöver du veta:

1. Vilket teckennummer har ø i Unicode?
2. Hur representerar du denna kodpunkt i UTF-8?

Fråga 1 fixar du med länken.
Fråga 2 kan du läsa på här: https://sv.wikipedia.org/wiki/UTF-8. Under rubriken Beskrivning står exakt hur du ska göra.

Kan också tillägga att frågan egentligen har noll med Linux att göra. Windows och typ alla andra OS funkar likadant.

Permalänk
Medlem

@Allimac: 0050 på vänstra sidan betyder att första siffra av två hexadecimalt är en femma, den andra siffran i paret tar du från övre raden dvs 4 => T

Beroende på kodtabell så är det olika tecken - alla är inte unicode, sedan kan du läsa på wikipedia om hur UTF-8 är annorlunda.

Permalänk
Medlem
Permalänk
Medlem

@pv2b: Länken är inte helt lätt för mig att förstå hur jag ska använda, tror eventuellt jag kommit det...

Permalänk
Medlem

ascii

@Allimac: 5468 i ditt exempel:

(x0, dvs hexadecimalt) 54 är det binära talet 01010100 = 5 x 16 + 4 = 84 = 'T'
(x0 ) 68 01101000 = 6 x 16 + 8 = 104 = 'h'

https://www.asciitabell.se/

Konventionen när man skriver hexadecimaltal för att det skall vara tydligt vad man menar
är 0x före talet, om man ska skriva samma tal på octal form (bas 8 istället för 16 eller 10) så
är vanligt prefix 0 så för de här två talen:

01010100 = 0124 ( 0 prefix, 1 = 1b, 2 = 010b, 4 = 100b )
01101000 = 0150 ( 0 prefix, 1 = 1b, 5 = 101b, 0 = 000b)

Lägg märke till att tal med hexadecimal bas kan representera ett 4 bitar långt binärt medans ett oktalt kan representera 3 binära bitar.

En maskin med ordlängden 18 (digitals PDP8/PDP11 exv) där kan en exv en adress enkelt skrivas som 6 st siffror med oktal bas exv 0110770 = 001001000111111000b (prefixet 0)
Hexadecimalt lämpar sig för arkitekturer med 4 som grund vs 3 för exv digitals pdp11.

Oktalt kan även lämpa sig om man vill titta på hur instruktioner är kodade.

Norskt/danskt Ø ? Det har troligtvis INTE samma kodning i UTF8 som svenskt Ö !

Permalänk
Medlem
Skrivet av Allimac:

Hej alla hjälpare,

Jag är helt ny på Linux, har aldrig skrivit i terminal osv. Har installerat Linux Mint och Visual Box på min iMac härhemma.

Just nu sitter jag med en fråga angående "Representing Text" och undrar om jag kan få ställa den här?

1.The following represents basic ASCII encoded text:

5468 6973 2069 7320 656e 636f 6465 6420
7573 696e 6720 6261 7369 6320 4153 4349
4921 0a

What does it mean?

2. The following represents ISO 8859-1 encoded text:

56e6 7220 73e5 2067 6f64 21

What does it mean?

3. The following represents UTF-8 encoded text:

56c3 a672 2073 c3a5 2067 6f64 21

What does it mean?

4. Encode ø in UTF-8.

Vad jag förstår ska jag använda basic ASCI Table men jag förstår inte hur jag ska lösa uppgiften. Hur använder jag tabellen? Var ska jag skriva in min fråga i tabellen? Hur räknar jag ut code point? Jag fattar liksom inte HUR jag ska göra för att komma fram till svaret, steg för steg.
Är det någon som vill hjälpa mig tar jag tacksamt emot hjälp. Jag har flera frågor till men jag börjar med dessa så får jag se om ni vill hjälpa mig.

https://unicode-table.com/en/#control-character

ett tips kan vara att latja med en hexeditor och notepad++ för att i hexeditorn se hur samma text ser ut beroende på vilken encoding du konverterar till i notepad++