plots erweitert

2024-05-31 20:30:57 +02:00
parent 421f382d07
commit fb58c51aa2
5 changed files with 94 additions and 22 deletions
--- a/chapters/10_Strings.qmd
+++ b/chapters/10_Strings.qmd
@@ -52,7 +52,7 @@ Der _American Standard Code for Information Interchange_ wurde 1963 in den USA a
   |ISO 8859-6 (Latin/Arabic) | |
   |ISO 8859-7 (Latin/Greek)  | |
   |...| | 
-   |ISO 8859-15 (Latin-9)| | 1999: Revision von Latin-1: jetzt mit Euro-Zeichen!  
+   |ISO 8859-15 (Latin-9)| | 1999: Revision von Latin-1: jetzt u.a. mit Euro-Zeichen 
   
 :::
   
@@ -61,7 +61,7 @@ Der _American Standard Code for Information Interchange_ wurde 1963 in den USA a
 Das Ziel des Unicode-Consortiums ist eine einheitliche Codierung für alle Schriften der Welt.

 - Unicode Version 1 erschien 1991
- Unicode Version 15 erschien 2021 mit 149 186 Zeichen (das sind 4489 mehr als Unicode 14), darunter: 
+- Unicode Version 15.1 erschien 2023 mit 149 813 Zeichen, darunter: 
   - 161 Schriften 
   - mathematische und technische Symbole
   - Emojis und andere Symbole, Steuer- und Formatierungszeichen
@@ -73,7 +73,7 @@ Das Ziel des Unicode-Consortiums ist eine einheitliche Codierung für alle Schri
 - Jedem Zeichen wird ein `codepoint` zugeordnet. Das ist einfach eine fortlaufende Nummer.
 - Diese Nummer wird hexadezimal notiert
   - entweder 4-stellig als `U+XXXX` (0-te Ebene) 
-   - oder 5...6-stellig als `U+XXXXXX`  (weitere Ebenen)
+   - oder 6-stellig als `U+XXXXXX`  (weitere Ebenen)
 - Jede Ebene geht von `U+XY0000`  bis `U+XYFFFF`, kann also $2^{16}=65\;534$ Zeichen enthalten.    
 - Vorgesehen sind bisher 17 Ebenen `XY=00` bis `XY=10`, also der  Wertebereich von `U+0000` bis `U+10FFFF`.
 - Damit sind maximal 21 Bits pro Zeichen nötig.
@@ -83,7 +83,8 @@ Das Ziel des Unicode-Consortiums ist eine einheitliche Codierung für alle Schri
     - Ebene 1 = SMP _Supplementary Multilingual Plane_  `U+010000 - U+01FFFF`,
     - Ebene 2 = SIP _Supplementary Ideographic Plane_    `U+020000 - U+02FFFF`, 
     - Ebene 3 = TIP _Tertiary Ideographic Plane_     `U+030000 - U+03FFFF`   und
-     - Ebene 14 = SSP _Supplementary Special-purpose Plane_ `U+0E0000 - U+0EFFFF` vergeben.
+     - Ebene 14 = SSP _Supplementary Special-purpose Plane_ `U+0E0000 - U+0EFFFF` 
+   vergeben.
 - `U+0000` bis `U+007F` ist identisch mit ASCII
 - `U+0000` bis `U+00FF` ist identisch mit ISO 8859-1 (Latin-1)

@@ -117,6 +118,8 @@ U+21B4 RIGHTWARDS ARROW WITH CORNER DOWNWARDS

 Wie sieht 'RIGHTWARDS ARROW WITH CORNER DOWNWARDS' aus?

+Julia verwendet `\U...` zur Eingabe von Unicode Codepoints.
+
 ```{julia}
 '\U21b4'
 ```
@@ -256,7 +259,7 @@ Da die Codepoints unterschiedlich lang sind, kann man sie nicht einfach hinterei

 - Damit ist jeder ASCII-Text automatisch auch ein korrekt codierter UTF-8-Text.

- Sollten die bisher für Unicode festgelegten 17 Ebenen = 21 Bit = 1.1 Mill. mögliche Zeichen mal erweitert werden, dann wird UTF-8 auf 5- und 6-Byte-Codes erweitert.  
+- Sollten die bisher für Unicode festgelegten 17 Ebenen (= 21 Bit = 1.1 Mill. mögliche Zeichen) mal erweitert werden, dann wird UTF-8 auf 5- und 6-Byte-Codes erweitert.  
  

 ## Zeichen und Zeichenketten in Julia
@@ -272,6 +275,17 @@ Der Datentyp `Char`  kodiert ein einzelnes Unicode-Zeichen.
 - der Integer-Wert ist gleich dem Unicode-codepoint.


+`Char`s können  von/zu `UInt`s umgewandelt werden.
+
+```{julia}
+UInt('a')
+```
+
+
+```{julia}
+b = Char(0x2656)
+```
+
 ### Zeichenketten: `String`

 - Für Strings verwendet Julia doppelte Anführungszeichen: `"a"`.
@@ -283,16 +297,7 @@ Der Datentyp `Char`  kodiert ein einzelnes Unicode-Zeichen.
 ```


- `Char`s können  von/zu `UInt`s umgewandelt werden.

-```{julia}
-UInt('a')
-```
-
-
-```{julia}
-b = Char(0x2656)
-```

 __Bei einem Nicht-ASCII-String unterscheiden sich Anzahl der Bytes und Anzahl der Zeichen:__