plots erweitert

This commit is contained in:
2024-05-31 20:30:57 +02:00
parent 421f382d07
commit fb58c51aa2
5 changed files with 94 additions and 22 deletions

View File

@@ -52,7 +52,7 @@ Der _American Standard Code for Information Interchange_ wurde 1963 in den USA a
|ISO 8859-6 (Latin/Arabic) | |
|ISO 8859-7 (Latin/Greek) | |
|...| |
|ISO 8859-15 (Latin-9)| | 1999: Revision von Latin-1: jetzt mit Euro-Zeichen!
|ISO 8859-15 (Latin-9)| | 1999: Revision von Latin-1: jetzt u.a. mit Euro-Zeichen
:::
@@ -61,7 +61,7 @@ Der _American Standard Code for Information Interchange_ wurde 1963 in den USA a
Das Ziel des Unicode-Consortiums ist eine einheitliche Codierung für alle Schriften der Welt.
- Unicode Version 1 erschien 1991
- Unicode Version 15 erschien 2021 mit 149 186 Zeichen (das sind 4489 mehr als Unicode 14), darunter:
- Unicode Version 15.1 erschien 2023 mit 149 813 Zeichen, darunter:
- 161 Schriften
- mathematische und technische Symbole
- Emojis und andere Symbole, Steuer- und Formatierungszeichen
@@ -73,7 +73,7 @@ Das Ziel des Unicode-Consortiums ist eine einheitliche Codierung für alle Schri
- Jedem Zeichen wird ein `codepoint` zugeordnet. Das ist einfach eine fortlaufende Nummer.
- Diese Nummer wird hexadezimal notiert
- entweder 4-stellig als `U+XXXX` (0-te Ebene)
- oder 5...6-stellig als `U+XXXXXX` (weitere Ebenen)
- oder 6-stellig als `U+XXXXXX` (weitere Ebenen)
- Jede Ebene geht von `U+XY0000` bis `U+XYFFFF`, kann also $2^{16}=65\;534$ Zeichen enthalten.
- Vorgesehen sind bisher 17 Ebenen `XY=00` bis `XY=10`, also der Wertebereich von `U+0000` bis `U+10FFFF`.
- Damit sind maximal 21 Bits pro Zeichen nötig.
@@ -83,7 +83,8 @@ Das Ziel des Unicode-Consortiums ist eine einheitliche Codierung für alle Schri
- Ebene 1 = SMP _Supplementary Multilingual Plane_ `U+010000 - U+01FFFF`,
- Ebene 2 = SIP _Supplementary Ideographic Plane_ `U+020000 - U+02FFFF`,
- Ebene 3 = TIP _Tertiary Ideographic Plane_ `U+030000 - U+03FFFF` und
- Ebene 14 = SSP _Supplementary Special-purpose Plane_ `U+0E0000 - U+0EFFFF` vergeben.
- Ebene 14 = SSP _Supplementary Special-purpose Plane_ `U+0E0000 - U+0EFFFF`
vergeben.
- `U+0000` bis `U+007F` ist identisch mit ASCII
- `U+0000` bis `U+00FF` ist identisch mit ISO 8859-1 (Latin-1)
@@ -117,6 +118,8 @@ U+21B4 RIGHTWARDS ARROW WITH CORNER DOWNWARDS
Wie sieht 'RIGHTWARDS ARROW WITH CORNER DOWNWARDS' aus?
Julia verwendet `\U...` zur Eingabe von Unicode Codepoints.
```{julia}
'\U21b4'
```
@@ -256,7 +259,7 @@ Da die Codepoints unterschiedlich lang sind, kann man sie nicht einfach hinterei
- Damit ist jeder ASCII-Text automatisch auch ein korrekt codierter UTF-8-Text.
- Sollten die bisher für Unicode festgelegten 17 Ebenen = 21 Bit = 1.1 Mill. mögliche Zeichen mal erweitert werden, dann wird UTF-8 auf 5- und 6-Byte-Codes erweitert.
- Sollten die bisher für Unicode festgelegten 17 Ebenen (= 21 Bit = 1.1 Mill. mögliche Zeichen) mal erweitert werden, dann wird UTF-8 auf 5- und 6-Byte-Codes erweitert.
## Zeichen und Zeichenketten in Julia
@@ -272,6 +275,17 @@ Der Datentyp `Char` kodiert ein einzelnes Unicode-Zeichen.
- der Integer-Wert ist gleich dem Unicode-codepoint.
`Char`s können von/zu `UInt`s umgewandelt werden.
```{julia}
UInt('a')
```
```{julia}
b = Char(0x2656)
```
### Zeichenketten: `String`
- Für Strings verwendet Julia doppelte Anführungszeichen: `"a"`.
@@ -283,16 +297,7 @@ Der Datentyp `Char` kodiert ein einzelnes Unicode-Zeichen.
```
- `Char`s können von/zu `UInt`s umgewandelt werden.
```{julia}
UInt('a')
```
```{julia}
b = Char(0x2656)
```
__Bei einem Nicht-ASCII-String unterscheiden sich Anzahl der Bytes und Anzahl der Zeichen:__