plots erweitert
This commit is contained in:
@@ -52,7 +52,7 @@ Der _American Standard Code for Information Interchange_ wurde 1963 in den USA a
|
||||
|ISO 8859-6 (Latin/Arabic) | |
|
||||
|ISO 8859-7 (Latin/Greek) | |
|
||||
|...| |
|
||||
|ISO 8859-15 (Latin-9)| | 1999: Revision von Latin-1: jetzt mit Euro-Zeichen!
|
||||
|ISO 8859-15 (Latin-9)| | 1999: Revision von Latin-1: jetzt u.a. mit Euro-Zeichen
|
||||
|
||||
:::
|
||||
|
||||
@@ -61,7 +61,7 @@ Der _American Standard Code for Information Interchange_ wurde 1963 in den USA a
|
||||
Das Ziel des Unicode-Consortiums ist eine einheitliche Codierung für alle Schriften der Welt.
|
||||
|
||||
- Unicode Version 1 erschien 1991
|
||||
- Unicode Version 15 erschien 2021 mit 149 186 Zeichen (das sind 4489 mehr als Unicode 14), darunter:
|
||||
- Unicode Version 15.1 erschien 2023 mit 149 813 Zeichen, darunter:
|
||||
- 161 Schriften
|
||||
- mathematische und technische Symbole
|
||||
- Emojis und andere Symbole, Steuer- und Formatierungszeichen
|
||||
@@ -73,7 +73,7 @@ Das Ziel des Unicode-Consortiums ist eine einheitliche Codierung für alle Schri
|
||||
- Jedem Zeichen wird ein `codepoint` zugeordnet. Das ist einfach eine fortlaufende Nummer.
|
||||
- Diese Nummer wird hexadezimal notiert
|
||||
- entweder 4-stellig als `U+XXXX` (0-te Ebene)
|
||||
- oder 5...6-stellig als `U+XXXXXX` (weitere Ebenen)
|
||||
- oder 6-stellig als `U+XXXXXX` (weitere Ebenen)
|
||||
- Jede Ebene geht von `U+XY0000` bis `U+XYFFFF`, kann also $2^{16}=65\;534$ Zeichen enthalten.
|
||||
- Vorgesehen sind bisher 17 Ebenen `XY=00` bis `XY=10`, also der Wertebereich von `U+0000` bis `U+10FFFF`.
|
||||
- Damit sind maximal 21 Bits pro Zeichen nötig.
|
||||
@@ -83,7 +83,8 @@ Das Ziel des Unicode-Consortiums ist eine einheitliche Codierung für alle Schri
|
||||
- Ebene 1 = SMP _Supplementary Multilingual Plane_ `U+010000 - U+01FFFF`,
|
||||
- Ebene 2 = SIP _Supplementary Ideographic Plane_ `U+020000 - U+02FFFF`,
|
||||
- Ebene 3 = TIP _Tertiary Ideographic Plane_ `U+030000 - U+03FFFF` und
|
||||
- Ebene 14 = SSP _Supplementary Special-purpose Plane_ `U+0E0000 - U+0EFFFF` vergeben.
|
||||
- Ebene 14 = SSP _Supplementary Special-purpose Plane_ `U+0E0000 - U+0EFFFF`
|
||||
vergeben.
|
||||
- `U+0000` bis `U+007F` ist identisch mit ASCII
|
||||
- `U+0000` bis `U+00FF` ist identisch mit ISO 8859-1 (Latin-1)
|
||||
|
||||
@@ -117,6 +118,8 @@ U+21B4 RIGHTWARDS ARROW WITH CORNER DOWNWARDS
|
||||
|
||||
Wie sieht 'RIGHTWARDS ARROW WITH CORNER DOWNWARDS' aus?
|
||||
|
||||
Julia verwendet `\U...` zur Eingabe von Unicode Codepoints.
|
||||
|
||||
```{julia}
|
||||
'\U21b4'
|
||||
```
|
||||
@@ -256,7 +259,7 @@ Da die Codepoints unterschiedlich lang sind, kann man sie nicht einfach hinterei
|
||||
|
||||
- Damit ist jeder ASCII-Text automatisch auch ein korrekt codierter UTF-8-Text.
|
||||
|
||||
- Sollten die bisher für Unicode festgelegten 17 Ebenen = 21 Bit = 1.1 Mill. mögliche Zeichen mal erweitert werden, dann wird UTF-8 auf 5- und 6-Byte-Codes erweitert.
|
||||
- Sollten die bisher für Unicode festgelegten 17 Ebenen (= 21 Bit = 1.1 Mill. mögliche Zeichen) mal erweitert werden, dann wird UTF-8 auf 5- und 6-Byte-Codes erweitert.
|
||||
|
||||
|
||||
## Zeichen und Zeichenketten in Julia
|
||||
@@ -272,6 +275,17 @@ Der Datentyp `Char` kodiert ein einzelnes Unicode-Zeichen.
|
||||
- der Integer-Wert ist gleich dem Unicode-codepoint.
|
||||
|
||||
|
||||
`Char`s können von/zu `UInt`s umgewandelt werden.
|
||||
|
||||
```{julia}
|
||||
UInt('a')
|
||||
```
|
||||
|
||||
|
||||
```{julia}
|
||||
b = Char(0x2656)
|
||||
```
|
||||
|
||||
### Zeichenketten: `String`
|
||||
|
||||
- Für Strings verwendet Julia doppelte Anführungszeichen: `"a"`.
|
||||
@@ -283,16 +297,7 @@ Der Datentyp `Char` kodiert ein einzelnes Unicode-Zeichen.
|
||||
```
|
||||
|
||||
|
||||
- `Char`s können von/zu `UInt`s umgewandelt werden.
|
||||
|
||||
```{julia}
|
||||
UInt('a')
|
||||
```
|
||||
|
||||
|
||||
```{julia}
|
||||
b = Char(0x2656)
|
||||
```
|
||||
|
||||
__Bei einem Nicht-ASCII-String unterscheiden sich Anzahl der Bytes und Anzahl der Zeichen:__
|
||||
|
||||
|
||||
Reference in New Issue
Block a user