- "cells": [
- {
- "cell_type": "markdown",
- "id": "7c21d452",
- "metadata": {},
- "source": [
- "# Zeichen, Strings und Unicode\n",
- "\n",
- "## Zeichencodierungen (Frühgeschichte)\n",
- "\n",
- "Es gab - abhängig von Hersteller, Land, Programmiersprache, Betriebsssystem,... - eine große Vielzahl von Codierungen. \n",
- "\n",
- "Bis heute relevant sind:\n",
- "\n",
- "\n",
- "### ASCII \n",
- "Der _American Standard Code for Information Interchange_ wurde 1963 in den USA als Standard veröffentlicht. \n",
- "\n",
- "- Er definiert $2^7=128$ Zeichen, und zwar: \n",
- " - 33 Steuerzeichen, wie `newline`, `escape`, `end of transmission/file`, `delete`\n",
- " - 95 graphisch darstellbare Zeichen:\n",
- " - 52 lateinische Buchstaben `a-z, A-Z`\n",
- " - 10 Ziffern `0-9`\n",
- " - 7 Satzzeichen `.,:;?!\"`\n",
- " - 1 Leerzeichen ` `\n",
- " - 6 Klammern `[{()}]`\n",
- " - 7 mathematische Operationen `+-*/<>=`\n",
- " - 12 Sonderzeichen ``` #$%&'\\^_|~`@ ``` \n",
- "\n",
- "- ASCII ist heute noch der \"kleinste gemeinsame Nenner\" im Codierungs-Chaos.\n",
- "- Die ersten 128 Unicode-Zeichen sind identisch mit ASCII.\n",
- "\n",
- "### ISO 8859-Zeichensätze\n",
- "\n",
- "- ASCII nutzt nur 7 Bits. \n",
- "- In einem Byte kann man durch Setzen des 8. Bits weitere 128 Zeichen unterbringen. \n",
- "- 1987/88 wurden im ISO 8859-Standard verschiedene 1-Byte-Codierungen festgelegt, die alle ASCII-kompatibel sind, darunter:\n",
- "\n",
- ":::{.narrow}\n",
- " |Codierung | Region | Sprachen|\n",
- " |:-----------|:----------|:-------|\n",
- " |ISO 8859-1 (Latin-1) | Westeuropa | Deutsch, Französisch,...,Isländisch\n",
- " |ISO 8859-2 (Latin-2) | Osteuropa | slawische Sprachen mit lateinischer Schrift\n",
- " |ISO 8859-3 (Latin-3) | Südeuropa | Türkisch, Maltesisch,...\n",
- " |ISO 8859-4 (Latin-4) | Nordeuropa | Estnisch, Lettisch, Litauisch, Grönländisch, Sami\n",
- " |ISO 8859-5 (Latin/Cyrillic) | Osteuropa | slawische Sprachen mit kyrillischer Schrift\n",
- " |ISO 8859-6 (Latin/Arabic) | |\n",
- " |ISO 8859-7 (Latin/Greek) | |\n",
- " |...| | \n",
- " |ISO 8859-15 (Latin-9)| | 1999: Revision von Latin-1: jetzt mit Euro-Zeichen! \n",
- " \n",
- ":::\n",
- " \n",
- "## Unicode \n",
- "\n",
- "Das Ziel des Unicode-Consortiums ist eine einheitliche Codierung für alle Schriften der Welt.\n",
- "\n",
- "- Unicode Version 1 erschien 1991\n",
- "- Unicode Version 15 erschien 2021 mit 149 186 Zeichen (das sind 4489 mehr als Unicode 14), darunter: \n",
- " - 161 Schriften \n",
- " - mathematische und technische Symbole\n",
- " - Emojis und andere Symbole, Steuer- und Formatierungszeichen\n",
- "- davon entfallen über 90 000 Zeichen auf die CJK-Schriften (Chinesisch/Japanisch/Koreanisch) \n",
- " \n",
- " \n",
- "### Technische Details\n",
- "\n",
- "- Jedem Zeichen wird ein `codepoint` zugeordnet. Das ist einfach eine fortlaufende Nummer.\n",
- "- Diese Nummer wird hexadezimal notiert\n",
- " - entweder 4-stellig als `U+XXXX` (0-te Ebene) \n",
- " - oder 5...6-stellig als `U+XXXXXX` (weitere Ebenen)\n",
- "- Jede Ebene geht von `U+XY0000` bis `U+XYFFFF`, kann also $2^{16}=65\\;534$ Zeichen enthalten. \n",
- "- Vorgesehen sind bisher 17 Ebenen `XY=00` bis `XY=10`, also der Wertebereich von `U+0000` bis `U+10FFFF`.\n",
- "- Damit sind maximal 21 Bits pro Zeichen nötig.\n",
- "- Die Gesamtzahl der damit möglichen Codepoints ist etwas kleiner als 0x10FFFF, da aus technischen Gründen gewisse Bereiche nicht verwendet werden. Sie beträgt etwa 1.1 Millionen, es ist also noch viel Platz. \n",
- "- Bisher wurden nur Codepoints aus den Ebenen \n",
- " - Ebene 0 = BMP _Basic Multilingual Plane_ `U+0000 - U+FFFF`,\n",
- " - Ebene 1 = SMP _Supplementary Multilingual Plane_ `U+010000 - U+01FFFF`,\n",
- " - Ebene 2 = SIP _Supplementary Ideographic Plane_ `U+020000 - U+02FFFF`, \n",
- " - Ebene 3 = TIP _Tertiary Ideographic Plane_ `U+030000 - U+03FFFF` und\n",
- " - Ebene 14 = SSP _Supplementary Special-purpose Plane_ `U+0E0000 - U+0EFFFF` vergeben.\n",
- "- `U+0000` bis `U+007F` ist identisch mit ASCII\n",
- "- `U+0000` bis `U+00FF` ist identisch mit ISO 8859-1 (Latin-1)\n",
- "\n",
- "### Eigenschaften von Unicode-Zeichen\n",
- "\n",
- "Im Standard wird jedes Zeichen beschrieben duch\n",
- "\n",
- " - seinen Codepoint (Nummer) \n",
- " - einen Namen (welcher nur aus ASCII-Großbuchstaben, Ziffern und Minuszeichen besteht) und \n",
- " - verschiedene Attributen wie\n",
- " - Laufrichtung der Schrift \n",
- " - Kategorie: Großbuchstabe, Kleinbuchstabe, modifizierender Buchstabe, Ziffer, Satzzeichen, Symbol, Seperator,....\n",
- "\n",
- "Im Unicode-Standard sieht das dann so aus (zur Vereinfachung nur Codepoint und Name):\n",
- "```\n",
- "...\n",
- "...\n",
- "...\n",
- "...\n",
- "...\n",
- "```\n",
- "\n",
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "48697b80",
- "metadata": {},
- "outputs": [],
- "source": [
- "'\\U21b4'"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "568c932d",
- "metadata": {},
- "source": [
- "### Eine Auswahl an Schriften \n",
- "\n",
- "::: {.content-visible when-format=\"html\"}\n",
- "\n",
- ":::{.callout-note}\n",
- "Falls im Folgenden einzelne Zeichen oder Schriften in Ihrem Browser nicht darstellbar sind, müssen Sie geeignete \n",
- "Fonts auf Ihrem Rechner installieren. \n",
- "\n",
- "Alternativ können Sie die PDF-Version dieser Seite verwenden. Dort sind alle Fonts eingebunden.\n",
- ":::\n",
- "\n",
- ":::\n",
- "\n",
- "Eine kleine Hilfsfunktion:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "44eecb07",
- "metadata": {},
- "outputs": [],
- "source": [
- "\"\"\"\n",
- "printuc(c, n):\n",
- "print n characters from unicode table, starting with character c \n",
- "\"\"\"\n",
- "function printuc(c, n)\n",
- " for i in 0:n-1\n",
- " print(c + i)\n",
- " end\n",
- "end"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "9857ec8a",
- "metadata": {},
- "source": [
- "__Kyrillisch__\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "d1827fb6",
- "metadata": {},
- "outputs": [],
- "source": [
- "printuc('\\U0400', 100)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "1975b4c8",
- "metadata": {},
- "source": [
- "__Tamilisch__\n",
- "\n",
- ":::{.cellmerge}\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "0ac169a1",
- "metadata": {},
- "outputs": [],
- "source": [
- "#| echo: true\n",
- "#| output: false\n",
- "printuc('\\U0be7',20)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "cf47c3ec",
- "metadata": {},
- "source": [
- "\\begingroup\\setmonofont{Noto Sans Tamil}\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "4c539418",
- "metadata": {},
- "outputs": [],
- "source": [
- "#| echo: false\n",
- "#| output: true\n",
- "printuc('\\U0be7',20)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "57b1dd19",
- "metadata": {},
- "source": [
- "\\endgroup\n",
- "\n",
- ":::\n",
- "\n",
- "__Schach__\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "6d474a65",
- "metadata": {},
- "outputs": [],
- "source": [
- "printuc('\\U2654', 12)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "9c31ea8a",
- "metadata": {},
- "source": [
- "__Mathematische Operatoren__\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "58aaf4c5",
- "metadata": {},
- "outputs": [],
- "source": [
- "printuc('\\U2200', 255)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "9b6c63b0",
- "metadata": {},
- "source": [
- "__Runen__\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "88859f95",
- "metadata": {},
- "outputs": [],
- "source": [
- "printuc('\\U16a0', 40)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "08203fd6",
- "metadata": {},
- "source": [
- ":::{.cellmerge}\n",
- "\n",
- "__Scheibe (Diskus) von Phaistos__\n",
- "\n",
- "- Diese Schrift ist nicht entziffert. \n",
- "- Es ist unklar, welche Sprache dargestellt wird.\n",
- "- Es gibt nur ein einziges Dokument in dieser Schrift: die Tonscheibe von Phaistos aus der Bronzezeit \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "640c2422",
- "metadata": {},
- "outputs": [],
- "source": [
- "#| echo: true\n",
- "#| output: false\n",
- "printuc('\\U101D0', 46 )"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "ee56718c",
- "metadata": {},
- "source": [
- "\\begingroup\\setmonofont{Phaistos.otf}\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "0a728045",
- "metadata": {},
- "outputs": [],
- "source": [
- "#| echo: false\n",
- "#| output: true\n",
- "printuc('\\U101D0', 46 )"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "cfcb78f6",
- "metadata": {},
- "source": [
- "\\endgroup\n",
- "\n",
- ":::\n",
- "\n",
- "### Unicode transformation formats: UTF-8, UTF-16, UTF-32\n",
- "\n",
- "_Unicode transformation formats_ legen fest, wie eine Folge von Codepoints als eine Folge von Bytes dargestellt wird. \n",
- "\n",
- "Da die Codepoints unterschiedlich lang sind, kann man sie nicht einfach hintereinander schreiben. Wo hört einer auf und fängt der nächste an? \n",
- "\n",
- "- __UTF-32__: Das einfachste, aber auch speicheraufwändigste, ist, sie alle auf gleiche Länge zu bringen. Jeder Codepoint wird in 4 Bytes = 32 Bit kodiert. \n",
- "- Bei __UTF-16__ wird ein Codepoint entweder mit 2 Bytes oder mit 4 Bytes dargestellt. \n",
- "- Bei __UTF-8__ wird ein Codepoint mit 1,2,3 oder 4 Bytes dargestellt. \n",
- "- __UTF-8__ ist das Format mit der höchsten Verbreitung. Es wird auch von Julia verwendet. \n",
- "\n",
- "\n",
- "### UTF-8\n",
- "\n",
- "- Für jeden Codepoint werden 1, 2, 3 oder 4 volle Bytes verwendet. \n",
- "\n",
- "- Bei einer Codierung mit variabler Länge muss man erkennen können, welche Bytefolgen zusammengehören:\n",
- " - Ein Byte der Form 0xxxxxxx steht für einen ASCII-Codepoint der Länge 1.\n",
- " - Ein Byte der Form 110xxxxx startet einen 2-Byte-Code.\n",
- " - Ein Byte der Form 1110xxxx startet einen 3-Byte-Code.\n",
- " - Ein Byte der Form 11110xxx startet einen 4-Byte-Code.\n",
- " - Alle weiteren Bytes eines 2-,3- oder 4-Byte-Codes haben die Form 10xxxxxx. \n",
- "\n",
- "- Damit ist der Platz, der für den Codepoint zur Verfügung steht (Anzahl der x):\n",
- " - Ein-Byte-Code: 7 Bits\n",
- " - Zwei-Byte-Code: 5 + 6 = 11 Bits\n",
- " - Drei-Byte-Code: 4 + 6 + 6 = 16 Bits\n",
- " - Vier-Byte-Code: 3 + 6 + 6 + 6 = 21 Bits\n",
- "\n",
- "- Damit ist jeder ASCII-Text automatisch auch ein korrekt codierter UTF-8-Text.\n",
- "\n",
- "- Sollten die bisher für Unicode festgelegten 17 Ebenen = 21 Bit = 1.1 Mill. mögliche Zeichen mal erweitert werden, dann wird UTF-8 auf 5- und 6-Byte-Codes erweitert. \n",
- " \n",
- "\n",
- "## Zeichen und Zeichenketten in Julia\n",
- "\n",
- "### Zeichen: `Char` \n",
- "\n",
- "Der Datentyp `Char` kodiert ein einzelnes Unicode-Zeichen. \n",
- "\n",
- "- Julia verwendet dafür einfache Anführungszeichen: `'a'`. \n",
- "- Ein `Char` belegt 4 Bytes Speicher und \n",
- "- repräsentiert einen Unicode-Codepoint.\n",
- "- `Char`s können von/zu `UInt`s umgewandelt werden und \n",
- "- der Integer-Wert ist gleich dem Unicode-codepoint.\n",
- "\n",
- "\n",
- "### Zeichenketten: `String`\n",
- "\n",
- "- Für Strings verwendet Julia doppelte Anführungszeichen: `\"a\"`.\n",
- "- Sie sind UTF-8-codiert, d.h., ein Zeichen kann zwischen 1 und 4 Bytes lang sein.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "707c245e",
- "metadata": {},
- "outputs": [],
- "source": [
- "@show typeof('a') sizeof('a') typeof(\"a\") sizeof(\"a\");"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "ce463383",
- "metadata": {},
- "source": [
- "- `Char`s können von/zu `UInt`s umgewandelt werden.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "6488fdf6",
- "metadata": {},
- "outputs": [],
- "source": [
- "UInt('a')"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "2637de2b",
- "metadata": {},
- "outputs": [],
- "source": [
- "b = Char(0x2656)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "985adab7",
- "metadata": {},
- "source": [
- "__Bei einem Nicht-ASCII-String unterscheiden sich Anzahl der Bytes und Anzahl der Zeichen:__\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "53c741c8",
- "metadata": {},
- "outputs": [],
- "source": [
- "asciistr = \"Hello World!\"\n",
- "@show length(asciistr) ncodeunits(asciistr);"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "bf536c2d",
- "metadata": {},
- "source": [
- "(Das Leerzeichen zählt natürlich auch.)\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "37e36e85",
- "metadata": {},
- "outputs": [],
- "source": [
- "str = \"😄 Hellö 🎶\"\n",
- "@show length(str) ncodeunits(str);"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "b9caf74d",
- "metadata": {},
- "source": [
- "__Iteration über einen String iteriert über die Zeichen:__\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "0e8e04e3",
- "metadata": {},
- "outputs": [],
- "source": [
- "for i in str\n",
- " println(i, \" \", typeof(i))\n",
- "end"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "ce0cfd1b",
- "metadata": {},
- "source": [
- "### Verkettung von Strings\n",
- "\n",
- "\"Strings mit Verkettung bilden ein nichtkommutatives Monoid.\"\n",
- "\n",
- "Deshalb wird in Julia die Verkettung multiplikativ geschrieben.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "6f35d90f",
- "metadata": {},
- "outputs": [],
- "source": [
- " str * asciistr * str"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "898a6ea1",
- "metadata": {},
- "source": [
- "Damit sind auch Potenzen mit natürlichem Exponenten definiert.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "cb9d7217",
- "metadata": {},
- "outputs": [],
- "source": [
- "str^3, str^0"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "cc89a9ca",
- "metadata": {},
- "source": [
- "### Stringinterpolation\n",
- "\n",
- "Das Dollarzeichen hat in Strings eine Sonderfunktion, die wir schon oft in \n",
- "`print()`-Anweisungen genutzt haben. MAn kann damit eine Variable oder einen Ausdruck interpolieren:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "16b8af0a",
- "metadata": {},
- "outputs": [],
- "source": [
- "a = 33.4\n",
- "b = \"x\"\n",
- "\n",
- "s = \"Das Ergebnis für $b ist gleich $a und die verdoppelte Wurzel daraus ist $(2sqrt(a))\\n\""
- ]
- },
- {
- "cell_type": "markdown",
- "id": "1ddcc1ad",
- "metadata": {},
- "source": [
- "### Backslash escape sequences \n",
- "\n",
- "Der _backslash_ `\\` hat in Stringkonstanten ebenfalls eine Sonderfunktion. \n",
- "Julia benutzt die von C und anderen Sprachen bekannten _backslash_-Codierungen für Sonderzeichen und für Dollarzeichen und Backslash selbst:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "64a50bab",
- "metadata": {},
- "outputs": [],
- "source": [
- "s = \"So bekommt man \\'Anführungszeichen\\\" und ein \\$-Zeichen und einen\\nZeilenumbruch und ein \\\\ usw... \"\n",
- "print(s)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "f8a758f6",
- "metadata": {},
- "source": [
- "### Triple-Quotes\n",
- "\n",
- "Man kann Strings auch mit Triple-Quotes begrenzen. \n",
- "In dieser Form bleiben Zeilenumbrüche und Anführungszeichen erhalten:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "a042c5ed",
- "metadata": {},
- "outputs": [],
- "source": [
- "s = \"\"\"\n",
- " Das soll\n",
- "ein \"längerer\" \n",
- " 'Text' sein.\n",
- "\"\"\"\n",
- "\n",
- "print(s)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "7ff4c2dd",
- "metadata": {},
- "source": [
- "### Raw strings\n",
- "\n",
- "In einem `raw string` sind alle backslash-Codierungen außer `\\\"` abgeschaltet:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "929529cf",
- "metadata": {},
- "outputs": [],
- "source": [
- "s = raw\"Ein $ und ein \\ und zwei \\\\ und ein 'bla'...\"\n",
- "print(s)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "0040e4d6",
- "metadata": {},
- "source": [
- "## Weitere Funktionen für Zeichen und Strings (Auswahl)\n",
- "\n",
- "### Tests für Zeichen\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "195a2a3e",
- "metadata": {},
- "outputs": [],
- "source": [
- "@show isdigit('0') isletter('Ψ') isascii('\\U2655') islowercase('α') \n",
- "@show isnumeric('½') iscntrl('\\n') ispunct(';');"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "2e50dae6",
- "metadata": {},
- "source": [
- "### Anwendung auf Strings\n",
- "\n",
- "Diese Tests lassen sich z.B. mit `all()`, `any()` oder `count()` auf Strings anwenden:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "c778a4ad",
- "metadata": {},
- "outputs": [],
- "source": [
- "all(ispunct, \";.:\")"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "6a162d83",
- "metadata": {},
- "outputs": [],
- "source": [
- "any(isdigit, \"Es ist 3 Uhr! 🕒\" )"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "c2d57533",
- "metadata": {},
- "outputs": [],
- "source": [
- "count(islowercase, \"Hello, du!!\")"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "f6562800",
- "metadata": {},
- "source": [
- "### Weitere String-Funktionen\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "495799ef",
- "metadata": {},
- "outputs": [],
- "source": [
- "@show startswith(\"Lampenschirm\", \"Lamp\") occursin(\"pensch\", \"Lampenschirm\") \n",
- "@show endswith(\"Lampenschirm\", \"irm\"); "
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "13e4d303",
- "metadata": {},
- "outputs": [],
- "source": [
- "@show uppercase(\"Eis\") lowercase(\"Eis\") titlecase(\"eiSen\");"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "36451c74",
- "metadata": {},
- "outputs": [],
- "source": [
- "# remove newline from end of string\n",
- "\n",
- "@show chomp(\"Eis\\n\") chomp(\"Eis\");"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "a665d380",
- "metadata": {},
- "outputs": [],
- "source": [
- "split(\"π ist irrational.\")"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "64967f02",
- "metadata": {},
- "outputs": [],
- "source": [
- "replace(\"π ist irrational.\", \"ist\" => \"ist angeblich\")"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "663832cf",
- "metadata": {},
- "source": [
- "## Indizierung von Strings\n",
- "\n",
- "Strings sind nicht mutierbar aber indizierbar. Dabei gibt es ein paar Besonderheiten.\n",
- "\n",
- "- Der Index nummeriert die Bytes des Strings. \n",
- "- Bei einem nicht-ASCII-String sind nicht alle Indizes gültig, denn\n",
- "- ein gültiger Index adressiert immer ein Unicode-Zeichen.\n",
- "\n",
- "Unser Beispielstring:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "23d51f20",
- "metadata": {},
- "outputs": [],
- "source": [
- "str"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "639c88fa",
- "metadata": {},
- "source": [
- "Das erste Zeichen\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "68ba5cb6",
- "metadata": {},
- "outputs": [],
- "source": [
- "str[1]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "44617a04",
- "metadata": {},
- "source": [
- "Dieses Zeichen ist in UTF8-Kodierung 4 Bytes lang. Damit sind 2,3 und 4 ungültige Indizes. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "c4575cca",
- "metadata": {},
- "outputs": [],
- "source": [
- "str[2]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "e558202c",
- "metadata": {},
- "source": [
- "Erst das 5. Byte ist ein neues Zeichen:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "3813bbdf",
- "metadata": {},
- "outputs": [],
- "source": [
- "str[5]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "48f4cca9",
- "metadata": {},
- "source": [
- "Auch bei der Adressierung von Substrings müssen Anfang und Ende jeweils gültige Indizes sein, d.h., der Endindex muss ebenfalls das erste Byte eines Zeichens indizieren und dieses Zeichen ist das letzte des Teilstrings. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "546d4ed2",
- "metadata": {},
- "outputs": [],
- "source": [
- "str[1:7]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "1007a717",
- "metadata": {},
- "source": [
- "Die Funktion `eachindex()` liefert einen Iterator über die gültigen Indizes:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "d01e440e",
- "metadata": {},
- "outputs": [],
- "source": [
- "for i in eachindex(str)\n",
- " c = str[i]\n",
- " println(\"$i: $c\")\n",
- "end"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "2f35e6bf",
- "metadata": {},
- "source": [
- "Wie üblich macht collect() aus einem Iterator einen Vektor.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "b1644ea5",
- "metadata": {},
- "outputs": [],
- "source": [
- "collect(eachindex(str))"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "dc77d9e5",
- "metadata": {},
- "source": [
- "Die Funktion `nextind()` liefert den nächsten gültigen Index.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "5c9f35e7",
- "metadata": {},
- "outputs": [],
- "source": [
- "@show nextind(str, 1) nextind(str, 2); "
- ]
- },
- {
- "cell_type": "markdown",
- "id": "6d1e346b",
- "metadata": {},
- "source": [
- "Warum verwendet Julia einen Byte-Index und keinen Zeichenindex? Der Hauptgrund dürfte die Effizienz der Indizierung sein.\n",
- "\n",
- "- In einem langen String, z.B. einem Buchtext, ist die Stelle `s[123455]` mit einem Byte-Index schnell zu finden. \n",
- "- Ein Zeichen-Index müsste in der UTF-8-Codierung den ganzen String durchlaufen, um das n-te Zeichen zu finden, da die Zeichen 1,2,3 oder 4 Bytes lang sein können.\n",
- "\n",
- "\n",
- "Einige Funktionen liefern Indizes oder Ranges als Resultat. Sie liefern immer gültige Indizes:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "e1ec4807",
- "metadata": {},
- "outputs": [],
- "source": [
- "findfirst('l', str)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "2f8520fd",
- "metadata": {},
- "outputs": [],
- "source": [
- "findfirst(\"Hel\", str)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "0f07cff3",
- "metadata": {},
- "outputs": [],
- "source": [
- "str2 = \"αβγδϵ\"^3"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "19e5bcc4",
- "metadata": {},
- "outputs": [],
- "source": [
- "n = findfirst('γ', str2)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "f614e688",
- "metadata": {},
- "source": [
- "So kann man ab dem nächsten nach `n=5` gültigen Index weitersuchen:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "3f3b90b4",
- "metadata": {},
- "outputs": [],
- "source": [
- "findnext('γ', str2, nextind(str2, n))"
- ]
- }
- ],
- "metadata": {
- "kernelspec": {
- "display_name": "Julia 1.10.2",
- "language": "julia",
- "name": "julia-1.10"
- }
- },
- "nbformat": 4,
- "nbformat_minor": 5
- "cells": [
- {
- "cell_type": "markdown",
- "id": "32301000",
- "metadata": {},
- "source": [
- "# Arbeit mit Julia: REPL, Pakete, Introspection\n",
- "\n",
- "\n",
- "\n",
- "## Dokumentation\n",
- "\n",
- "Die offizielle Julia-Dokumentation [https://docs.julialang.org/](https://docs.julialang.org/) enthält zahlreiche Übersichten, darunter:\n",
- "\n",
- " - [https://docs.julialang.org/en/v1/base/punctuation/](https://docs.julialang.org/en/v1/base/punctuation/) Verzeichnis der Symbole\n",
- " - [https://docs.julialang.org/en/v1/manual/unicode-input/](https://docs.julialang.org/en/v1/manual/unicode-input/) Verzeichnis spezieller Unicode-Symbole und deren Eingabe in Julia via Tab-Vervollständigung\n",
- " - [https://docs.julialang.org/en/v1/manual/mathematical-operations/#Rounding-functions](https://docs.julialang.org/en/v1/manual/mathematical-operations/#Rounding-functions) Liste mathematischer Funktionen \n",
- "\n",
- "\n",
- "\n",
- "\n",
- "## Julia REPL (Read - Eval - Print - Loop)\n",
- "\n",
- "Nach dem Start von Julia in einem Terminal kann man neben Julia-Code auch verschiedene Kommandos eingeben \n",
- "\n",
- ":::{.narrow}\n",
- "| Kommando | Wirkung |\n",
- "| :----------------------------| :------------------------ |\n",
- "| `exit()` oder `Ctrl-d` | exit Julia |\n",
- "| `Ctrl-c` | interrupt |\n",
- "| `Ctrl-l` | clear screen |\n",
- "| Kommando mit `;` beenden | Ausgabe unterdrückt |\n",
- "| `include(\"filename.jl\")` | Datei mit Julia-Code einlesen und ausführen |\n",
- "\n",
- "\n",
- "\n",
- "Der REPL hat verschiedene Modi: \n",
- "\n",
- "| Modus | Prompt | Modus starten | Modus verlassen |\n",
- "| :- | :- | :- | :- |\n",
- "| default| `julia>` | | `Ctrl-d`|\n",
- "| Package manager | `pkg>` | `]` | `backspace` |\n",
- "| Help | `help?>` | `?`| `backspace `|\n",
- "|Shell | `shell>` | `;` | `backspace`|\n",
- "\n",
- ":::\n",
- "\n",
- "\n",
- "## Jupyter-Notebooks (IJulia)\n",
- "\n",
- "\n",
- "In einem Jupyter-Notebook sind die Modi sind als Einzeiler in einer eigenen Input-Zelle nutzbar: \n",
- "\n",
- "(i) ein Kommando des Paket-Managers:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "efacde4f",
- "metadata": {},
- "outputs": [],
- "source": [
- "#| eval: false\n",
- "] status "
- ]
- },
- {
- "cell_type": "markdown",
- "id": "85fec425",
- "metadata": {},
- "source": [
- "(ii) eine Help-Abfrage:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "80535b76",
- "metadata": {},
- "outputs": [],
- "source": [
- "#| eval: false\n",
- "?sin"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "581aae68",
- "metadata": {},
- "source": [
- "(iii) Ein Shell-Kommando:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "c2438155",
- "metadata": {},
- "outputs": [],
- "source": [
- "#| eval: false\n",
- ";ls "
- ]
- },
- {
- "cell_type": "markdown",
- "id": "bd2c64b7",
- "metadata": {},
- "source": [
- "## Der Paketmanager\n",
- "\n",
- "Wichtiger Teil des _Julia Ecosystems_ sind die zahlreichen Pakete, die Julia erweitern.\n",
- "\n",
- "- Einige Pakete sind Teil jeder Julia-Installation und müssen nur mit einer `using Paketname`-Anweisung aktiviert werden. \n",
- " - Sie bilden die sogenannte _Standard Library_ und dazu gehören \n",
- " - `LinearAlgebra`, `Statistics`, `SparseArrays`, `Printf`, `Pkg` und andere.\n",
- "- Über 9000 Pakete sind offiziell registriert, siehe [https://julialang.org/packages/](https://julialang.org/packages/). \n",
- " - Diese können mit wenigen Tastendrücken heruntergeladen und installiert werden.\n",
- " - Dazu dient der _package manager_ `Pkg`.\n",
- " - Man kann ihn auf zwei Arten verwenden: \n",
- " - als normale Julia-Anweisungen, die auch in einer `.jl`-Programmdatei stehen können:\n",
- " ```\n",
- " using Pkg\n",
- " Pkg.add(\"PaketXY\")\n",
- " ```\n",
- " - im speziellen pkg-Modus des Julia-REPLs:\n",
- " ```\n",
- " ] add PaketXY\n",
- " ```\n",
- " - Anschließend kann das Paket mit `using PaketXY` verwendet werden.\n",
- "- Man kann auch Pakete aus anderen Quellen und selbstgeschriebene Pakete installieren.\n",
- "\n",
- " \n",
- "### Einige Funktionen des Paketmanagers\n",
- "\n",
- "| Funktion | `pkg` - Mode | Erklärung |\n",
- "|:------------------------|:--------------------------| :-------------------------------------------------------|\n",
- "| `Pkg.add(\"MyPack\")` | `pkg> add MyPack` | add `MyPack.jl` to current environment |\n",
- "| `Pkg.rm(\"MyPack\")` | `pkg> remove MyPack` | remove `MyPack.jl` from current environment |\n",
- "| `Pkg.update()` | `pkg> update` | update packages in current environment |\n",
- "| `Pkg.activate(\"mydir\")` | `pkg> activate mydir` | activate directory as current environment |\n",
- "| `Pkg.status()` | `pkg> status` | list packages |\n",
- "| `Pkg.instantiate()` | `pg> instantiate` | install all packages according to `Project.toml` |\n",
- "\n",
- "\n",
- "### Installierte Pakete und Environments \n",
- "\n",
- "- Julia und der Paketmanager verwalten \n",
- " 1. eine Liste der mit dem Kommando `Pkg.add()` bzw. `]add` explizit installierten Pakete mit genauer Versionsbezeichnung in einer Datei `Project.toml` und \n",
- " 2. eine Liste aller dabei auch als implizite Abhängigkeiten installierten Pakete in der Datei `Manifest.toml`. \n",
- "- Das Verzeichnis, in dem diese Dateien stehen, ist das `environment` und wird mit `Pkg.status()` bzw. `]status` angezeigt. \n",
- "- Im Normalfall sieht das so aus: \n",
- "\n",
- "```\n",
- "(@v1.8) pkg> status\n",
- " Status `~/.julia/environments/v1.8/Project.toml`\n",
- " [1dea7af3] OrdinaryDiffEq v6.7.1\n",
- " [91a5bcdd] Plots v1.27.1\n",
- " [438e738f] PyCall v1.93.1\n",
- "```\n",
- "\n",
- "- Man kann für verschiedene Projekte eigene `environments` benutzen. Dazu kann man entweder Julia mit \n",
- "```shell\n",
- "julia --project=path/to/myproject\n",
- "```\n",
- "starten oder in Julia das environment mit `Pkg.activate(\"path/to/myproject\")` aktivieren. Dann werden `Project.toml, Manifest.toml` dort angelegt und verwaltet. (Die Installation der Paketdateien erfolgt weiterhin irgendwo unter `$HOME/.julia`) \n",
- "\n",
- "\n",
- "### Zum Installieren von Paketen auf unserem Jupyter-Server `misun103`:\n",
- "\n",
- "- Es gibt ein zentrales Repository, in dem alle in diesem Kurs erwähnten Pakete bereits installiert sind. \n",
- "- Dort haben Sie keine Schreibrechte.\n",
- "- Sie können aber zusätzliche Pakete in Ihrem `HOME` installieren. Dazu ist als erster Befehl nötig, das aktuelle Verzeichnis zu aktivieren: \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "87138f78",
- "metadata": {},
- "outputs": [],
- "source": [
- "#| eval: false\n",
- "] activate ."
- ]
- },
- {
- "cell_type": "markdown",
- "id": "da9c6bb6",
- "metadata": {},
- "source": [
- "(Man beachte den Punkt!)\n",
- "\n",
- "\n",
- "Danach können Sie mit `add` im Pkg-Modus auch Pakete installieren:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "7a9e6ab0",
- "metadata": {},
- "outputs": [],
- "source": [
- "#| eval: false\n",
- "] add PaketXY"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "d5fc8aef",
- "metadata": {},
- "source": [
- "Achtung! Das kann dauern! Viele Pakete haben komplexe Abhängigkeiten und lösen die Installation von weiteren Paketen aus. Viele Pakete werden beim Installieren vorkompiliert. Im REPL sieht man den Installationsfortschritt, im Jupyter-Notebook leider nicht.\n",
- "\n",
- "\n",
- "\n",
- "\n",
- "\n",
- "## Der Julia JIT _(just in time)_ Compiler: Introspection\n",
- "\n",
- "Julia baut auf die Werkzeuge des _LLVM Compiler Infrastructure Projects_ auf.\n",
- "\n",
- ":::{.narrow}\n",
- "Stages of Compilation \n",
- "\n",
- "| stage & result | introspection command |\n",
- "| :--- | :--- |\n",
- "|Parse $\\Longrightarrow$ Abstract Syntax Tree (AST) | `Meta.parse()` |\n",
- "| Lowering: transform AST $\\Longrightarrow$ Static Single Assignment (SSA) form | `@code_lowered`|\n",
- "| Type Inference | `@code_warntype`, `@code_typed` |\n",
- "| Generate LLVM intermediate representation | `@code_llvm`|\n",
- "| Generate native machine code | `@code_native` |\n",
- "\n",
- ":::\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "bc5fdcec",
- "metadata": {},
- "outputs": [],
- "source": [
- "function f(x,y)\n",
- " z = x^2 + log(y)\n",
- " return 2z\n",
- "end"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "bb56b5a6",
- "metadata": {},
- "outputs": [],
- "source": [
- "p = Meta.parse( \"function f(x,y); z=x^2+log(y); return 2x; end \")"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "9a8825dd",
- "metadata": {},
- "outputs": [],
- "source": [
- "using TreeView\n",
- "\n",
- "walk_tree(p)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "aa2d2ada",
- "metadata": {},
- "outputs": [],
- "source": [
- "@code_lowered f(2,4)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "e6303b02",
- "metadata": {},
- "outputs": [],
- "source": [
- "@code_warntype f(2,4)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "05f5a0cd",
- "metadata": {},
- "outputs": [],
- "source": [
- "@code_typed f(2,4)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "523e86a5",
- "metadata": {},
- "outputs": [],
- "source": [
- "@code_llvm f(2,4)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "953d5e83",
- "metadata": {},
- "outputs": [],
- "source": [
- "@code_native f(2,4)"
- ]
- }
- ],
- "metadata": {
- "kernelspec": {
- "display_name": "Julia 1.10.2",
- "language": "julia",
- "name": "julia-1.10"
- }
- },
- "nbformat": 4,
- "nbformat_minor": 5
- "cells": [
- {
- "cell_type": "markdown",
- "id": "81cc02aa",
- "metadata": {},
- "source": [
- "# Container\n",
- "\n",
- "\n",
- "Julia bietet eine große Auswahl von Containertypen mit weitgehend ähnlichem Interface an. \n",
- "Wir stellen hier `Tuple`, `Range` und `Dict` vor, im nächsten Kapitel dann `Array`, `Vector` und `Matrix`. \n",
- "\n",
- "Diese Container sind: \n",
- "\n",
- "- **iterierbar:** Man kann über die Elemente des Containers iterieren: \n",
- "```julia \n",
- "for x ∈ container ... end\n",
- "```\n",
- "- **indizierbar:** Man kann auf Elemente über ihren Index zugreifen: \n",
- "```julia\n",
- "x = container[i]\n",
- "``` \n",
- "und einige sind auch \n",
- "\n",
- "- **mutierbar**: Man kann Elemente hinzufügen, entfernen und ändern.\n",
- "\n",
- "Weiterhin gibt es eine Reihe gemeinsamer Funktionen, z.B.\n",
- "\n",
- "- `length(container)` --- Anzahl der Elemente\n",
- "- `eltype(container)` --- Typ der Elemente\n",
- "- `isempty(container)` --- Test, ob Container leer ist\n",
- "- `empty!(container)` --- leert Container (nur wenn mutierbar)\n",
- "\n",
- "\n",
- "## Tupeln\n",
- "\n",
- "Ein Tupel ist ein nicht mutierbarer Container von Elementen. Es ist also nicht möglich, neue Elemente dazuzufügen oder den Wert eines Elements zu ändern. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "ec893f0b",
- "metadata": {},
- "outputs": [],
- "source": [
- "t = (33, 4.5, \"Hello\")\n",
- "\n",
- "@show t[2] # indizierbar\n",
- "\n",
- "for i ∈ t println(i) end # iterierbar"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "21549769",
- "metadata": {},
- "source": [
- "Ein Tupel ist ein **inhomogener** Typ. Jedes Element hat seinen eigenen Typ und das zeigt sich auch im Typ des Tupels:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "5add8abb",
- "metadata": {},
- "outputs": [],
- "source": [
- "typeof(t)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "e8bc972e",
- "metadata": {},
- "source": [
- "Man verwendet Tupel gerne als Rückgabewerte von Funktionen, um mehr als ein Objekt zurückzulieferen.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "85b3f1fd",
- "metadata": {},
- "outputs": [],
- "source": [
- "# Ganzzahldivision und Rest: \n",
- "# Quotient und Rest werden den Variablen q und r zugewiesen\n",
- "\n",
- "q, r = divrem(71, 6)\n",
- "@show q r;"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "d144679d",
- "metadata": {},
- "source": [
- "Wie man hier sieht, kann man in bestimmten Konstrukten die Klammern auch weglassen.\n",
- "Dieses *implict tuple packing/unpacking* verwendet man auch gerne in Mehrfachzuweisungen:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "2ef18811",
- "metadata": {},
- "outputs": [],
- "source": [
- "x, y, z = 12, 17, 203"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "759e8783",
- "metadata": {},
- "outputs": [],
- "source": [
- "y"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "2bed8606",
- "metadata": {},
- "source": [
- "Manche Funktionen bestehen auf Tupeln als Argument oder geben immer Tupeln zurück. Dann braucht man manchmal ein Tupel aus einem Element. \n",
- "\n",
- "Das notiert man so:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "e985c23d",
- "metadata": {},
- "outputs": [],
- "source": [
- "x = (13,) # ein 1-Element-Tupel"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "174aed3a",
- "metadata": {},
- "source": [
- "Das Komma - und nicht die Klammern -- macht das Tupel. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "8359e689",
- "metadata": {},
- "outputs": [],
- "source": [
- "x= (13) # kein Tupel"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "a5fb2b62",
- "metadata": {},
- "source": [
- "## Ranges\n",
- "\n",
- "Wir haben *range*-Objekte schon in numerischen `for`-Schleifen verwendet.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "ba823baf",
- "metadata": {},
- "outputs": [],
- "source": [
- "r = 1:1000\n",
- "typeof(r)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "6dd2ebf4",
- "metadata": {},
- "source": [
- "Es gibt verschiedene *range*-Typen. Wie man sieht, sind es über den Zahlentyp parametrisierte Typen und `UnitRange` ist z.B. ein *range* mit der Schrittweite 1. Ihre Konstruktoren heißen in der Regel `range()`. \n",
- "\n",
- "Der Doppelpunkt ist eine spezielle Syntax. \n",
- "\n",
- "- `a:b` wird vom Parser umgesetzt zu `range(a, b)` \n",
- "- `a:b:c` wird umgesetzt zu `range(a, c, step=b)`\n",
- "\n",
- "\n",
- "*Ranges* sind offensichtlich iterierbar, nicht mutierbar aber indizierbar.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "5ee0a9ef",
- "metadata": {},
- "outputs": [],
- "source": [
- "(3:100)[20] # das zwanzigste Element"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "f4524b63",
- "metadata": {},
- "source": [
- "Wir erinnern an die Semantik der `for`-Schleife: `for i in 1:1000` heißt **nicht**:\n",
- "\n",
- "- 'Die Schleifenvariable `i` wird bei jedem Durchlauf um eins erhöht' **sondern** \n",
- "- 'Der Schleifenvariable werden nacheinander die Werte 1,2,3,...,1000 aus dem Container zugewiesen'. \n",
- "\n",
- "Allerdings wäre es sehr ineffektiv, diesen Container tatsächlich explizit anzulegen. \n",
- "\n",
- "- _Ranges_ sind \"lazy\" Vektoren, die nie wirklich irgendwo als konkrete Liste abgespeichert werden. Das macht sie als Iteratoren in `for`-Schleifen so nützlich: speichersparend und schnell.\n",
- "- Sie sind 'Rezepte' oder Generatoren, die auf die Abfrage 'Gib mir dein nächstes Element!' antworten.\n",
- "- Tatsächlich ist der Muttertyp `AbstractRange` ein Subtyp von `AbstractVector`.\n",
- "\n",
- "Das Macro `@allocated` gibt aus, wieviel Bytes an Speicher bei der Auswertung eines Ausdrucks alloziert wurden.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "7049d454",
- "metadata": {},
- "outputs": [],
- "source": [
- "@allocated [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "dbc66a57",
- "metadata": {},
- "outputs": [],
- "source": [
- "@allocated 1:20"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "3d98f5f4",
- "metadata": {},
- "source": [
- "Zum Umwandeln in einen 'richtigen' Vektor dient die Funktion `collect()`.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "fe033c47",
- "metadata": {},
- "outputs": [],
- "source": [
- "collect(20:-3:1)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "a94e5258",
- "metadata": {},
- "source": [
- "Recht nützlich, z.B. beim Vorbereiten von Daten zum Plotten, ist der *range*-Typ `LinRange`.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "e4b40085",
- "metadata": {},
- "outputs": [],
- "source": [
- "LinRange(2, 50, 300)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "bde8b38f",
- "metadata": {},
- "source": [
- "`LinRange(start, stop, n)` erzeugt eine äquidistante Liste von `n` Werten von denen der erste und der letzte die vorgegebenen Grenzen sind. \n",
- "Mit `collect()` kann man bei Bedarf auch daraus den entsprechenden Vektor gewinnen.\n",
- "\n",
- "\n",
- "## Dictionaries \n",
- "\n",
- "- _Dictionaries_ (deutsch: \"assoziative Liste\" oder \"Zuordnungstabelle\" oder ...) sind spezielle Container. \n",
- "- Einträge in einem Vektor `v` sind durch einen Index 1,2,3.... addressierbar: `v[i]`\n",
- "- Einträge in einem _dictionary_ sind durch allgemeinere _keys_ addressierbar. \n",
- "- Ein _dictionary_ ist eine Ansammlung von _key-value_-Paaren.\n",
- "- Damit haben _dictionaries_ in Julia den parametrisierten Typ `Dict{S,T}`, wobei `S` der Typ der _keys_ und `T` der Typ der _values_ ist\n",
- "\n",
- "\n",
- "Man kann sie explizit anlegen:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "25c7aefc",
- "metadata": {},
- "outputs": [],
- "source": [
- "# Einwohner 2020 in Millionen, Quelle: wikipedia\n",
- "\n",
- "EW = Dict(\"Berlin\" => 3.66, \"Hamburg\" => 1.85, \n",
- " \"München\" => 1.49, \"Köln\" => 1.08)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "9620f365",
- "metadata": {},
- "outputs": [],
- "source": [
- "typeof(EW)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "d3b4d2af",
- "metadata": {},
- "source": [
- "und mit den _keys_ indizieren:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "62938a1b",
- "metadata": {},
- "outputs": [],
- "source": [
- "EW[\"Berlin\"]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "73ddf61d",
- "metadata": {},
- "source": [
- "Das Abfragen eines nicht existierenden _keys_ ist natürlich ein Fehler.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "6e16eb41",
- "metadata": {},
- "outputs": [],
- "source": [
- "EW[\"Leipzig\"]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "49a6d001",
- "metadata": {},
- "source": [
- "Man kann ja auch vorher mal anfragen...\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "e43aec5d",
- "metadata": {},
- "outputs": [],
- "source": [
- "haskey(EW, \"Leipzig\")"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "a1cefaa1",
- "metadata": {},
- "source": [
- "... oder die Funktion `get(dict, key, default)` benutzen, die bei nicht existierendem Key keinen Fehler wirft sondern das 3. Argument zurückgibt. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "e31c792c",
- "metadata": {},
- "outputs": [],
- "source": [
- "@show get(EW, \"Leipzig\", -1) get(EW, \"Berlin\", -1);"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "f625eaaa",
- "metadata": {},
- "source": [
- "Man kann sich auch alle `keys` und `values` als spezielle Container geben lassen.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "21460e3a",
- "metadata": {},
- "outputs": [],
- "source": [
- "keys(EW)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "a87d9788",
- "metadata": {},
- "outputs": [],
- "source": [
- "values(EW)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "97b96369",
- "metadata": {},
- "source": [
- "Man kann über die `keys` iterieren...\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "41e9189f",
- "metadata": {},
- "outputs": [],
- "source": [
- "for i in keys(EW)\n",
- " n = EW[i]\n",
- " println(\"Die Stadt $i hat $n Millionen Einwohner.\")\n",
- "end"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "b2fe653a",
- "metadata": {},
- "source": [
- "odere gleich über `key-value`-Paare.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "0b445207",
- "metadata": {},
- "outputs": [],
- "source": [
- "for (stadt, ew) ∈ EW\n",
- " println(\"$stadt : $ew Mill.\")\n",
- "end"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "6fcd4019",
- "metadata": {},
- "source": [
- "### Erweitern und Modifizieren\n",
- "\n",
- "Man kann in ein `Dict` zusätzliche `key-value`-Paare eintragen...\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "94c4f076",
- "metadata": {},
- "outputs": [],
- "source": [
- "EW[\"Leipzig\"] = 0.52\n",
- "EW[\"Dresden\"] = 0.52 \n",
- "EW"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "ed90d684",
- "metadata": {},
- "source": [
- "und einen `value` ändern.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "c57e8dd2",
- "metadata": {},
- "outputs": [],
- "source": [
- "# Oh, das war bei Leipzig die Zahl von 2010, nicht 2020\n",
- "\n",
- "EW[\"Leipzig\"] = 0.597\n",
- "EW"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "3d0eadd7",
- "metadata": {},
- "source": [
- "Ein Paar kann über seinen `key` auch gelöscht werden.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "0dfd9f2d",
- "metadata": {},
- "outputs": [],
- "source": [
- "delete!(EW, \"Dresden\")"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "3db2aa1f",
- "metadata": {},
- "source": [
- "Zahlreiche Funktionen können mit `Dicts` wie mit anderen Containern arbeiten.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "1204aaab",
- "metadata": {},
- "outputs": [],
- "source": [
- "maximum(values(EW))"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "6a4946b4",
- "metadata": {},
- "source": [
- "### Anlegen eines leeren Dictionaries\n",
- "\n",
- "Ohne Typspezifikation ...\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "1f82ac79",
- "metadata": {},
- "outputs": [],
- "source": [
- "d1 = Dict()"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "27c98eaf",
- "metadata": {},
- "source": [
- "und mit Typspezifikation:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "1b8f201e",
- "metadata": {},
- "outputs": [],
- "source": [
- "d2 = Dict{String, Int}()"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "7fe71a3b",
- "metadata": {},
- "source": [
- "### Umwandlung in Vektoren: `collect()`\n",
- "\n",
- "- `keys(dict)` und `values(dict)` sind spezielle Datentypen. \n",
- "- Die Funktion `collect()` macht daraus eine Liste vom Typ `Vector`. \n",
- "- `collect(dict)` liefert eine Liste vom Typ `Vector{Pair{S,T}}` \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "2dc85bdd",
- "metadata": {},
- "outputs": [],
- "source": [
- "collect(EW)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "100dbbf1",
- "metadata": {},
- "outputs": [],
- "source": [
- "collect(keys(EW)), collect(values(EW))"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "f9703f73",
- "metadata": {},
- "source": [
- "### Geordnetes Iterieren über ein Dictionary\n",
- "\n",
- "Wir sortieren die Keys. Als Strings werden sie alphabetisch sortiert. Mit dem `rev`-Parameter wird rückwärts sortiert.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "3c02f0ca",
- "metadata": {},
- "outputs": [],
- "source": [
- "for k in sort(collect(keys(EW)), rev = true)\n",
- " n = EW[k]\n",
- " println(\"$k hat $n Millionen Einw. \")\n",
- "end"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "c20f0654",
- "metadata": {},
- "source": [
- "Wir sortieren `collect(dict)`. Das ist ein Vektor von Paaren. Mit `by` definieren wir, wonach zu sortieren ist: nach dem 2. Element des Paares. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "89ee04e9",
- "metadata": {},
- "outputs": [],
- "source": [
- "for (k,v) in sort(collect(EW), by = pair -> last(pair), rev=false)\n",
- " println(\"$k hat $v Mill. EW\")\n",
- "end"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "94ba9752",
- "metadata": {},
- "source": [
- "### Eine Anwendung von Dictionaries: Zählen von Häufigkeiten\n",
- "\n",
- "Wir machen 'experimentelle Stochastik' mit 2 Würfeln: \n",
- "\n",
- "Gegeben sei `l`, eine Liste mit den Ergebnissen von 100 000 Pasch-Würfen, also 100 000 Zahlen zwischen 2 und 12.\n",
- "\n",
- "Wie häufig sind die Zahlen 2 bis 12?\n",
- "\n",
- "\n",
- "Wir (lassen) würfeln:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "a7ff829d",
- "metadata": {},
- "outputs": [],
- "source": [
- "l = rand(1:6, 100_000) .+ rand(1:6, 100_000)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "48a58503",
- "metadata": {},
- "source": [
- "Wir zählen mit Hilfe eines Dictionaries die Häufigkeiten der Ereignisse. Dazu nehmen wir das Ereignis als `key` und seine Häufigkeit als `value`.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "dd2bcd79",
- "metadata": {},
- "outputs": [],
- "source": [
- "# In diesem Fall könnte man das auch mit einem einfachen Vektor\n",
- "# lösen. Eine bessere Illustration wäre z.B. Worthäufigkeit in\n",
- "# einem Text. Dann ist i keine ganze Zahl sondern ein Wort=String\n",
- "\n",
- "d = Dict{Int,Int}() # das Dict zum 'reinzählen'\n",
- "\n",
- "for i in l # für jedes i wird d[i] erhöht. \n",
- " d[i] = get(d, i, 0) + 1 \n",
- "end\n",
- "d"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "62fe53b9",
- "metadata": {},
- "source": [
- "Das Ergebnis:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "154252d3",
- "metadata": {},
- "outputs": [],
- "source": [
- "using Plots\n",
- "\n",
- "plot(collect(keys(d)), collect(values(d)), seriestype=:scatter)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "dd482553",
- "metadata": {},
- "source": [
- "##### Das Erklär-Bild dazu:\n",
- "\n",
- "[https://math.stackexchange.com/questions/1204396/why-is-the-sum-of-the-rolls-of-two-dices-a-binomial-distribution-what-is-define](https://math.stackexchange.com/questions/1204396/why-is-the-sum-of-the-rolls-of-two-dices-a-binomial-distribution-what-is-define)\n"
- ]
- }
- ],
- "metadata": {
- "kernelspec": {
- "display_name": "Julia 1.10.2",
- "language": "julia",
- "name": "julia-1.10"
- }
- },
- "nbformat": 4,
- "nbformat_minor": 5
- "cells": [
- {
- "cell_type": "markdown",
- "id": "e43a03dc",
- "metadata": {},
- "source": [
- "# Vektoren, Matrizen, Arrays\n",
- "\n",
- "## Allgemeines \n",
- "\n",
- "Kommen wir nun zu den wohl wichtigsten Containern für numerische Mathematik: \n",
- "\n",
- "- Vektoren `Vector{T}` \n",
- "- Matrizen `Matrix{T}` mit zwei Indizes \n",
- "- N-dimensionale Arrays mit N Indizes `Array{T,N}`\n",
- "\n",
- "Tatsächlich ist `Vector{T}` ein Alias für `Array{T,1}` und `Matrix{T}` ein Alias für `Array{T,2}`.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "4b125a0a",
- "metadata": {},
- "outputs": [],
- "source": [
- "Vector{Float64} === Array{Float64,1} && Matrix{Float64} === Array{Float64,2}"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "78eba0dc",
- "metadata": {},
- "source": [
- "Beim Anlegen durch eine explizite Elementliste wird der 'kleinste gemeinsame Typ' für den Typparameter `T` ermittelt.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "6205881e",
- "metadata": {},
- "outputs": [],
- "source": [
- "v = [33, \"33\", 1.2]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "f720c669",
- "metadata": {},
- "source": [
- "Falls `T` ein numerischer Typ ist, werden die Elemente in diesen Typ umgewandelt.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "b0e9d4a3",
- "metadata": {},
- "outputs": [],
- "source": [
- "v = [3//7, 4, 2im]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "d0cbc3d0",
- "metadata": {},
- "source": [
- "Informationen über einen Array liefern die Funktionen:\n",
- "\n",
- "- `length(A)` --- Anzahl der Elemente\n",
- "- `eltype(A)` --- Typ der Elemente\n",
- "- `ndims(A)` --- Anzahl der Dimensionen (Indizes)\n",
- "- `size(A)` --- Tupel mit den Dimensionen des Arrays \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "333529d4",
- "metadata": {},
- "outputs": [],
- "source": [
- "v1 = [12, 13, 15]\n",
- "\n",
- "m1 = [ 1 2.5\n",
- " 6 -3 ]\n",
- "\n",
- "for f ∈ (length, eltype, ndims, size)\n",
- " println(\"$(f)(v) = $(f(v)), $(f)(m1) = $(f(m1))\")\n",
- "end"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "b21923e2",
- "metadata": {},
- "source": [
- "- Die Stärke des 'klassischen' Arrays für das wissenschaftliche Rechnen besteht darin, dass es einfach nur ein zusammenhängendes Speichersegment ist, in dem die Komponenten gleicher Länge (z.B. 64 Bit) geordnet hintereinander abgespeichert sind. Damit ist der Speicherbedarf minimal und die Zugriffsgeschwindigkeit auf eine Komponente, sowohl beim Lesen als auch beim Modifizieren, maximal. Der Platz der Komponente `v[i]` ist sofort aus `i` berechenbar. \n",
- "- Julias `Array{T,N}` (und damit Vektoren und Matrizen) ist für die üblichen numerischen Typen `T` in dieser Weise implementiert. Die Elemente werden *unboxed* gespeichert. Im Gegensatz dazu ist z.B. ein `Vector{Any}` implementiert als Liste von Adressen von Objekten *(boxed)* und nicht als Liste der Objekte selbst. \n",
- "- Julias `Array{T,N}` speichert seine Elemente direkt *(unboxed)*, wenn `isbitstype(T) == true`.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "50682513",
- "metadata": {},
- "outputs": [],
- "source": [
- "isbitstype(Float64), \n",
- "isbitstype(Complex{Rational{Int64}}), \n",
- "isbitstype(String)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "fc6ba262",
- "metadata": {},
- "source": [
- "## Vektoren\n",
- "\n",
- "### Listen-artige Funktionen \n",
- "\n",
- "- `push!(vector, items...)` --- fügt Elemente am Ende des Vektors an\n",
- "- `pushfirst!(vector, items...)` --- fügt Elemente am Anfang des Vektors an\n",
- "- `pop!(vector)` --- entfernt letztes Element und liefert es als Ergebnis zurück,\n",
- "- `popfirst!(vector)` --- entfernt erstes Element und liefert es zurück \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "6a668c97",
- "metadata": {},
- "outputs": [],
- "source": [
- "v = Float64[] # leerer Vector{Float64}\n",
- "\n",
- "push!(v, 3, 7)\n",
- "pushfirst!(v, 1)\n",
- "\n",
- "a = pop!(v)\n",
- "println(\"a= $a\")\n",
- "\n",
- "push!(v, 17)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "15639f3a",
- "metadata": {},
- "source": [
- "Ein `push!()` kann sehr aufwändig sein, da eventuell neuer Speicher alloziert und dann der ganze bestehende Vektor umkopiert werden muss. Julia optimiert das Speichermanagement. Es wird in einem solchen Fall Speicher auf Vorrat alloziert, so dass weitere `push!`s sehr schnell sind und man 'fast O(1)-Geschwindigkeit' erreicht. \n",
- "\n",
- "Trotzdem sollte man bei zeitkritischem Code und sehr großen Feldern Operationen wie `push!()` oder `resize()` vermeiden.\n",
- "\n",
- "### Weitere Konstruktoren\n",
- "\n",
- "Man kann Vektoren mit vorgegebener Länge und Typ uninitialisiert anlegen. Das geht am Schnellsten, die Elemente sind zufällige Bitmuster.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "50f6c3b9",
- "metadata": {},
- "outputs": [],
- "source": [
- "# fixe Länge 1000, uninitialisiert\n",
- "\n",
- "v = Vector{Float64}(undef, 1000)\n",
- "v[345]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "5076f499",
- "metadata": {},
- "source": [
- "- `zeros(n)` legt einen `Vector{Float64}` der Länge `n` an und initialisiert mit Null. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "8207df1d",
- "metadata": {},
- "outputs": [],
- "source": [
- "v = zeros(7) "
- ]
- },
- {
- "cell_type": "markdown",
- "id": "7696ccaa",
- "metadata": {},
- "source": [
- "- `zeros(T,n)` legt einen Nullvektor vom Typ `T` an.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "6e578ab8",
- "metadata": {},
- "outputs": [],
- "source": [
- "v=zeros(Int, 4)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "6c9dc7a8",
- "metadata": {},
- "source": [
- "- `fill(x, n)` legt `Vector{typeof(x)}` der Länge `n` an und füllt mit `x`.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "d9cba335",
- "metadata": {},
- "outputs": [],
- "source": [
- "v = fill(sqrt(2), 5)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "2868cf5c",
- "metadata": {},
- "source": [
- "- `similar(v)` legt einen uninitialisierten Vektor von gleichem Typ und Größe wie `v` an.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "62eca8f9",
- "metadata": {},
- "outputs": [],
- "source": [
- "w = similar(v)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "7cbf3df1",
- "metadata": {},
- "source": [
- "### Konstruktion durch implizite Schleife _(list comprehension)_\n",
- "\n",
- "Implizite `for`-Schleifen sind eine weitere Methode, Vektoren zu erzeugen.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "e07eaf25",
- "metadata": {},
- "outputs": [],
- "source": [
- "v4 = [i for i in 1.0:8]"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "2fce397a",
- "metadata": {},
- "outputs": [],
- "source": [
- "v5 = [log(i^2) for i in 1:4 ]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "d3432e22",
- "metadata": {},
- "source": [
- "Man kann sogar noch ein `if` unterbringen.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "c61e9e2c",
- "metadata": {},
- "outputs": [],
- "source": [
- "v6 = [i^2 for i in 1:8 if i%3 != 2]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "7606acd1",
- "metadata": {},
- "source": [
- "### Bitvektoren {#sec-bitvec}\n",
- "\n",
- "Neben `Vector{Bool}` gibt es noch den speziellen Datentyp `BitVector` (und allgemeiner auch `BitArray`) zur Speicherung von Feldern mit Wahrheitswerten. \n",
- "\n",
- "Während für die Speicherung eines `Bool`s ein Byte verwendet wird, erfolgt die Speicherung in einem BitVector bitweise. \n",
- "\n",
- "Der Konstruktor wandelt einen \n",
- "`Vector{Bool}` in einen `BitVector` um.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "0d5b1e39",
- "metadata": {},
- "outputs": [],
- "source": [
- "vb = BitVector([true, false, true, true])"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "426cefd2",
- "metadata": {},
- "source": [
- "Für die Gegenrichtung gibt es `collect()`.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "65291775",
- "metadata": {},
- "outputs": [],
- "source": [
- "collect(vb)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "3f56c7c8",
- "metadata": {},
- "source": [
- "BitVectoren entstehen z.B. als Ergebnis von elementweisen Vergleichen (s. @sec-broadcast).\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "2584c04e",
- "metadata": {},
- "outputs": [],
- "source": [
- "v4 .> 3.5"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "6a0f2b5e",
- "metadata": {},
- "source": [
- "### Indizierung\n",
- "\n",
- "Indizes sind Ordinalzahlen. Also __startet die Indexzählung mit 1.__\n",
- "\n",
- "Als Index kann man verwenden:\n",
- "\n",
- " - Integer\n",
- " - Integer-wertigen Range (gleiche Länge oder kürzer)\n",
- " - Integer-Vektor (gleiche Länge oder kürzer)\n",
- " - Bool-Vektor oder BitVector (gleiche Länge)\n",
- " \n",
- " \n",
- "Mit Indizes kann man Arrayelemente/teile lesen und schreiben.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "9180ff62",
- "metadata": {},
- "outputs": [],
- "source": [
- "v = [ 3i + 5.2 for i in 1:8]"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "cb5a9547",
- "metadata": {},
- "outputs": [],
- "source": [
- "v[5]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "e58751f6",
- "metadata": {},
- "source": [
- "Bei Zuweisungen wird die rechte Seite wenn nötig mit `convert(T,x)` in den Vektorelementetyp umgewandelt.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "d029af20",
- "metadata": {},
- "outputs": [],
- "source": [
- "v[6] = 9999\n",
- "v"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "2561448e",
- "metadata": {},
- "source": [
- "Überschreiten der Indexgrenzen führt zu einem `BoundsError`. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "06224d52",
- "metadata": {},
- "outputs": [],
- "source": [
- "v[77]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "deb2c6b3",
- "metadata": {},
- "source": [
- "Mit einem `range`-Objekt kann man einen Teilvektor adressieren.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "322752f1",
- "metadata": {},
- "outputs": [],
- "source": [
- "vp = v[3:5]\n",
- "vp"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "a24080ff",
- "metadata": {},
- "outputs": [],
- "source": [
- "vp = v[1:2:7] # range mit Schrittweite\n",
- "vp"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "9a7afae9",
- "metadata": {},
- "source": [
- "- Bei der Verwendung als Index kann in einem Range der Spezialwert `end` verwendet werden.\n",
- "- Bei der Verwendung als Index kann der \"leere\" Range `:` als Abkürzung von `1:end` verwendet werden. Das ist nützlich bei Matrizen: `A[:, 3]` adressiert die gesamte 3. Spalte von `A`. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "e7bfe889",
- "metadata": {},
- "outputs": [],
- "source": [
- "v[6:end] = [7, 7, 7]\n",
- "v"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "178a0bd2",
- "metadata": {},
- "source": [
- "#### Indirekte Indizierung\n",
- "\n",
- "Die indirekte Indizierung mit einem *Vector of Integers/Indices* erfolgt nach der Formel \n",
- "\n",
- "\n",
- "$v[ [i_1,\\ i_2,\\ i_3,...]] = [\\ v[i_1],\\ v[i_2],\\ v[i_3],...]$\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "f72a76df",
- "metadata": {},
- "outputs": [],
- "source": [
- "v[ [1, 3, 4] ]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "f2d76c2c",
- "metadata": {},
- "source": [
- "ist also gleich\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "5c9556da",
- "metadata": {},
- "outputs": [],
- "source": [
- "[ v[1], v[3], v[4] ]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "3d7b83ee",
- "metadata": {},
- "source": [
- "#### Indizierung mit einem Vektor von Wahrheitswerten\n",
- "\n",
- "Als Index kann man auch einen `Vector{Bool}` oder `BitVector` (s. @sec-bitvec) **derselben Länge** verwenden. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "0995d191",
- "metadata": {},
- "outputs": [],
- "source": [
- "v[ [true, true, false, false, true, false, true, true] ]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "f7ef567d",
- "metadata": {},
- "source": [
- "Das ist nützlich, da man z.B.\n",
- "\n",
- " - Tests broadcasten kann (s. @sec-broadcast),\n",
- " - diese Tests dann einen BitVector liefern und\n",
- " - bei Bedarf solche Bitvektoren durch die Bit-weisen Operatoren `&` und `|` verknüpft werden können. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "eda29b0d",
- "metadata": {},
- "outputs": [],
- "source": [
- "v[ (v .> 13) .& (v.<20) ]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "3f46137f",
- "metadata": {},
- "source": [
- "## Matrizen und Arrays\n",
- "\n",
- "Die bisher vorgestellten Methoden für Vektoren übertragen sich auch auf höherdimensionale Arrays.\n",
- "\n",
- "Man kann sie uninitialisiert anlegen:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "a8bf798b",
- "metadata": {},
- "outputs": [],
- "source": [
- "A = Array{Float64,3}(undef, 6,9,3)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "60e20aae",
- "metadata": {},
- "source": [
- "In den meisten Funktionen kann man die Dimensionen auch als Tupel übergeben. Die obige Anweisung lässt sich auch so schreiben:\n",
- "\n",
- "```julia\n",
- "A = Array{Float64, 3}(undef, (6,9,3)) \n",
- "```\n",
- "\n",
- "Funktionen wie `zeros()` usw. funktionieren natürlich auch.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "50627ef8",
- "metadata": {},
- "outputs": [],
- "source": [
- "m2 = zeros(3, 4, 2) # oder zeros((3,4,2)) "
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "fa2da287",
- "metadata": {},
- "outputs": [],
- "source": [
- "M = fill(5 , (3, 3)) # oder fill(5, 3, 3)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "79c237c5",
- "metadata": {},
- "source": [
- "Die Funktion `similar()`, die einen Array gleicher Größe uninitialisiert erzeugt, kann auch einen Typ als weiteres Argument bekommen.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "967c0a3e",
- "metadata": {},
- "outputs": [],
- "source": [
- "M2 = similar(M, Float64)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "381254e3",
- "metadata": {},
- "source": [
- "### Konstruktion durch explizite Elementliste\n",
- "\n",
- "Während man Vektoren kommagetrennt in eckigen Klammern notiert, ist die Notation für höherdimensionale Objekte etwas anders. \n",
- "\n",
- "- Eine Matrix:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "7100bcaf",
- "metadata": {},
- "outputs": [],
- "source": [
- "M2 = [2 3 -1\n",
- " 4 5 -2]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "45bef96a",
- "metadata": {},
- "source": [
- "- dieselbe Matrix:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "7e6caf84",
- "metadata": {},
- "outputs": [],
- "source": [
- "M2 = [2 3 -1; 4 5 -2]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "be6fedc8",
- "metadata": {},
- "source": [
- "- Ein Array mit 3 Indizes:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "3f2233ce",
- "metadata": {},
- "outputs": [],
- "source": [
- "M3 = [2 3 -1 \n",
- " 4 5 6 ;;;\n",
- " 7 8 9\n",
- " 11 12 13]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "e3bee379",
- "metadata": {},
- "source": [
- "- und nochmal die Matrix `M2`:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "efa9ecd7",
- "metadata": {},
- "outputs": [],
- "source": [
- "M2 = [2;4;; 3;5;; -1;-2]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "fa6e923a",
- "metadata": {},
- "source": [
- "Im letzten Beispiel kommen diese Regeln zur Anwendung:\n",
- "\n",
- "- Trenner ist das Semikolon.\n",
- "- Ein Semikolon `;` erhöht den 1. Index.\n",
- "- Zwei Semikolons `;;` erhöhen den 2. Index.\n",
- "- Drei Semikolons `;;;` erhöhen den 3. Index usw. \n",
- "\n",
- "In den Beispielen davor wurde folgende Syntaktische Verschönerung (_syntactic sugar_) angewendet:\n",
- "\n",
- "- Leerzeichen trennen wie 2 Semikolons -- erhöht also den 2. Index: $\\quad a_{12}\\quad a_{13}\\quad a_{14}\\ ...$\n",
- "- Zeilenumbruch trennt wie ein Semikolon -- erhöht also den 1. Index.\n",
- "\n",
- "\n",
- ":::{.callout-important}\n",
- "\n",
- "- Vektorschreibweise mit Komma als Trenner geht nur bei Vektoren, nicht mit \"Semikolon, Leerzeichen, Newline\" mischen! \n",
- "- Vektoren, $1\\!\\times\\!n$-Matrizen und $n\\!\\times\\!1$-Matrizen sind drei verschiedene Dinge!\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "20499e99",
- "metadata": {},
- "outputs": [],
- "source": [
- "v1 = [2,3,4]"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "e8554e3f",
- "metadata": {},
- "outputs": [],
- "source": [
- "v2 = [2;3;4]"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "d42f242f",
- "metadata": {},
- "outputs": [],
- "source": [
- "v3 = [2 3 4]"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "f76b20d5",
- "metadata": {},
- "outputs": [],
- "source": [
- "v3 = [2;3;4;;]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "a049e8a8",
- "metadata": {},
- "source": [
- ":::\n",
- "\n",
- "\n",
- "Einen \"vector of vectors\" a la C/C++ kann man natürlich auch konstruieren. \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "73cfb832",
- "metadata": {},
- "outputs": [],
- "source": [
- "v = [[2,3,4], [5,6,7,8]]"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "55f2f419",
- "metadata": {},
- "outputs": [],
- "source": [
- "v[2][3]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "69072c6f",
- "metadata": {},
- "source": [
- "Das sollte man nur in Spezialfällen tun. Die Array-Sprache von Julia ist in der Regel bequemer und schneller.\n",
- "\n",
- "### Indizes, Teilfelder, Slices\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "f8d1140f",
- "metadata": {},
- "outputs": [],
- "source": [
- "# 6x6 Matrix mit Zufallszahlen gleichverteilt aus [0,1) ∈ Float64\n",
- "A = rand(6,6)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "7ca06ccd",
- "metadata": {},
- "source": [
- "Die übliche Indexnotation:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "117b78c9",
- "metadata": {},
- "outputs": [],
- "source": [
- "A[2, 3] = 77.77777\n",
- "A"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "6a1d738b",
- "metadata": {},
- "source": [
- "Man kann mit Ranges Teilfelder adressieren:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "733f15a6",
- "metadata": {},
- "outputs": [],
- "source": [
- "B = A[1:2, 1:3]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "212c6e6d",
- "metadata": {},
- "source": [
- "Das Adressieren von Teilen mit geringerer Dimension wird auch *slicing* genannt.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "2190a0d6",
- "metadata": {},
- "outputs": [],
- "source": [
- "# die 3. Spalte als Vektor (slicing)\n",
- "\n",
- "C = A[:, 3]"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "94e3dc5b",
- "metadata": {},
- "outputs": [],
- "source": [
- "# die 3. Zeile als Vektor (slicing)\n",
- "\n",
- "E = A[3, :]"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "45c89587",
- "metadata": {},
- "source": [
- "Natürlich sind damit auch Zuweisungen möglich:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "beca175d",
- "metadata": {},
- "outputs": [],
- "source": [
- "# Man kann slices und Teilfeldern auch etwas zuweisen \n",
- "\n",
- "A[2, :] = [1,2,3,4,5,6]\n",
- "A"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "9dd8da68",
- "metadata": {},
- "source": [
- "## Verhalten bei Zuweisungen, `copy()` und `deepcopy()`, Views\n",
- "\n",
- "### Zuweisungen und Kopien\n",
- "\n",
- "- Variablen sind Referenzen auf Objekte. \n",
- "- _Eine Zuweisung zu einer Variablen erzeugt kein neues Objekt._\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "e7ece88d",
- "metadata": {},
- "outputs": [],
- "source": [
- "A = [1, 2, 3]\n",
- "B = A"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "390e8338",
- "metadata": {},
- "source": [
- "`A` und `B` sind jetzt Namen desselben Objekts.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "ad71682b",
- "metadata": {},
- "outputs": [],
- "source": [
- "A[1] = 77\n",
- "@show B;"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "9422450b",
- "metadata": {},
- "outputs": [],
- "source": [
- "B[3] = 300\n",
- "@show A;"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "ce960e49",
- "metadata": {},
- "source": [
- "Dieses Verhalten spart viel Zeit und Speicher, ist aber nicht immer gewünscht. \n",
- "Die Funktion `copy()` erzeugt eine 'echte' Kopie des Objekts.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "61fd903e",
- "metadata": {},
- "outputs": [],
- "source": [
- "A = [1, 2, 3]\n",
- "B = copy(A)\n",
- "A[1] = 100\n",
- "@show A B;"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "cf24b145",
- "metadata": {},
- "source": [
- "Die Funktion \n",
- "`deepcopy(A)` kopiert rekursiv. Auch von den Elementen, aus denen `A` besteht, werden (wieder rekursive) Kopien erstellt. \n",
- "\n",
- "Solange ein Array nur primitive Objekte (Zahlen) enthält, sind `copy()` und `deepcopy()` äquivalent. \n",
- "\n",
- "Das folgende Beispiel zeigt den Unterschied zwischen `copy()` und `deepcopy()`.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "174a9513",
- "metadata": {},
- "outputs": [],
- "source": [
- "mutable struct Person\n",
- " name :: String\n",
- " age :: Int\n",
- "end\n",
- "\n",
- "A = [Person(\"Meier\", 20), Person(\"Müller\", 21), Person(\"Schmidt\", 23)]\n",
- "B = A\n",
- "C = copy(A)\n",
- "D = deepcopy(A)"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "79dac2ba",
- "metadata": {},
- "outputs": [],
- "source": [
- "A[1] = Person(\"Mustermann\", 83)\n",
- "A[3].age = 199 \n",
- "\n",
- "@show B C D;"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "8adee725",
- "metadata": {},
- "source": [
- "### Views\n",
- "\n",
- "Wenn man mittels *indices/ranges/slices* einer Variablen ein Teilstück eines Arrays zuweist, \n",
- "wird von Julia grundsätzlich **ein neues Objekt** konstruiert.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "0aeffcf9",
- "metadata": {},
- "outputs": [],
- "source": [
- "A = [1 2 3\n",
- " 3 4 5]\n",
- "\n",
- "v = A[:, 2]\n",
- "@show v\n",
- "\n",
- "A[1, 2] = 77\n",
- "@show A v;"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "1e2f7d51",
- "metadata": {},
- "source": [
- "Manchmal möchte man aber gerade hier eine Referenz-Semantik haben im Sinne von: \"Vektor `v` soll der 2. Spaltenvektor von `A` sein und auch bleiben (d.h., sich mitändern, wenn sich `A` ändert).\"\n",
- "\n",
- "Dies bezeichnet man in Julia als *views*: Wir wollen, dass die Variable `v` nur einen 'alternativen Blick' auf die Matrix `A` darstellt.\n",
- "\n",
- "Das kann man erreichen durch das `@view`-Macro: \n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "1ea24972",
- "metadata": {},
- "outputs": [],
- "source": [
- "A = [1 2 3\n",
- " 3 4 5]\n",
- "\n",
- "v = @view A[:,2]\n",
- "@show v\n",
- "\n",
- "A[1, 2] = 77\n",
- "@show v;"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "929d0c0c",
- "metadata": {},
- "source": [
- "Diese Technik wird von Julia aus Effizienzgründen auch bei einigen Funktionen der linearen Algebra verwendet. \n",
- "Ein Beispiel ist der Operator `'`, der zu einer Matrix `A` die adjungierte Matrix `A'` liefert.\n",
- "\n",
- "- Die adjungierte _(adjoint)_ Matrix `A'` ist die transponierte und elementweise komplex-konjugierte Matrix zu `A`. \n",
- "- Der Parser macht daraus den Funktionsaufruf `adjoint(A)`. \n",
- "- Für reelle Matrizen ist die Adjungierte gleich der transponierten Matrix.\n",
- "- Julia implementiert `adjoint()` als _lazy function_, d.h., \n",
- "- es wird aus Effizienzgründen kein neues Objekt konstruiert, sondern nur ein alternativer 'View' auf die Matrix (\"mit vertauschten Indizes\") und ein alternativer 'View' auf die Einträge (mit Vorzeichenwechsel im Imaginärteil).\n",
- "- Aus Vektoren macht `adjoint()` eine $1\\!\\times\\!n$-Matrix (einen Zeilenvektor).\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "4eab95b5",
- "metadata": {},
- "outputs": [],
- "source": [
- "A = [ 1. 2.\n",
- " 3. 4.]\n",
- "B = A'"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "05788cae",
- "metadata": {},
- "source": [
- "Die Matrix `B` ist nur ein modifizierter 'View' auf `A`:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "8cbbd3b6",
- "metadata": {},
- "outputs": [],
- "source": [
- "A[1, 2] =10\n",
- "B"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "67cfc86f",
- "metadata": {},
- "source": [
- "Aus Vektoren macht `adjoint()` eine $1\\!\\times\\!n$-Matrix (einen Zeilenvektor).\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "5bbd675d",
- "metadata": {},
- "outputs": [],
- "source": [
- "v = [1, 2, 3]\n",
- "v'"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "c6a6095a",
- "metadata": {},
- "source": [
- "Eine weitere solche Funktion, die einen alternativen 'View', eine andere Indizierung, derselben Daten \n",
- "liefert, ist `reshape()`. \n",
- "\n",
- "Hier wird ein Vektor mit 12 Einträgen in eine 3x4-Matrix verwandelt.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "6f9b3031",
- "metadata": {},
- "outputs": [],
- "source": [
- "A = [1,2,3,4,5,6,7,8,9,10,11,12]\n",
- "\n",
- "B = reshape(A, 3, 4) "
- ]
- },
- {
- "cell_type": "markdown",
- "id": "a113beb5",
- "metadata": {},
- "source": [
- "## Speicherung eines Arrays\n",
- "\n",
- "- Speicher wird linear adressiert. Eine Matrix kann zeilenweise _(row major)_ oder spaltenweise _(column major)_ im Speicher angeordnet sein. \n",
- "- C/C++/Python(NumPy) verwenden eine zeilenweise Speicherung: Die 4 Elemente einer 2x2-Matrix sind abgespeichert in der Reihenfolge $a_{11},a_{12},a_{21},a_{22}$. \n",
- "- Julia, Fortran, Matlab speichern spaltenweise: $a_{11},a_{21},a_{12},a_{22}$. \n",
- "\n",
- "Diese Information ist wichtig, um effizient über Matrizen zu iterieren:\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "d465b690",
- "metadata": {},
- "outputs": [],
- "source": [
- "function column_major_add(A, B)\n",
- " (n,m) = size(A)\n",
- " for j = 1:m\n",
- " for i = 1:n # innere Schleife durchläuft eine Spalte\n",
- " A[i,j] += B[i,j]\n",
- " end\n",
- " end\n",
- "end\n",
- "\n",
- "function row_major_add(A, B)\n",
- " (n,m) = size(A)\n",
- " for i = 1:n\n",
- " for j = 1:m # inere Schleife durchläuft eine Zeile\n",
- " A[i,j] += B[i,j]\n",
- " end\n",
- " end\n",
- "end"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "eba4dc73",
- "metadata": {},
- "outputs": [],
- "source": [
- "A = rand(10000, 10000);\n",
- "B = rand(10000, 10000);"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "ae245931",
- "metadata": {},
- "outputs": [],
- "source": [
- "using BenchmarkTools\n",
- "\n",
- "@benchmark row_major_add($A, $B) "
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "604ed987",
- "metadata": {},
- "outputs": [],
- "source": [
- "@benchmark column_major_add($A, $B)"
- ]
- },
- {
- "cell_type": "markdown",
- "id": "18adb785",
- "metadata": {},
- "source": [
- "### Lokalität von Speicherzugriffen und _Caching_\n",
- "\n",
- "Wir haben gesehen, dass die Reihenfolge von innerem und äußerem Loop einen erheblichen Geschwindigkeitsunterschied macht:\n",
- "\n",
- "__Es ist effizienter, wenn die innerste Schleife über den linken Index läuft__, also eine Spalte und nicht eine Zeile durchläuft. Die Ursache dafür liegt in der Architektur moderner Prozessoren.\n",
- "\n",
- "- Speicherzugriffe erfolgt über mehrere Cache-Ebenen. \n",
- "- Ein _cache miss_, der ein Nachladen aus langsameren Caches auslöst, bremst aus.\n",
- "- Es werden immer gleich größere Speicherblöcke nachgeladen, um die Häufigkeit von _cache misses_ zu minimieren.\n",
- "- Daher ist es wichtig, Speicherzugriffe möglichst lokal zu organisieren.\n",
- "\n",
- "::: {.content-visible when-format=\"html\"}\n",
- "](../images/cache.png){width=\"75%\"}\n",
- "\n",
- ":::\n",
- "\n",
- "::: {.content-visible when-format=\"pdf\"}\n",
- "](../images/cache.png){width=\"70%\"}\n",
- ":::\n",
- "\n",
- "\n",
- "## Mathematische Operationen mit Arrays\n",
- "\n",
- "Arrays der gleichen Dimension (z.B. alle $7\\!\\times\\!3$-Matrizen) bilden einen linearen Raum. \n",
- "\n",
- " - Sie können mit Skalaren multipliziert werden und\n",
- " - sie können addiert und subtrahiert werden.\n"
- ]
- },
- {
- "cell_type": "code",
- "execution_count": null,
- "id": "dfb3003d",
- "metadata": {},
- "outputs": [],
- "source": [
- "0.5 * [2, 3, 4, 5]"
- ]
- },
- {
- "cell_type": "code",
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- }
diff --git a/nb/first_contact.nbconvert.ipynb b/nb/first_contact.nbconvert.ipynb
- "cells": [
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- },
- }
diff --git a/nb/intro.ipynb b/nb/intro.ipynb
- "cells": [
- },
- },
- },
- },
- }
diff --git a/nb/makie.ipynb b/nb/makie.ipynb
- "cells": [
- },
- },
- },
- }
diff --git a/nb/numerictypes.ipynb b/nb/numerictypes.ipynb
- "cells": [
- },
- },
- },
- },
- {
- },
- },
- },
- },
- },
- {
- {
- {
- {
- {
- },
- },
- {
- {
- },
- },
- "Die Operationen `+`,`-`,`*` haben die übliche exakte Arithmetik **modulo $2^{64}$**.\n",
- {
- {
- {
- {
- {
- },
- {
- {
- {
- {
- {
- {
- {
- },
- },
- },
- {
- },
- {
- },
- },
- },
- },
- {
- },
- },
- },
- {
- {
- },
- {
- {
- {
- {
- },
- {
- {
- },
- },
- },
- },
- {
- {
- },
- },
- {
- {
- {
- },
- },
- },
- },
- {
- {
- {
- },
- },
- {
- {
- {
- },
- {
- },
- {
- {
- {
- {
- {
- {
- {
- {
- {
- {
- {
- {
- {
- },
- {
- {
- ],
diff --git a/nb/pcomplex.ipynb b/nb/pcomplex.ipynb
- "cells": [
- {
- {
- {
- "cell_type": "markdown",
- },
- "\n",
- },
- "using Printf\n",
- {
- {
- "source": [
- {
- "wp = @which +\n",
- {
- "source": [
- {
- {
- "cell_type": "code",
- "source": [
- {
- {
- "Base.sqrt(z::PComplex) = qwurzel(z)\n",
- },
- "execution_count": 33,
- {
