IT- und Medientechnik - Vorlesung 5: 12.11.2018 Wintersemester 2018/2019 h_da - Vorlesungsfolien von Heiko Weber
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
IT- und Medientechnik Vorlesung 5: 12.11.2018 Wintersemester 2018/2019 h_da Heiko Weber, Lehrbeauftragter
Teil 1: IT- und Medientechnik
Themenübersicht der Vorlesung
Hard- und Software
Hardware: CPU, Speicher, Bus, I/O, ...
Software: System-, Unterstützungs-, Anwendungssoftware
Quellcode und Entwicklerdokumentation
Programmiersprachen, Dokumentation
Phasen der Softwareentwicklung, Software-Entwicklungsmethoden
Netzwerke und Internet
Geschichte, Netzwerk-Strukturen
Protokolle und Technologien, Standards, Cloud
Techniken der Datenübertragung
Sockets, LAN vs. WAN, VPN
Digitalisierung von Inhalten und elektronische Übertragung
Dateiformate, Kompression, Backups, Virtuelle Maschinen
IT- und Medientechnik 5-2 12.11.2018 Heiko WeberDaten und Dateien
Daten
letztendlich sind Daten eine Reihenfolge von 0 und 1, die einen entsprechenden Inhalt darstellen
grob wird unterschieden zwischen:
Binärdaten: die Reihenfolge von 0 und 1 hat eine spezielle Semantik für einen speziellen
Anwendungsfall
Textdaten: die Reihenfolge von 0 und 1 stellt Zeichen dar, die anwendungsunabhängig
dargestellt werden können, aber die Zeichen haben normalerweise auch eine spezielle
Semantik für einen speziellen Anwendungsfall
Dateien
Daten werden in Container zusammengefasst, damit sie einfacher gespeichert und geladen werden
können - diese werden als Dateien bezeichnet
oft gibt die Endung einer Datei an, von welchem Typ die Daten sind
z.B. mp3, doc, xls, txt, html, png
IT- und Medientechnik 5-3 12.11.2018 Heiko WeberDateisysteme
damit Dateien in einem Speicher abgelegt und von dort wieder gelesen werden können,
muss der Speicher eine spezielle Struktur haben, um die Dateien zu adressieren (z.B.
über den Namen)
eine solche Speicher-Struktur für Dateien wird als Dateisystem bezeichnet
es gibt viele verschiedene Dateisysteme, die für spezielle Anwendungen optimiert sind
(z.B. für sehr große Dateien, für schnelles Lesen, für schnelles Schreiben, für wenig
Speicherverbrauch, …)
gängige Dateisysteme:
NTFS – New Technology File System (gängig auf Windows)
ext4 – fourth extended file sytem (gängig auf Linux)
HFS+ - Hierarchical File System Plus (gängig auf Mac)
FAT – File Allocation Table (kompatibel zu vielen Betriebssystemen)
IT- und Medientechnik 5-4 12.11.2018 Heiko WeberMedienformate
für spezielle Typen von Daten gibt es verschiedene Medienformate – hier sind einige
beispielhaft aufgeführt:
Video
MPEG – Motion Picture Experts Group (*.mpg, *.mpeg)
AVI – Audio Video Interleave (*.avi)
WMV – Windows Media Video (*.wmv)
Audio
MP3 – MPEG Audio Layer 3 (*.mp3)
WAVE (*.wav)
Textverarbeitung
Word Document (*.doc)
OpenDocument-Text (*.odt)
IT- und Medientechnik 5-5 12.11.2018 Heiko WeberMedienformate im Internet
Media-Types
verwaltet von der IANA:
http://www.iana.org/assignments/media-types/media-types.xhtml
unterteilt in 9 Kategorien:
application, audio, example, image, message, model, multipart,
text, video
wird im HTTP-Header, Mail-Header etc. mitgeschickt, damit das verarbeitende Programm
(z.B. der Webbrowser) mitgeteilt bekommt, was für Daten geschickt werden
Syntax: Kategorie/Typ
Beispiele
PNG-Grafiken: image/png
HTML-Seiten: text/html
IT- und Medientechnik 5-6 12.11.2018 Heiko WeberSpeicherformate
Daten sind immer nur Nummern, die aber je nach Anwendung eine spezielle Semantik
haben
für Textdaten werden Zeichencodes gespeichert, bei denen jeder Code einem Zeichen
zugeordnet ist
z.B. ASCII-Zeichensatz
für Bild- und Video-Daten werden für Pixel (Bildpunkte) oder andere Objekte in einem
Bild die Farbwerte gespeichert
z.B. RGB für Bilder, die am Bildschirm angezeigt werden
z.B. CMYK für Bilder, die gedruckt werden
IT- und Medientechnik 5-7 12.11.2018 Heiko Weberdruckbare Zeichen im ASCII-Zeichensatz IT- und Medientechnik 5-8 12.11.2018 Heiko Weber
RGB-Farbwerte
Farbe wird aus 3 Farbwerten gemischt, wobei jeder Wert die Lichthelligkeit der Farbe
angibt
R = rot
G = grün
B = blau
normalerweise Werte von 0 bis 255 (1 Byte) pro Farbe
(0,0,0) = Hexadezimal = (0,0,0) #000000
(255,0,0) = Hexadezimal = (FF,0,0) #FF0000
(0,0,255) = Hexadezimal = (0,0,FF) #0000FF
(255,255,0) = Hexadezimal = (FF,FF,0) #FFFF00
IT- und Medientechnik 5-9 12.11.2018 Heiko WeberVerschiedene Grafikformate
es gibt verschiedene Grafikformate, weil:
unterschiedliche Bildtypen sich mit unterschiedlichen Verfahren optimal speichern
lassen
für unterschiedliche Zwecke auch unterschiedliche Informationen in den Grafik-
Dateien gespeichert werden müssen
Bildtypen
Fotos
Grafiken mit großen einheitlichen Flächen
Grafiken mit viel Text
Vektorgrafiken
Zwecke
betrachten auf dem Monitor
drucken
Weiterbearbeitung im Grafikprogramm
IT- und Medientechnik 5-10 12.11.2018 Heiko WeberBMP, PNG, JPEG – Grafikformate
BMP - Bitmap
jeder Pixel wird einzeln abgespeichert
verlustfreies Format
PNG – Portable Network Graphics
Flächen gleicher Farben werden zusammengefasst
verlustfreies Format
gut für einfache Bilder
JPEG – Joint Photographic Experts Group
Flächen ähnlicher Farben werden zusammengefasst
verlustbehaftetes Format
gut für komplexe Bilder – z.B. Fotos
IT- und Medientechnik 5-11 12.11.2018 Heiko WeberBMP, PNG, JPEG – Grafikformate - Größenunterschiede
BMP PNG JPEG
einfaches Bild
800 x 600 Pixel
1407 kB 8 kB 29 kB
Foto
800 x 600 Pixel
1407 kB 1017 kB 429 kB
IT- und Medientechnik 5-12 12.11.2018 Heiko WeberKompression
was ist Kompression?
Datengröße verkleinern, so dass die Daten wieder zurück in den Original-zustand oder einem
äquivalenten Zustand gebracht werden können
Verkleinern: Kompression
Zurückkonvertieren in Original: Dekompression
wieso Kompression?
Platz auf Speichermedien sparen
Datenübertragung beschleunigen, weil weniger Daten übertragen werden müssen
z.B. im Internet oder Mobilfunknetz
z.B. beim Lesen von oder Speichern auf Festplatte
Einige Daten, z.B. reine Textdaten, lassen sich sehr gut verkleinern – andere Daten, z.B. viele Bild- und Audioformate, lassen
sich kaum oder nur wenig verkleinern, weil sie oft schon in ihrem Speicherformat eine Kompression enthalten haben.
IT- und Medientechnik 5-13 12.11.2018 Heiko WeberKompressionsverfahren
verlustfrei
der Originalzustand kann 100% wieder hergestellt werden
Musterersetzung: wiederholende Muster suchen und durch kürzere ersetzen
Entropie-Codes: Huffman-Code, arithmetische Codierung
dynamische Codebuch-Kodierung
verlustbehaftet
ja nach Datentyp, muss nicht unbedingt der Originalzustand wieder hergestellt werden,
sondern reichen Daten, die die gleichen Eigenschaften haben (also z.B. ein Bild, welches
gleich aussieht, oder eine XML-Datei, die semantisch äquivalent ist)
bei verlustbehafteter Kompression, kann oft auch die Qualität eingestellt werden
IT- und Medientechnik 5-14 12.11.2018 Heiko WeberGängige allgemeine Kompressionsprogramme
allgemein = können für beliebige Daten benutzt werden
ZIP (*.zip)
gängigstes Format – Quasi-Standard auf Windows
kommerzielles Programm: http://www.winzip.de/
7ZIP (*.7z)
offene Kompressions-Architektur, die eine Vielzahl an Kompressionsverfahren
unterstützt
kostenloses Open-Source-Programm: http://www.7-zip.de/
gzip / Gnu ZIP (*.gz)
Standard auf Linux-Systemen – eigentlich automatisch dabei
gzip2 (*.bz)
höhere Kompressionsrate als GZIP, aber auch langsamer
IT- und Medientechnik 5-15 12.11.2018 Heiko WeberAnwendungsbereiche für Kompression
eigentlich überall wo Daten gespeichert oder übertragen werden, kann eine
Kompression eingesetzt werden
insbesondere wenn größere Datenmengen gespeichert werden, wird Kompression häufig
eingesetzt
wenn langsame Datenübertragungskanäle genutzt werden
(z.B. Mobilfunknetz)
wenn kleinere Speichermedien eingesetzt werden
(z.B. Software-Installation von CD/DVD)
IT- und Medientechnik 5-16 12.11.2018 Heiko WeberSpezielle Kompression
Bilder
größere Farbflächen zusammenfassen
ähnliche Farben zusammenfassen
Transformationen
z.B. JPEG
Audio
Frequenzbereiche rausschneiden, die für das menschliche Ohr nicht oder kaum
wahrnehmbar sind
mathematische Funktionen
z.B. MP3
Video (Bildsequenzen+Audio)
Kombination aus den Kompressionsverfahren für Bilder und Audio
IT- und Medientechnik 5-17 12.11.2018 Heiko WeberJPEG-Kompressions-Faktor Faktor 1 Faktor 50 Faktor 99 Größe: 9303 Bytes Größe: 2645 Bytes Größe: 1101 Bytes IT- und Medientechnik 5-18 12.11.2018 Heiko Weber
PNG-Farbreduktion 24 Bit 8 Bit 4 Bit 16,7 Millionen Farben 256 Farben 16 Farben Größe: 10566 Bytes Größe: 4244 Bytes Größe: 1857 Bytes IT- und Medientechnik 5-19 12.11.2018 Heiko Weber
Backups
Backup = Datensicherung
wieso Backups?
Datenverlust verhindern / Desaster Recovery
Speichermedien defekt (z.B. Festplatten-Crash) oder gestohlen
Daten wurden aus versehen gelöscht oder verändert
Daten wurden böswillig gelöscht oder verändert
Wiederherstellen alter Zustände / Rollback
Daten zu Testzwecken verändert
zum Überprüfen zu einem speziellen Zeitpunkt zurück gehen
Erstellen von Kopien
zur Archivierung
zum Vervielfältigen
IT- und Medientechnik 5-20 12.11.2018 Heiko WeberBackup-Speicherorte
je nach Motivation des Backups, sollte ein passender Ort zum Speichern der Backup-
Daten gewählt werden
Datenverlust verhindern
über mehrere physisch voneinander getrennte Rechenzentren
oftmals auch in verschiedenen Ländern oder zumindest weit voneinander entfernt
Archivierung
sicherstellen, dass sie auch langfristig gespeichert werden können
Wiederherstellen alter Zustände
speichern, wo auch schnell wieder darauf zugegriffen werden kann – evtl. zusätzliche
Festplatte im System
zur Vervielfältigung
speichern, wo die Daten auch im Netzwerk von anderen geladen werden können
IT- und Medientechnik 5-21 12.11.2018 Heiko WeberBackup-Speicherungsarten
vollständig
die kompletten Daten für ein System werden gespeichert
Vorteil: mit dem Backup können die kompletten Daten hergestellt werden
Nachteil: kann sehr groß sein und sehr lange dauern
inkrementell
nur die Daten, die sich seit dem letzten Backup verändert haben, werden
gespeichert
Vorteil: nur ein kleiner Teil der Daten muss im Normalfall gespeichert werden
und es dauert kürzer als ein kompletter Backup
Nachteil: die Daten können nur komplett hergestellt werden, wenn alle
vorangegangenen Backups verfügbar sind
oft wird eine Kombination aus vollständig und zwischendurch ein paar inkrementellen Backups
verwendet – z.B 1 voll – 5 inkr. - 1 voll - 5 inkr. - ...
IT- und Medientechnik 5-22 12.11.2018 Heiko WeberBackup-Anwendungsbereiche
Arbeitsplatz-Backup
spezielle Nutzerdaten werden gesichert
Datenbank-Backup
Änderungen seit einem speziellen Zeitpunkt werden gesichert
ermöglicht auch einen Rollback zu einem früheren Zustand der Datenbank
Machine-Image
Kopie aller Daten eines Computers
zum Vervielfältigen eines Systems oder einfach als Sicherung, falls der
Computer von einem Virus befallen wird oder ähnliches
zum erstellen einer Virtuellen Maschine (VM)
IT- und Medientechnik 5-23 12.11.2018 Heiko WeberBesondere Herausforderungen
Langzeitarchivierung
Daten in einem Format speichern, in dem sie auch nach 20, 30, 40, 50 Jahren
noch verarbeitet werden können
Daten auf einem Speichermedium speichern, welches auch nach 20, 30, 40, 50
Jahren noch korrekt funktioniert
zuverlässige Archivierung
sicherstellen, dass Daten im Backup nicht verändert wurden
spezielle Signaturen und Checksummen auf den Daten stellen sicher, dass sie
seit dem Speichern nicht verändert wurden
Sicherheitsaspekt „Verbindlichkeit“
IT- und Medientechnik 5-24 12.11.2018 Heiko WeberVirtuelle Maschine
Eine Virtuelle Maschine (VM) ist die Software-Implementation einer Hardware-
Computer-Umgebung, in der sich ein Betriebssystem und weitere Programm ausführen
lassen, so als würden sie direkt die Hardware nutzen, wobei sie aber nur virtuell zur
Verfügung steht.
Virtuelle Maschine 1 Virtuelle Maschine 2
Virtualisierungs-System
Host-Betriebssystem
Hardware
IT- und Medientechnik 5-25 12.11.2018 Heiko WeberVirtuelle Maschine
Eine Virtuelle Maschine (VM) ist die Software-Implementation einer Hardware-
Computer-Umgebung, in der sich ein Betriebssystem und weitere Programm ausführen
lassen, so als würden sie direkt die Hardware nutzen, wobei sie aber nur virtuell zur
Verfügung steht.
Virtuelle Maschine 1 Virtuelle Maschine 2
z.B. mit RedHat Linux z.B. mit Windows 7
Virtualisierungs-System z.B. VMware
Host-Betriebssystem z.B. Windows 2012
z.B. Computer mit
Hardware
Intel-Prozessor
IT- und Medientechnik 5-26 12.11.2018 Heiko WeberWieso Virtuelle Maschinen?
Kostengründe
Auf einem realen Computer können viele Virtuelle Maschinen parallel laufen – spart also
Hardware-Kosten.
Zum Testen
Eine Virtuelle Maschine kann als Testumgebung genutzt werden und wenn im Rahmen des
Tests die Umgebung kaputt geht, wird einfach wieder der Originalzustand neu gestartet.
Zur Sicherheit
Wenn das System von einem Angriff befallen wurde, kann es einfach komplett gelöscht
und eine neue Kopie der Virtuellen Maschine gestartete werden. Der Zugriff auf die reale
Hardware kann in der Virtuellen Maschine zusätzlich eingeschränkt werden, um es einem
Angreifer schwerer zu machen, das System zu befallen.
IT- und Medientechnik 5-27 12.11.2018 Heiko WeberWieso Virtuelle Maschinen?
Kostengründe
Auf einem realen Computer können viele Virtuelle Maschinen parallel laufen – spart also
Hardware-Kosten.
Zum Testen
Eine Virtuelle Maschine kann als Testumgebung genutzt werden und wenn im Rahmen des
Tests die Umgebung kaputt geht, wird einfach wieder der Originalzustand neu gestartet.
Zur Sicherheit Datensicherheit
Wenn das System von einem Angriff befallen wurde, kann es einfach komplett gelöscht
und eine neue Kopie der Virtuellen Maschine gestartete werden. Der Zugriff auf die reale
Hardware kann in der Virtuellen Maschine zusätzlich eingeschränkt werden, um es einem
Angreifer schwerer zu machen, das System zu befallen.
IT- und Medientechnik 5-28 12.11.2018 Heiko WeberSie können auch lesen