IT- und Medientechnik - Vorlesung 5: 12.11.2018 Wintersemester 2018/2019 h_da - Vorlesungsfolien von Heiko Weber

Die Seite wird erstellt Yannik Kunze
 
WEITER LESEN
IT- und Medientechnik - Vorlesung 5: 12.11.2018 Wintersemester 2018/2019 h_da - Vorlesungsfolien von Heiko Weber
IT- und Medientechnik
Vorlesung 5: 12.11.2018
Wintersemester 2018/2019 h_da

Heiko Weber, Lehrbeauftragter
Teil 1: IT- und Medientechnik
Themenübersicht der Vorlesung
    Hard- und Software
     
          Hardware: CPU, Speicher, Bus, I/O, ...
     
          Software: System-, Unterstützungs-, Anwendungssoftware
    Quellcode und Entwicklerdokumentation
     
          Programmiersprachen, Dokumentation
     
          Phasen der Softwareentwicklung, Software-Entwicklungsmethoden
    Netzwerke und Internet
     
          Geschichte, Netzwerk-Strukturen
     
          Protokolle und Technologien, Standards, Cloud
    Techniken der Datenübertragung
     
          Sockets, LAN vs. WAN, VPN
    Digitalisierung von Inhalten und elektronische Übertragung
     
          Dateiformate, Kompression, Backups, Virtuelle Maschinen
    IT- und Medientechnik                          5-2    12.11.2018      Heiko Weber
Daten und Dateien

Daten
       letztendlich sind Daten eine Reihenfolge von 0 und 1, die einen entsprechenden Inhalt darstellen
 
        grob wird unterschieden zwischen:
                Binärdaten: die Reihenfolge von 0 und 1 hat eine spezielle Semantik für einen speziellen
                 Anwendungsfall
                Textdaten: die Reihenfolge von 0 und 1 stellt Zeichen dar, die anwendungsunabhängig
                 dargestellt werden können, aber die Zeichen haben normalerweise auch eine spezielle
                 Semantik für einen speziellen Anwendungsfall

Dateien
       Daten werden in Container zusammengefasst, damit sie einfacher gespeichert und geladen werden
        können - diese werden als Dateien bezeichnet
 
        oft gibt die Endung einer Datei an, von welchem Typ die Daten sind
                z.B. mp3, doc, xls, txt, html, png
     IT- und Medientechnik                            5-3    12.11.2018                               Heiko Weber
Dateisysteme

      damit Dateien in einem Speicher abgelegt und von dort wieder gelesen werden können,
       muss der Speicher eine spezielle Struktur haben, um die Dateien zu adressieren (z.B.
       über den Namen)
      eine solche Speicher-Struktur für Dateien wird als Dateisystem bezeichnet
      es gibt viele verschiedene Dateisysteme, die für spezielle Anwendungen optimiert sind
       (z.B. für sehr große Dateien, für schnelles Lesen, für schnelles Schreiben, für wenig
       Speicherverbrauch, …)
      gängige Dateisysteme:
         
                NTFS – New Technology File System (gängig auf Windows)
         
                ext4 – fourth extended file sytem (gängig auf Linux)
         
                HFS+ - Hierarchical File System Plus (gängig auf Mac)
         
                FAT – File Allocation Table (kompatibel zu vielen Betriebssystemen)

    IT- und Medientechnik                        5-4    12.11.2018                    Heiko Weber
Medienformate

für spezielle Typen von Daten gibt es verschiedene Medienformate – hier sind einige
beispielhaft aufgeführt:
       Video
          
                 MPEG – Motion Picture Experts Group (*.mpg, *.mpeg)
          
                 AVI – Audio Video Interleave (*.avi)
          
                 WMV – Windows Media Video (*.wmv)
       Audio
          
                 MP3 – MPEG Audio Layer 3 (*.mp3)
          
                 WAVE (*.wav)
 
        Textverarbeitung
          
                 Word Document (*.doc)
          
                 OpenDocument-Text (*.odt)

     IT- und Medientechnik                          5-5   12.11.2018            Heiko Weber
Medienformate im Internet

      Media-Types
         
                verwaltet von der IANA:
                http://www.iana.org/assignments/media-types/media-types.xhtml
         
                unterteilt in 9 Kategorien:
                application, audio, example, image, message, model, multipart,
                text, video
         
                wird im HTTP-Header, Mail-Header etc. mitgeschickt, damit das verarbeitende Programm
                (z.B. der Webbrowser) mitgeteilt bekommt, was für Daten geschickt werden
         
                Syntax: Kategorie/Typ

       Beispiele
         
                PNG-Grafiken: image/png
         
                HTML-Seiten: text/html

    IT- und Medientechnik                          5-6    12.11.2018                          Heiko Weber
Speicherformate

      Daten sind immer nur Nummern, die aber je nach Anwendung eine spezielle Semantik
       haben
      für Textdaten werden Zeichencodes gespeichert, bei denen jeder Code einem Zeichen
       zugeordnet ist
         
                z.B. ASCII-Zeichensatz
      für Bild- und Video-Daten werden für Pixel (Bildpunkte) oder andere Objekte in einem
       Bild die Farbwerte gespeichert
         
                z.B. RGB für Bilder, die am Bildschirm angezeigt werden
                z.B. CMYK für Bilder, die gedruckt werden

    IT- und Medientechnik                          5-7    12.11.2018                 Heiko Weber
druckbare Zeichen im ASCII-Zeichensatz

IT- und Medientechnik          5-8   12.11.2018   Heiko Weber
RGB-Farbwerte

      Farbe wird aus 3 Farbwerten gemischt, wobei jeder Wert die Lichthelligkeit der Farbe
       angibt
      R = rot
       G = grün
       B = blau
      normalerweise Werte von 0 bis 255 (1 Byte) pro Farbe
      (0,0,0) =                      Hexadezimal = (0,0,0)     #000000
      (255,0,0) =                    Hexadezimal = (FF,0,0)    #FF0000
      (0,0,255) =                    Hexadezimal = (0,0,FF)    #0000FF
      (255,255,0) =                  Hexadezimal = (FF,FF,0) #FFFF00

    IT- und Medientechnik                  5-9    12.11.2018                         Heiko Weber
Verschiedene Grafikformate

      es gibt verschiedene Grafikformate, weil:
         
                unterschiedliche Bildtypen sich mit unterschiedlichen Verfahren optimal speichern
                lassen
         
                für unterschiedliche Zwecke auch unterschiedliche Informationen in den Grafik-
                Dateien gespeichert werden müssen
      Bildtypen
         
                Fotos
         
                Grafiken mit großen einheitlichen Flächen
         
                Grafiken mit viel Text
         
                Vektorgrafiken

       Zwecke
         
                betrachten auf dem Monitor
         
                drucken
         
                Weiterbearbeitung im Grafikprogramm
    IT- und Medientechnik                        5-10   12.11.2018                          Heiko Weber
BMP, PNG, JPEG – Grafikformate

      BMP - Bitmap
         
                jeder Pixel wird einzeln abgespeichert
         
                verlustfreies Format
      PNG – Portable Network Graphics
         
                Flächen gleicher Farben werden zusammengefasst
         
                verlustfreies Format
         
                gut für einfache Bilder
      JPEG – Joint Photographic Experts Group
         
                Flächen ähnlicher Farben werden zusammengefasst
         
                verlustbehaftetes Format
         
                gut für komplexe Bilder – z.B. Fotos
    IT- und Medientechnik                     5-11   12.11.2018   Heiko Weber
BMP, PNG, JPEG – Grafikformate - Größenunterschiede

                               BMP                    PNG      JPEG
             einfaches Bild
            800 x 600 Pixel
                              1407 kB                 8 kB     29 kB

                 Foto
            800 x 600 Pixel
                              1407 kB                1017 kB   429 kB

IT- und Medientechnik           5-12    12.11.2018                  Heiko Weber
Kompression

was ist Kompression?
      Datengröße verkleinern, so dass die Daten wieder zurück in den Original-zustand oder einem
       äquivalenten Zustand gebracht werden können
               Verkleinern: Kompression
               Zurückkonvertieren in Original: Dekompression

wieso Kompression?
      Platz auf Speichermedien sparen
      Datenübertragung beschleunigen, weil weniger Daten übertragen werden müssen
               z.B. im Internet oder Mobilfunknetz
               z.B. beim Lesen von oder Speichern auf Festplatte

Einige Daten, z.B. reine Textdaten, lassen sich sehr gut verkleinern – andere Daten, z.B. viele Bild- und Audioformate, lassen
sich kaum oder nur wenig verkleinern, weil sie oft schon in ihrem Speicherformat eine Kompression enthalten haben.
  IT- und Medientechnik                                   5-13     12.11.2018                                          Heiko Weber
Kompressionsverfahren

verlustfrei
     der Originalzustand kann 100% wieder hergestellt werden
     Musterersetzung: wiederholende Muster suchen und durch kürzere ersetzen
     Entropie-Codes: Huffman-Code, arithmetische Codierung
     dynamische Codebuch-Kodierung

verlustbehaftet
     ja nach Datentyp, muss nicht unbedingt der Originalzustand wieder hergestellt werden,
      sondern reichen Daten, die die gleichen Eigenschaften haben (also z.B. ein Bild, welches
      gleich aussieht, oder eine XML-Datei, die semantisch äquivalent ist)
     bei verlustbehafteter Kompression, kann oft auch die Qualität eingestellt werden

IT- und Medientechnik                       5-14   12.11.2018                             Heiko Weber
Gängige allgemeine Kompressionsprogramme

      allgemein = können für beliebige Daten benutzt werden
      ZIP (*.zip)
         
                gängigstes Format – Quasi-Standard auf Windows
         
                kommerzielles Programm: http://www.winzip.de/
      7ZIP (*.7z)
         
                offene Kompressions-Architektur, die eine Vielzahl an Kompressionsverfahren
                unterstützt
         
                kostenloses Open-Source-Programm: http://www.7-zip.de/
      gzip / Gnu ZIP (*.gz)
         
                Standard auf Linux-Systemen – eigentlich automatisch dabei

       gzip2 (*.bz)
         
                höhere Kompressionsrate als GZIP, aber auch langsamer
    IT- und Medientechnik                       5-15   12.11.2018                         Heiko Weber
Anwendungsbereiche für Kompression

      eigentlich überall wo Daten gespeichert oder übertragen werden, kann eine
       Kompression eingesetzt werden
      insbesondere wenn größere Datenmengen gespeichert werden, wird Kompression häufig
       eingesetzt
      wenn langsame Datenübertragungskanäle genutzt werden
       (z.B. Mobilfunknetz)
      wenn kleinere Speichermedien eingesetzt werden
       (z.B. Software-Installation von CD/DVD)

    IT- und Medientechnik                  5-16   12.11.2018                       Heiko Weber
Spezielle Kompression

      Bilder
         
                größere Farbflächen zusammenfassen
         
                ähnliche Farben zusammenfassen
         
                Transformationen
         
                z.B. JPEG
      Audio
         
                Frequenzbereiche rausschneiden, die für das menschliche Ohr nicht oder kaum
                wahrnehmbar sind
         
                mathematische Funktionen
         
                z.B. MP3
      Video (Bildsequenzen+Audio)
         
                Kombination aus den Kompressionsverfahren für Bilder und Audio
    IT- und Medientechnik                    5-17    12.11.2018                     Heiko Weber
JPEG-Kompressions-Faktor

  Faktor 1              Faktor 50                  Faktor 99
  Größe: 9303 Bytes     Größe: 2645 Bytes          Größe: 1101 Bytes

IT- und Medientechnik          5-18   12.11.2018                       Heiko Weber
PNG-Farbreduktion

  24 Bit                  8 Bit                      4 Bit
  16,7 Millionen Farben   256 Farben                 16 Farben
  Größe: 10566 Bytes      Größe: 4244 Bytes          Größe: 1857 Bytes

IT- und Medientechnik            5-19   12.11.2018                       Heiko Weber
Backups

      Backup = Datensicherung

      wieso Backups?
         
                Datenverlust verhindern / Desaster Recovery
                  
                    Speichermedien defekt (z.B. Festplatten-Crash) oder gestohlen
                  
                    Daten wurden aus versehen gelöscht oder verändert
                  
                    Daten wurden böswillig gelöscht oder verändert
         
                Wiederherstellen alter Zustände / Rollback
                 
                    Daten zu Testzwecken verändert
                 
                    zum Überprüfen zu einem speziellen Zeitpunkt zurück gehen
         
                Erstellen von Kopien
                  
                     zur Archivierung
                  
                     zum Vervielfältigen
    IT- und Medientechnik                    5-20   12.11.2018                      Heiko Weber
Backup-Speicherorte

      je nach Motivation des Backups, sollte ein passender Ort zum Speichern der Backup-
       Daten gewählt werden
      Datenverlust verhindern
         
                über mehrere physisch voneinander getrennte Rechenzentren
         
                oftmals auch in verschiedenen Ländern oder zumindest weit voneinander entfernt
      Archivierung
         
                sicherstellen, dass sie auch langfristig gespeichert werden können
      Wiederherstellen alter Zustände
         
                speichern, wo auch schnell wieder darauf zugegriffen werden kann – evtl. zusätzliche
                Festplatte im System
      zur Vervielfältigung
         
                speichern, wo die Daten auch im Netzwerk von anderen geladen werden können
    IT- und Medientechnik                        5-21   12.11.2018                          Heiko Weber
Backup-Speicherungsarten

      vollständig
         
                die kompletten Daten für ein System werden gespeichert
         
                Vorteil: mit dem Backup können die kompletten Daten hergestellt werden
         
                Nachteil: kann sehr groß sein und sehr lange dauern
      inkrementell
         
                nur die Daten, die sich seit dem letzten Backup verändert haben, werden
                gespeichert
         
                Vorteil: nur ein kleiner Teil der Daten muss im Normalfall gespeichert werden
                und es dauert kürzer als ein kompletter Backup
         
                Nachteil: die Daten können nur komplett hergestellt werden, wenn alle
                vorangegangenen Backups verfügbar sind
      oft wird eine Kombination aus vollständig und zwischendurch ein paar inkrementellen Backups
       verwendet – z.B 1 voll – 5 inkr. - 1 voll - 5 inkr. - ...
    IT- und Medientechnik                      5-22   12.11.2018                          Heiko Weber
Backup-Anwendungsbereiche

      Arbeitsplatz-Backup
         
                spezielle Nutzerdaten werden gesichert
      Datenbank-Backup
         
                Änderungen seit einem speziellen Zeitpunkt werden gesichert
         
                ermöglicht auch einen Rollback zu einem früheren Zustand der Datenbank
      Machine-Image
         
                Kopie aller Daten eines Computers
         
                zum Vervielfältigen eines Systems oder einfach als Sicherung, falls der
                Computer von einem Virus befallen wird oder ähnliches
         
                zum erstellen einer Virtuellen Maschine (VM)

    IT- und Medientechnik                      5-23   12.11.2018                          Heiko Weber
Besondere Herausforderungen

      Langzeitarchivierung
         
                Daten in einem Format speichern, in dem sie auch nach 20, 30, 40, 50 Jahren
                noch verarbeitet werden können
         
                Daten auf einem Speichermedium speichern, welches auch nach 20, 30, 40, 50
                Jahren noch korrekt funktioniert

       zuverlässige Archivierung
         
                sicherstellen, dass Daten im Backup nicht verändert wurden
         
                spezielle Signaturen und Checksummen auf den Daten stellen sicher, dass sie
                seit dem Speichern nicht verändert wurden
         
                Sicherheitsaspekt „Verbindlichkeit“

    IT- und Medientechnik                      5-24   12.11.2018                     Heiko Weber
Virtuelle Maschine

      Eine Virtuelle Maschine (VM) ist die Software-Implementation einer Hardware-
       Computer-Umgebung, in der sich ein Betriebssystem und weitere Programm ausführen
       lassen, so als würden sie direkt die Hardware nutzen, wobei sie aber nur virtuell zur
       Verfügung steht.

                            Virtuelle Maschine 1                       Virtuelle Maschine 2

                                             Virtualisierungs-System

                                              Host-Betriebssystem

                                                   Hardware
    IT- und Medientechnik                          5-25   12.11.2018                          Heiko Weber
Virtuelle Maschine

      Eine Virtuelle Maschine (VM) ist die Software-Implementation einer Hardware-
       Computer-Umgebung, in der sich ein Betriebssystem und weitere Programm ausführen
       lassen, so als würden sie direkt die Hardware nutzen, wobei sie aber nur virtuell zur
       Verfügung steht.

                            Virtuelle Maschine 1                             Virtuelle Maschine 2
                             z.B. mit RedHat Linux                             z.B. mit Windows 7

                                                Virtualisierungs-System                    z.B. VMware

                                                     Host-Betriebssystem                z.B. Windows 2012

                                                                                        z.B. Computer mit
                                                         Hardware
                                                                                          Intel-Prozessor
    IT- und Medientechnik                                5-26   12.11.2018                               Heiko Weber
Wieso Virtuelle Maschinen?

   Kostengründe
    Auf einem realen Computer können viele Virtuelle Maschinen parallel laufen – spart also
    Hardware-Kosten.
   Zum Testen
    Eine Virtuelle Maschine kann als Testumgebung genutzt werden und wenn im Rahmen des
    Tests die Umgebung kaputt geht, wird einfach wieder der Originalzustand neu gestartet.
   Zur Sicherheit
    Wenn das System von einem Angriff befallen wurde, kann es einfach komplett gelöscht
    und eine neue Kopie der Virtuellen Maschine gestartete werden. Der Zugriff auf die reale
    Hardware kann in der Virtuellen Maschine zusätzlich eingeschränkt werden, um es einem
    Angreifer schwerer zu machen, das System zu befallen.

IT- und Medientechnik                    5-27   12.11.2018                          Heiko Weber
Wieso Virtuelle Maschinen?

   Kostengründe
    Auf einem realen Computer können viele Virtuelle Maschinen parallel laufen – spart also
    Hardware-Kosten.
   Zum Testen
    Eine Virtuelle Maschine kann als Testumgebung genutzt werden und wenn im Rahmen des
    Tests die Umgebung kaputt geht, wird einfach wieder der Originalzustand neu gestartet.
   Zur Sicherheit             Datensicherheit
    Wenn das System von einem Angriff befallen wurde, kann es einfach komplett gelöscht
    und eine neue Kopie der Virtuellen Maschine gestartete werden. Der Zugriff auf die reale
    Hardware kann in der Virtuellen Maschine zusätzlich eingeschränkt werden, um es einem
    Angreifer schwerer zu machen, das System zu befallen.

IT- und Medientechnik                    5-28   12.11.2018                          Heiko Weber
Sie können auch lesen