KI & ML - Ein Blick unter die Motorhaube b+m Engineering Digitale Woche 2020

Die Seite wird erstellt Pirmin Steffen

Gesundheit und Fitness

Deutsch

Like
Teilen
Einbetten
Vollbild
Folien
HTML Herunterladen
PDF Herunterladen
Missbrauch

←

WEITER LESEN

→

Transkription von Seiteninhalten

Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten

KI & ML - Ein Blick unter die Motorhaube b+m Engineering Digitale Woche 2020

KI & ML – Ein Blick unter die Motorhaube

b+m Engineering                    Digitale Woche 2020

Agenda

Die drei großen Bereiche des Machine Learning –
dazu (Live) Beispiele, sowie Erläuterung der Funktionsweise

  1. Supervised Learning: Image Classification mit Convolutional Neural Nets
  2. Unsupervised Learning: Anomalieerkennung/Fraud Detection
  3. Reinforcement Learning: Deep Q-Learning

                                                                               2

AI-Durchbrüche auf einigen Anwendungsfeldern

      Image Processing                     Natural Language                      Intelligent Systems                  Games
Convolutional Neural Networks                 Processing                       Reinforcement Learning         Reinforcement Learning
           (CNN)                      Recurrent Neural Networks
                                             (RNN/LSTM)

                                                                               Google Deepmind Runner

                                  Google Assistant: Haircut Appointment Call                                Mögliche Go Positionen: ~10170
                                                                                                            Atome im sichtb. Universum: ~1080

Generative Adverserial Networks
             (GAN)

                                        Facebook: Alice & Bob Experiment

                                                                                    Boston Dynamics Atlas      AlphaGo Zero

                                                                                                                                                3

AI – Definition über Forschungs- bzw. Anwendungsfelder

                                                Spitzenforschung
                                                Forschung in den Kinderschuhen

                                                                                 4

AI - Ansätze
                                                                     Lernende, stochastische
        z.B. klassische                                                     Systeme
      Expertensysteme
                -
          Anwendung              Machine Learning
    explizit ausformulierter                                                       Systeme lernen durch annotierte
             Regeln                                                                  („gelabelte“) Daten/Beispiele

                                  Supervised Learning
                                     Deep Neural Networks (Deep Learning)
                      Symbolic                                                        Systeme lernen durch nicht-
                                  Unsupervised Learning
                         AI                                                           annotierte Daten/Beispiele

                                  Reinforcement Learning                      Systeme (Agenten) lernen
                                                                            selbstständig durch Erkunden
                                                                                   ihrer Umgebung

   AI Landscape – Big Picture
                                                                                                                     5

Agenda

Die drei großen Bereiche des Machine Learning –
dazu (Live) Beispiele, sowie Erläuterung der Funktionsweise

  1. Supervised Learning: Image Classification mit Convolutional Neural Nets
  2. Unsupervised Learning: Anomalieerkennung / Fraud Detection
  3. Reinforcement Learning: Deep Q-Learning

                                                                               6

ANN – Einführung: Mathematische Modellierung eines Neurons

                    Mathematische Grundelemente eines      Synapsen    Zellkörper (Soma) Axon-Aktivität
                          künstlichen Neurons
                                                                   Dendriten

                                                                                                (Bias)

                        Linearer Teil (gewichtete Summen + Bias)    Nicht-linearer Teil (Schwellwertfuntion)

                                                                                                               7

Convolutional Neural Nets – Beispiel: Face Classification
                                                                  Classification Output
                                                                  Woman:          85%
                                                                  Girl:           14,5%
                                                                  Boy:            0,5%
                                                                  Man:            0%

                                                                         Woman
                                                                         Man
                                                                         Girl
                                                                         Boy

Input Layer                                                                      Output-Layer
(Neuron = Pixel)                                                                 (Neuron = Klasse)

                                Visueller Cortex            Klassifikator (hier: 4 Klassen)
                                                                                                     8

Supervised Learning – Training and Validation: Samples

                                         Input                       Target (Output)

      Image Classification Sample                                    „Jaguar E-Type Serie-1 Roadster“

   Semantic Text Analysis Sample                                     Beschwerde, Schadenmeldung; „empört“
         (Topic + Sentiment Analysis)

                                         Adresse: Schlossallee 1
    Data Based Prediction Sample         Liquidität: 50 TEUR         Kreditausfall nach 3 Jahren
                                         Mahnungen: 10
                                         Mtl. Ausgaben: 3 TEUR
                                         …

   Time Series Prediction Sample                                     Passagierzahlen KW7 2018

                                        Passagierzahlen KW1-6 2018

                                                                                                            9

Supervised Learning – Training and Validation: Sample Sets

                                           Sample Set         Data        Training
   Samples                                                 Augmentation
   Min. ca. 8 Tsd.        Preprocessing
   Avg. ca. 80 Tsd.                        Training Set
   Large ca. 1 Mio.
   Very Large ca. 10 Mio.
                                          Validation Set
                                                            Validation

                                                                                     10

Agenda

Die drei großen Bereiche des Machine Learning –
dazu (Live) Beispiele, sowie Erläuterung der Funktionsweise

  1. Supervised Learning: Image Classification mit Convolutional Neural Nets
  2. Unsupervised Learning: Anomalieerkennung / Fraud Detection
  3. Reinforcement Learning: Deep Q-Learning

                                                                               11

Data-Based Unsupervised Learning - Charakteristika

▪ Samples bestehen nur aus dem Input – es gibt keine Labels (Targets)
  (d.h. keine Zielvorgabe/Soll-Output).
▪ Das ML-Modell muss selbstständig Strukturen und Zusammenhänge in den Daten
  erkennen/lernen.
▪ Supervised Learning ist in der Regel genauer und führt direkter zum Ziel, dafür kann
  Unsupervised Learning verwendet werden, wenn das genaue Lernziel a priori noch
  unbekannt ist (Data-Mining), oder das Labeling der Trainingsdaten zu
  teuer/aufwändig.
  Spezialfall Anomalieerkennung: Oftmals sind (fast) nur Daten verfügbar, die den
    Normalfall repräsentieren (Bsp. Server-Logs oder Bank-Transaktionen).
    Das Modell muss also lernen, diesen Datenraum zu „verstehen“.
    Anomalien sind dann (neue/unbekannte) Daten, die diesem Verständnis nicht
    entsprechen.

                                                                                         12

AI/ML Grundlagen – Datenräume und Dimensionen

     Beispiel: Vereinfachter Kreditrating Datensatz          3dim Datenraum (math.: Vektorraum)
     Identifikator + 3 Attribute

                                                                 Gehalt
      KdNr     Bonität   Gehalt    Kosten
                                                                                      125
      123      5000      2000      1500                                         124
                                                                          123
      124      25000     2500      2000                                                     Bonität
      125      30000     3000      2000

 •     Spalten/Tabellenüberschriften sind Dimensionen im Datenraum
 •     Eine Zeile/einzelner Datensatz ist ein Punkt (Vektor) im Datenraum
 •     Der Wert einer Zelle ist ein Wert auf der entsprechenden Achse im Datenraum (Vektor-Komponente)

 In der Praxis entstehen schnell hochdimensionale Datenräume, die daher nicht 1:1 visualisiert werden können

                                                                                                               13

ShowCase: Anomalieerkennung mit Parametric t-SNE und Clustering
Aufgabe:
Erkennung von Anomalien (Betrugsfälle bei Kreditkarten-Transaktionen) mittels Unsupervised Learning -
Das Modell wird ausschließlich mit normalen Tx (d.h. Nicht-Betrugsfällen) trainiert und muss lernen,
diesen Datenraum zu „verstehen“. Dieser ist 28-dimensional und enthält 10000 normale Transaktionen

Modell:
Ein Dimensionsreduzierer (28 -> 3), dem ein neuronales Netz „injiziert“ wurde. Somit können auch neue,
dem Modell nicht bekannte Daten verarbeitet werden.

                                                                                                         14

ShowCase: Anomalieerkennung mit Parametric t-SNE und Clustering
Aufgabe:
Erkennung von Anomalien (Betrugsfälle bei Kreditkarten-Transaktionen) mittels Unsupervised Learning -
Das Modell wird ausschließlich mit normalen Tx (d.h. Nicht-Betrugsfällen) trainiert und muss lernen,
diesen Datenraum zu „verstehen“. Dieser ist 28-dimensional und enthält 10000 normale Transaktionen

Modell:
Ein Dimensionsreduzierer (28 -> 3), dem ein neuronales Netz „injiziert“ wurde. Somit können auch neue,
dem Modell nicht bekannte Daten verarbeitet werden.

Ergebnis:
Der trainierte Normalfall enthält 5 Cluster.
Die Betrugsfälle bilden ein neues Cluster, das
mathematisch separiert werden kann.
Somit ist eine Prognose für zukünftige Transaktionen möglich.
Metriken:
train recall (false negatives critical)                   = 97.13%
validation recall (false negatives critical)              = 96.91%
validation accuracy (true positives/negatives critical)   = 93.10%
validation precision (false positives critical)           = 94.00%
validation f1-score (balanced recall and precision)       = 95.43%
                                                                                                         15

Agenda

Die drei großen Bereiche des Machine Learning –
dazu (Live) Beispiele, sowie Erläuterung der Funktionsweise

  1. Supervised Learning: Image Classification mit Convolutional Neural Nets
  2. Unsupervised Learning: Anomalieerkennung / Fraud Detection
  3. Reinforcement Learning: Deep Q-Learning

                                                                               16

Reinforcement Learning (RL)

                   Agent
    Observation

                                    Action
                    Reward
                  Environment+/-
                     (State)

Observation: (Observable part of) current state
Reward: Measure of „what is good“ or „bad“ (given by design)

                                                               17

Reinforcement Learning (RL)
                                                       Agents Knowledge Representation

                    Agent
                                                     Policy-Function      Value-Function
                                                       (learnable)          (learnable)
    Observation

                                     Action
                     Reward
                              +/-
                                                                       Experience
                                                                        Memory

                                                                Experienced
                  Environment
                                                                 Transitions
                     (State)

Policy: What to do next (learnable)
Value: Rating of a state based on reward prediction (learnable)
Reward: Measure of „what is good“ or „bad“ (given by design)
Experience: Past reaction of environment in a state to an action: reward + next obs.
Env-Model: Agents representation of Environment (optional, given or learnable)
                                                                                           18

AI – Research Benchmarks: Games

Board Games (tief aber nicht visuell)                Real World UseCases

                                            Adobe Stock Datei-Nr.: 162980569 | Urheber: metamorworks

Computer Games (visuell reichhaltig)
                                        •       Autonomes Fahren
                                        •       Robotics
                                        •       Steuerung von Industrieanlagen
                                        •       Intelligente Verkehrsleitung
                                        •       Geschäftsprozessoptimierung
                                        •       Proteinfaltung
                                        •       …
                                                                                                       19

Reinforcement Learning Beispiel – Deep Q-Learning (DQN) mit Atari-Games
                                                               Pixelstrom (Frames)
    • Keine Information über Spielmechanik/Ziel
    • Keine taktischen oder strategischen Informationen
    • Einzige Aufgabe: Reward-Maximierung (langfristig)

               Agent

                                         Pos. Reward = Score                         Environment
                                                                                     (Emulator)
                                          Neg. Reward = Live loss

                                                                                                   20

RL / DQN – Atari Games

Herausforderungen / Setting
• Der Agent bekommt ausschließlich den Pixelstrom (Bildfolge), den Score (positiver Reward)
   sowie das „Life lost“-Ereignis (negativer Reward) als Input.
• Der Agent hat 6 Aktionen zur Verfügung:
   Stehen, Stehen+Feuer, Rechts, Links, Rechts+Feuer, Links+Feuer.
• Der Agent hat also initial keinerlei „Vorstellung“ worum es in dem Spiel überhaupt geht und
   welche Wirkung die Aktionen haben oder welche Regeln gelten. Erst recht besitzt er keinerlei
   taktische oder gar strategische Information.
• Seine Aufgabe besteht schlicht in der Maximierung des (langfristigen) Rewards.
• Dieses Spiel kann nicht gewonnen werden (aber verloren).

                                                                                                  21

RL / DQN – Atari Games

                         22

RL / DQN – Beispiel Atari Games

Der Agent lernt im Lauf der Zeit, etwa in dieser Reihenfolge, selbstständig taktische Elemente des
Spiels - nämlich dass
• die „Feuer“-Aktionen irgendwann später oftmals einen positiven Reward ergeben
   => Dauerfeuer-Strategie
• weiße Pixelstriche, die von oben kommen „tödlich“ sind (Invader Schüsse)
• Invader-Schüssen mit Aktionen wie „Links“ oder „Rechts“ ausgewichen werden kann.
   Somit hat der Agent ein Verständnis erlangt, dass das Raumschiff den Spieler repräsentiert.
• weiße Pixelstriche, die von unten nach oben laufen, durch „Feuer“ Aktionen ausgelöst werden
   und ursächlich für Treffer sind (positiver Reward)
• UfOs (Mutterschiffe) mehr Reward erbringen
• spaltenweises Dauerfeuer Reward-Ketten erzeugen kann
• Barrieren (eigenes und Invader-)Feuer abhalten, aber sukzessive zerstört werden
• mit einem Vorlauf in Abhängigkeit zur Entfernung auf Invader gezielt werden kann
• die Aktion „Feuer“ blockiert ist, solange noch ein eigener Schuss zu sehen ist

                                                                                                     23

RL / DQN – Beispiel Atari Games

Das Spiel enthält strategische Komponenten, die erst dann zu Tage treten, wenn der Agent ein
gewisses Niveau erreicht hat:
• Erreicht ein Invader den „Boden“, ist das komplette Spiel verloren. Dies ist eine zunächst extrem
   seltene aber sehr wichtige Erfahrung
   (-> Prioritized Experience Replay Memory)
• Dies hat zur Folge, dass der Agent eine langfristige Strategie entwickeln muss und nicht einfach
   „spaltenweise“ vorgehen oder „trödeln“ kann.
• Eine Dauerfeuer-Strategie ist nicht optimal, gerade in der Endphase einer Episode (wegen der
   Feuer-Blockierung)
• Die Angriffswellen werden pro Episode immer schneller und immer tiefer – das erfordert
   visuelle Generalisierung

                                                                                                      24

RL/DQN – Policy Function Construction
Input:                                                             Output:
Observation from                                                   Next Best Action
Emulator                                                           Q-Value „distribution“
Pixel stream 120x100
(1 Observation                                                     Action         Q-Value
= 4 consecutive frames)
                                                                   None           0.042
                                        Policy-Function            Fire           0.132
                                               =
                                                                   Left           0.057
 Detection of                            Convolutional
 movement
 direction
                                          Neural Net               Right          0.007
 possible                                    (CNN)
                                                                   Left+Fire      0.164
                                                                   Right+Fire     0.018
                                        Supervised Learning from
                                        Experience Memory +        Agent choses action with
                                        Bellman Equation           highest Q-value

                                                                                              25

RL/DQN – Learning Principle

                              Used for calculation
                              of new target
                                                     26

RL / DQN – Summary

Ziel dieses Atari DQN-Experiments war es nicht einen neuen High Score aufzustellen, sondern:
• Lernen und tiefgreifendes Verständnis erlangen (Mathematik und softwaretechnische Umsetzung)
    ->
    Der Code subsummiert Ansätze diverser wissenschaftlicher Paper der letzten Jahre.
• Schaffung einer Code-Basis für eigene konzeptionelle und technische Verbesserungen des Deep Q-
    Learning. Es wurden eigene Innovationen eingebracht.
     ->
    insb. Maßnahmen zur Verkürzung der Lernphase und Reduktion der benötigten Datenmenge
• Schaffung einer Basis (Code + Know-how) für praxisrelevante UseCases und etwaige
    Forschungsprojekte.
    ->
    Der entstandene Code ist vollständig generisch - d.h. auf ganz andere Domänen als (Atari-)Spiele
    übertragbar.

Wesentliche Herausforderungen bei der Übertragung von RL-Algorithmen auf praxisrelevante UseCases:
• Auswahl des „richtigen“ Algorithmus bzw. seiner Derivate
• Generierung ausreichend großer Datenmengen für das Training
• Design der Reward- (bzw. Utility-)Function

                                                                                                       27

b+m Informatik AG
Rotenhofer Weg 20
24109 Melsdorf
www.bmiag.de

Ihr Ansprechpartner
Thomas Stahl
CTO
Head of AI-Lab

thomas.stahl@bmiag.de

Sie können auch lesen

Schneller, billiger, sicherer: Flexibler reagieren, Kosten senken und Sicherheit verbessern durch agentenloses Job-Scheduling - White Paper im ...

NRW KULTURsekretariat Internationales Besucherprogramm

Eltern-Informationsabende der Oberen Neckarvororte zur Grundschulempfehlung

Home-Schooling - Unser Leitfaden für effektives Lehren und Lernen während einer globalen Pandemie - Bosch Data GmbH

Mögliche Modelle zur Durchführung von Berufssprachkursen unter Pandemiebedingungen - BAMF

Wortarten spielerisch lernen - Eurac

SCHUL- UND KINDERGRUPPEN 2020 - "NATUR IM GARTEN" ERLEBNISWELT 11. APRIL - OKTOBER 2020 - Die Garten Tulln

"Media meet School" Tablet-Modellprojekt - STAUFFENBERG

Publikationsverzeichnis Sabine Streller (Stand 21.11.2020) - Freie Universität Berlin

JAH RES PROGRAMM 2021 - Workshops und Seminare - vft Familientherapie

Englisch und Französisch auf der Primarstufe - Verlängerung des NFP-56-Projekts

PRODUKTFOLDER Ausbildung und Schulung - Ausgabe 2021 - RORACO

Konferenz Lernbereich Schule und Praxis - Dienstag, 19. März 2019

Räume schnell und bequem warm schalten - RAUMHEIZUNG DIREKTHEIZGERÄTE - Nach Bedarf effiziente Wärme mit flexibel einsetzbaren Heizgeräten ...

Beschreibungen der AGs Klasse 7/8 - im 2. Halbjahr 2018/19 in alphabetischer Reihenfolge (Donnerstags und für Klasse 7 und Klasse 8 (außer GCL, KSJ))

Faszinierende Projektionen - in 2D & 3D - Projector - Logando

Morphable Face Models - Erzeugung und Anwendungen

Kluge Kinder lesen Zeitung!

Programm 1. Halbjahr 2019 - www.kulturforum-noerdlingen.de - Kulturforum Nördlingen eV

FUTURE FOUNDERS CHALLENGE - TEILNAHMEBEDINGUNGEN DER

Kurzanleitung IND360 - Mettler Toledo

Gzhottingen august september oktober 3/2018

Austrian Elevation Service Austrian Elevation Service - gis.Point

Die Thüringer Schulcloud - Erste Schritte für Eltern und Schüler - Wiebeckschule

Professionelles Adress- und Kontaktmanagement - für Bürokommunikation, Marketing und Verkauf

Amtsblatt der Freien Hansestadt Bremen - Hochschule Bremen

TP PERSPECTIVES - NEWSFLASH - PWC BLOGS

NATIXIS Pfandbriefbank AG - Präsentation - Marketing Material April 2021 - pfandbrief.market

Ausschreibung für Forschungsvorhaben im Rahmen der Extramuralen Forschung - Vorlaufforschung zu den Themen - DWD

Romantic Renaissance- 13. November 2019 l Station Berlin - Aufbruch zu werteorientierten Organisationen der Zukunft - Handelsblatt Fachmedien

AUDIO- UND VIDEOKONFERENZEN AN DER UDS - DEZERNAT LEHRE UND STUDIUM STABSSTELLE FÜR DIGITALISIERUNG UND NACHHALTIGKEIT BEHÖRDLICHE ...

Vom Produktkatalog bis zur Auslieferung - COMPRA GmbH

Fragen und Antworten zur neuen Qualitätsprüfung für Pflegeheime ab November 2019 - MDS

IDC CIO Briefingreise - Silicon Valley, 13 - 19. September 2020 - Angebot

ENDET DAS BÜRGERBÜRO WIE DIE BANKFILIALE? - Netzwerk ...

Lebensstil und Demenz - Prof. Harald Walach

Kindheit in Sachsen - Deutscher Kinderschutzbund ...

KONGRESS GYNÄKOLOGISCHE ONKOLOGIE - VORPROGRAMM 2019 - DGGG

BILDUNGSPLATTFORM INNSBRUCK - Navigation durch die Bildungslandschaft

Allgemeine Gescha ftsbedingungen (AGB) der More 4 Fun GmbH fu r Segway-Touren, Segway-Parcours und die Vermietung von Segways und anderen ...

Einführung in die Thüringer Schulcloud - Staatliches Gymnasium und Seminarschule "Ernst Abbe" Eisenach - Ernst-Abbe ...

Google Analytics Mehr Erkenntnisse mit benutzerdefinierten Segmenten - Metrika

DIGITALE SEQUENZ-INFORMATION (DSI) - NEFO-FAKTENBLATT ZUR VORBEREITUNG AUF SBSTTA-22 IM JULI 2018

COVID & Sie Ein EBMT Webinar für Patienten und Angehörige

Warum Ihre Bibliothek auf Ex Libris Alma wechseln sollte - Eine Ex Libris Alma Lösungsbeschreibung

GESUNDHEIT 65+: STUDIE ZUR GESUNDHEIT ÄLTERER MENSCHEN IN DEUTSCHLAND - FORTBILDUNG FÜR DEN ÖFFENTLICHEN GESUNDHEITSDIENST 2021 - BFR

Enterprise Service Management - Tools and Services 2021 2021 - ISG

Kill the Messenger - GNU/Linux.ch

Vasco Traveler 7" BEDIENUNGSANLEITUNG GERÄT UND TECHNISCHE DATEN DEUTSCH - Vasco Electronics

UBER TECHNOLOGIES BERICHT ZUM BÖRSENGANG - XTB