Machine Learning im Maschinen- und Anlagenbau - Quick Guide Software und Digitalisierung - VDMA

Die Seite wird erstellt Fynn Appel
 
WEITER LESEN
Machine Learning im Maschinen- und Anlagenbau - Quick Guide Software und Digitalisierung - VDMA
Software und Digitalisierung

Quick Guide
Machine Learning
im Maschinen- und Anlagenbau
Machine Learning im Maschinen- und Anlagenbau - Quick Guide Software und Digitalisierung - VDMA
Software und Digitalisierung

                               Quick Guide
                               Machine Learning im
                               Maschinen- und Anlagenbau

                               © 2018
                               VDMA Software und Digitalisierung
                               Lyoner Straße 18
                               60528 Frankfurt am Main
                               sud.vdma.org

                               Alle Rechte vorbehalten, insbesondere das Recht der Vervielfältigung und Verbreitung sowie der Über-
                               setzung. Kein Teil des Werkes darf in irgendeiner Form (Druck, Fotokopie, Mikrofilm oder
                               anderes Verfahren) ohne schriftliche Genehmigung des VDMA reproduziert oder unter Verwendung
                               elektronischer Systeme gespeichert, verarbeitet, vervielfältigt oder verbreitet werden.
Machine Learning im Maschinen- und Anlagenbau - Quick Guide Software und Digitalisierung - VDMA
2   INHALT

             Inhalt

                      Vorwort                                              3

                      1.    Was ist Machine Learning?                       4

                      2.    Nutzen, Chancen und Risiken im Maschinenbau    8

                      3.    Anwendungsfälle im Maschinen- und Anlagenbau   10

                      4.    Daten als Rohstoff                             15

                      5.    Datengetriebene Modellierung                   17

                      6.    Technische Umsetzung der Anwendungsfälle       20

                      7.    Build or Buy                                   23

                      8.    Voraussetzungen                                27

                      9.    Ausblick                                       29

                      10.   Mitarbeitende im Arbeitskreis                  30

                      11.   Quellen und Verweise                           32
Machine Learning im Maschinen- und Anlagenbau - Quick Guide Software und Digitalisierung - VDMA
VORWORT         3

Vorwort

          Die Innovationstreiber im Maschinenbau               Machine Learning sorgt dafür, dass Software
                                                               und Informatik immer stärker zum maßgebli-
          Das Thema Machine Learning oder auch                 chen Innovationstreiber im Maschinenbau
          künstliche Intelligenz ist aktuell in aller Munde.   werden.
          Die Technologie und deren Tools werden ständig
          weiterentwickelt und springen aus der Konsu-         Nachfolgender Guick Guide wurde vom Exper-
          merwelt kommend nun über in den industriellen        tenkreis Machine Learning des Fachverbandes
          Sektor und damit auch in den Maschinen- und          Software und Digitalisierung verfasst und rich-
          Anlagenbau.                                          tet sich vor allem an das Management von
                                                               Maschinebauunternehmen, die sich mit dem
          Viele Jahre oder sogar Jahrzehnte war diese Dis-     Gedanken tragen das Thema „Machine
          ziplin nur Akademikern zugänglich und hat sich       Learning“ für ihr Unternehmen zu beleuchten
          in einigen wenigen Bereichen etabliert. Die sin-     und zu bewerten. Er gibt Hinweise zu den Chan-
          kenden Preise für Rechenleistung und Speicher        cen, Herausforderungen und mögliche Lösun-
          sorgten in den letzten zehn Jahren für rasante       gen. Vor allem aber soll dieser Quick Guide
          Entwicklung von Cloud- und Big Data-Technolo-        helfen sich dem Thema mit den richtigen Fragen
          gien. Diese zwei Faktoren führten schnell zur        zu nähern und daraus die eigenen Schlüsse zie-
          Entwicklung von verschiedenen Software-Tech-         hen zu können. Aufgrund des dynamischen Um-
          nologien, die den Bereich Künstliche Intelligenz     feldes wird dieser Quick Guide die Thematik
          nicht unberührt ließen.                              nicht erschöpfend und allumfassend behandeln
                                                               können. Die Mitarbeiter des Expertenkreises ste-
          Machine Learning (deutsch: maschinelles              hen für das Thema Machine Learning im VDMA
          Lernen) ist ein wichtiger Bereich der Computer-      zur Verfügung und werden diese anspruchsvolle
          wissenschaft und Bestandteil künstlicher             Materie weiterhin begleiten.
          Intelligenz. Computerprogramme, die auf
          Machine Learning basieren, können mit Hilfe
          von Algorithmen eigenständig Lösungen für
          neue und unbekannte Probleme finden. Das             Prof. Claus Oetter
          künstliche System „erkennt Muster“ und Gesetz-       Stellv. Geschäftsführer
          mäßigkeiten in den Lerndaten, die es zugespielt
          bekommt. Tools, die bereits auf dem Markt etab-      VDMA
          liert sind, helfen dabei, die Algorithmen zu fin-    Software und Digitalisierung
          den. Neue Frameworks und Plattformen unter-
          stützen die breite Anwendung dieser bisher eher
          „akademischen“ Themen im Projektalltag.
          Gerade für den Maschinenbau bringt diese
          Technologie viele neue und spannende Ansätze.
Machine Learning im Maschinen- und Anlagenbau - Quick Guide Software und Digitalisierung - VDMA
4   QUICK GUIDE „MACHINE LEARNING“

                   1.      Was ist Machine Learning?

                               Die Themen „Machine Learning“ (ML) und              Algorithmen, die aus Daten lernen und Vorher-
                               „Künstliche Intelligenz“ (KI) sind omnipräsent —    sagen treffen, welche mit einer gewissen Wahr-
                               in den Medien, in Unternehmen und auch im           scheinlichkeit eintreten. Solche Algorithmen
                               privaten Bereich. Denn die Digitalisierung verän-   folgen keinen starren, von Menschen definierten
                               dert alle gesellschaftlichen Bereiche dramatisch,   Programm- und Regelvorgaben — sie treffen viel-
                               so auch die produzierende Wirtschaft. Insbeson-     mehr datengestützte Vorhersagen, indem sie
                               dere der deutsche Maschinenbau wird sich den        auf Basis von Beispielen Wissen generieren —
                                                                                   also lernen.
                               Herausforderungen stellen müssen, wenn er
                               seine in vielen Bereichen international beste-      Bereits 1959 definierte der US-amerikanische
                               hende Produktführerschaft behalten und aus-         Informatiker und Computerpionier Arthur
                               bauen will.                                         Samuel ML als ein Studiengebiet, welches
                                                                                   „Computern die Fähigkeit gibt zu lernen, ohne
                               Doch was ist ML? Im wahrsten Sinne des Wortes       dazu vorher explizit programmiert worden zu
                               bedeutet es maschinelles Lernen. Maschinen, im      sein“. Es kommt, wie das Data Mining, aus der
                               Sinne von Computern, erhalten die Fähigkeit,        Statistik. Die Unterschiede: Die Statistik defi-
                               selbstständig zu lernen. ML befasst sich mit        niert, was passiert ist; das Data Mining erklärt,
                                                                                   warum etwas geschehen ist; das ML bestimmt,
                                                                                   was passieren wird und gibt vor, wie bestimmte
                                                                                   Situationen optimiert oder vermieden werden
                                                 Künstliche                        können.
                                                 Intelligenz

                                                                                   ML ist eine eigenständige Disziplin, die häufig
                                                                                   mit KI (Künstliche Intelligenz) verwechselt wird;
                                               Maschinelles                        der Begriff KI stammt aus dem Jahre 1956 und
                                                 Lernen
                                                                                   ist damit nur geringfügig älter. Er bezeichnet
                                                                                   den Versuch, eine menschenähnliche Intelligenz
                                                                                   nachzubilden. Das ML kann auf diesem Weg ein
                                                                                   erster, erfolgreicher Schritt sein, weshalb ML
                                                                                   gerne als Teilbereich der KI verstanden wird.
                                               Neuronale Netze
                                                    Deep                           Doch nicht nur die Ziele dieser beiden Diszipli-
                                                  Learning                         nen sind von unterschiedlicher Größe — es gibt
                                                                                   einen weitaus wichtigeren Unterschied: ML ist
                                                                                   schon da, ist bereits unter uns; wann wir das von
                                                                                   der Künstlichen Intelligenz behaupten können,
                                                                                   steht dagegen in den Sternen.
                        Abbildung 1:
                        Abgrenzung KI — ML — NN — DL (Quelle: Softing GmbH)
Machine Learning im Maschinen- und Anlagenbau - Quick Guide Software und Digitalisierung - VDMA
QUICK GUIDE „MACHINE LEARNING“            5

Ein weiterer Begriff wird häufig im Zusammen-       So wird das Thema an die IT oder die Produkt-
hang mit Machine Learning aufgeführt, aber          entwicklung weitergegeben — wie so oft bei
meist missverständlich verwendet: „Big Data“.       innovativen Technologien. Dadurch reduziert
Big Data steht für das Verarbeiten von großen,      sich der Fokus häufig auf die Technik, die be-
heterogenen Datenmengen, deren Geschwin-            triebswirtschaftlichen Mehrwerte verlieren an
digkeiten und Datentypen — mit oder ohne ML.        Bedeutung.

Wir befassen uns in diesem Dokument nicht mit       ML wird bereits eingesetzt, um kritische Ent-
KI oder Big Data, wir konzentrieren uns auf das     scheidungen in der medizinischen Diagnostik,
Fachgebiet des ML.                                  auf den Finanzmärkten oder in der Energiewirt-
                                                    schaft zu unterstützen oder gar automatisch zu
Welche Rolle kann ML für den Maschinenbau in        treffen. Auch unser Alltag wird durch ML ge-
der Produktführerschaft spielen? Behalt und         prägt; denken wir nur an all die Produktemp-
Ausbau in vielen Bereichen vorausgesetzt.           fehlung, die uns täglich erreichen. Sie basieren
                                                    auf unseren vorigen Einkäufen, auf unserem
Die Möglichkeiten sind vielfältig, und ein Groß-    Suchverhalten und den Begriffen, die wir in die
teil der Anwendungen ist heute noch nicht           Tastatur unserer Endgeräte eingeben. Zuneh-
absehbar. Dennoch gibt es bereits heute viele       mend findet ML aber auch Einzug in den Maschi-
naheliegende praktische Anwendungsgebiete           nen- und Anlagenbau und ermöglicht dort neue
und Lösungen. Sie ermöglichen den Unterneh-         Anwendungsfälle, auf die wir in Kapitel 3 einge-
men im Maschinenbau einerseits einen schnel-        hen werden.
len Einstieg, andererseits aber auch einen weite-
ren Ausbau beim Thema ML. Ansätze dafür lie-        Warum gewinnt das Thema ML gerade jetzt und
gen sowohl in der Optimierung der Prozesse als      in diesem Maße an Bedeutung? Die Antwort ist
auch im Erhalt und in der Erweiterung der Pro-      so einfach wie komplex: Was gestern noch nicht
duktinnovationsführerschaft.                        möglich war, ist heute Alltag. Hohe Rechenleis-
                                                    tung — in diesem Maß vor zehn Jahren noch au-
Einige Kernthemen sorgen dabei für eine             ßerhalb unseres Vorstellungsvermögens — ist zu
gewisse Verunsicherung: Dazu zählt das erfor-       einem bezahlbaren Gut geworden. Kombiniert
derliche Wissen, wie die relevanten Algorithmen     man diese Rechenleistung mit großen Daten-
ausgewählt, entwickelt und konfiguriert             mengen mit Lernpotenzial, lassen sich Algorith-
werden, wie die Daten beschafft und bereitge-       men kontinuierlich weiterentwickeln. All das
stellt werden und nicht zuletzt die zwingend        sind weitere wichtige Faktoren des rasanten
notwendige Erfahrung mit diesen Faktoren.           Fortschritts.
Auch unklare rechtliche Aspekte und Implikatio-
nen halten Unternehmen davon ab, in diesen          Dieser Quick Guide richtet sich an Entscheider,
Bereich geschäftsrelevant zu investieren. Vielen    die mehr über ML erfahren möchten. Zuerst wird
Maschinenbauern fällt es schon schwer, ein          erklärt, was wir unter ML verstehen und welche
fachliches Anwendungsfeld oder ein Projekt zu       Chancen und Risiken die Technologie für den
erkunden und zu definieren.                         Maschinenbau mit sich bringt. Anschließend
                                                    werden einige typische Anwendungsfälle vorge-
                                                    stellt.
Machine Learning im Maschinen- und Anlagenbau - Quick Guide Software und Digitalisierung - VDMA
6   QUICK GUIDE „MACHINE LEARNING“

                             Wir erläutern die Bedeutung der Daten für ML,        Dazu Aber wie funktioniert das Lernen aus
                             beschreiben die grundlegende Vorgehensweise          Daten und das Anwenden des Gelernten konk-
                             bei ML-Projekten und erklären, wie der Einstieg      ret? Dazu klären wir vorab einige Begriffe. Ein
                             in das Thema gelingt. Ein Ausblick auf die künf-     Grundbegriff beim Lernen ist das Modell. Das
                             tige Entwicklung rundet den Guide ab.                Modell enthält das gelernte Wissen und wird
                                                                                  verwendet, um Vorhersagen zu treffen. Modelle
                             1.1   Lernen aus Daten                               sind in der Regel nur für eine Aufgabe ausgelegt.
                                                                                  Beispiel: Anhand von Sensordaten (Eingabe)
                             ML ermöglicht technischen Systemen, was              wird die Wahrscheinlichkeit einer Störung vor-
                             bisher natürlichen Lebewesen vorbehalten war:        hergesagt (Ausgabe). Ein weiterer wichtiger
                             Aus Erfahrungen lernen! ML-Algorithmen erler-        Begriff ist das Modell-Training. Beim Modell-
                             nen dazu Muster und Strukturen in Beispielda-        Training wird das Modell mit Daten angelernt.
                             ten, die von Menschen bereitgestellt werden.         Üblicherweise werden Modelle einmal trainiert
                             Dieses neue Wissen wenden sie im Anschluss           und anschließend für Vorhersagen verwendet.
                             auf neue, unbekannte Fälle an. So lernen ML-         ML-Algorithmen lassen sich nach der Art unter-
                             Algorithmen zum Beispiel anhand einer Vielzahl       schieden, wie sie aus Daten lernen bzw. wie das
                             von Musterbildern, wie ein Gut-Teil auf einem        Modell trainiert wird. Man unterscheidet dabei
                             Kamerabild aussieht. Diese selbst vorgegebenen       in drei Kategorien:
                             Darstellungsvarianten wendet das System in der
                             Folge an, um Schlecht-Teile zu erkennen und            überwachtes Lernen (supervised learning)
                             auszusortieren. Die Maschine lernt auf diese           unüberwachtes Lernen
                             Weise, schlecht von gut zu unterscheiden.               (unsupervised learning)
                                                                                    bestärkendes Lernen
                                                                                     (reinforcement learning)

                                                                                                       Klassifizierung

                                                                       Überwachtes
                                                                         Lernen

                                                                                                          Regression

                                      Maschinelles                      Bestärkendes
                                                                                                      Belohnungsprinzipien
                                        Lernen                             Lernen

                                                                                                      Zugehörigkeitsbildung

                                                                      Unüberwachtes
                                                                         Lernen

                                                                                                        Kategorisierung

                               Abbildung 2: ML-Typen
Machine Learning im Maschinen- und Anlagenbau - Quick Guide Software und Digitalisierung - VDMA
QUICK GUIDE „MACHINE LEARNING“           7

1.2   Überwachtes Lernen                            Bei einer anderen Herangehensweise an das
                                                    unüberwachte Lernen werden die Daten auto-
Beim überwachten Lernen wird das Modell mit         matisch in Gruppen eingeteilt. Solche Gruppen
Beispielen aus Eingabewerten und Ausgabewer-        können zum Beispiel sein: „Maschine produ-
ten trainiert. Für das Beispiel Störungsanalyse     ziert“, „Maschine in Störung“, „Maschine in
würde man beispielhafte Sensordaten zusam-          Stillstand“.
men mit Information über anstehende Störun-
gen in das System einspeisen. Das Modell lernt      Der Vorteil des unüberwachten Lernens: Die
dann den Zusammenhang zwischen Sensorda-            Beispieldaten lassen sich mit wenig Aufwand
ten und Störung. Man nennt diesen Lernvorgang       erstellen. Der Nachteil: Einige Anwendungsfälle
überwacht, da für jede Eingabe die richtige Aus-    deckt das unüberwachte Lernen nicht ab.
gabe bekannt ist und man das Modell bei
falschen Vorhersagen korrigieren kann.              1.4   Bestärkendes Lernen

Um das Modell trainieren zu können ist eine         Beim bestärkenden Lernen werden Modelle
große Menge an beispielhaften Ein- und Ausga-       durch Belohnung und Bestrafung trainiert. Jede
bedaten erforderlich. Diese Beispieldaten zu        Lösung oder jeder Teilschritt einer Lösung wird
erstellen kann sehr teuer oder schwierig sein, da   dabei typischerweise mit einer Punktzahl bewer-
meist Expertenwissen gelernt werden soll. Wich-     tet. Belohnung wird durch den Anstieg der
tig ist auch die Qualität der Beispieldaten. Wird   Punktzahl ausgedrückt, Bestrafung durch deren
das Modell mit falschen Beispieldaten gefüttert,    Verringerung. Das Ziel ist die maximal mögliche
lernt es auch fehlerhafte Zusammenhänge.            Punktzahl. Während des

1.3   Unüberwachtes Lernen                          Trainings werden durch Versuch und Irrtum
                                                    immer neue Lösungsvorschläge erzeugt und
Beim unüberwachten Lernen lernt das System          zunehmend verfeinert, um die Punktzahl stetig
ebenfalls aus Beispieldaten; allerdings enthalten   zu verbessern. Die Herausforderungen beim
die Beispieldaten keine bekannten Ausgabeda-        bestärkenden Lernen: Es müssen geeignete
ten. Stattdessen wird anhand der Beispiele          Belohnungsmechanismus gefunden werden.
gelernt, wie „typische“ Daten oder Datengrup-       Kurzfristige Vorteile der Lösungen sind gegen
pen aussehen. Beim Beispiel der Sensordaten         langfristige abzuwägen. Man nennt diese Form
würde das Modell lernen, wie typische Sensorda-     des Lernens bestärkend, da sie an das menschli-
ten der Maschine aussehen. Bei Abweichungen         che Lernen durch Lob und Tadel erinnert.
von diesen Daten würde es auf Fehlerzustände
schließen.
Machine Learning im Maschinen- und Anlagenbau - Quick Guide Software und Digitalisierung - VDMA
8   QUICK GUIDE „MACHINE LEARNING“

                     2.      Nutzen, Chancen und Risiken im Maschinenbau

                             In vielen Maschinenbauunternehmen ist man           Die Eigenschaften lassen sich nicht immer sinn-
                             sich noch nicht sicher, ob ML ein geschäfts-rele-   voll abgrenzen und sollten deshalb im konkreten
                             vantes Thema ist. Die zunehmende                    Anwendungsszenario definiert werden.
                             Austauschbarkeit einzelner Maschinen wird in
                             vielen Bereichen dazu führen, dass künftig nicht       „0-Fehler-Qualität bei größtmöglicher
                             mehr nur die Maschine selbst, sondern vor allem        Termintreue“
                             ergänzende Leistungen verkauft werden. Damit
                             ändert sich die Geschäftsgrundlage für den          Der jeweilige betriebswirtschaftliche Nutzen
                             Maschinenbau gravierend. Dies erklärt, warum        sollte sich in einem konkreten Szenario klar
                             das Thema ML im Management und in vielen            beschreiben und quantifizieren lassen. Ein
                             Fachbereichen von Maschinenbauunternehmen           Beispiel hierfür wäre ein automatisierter
                             höchst präsent ist.                                 Zahlungseingang mit Rechnungsabgleich mit
                                                                                 einem Einsparpotenzial im zweistelligen
                             ML bietet dem deutschen Maschinen- und Anla-        Prozent-Bereich. Ein weiterer Bereich: die Preis-
                             genbau ungeahnte Möglichkeiten: Bestehende          anfrage zu komplexen Maschinenkonfiguratio-
                             Geschäfts- und Produktionsprozesse lassen sich      nen.
                             optimieren, die Maschinen reifen in der Folge zu
                             intelligenten und beinahe autark arbeitenden        Mit einer umfangreichen, ML-basierten Automa-
                             Prozessdienstleistern. Wichtige Teilaspekte         tisierung würden Angebotsanfragen sehr viel
                             werden einer strukturierten Nutzen-Chancen-         schneller beantwortet, die Zahl der Vertragsab-
                             Risiko-Analyse unterzogen und mittels               schlüsse würde entsprechend steigen. Szenarien
                             Beispielen in einen betriebswirtschaftlichen        dieser Art entlang der Kernprozesse eines Unter-
                             Kontext gesetzt. Das Ziel ist eine erste            nehmens sind schon heute als Bestandteil von
                             Hilfestellung zur betriebswirtschaftlichen          ERP, Marketing oder Vertriebssystem verfügbar
                             Einschätzung und Relevanz von ML für den            bzw. einsetzbar.
                             Leser, um daraus eine eigene Herangehensweise
                             und Strategiedefinition ableiten zu können.            „Machine Learning stärkt die Kosten- und
                                                                                    Produktinnovationsführerschaft“
                             Grundsätzlich können ML-Nutzenpotenziale im
                             Kontext der Produkteigenschaften sowie in der       Nicht nur der Nutzen in Kerngeschäftsprozes-
                             Optimierung interner Prozesse angesiedelt           sen, auch der ML-Nutzen als Bestandteil der
                             werden. Das gilt für die Zahlungseingangs-          eigenen Produkte mit Blick auf die Produktfüh-
                             verarbeitung und Angebotserstellung ebenso          rerschaft ist ein weiteres Anwendungsfeld. Hier
                             wie für die Produktionsplanung.                     lassen sich zwei Nutzenpotenziale adressieren:
                                                                                 Für den Kunden kann einerseits ein direkter
                             Auch im produktnahen Bereich unterscheiden          Mehrwert beim Betreiben der Maschinen ent-
                             sich die ML-Eigenschaften: einerseits im Produkt    stehen, andererseits können auf Basis der
                             selbst, beispielsweise durch Expertensysteme        verfügbaren Maschinendaten Mehrwertdienste
                             zur Unterstützung des Maschinenbedieners,           geschaffen werden.
                             andererseits im maschinenbezogenen Prozess-
                             umfeld wie Wartungs- oder zusätzliche Mehr-
                             wertdienste.
Machine Learning im Maschinen- und Anlagenbau - Quick Guide Software und Digitalisierung - VDMA
QUICK GUIDE „MACHINE LEARNING“            9

      Ein Beispiel für die Verbesserung des eigenen           „Vermeidung von zu großen oder zu
      Produktes mit ML ist die sogenannte voraus-             komplexen Projekten beim Einstieg“
      schauende Wartung (predictive maintenance).
      Auf Grundlage der vielen gewonnenen                  Doch wie gelingt der Einstieg in dieses Themen-
      Informationen lassen sich Probleme an einer          feld? Studien zeigen, dass viele Unternehmen
      Maschine frühzeitig erkennen und geplant             die ersten Projekte zu groß und zu komplex
      beheben — bevor die Produktion beim Kunden           gestalten — viele relevante Aspekte werden
      unerwartet und meist unpassend unterbrochen          dadurch nicht erfolgreich adressiert. Folgende
      werden muss. Dadurch kann der Kunde des              Fragen sollten vor Projektbeginn beantwortet
      Maschinenbauers die Instandhaltung planen            sein: Welches Anwendungsszenario bietet sich
      und effizient in die internen Abläufe integrieren.   für mein Unternehmen zum Einstieg an? Wie
      Wird die Sensorik für vorausschauende Wartung        kann das notwendige Wissen im eigenen Unter-
      in Verbindung mit Software eingesetzt, lässt         nehmen sukzessive aufgebaut werden?
      sich die Maschineneffizienz im Sinne eines Fein-
      tunings zusätzlich optimieren.                       Welche ML-Techniken und Algorithmen sind für
                                                           mich relevant? Wie lassen sich
      Ein weiteres ML-Feld: Die Maschinenbedienung         Unternehmensrisiken durch die Ergebnisse der
      wird durch Expertensysteme vereinfacht. In der       ML-Algorithmen vermeiden — oder kann man
      Folge reduzieren sich Einarbeitungszeit, Schu-       ihnen wenigstens frühzeitig entgegensteuern?
      lungsaufwand und Rüstzeiten, gleichzeitig steigt     Auch die Verfügbarkeit der notwendigen Daten
      die Effizienz. ML ermöglicht damit sowohl dem        ist kritisch und spielt eine wichtige Rolle.
      Maschinenbauer als auch dessen Kunden, ihre
      Prozesse zu optimieren.                              Noch eine wichtige Frage ist zu klären: Wer ist
                                                           verantwortlich, wenn Menschen Entscheidun-
„Schulungs- und Maschinenrüstzeiten reduzieren“            gen an Maschinen delegieren. Wenn beispiels-
                                                           weise das Modell formal richtig ist, das Ergebnis
      Zugunsten einer Differenzierung und Führer-          durch das Lernen falscher oder ungeeigneter
      schaft der eigenen Produkte sind weitere poten-      Daten aber falsch oder negativ.
      zielle Kundennutzen im Anwendungsfall detail-
      liert zu evaluieren und gemeinsam mit dem            Soll ein erfolgreiches ML-Projekt aufgesetzt
      Kunden zu entwickeln. Für die Mehrwertdienste        werden, müssen diese Fragen zuvor strukturiert
      würden geeignete ML-Algorithmen nicht beim           und umfassend mit Experten untersucht und
      Kunden zum Einsatz kommen, sondern beim              definiert werden, besonders mit Blick auf Rele-
      Maschinenbauer. Auf Basis dieser Algorithmen         vanz, Risiken und Investitionsbedarfe für das
      könnten neue Kundenservices entwickelt               eigene Unternehmen. Gleichzeitig darf man sich
      werden, aber auch neue Preismodelle für die          nicht vom Umfang der Themen erschlagen
      Nutzung der Maschinen. Letztendlich wird ML zu       lassen und dadurch den Startschuss verpassen.
      einer 0-Fehler-Qualität bei größtmöglicher           Wie immer gilt: Es ist wichtig, anzufangen.
      Termintreue führen. Aber auch bei einer
      möglichen Dokumentationspflicht kann die
      gewonnene Datenlage effizient unterstützen.
10 QUICK GUIDE „MACHINE LEARNING“

                    3.      Anwendungsfälle im Maschinen- und Anlagenbau

                            In diesem Kapitel werden einige typische ML-         Beim bildgebenden Verfahren können in Kombi-
                            Anwendungsfälle im Maschinenbau vorgestellt.         nation mit der menschenähnlichen Bildverarbei-
                            Jeder Anwendungsfall wird kurz beschrieben,          tung alle Arten von Sensoren eingesetzt werden:
                            eine mögliche Umsetzungsstrategie erläutert.         2D, 3D, Ultraschall, Röntgen und Shape from
                            Anschließend werden Nutzen, benötigte Fähig-         Shading. Die ML-Anwendung stützt sich dabei
                            keiten sowie Aufwand, Chancen und                    auf eine Trainingsphase mit Gut-Teilen; bei
                                                                                 herkömmlichen Bildverarbeitungsanwendungen
                            Risiken aufgeführt. Auf die technische Umset-        dagegen sind meist umfassende Fehlerkataloge
                            zung dieser Anwendungsfälle wird genauer in          zu berücksichtigen. Mit ML ist somit das
                            Kapitel 6 eingegangen.                               gewünschte Ergebnis selbst das Maß, und nicht
                                                                                 die Abweichung davon.
                            3.1 Menschenähnliche Bildverarbeitung
                                („Human-like Machine Vision“)                    Die prozesssichere Lösung für solche Aufgaben-
                                                                                 stellungen sind ML-basierte Bildverarbeitungs-
                            Oberflächen mit Texturen zu beurteilen ist eine      systeme, die speziell für das industrielle Analy-
                            der Aufgaben, bei denen klassische Bildverarbei-     sieren von Bildern entwickelt und optimiert
                            tungs-Systeme an ihre Grenzen stoßen. Das            werden.
                            menschliche Auge dagegen kann Texturen,
                            Muster, Objekte und Strukturen erkennen und          Der Einsatz solcher Systeme auf Basis von ML
                            bereits nach kurzer Anlernzeit zuverlässig visuell   erschließt weitere Anwendungsmöglichkeiten
                            beurteilen und klassifizieren. Anhand von            von prozesssicherer, automatisierter Inspektion
                            wenigen Beispielen lernt der Mensch, zulässige       mit sehr hoher Erkennungsleistung. Wo
                            Variationen von Fehlern zu unterscheiden —           klassische Vision-Systeme an ihre Grenzen
                            selbst bei Naturprodukten, bei denen keine zwei      stoßen und die Beurteilung durch den Menschen
                            Teile gleich sind.                                   trotz aller Einschränkungen und Risiken die
                                                                                 beste Lösung ist, bietet die „menschenähnliche
                                                                                 Bildverarbeitung“, basierend auf ML-
                                                                                 Algorithmen, aktuell eine Lösung auf dem Stand
                                                                                 der Technik. Weiterhin sind neue Produkte ohne
                                                                                 großen Aufwand lernbar, und selbst neue, unbe-
                                                                                 kannte Merkmale werden ohne aufwendige
                                                                                 Fehlerbibliotheken erkannt. Dies resultiert in
                                                                                 deutlich reduzierte Entwicklungs- und
                                                                                 Produkteinführungszeiten.

                                                                                 Neben der Erfahrung bei der herkömmlichen
                                                                                 Bildverarbeitung und der Erfahrung bei der
                                                                                 Auslegung optischer Kamerasysteme bedarf es
                                                                                 für die Modellierung keiner weiteren Software-
                                                                                 entwicklung und keinem Verständnis der
                                                                                 Algorithmen.
                                    Filtersieb
                                    (Metall, 2D)       Kleberraupe,
                                                       (Dichtungen,
                                                       Kleberraupen, 3D)

                            Abbildung 3: Labor (Quelle: i-mation GmbH)
QUICK GUIDE „MACHINE LEARNING“ 11

ML hat trotz aller Möglichkeiten Grenzen und ist   Gleichzeitig beeinflussen weitere Parameter das
nicht in jedem Fall das Mittel der Wahl.           Druckergebnis in unbekannter Form:
                                                   Verbrauchsstoffe, physikalische Einflussgrößen
Limitierende Faktoren können insbesondere          und der Maschinenzustand.
sein:

 Zugänglichkeit der erforderlichen
  Trainingsdaten
 Verfügbarkeit und Bestimmungsgrad von
  Expertenfeedback bei der Ergebnisbewertung
 Bildauflösung und die Größe der zu übermit-
  telnden bzw. zu speichernden Dateien
 Anfälligkeit gegen gezielte Manipulation oder     Abbildung 4:
  Sabotage des ML-Systems.                          Einstellprozess (Quelle: Fraunhofer IGCV)

In einigen Fällen ist auch die Kombination mit
herkömmlicher Bildverarbeitung notwendig. Um
das Potenzial von ML-Systemen gewinnbringend
einzusetzen, braucht es interdisziplinäres Know-
how, ein umfassendes Portfolio an Bildverarbei-
tungslösungen und ein sorgfältiges Abwägen
von Chancen und Risiken.

3.2   Adaptive Regelung zur Prozessoptimierung
                                                     Abbildung 5:
                                                     Hochlauf (geregelt und ungeregelt)
In diesem Anwendungsfall wird das Optimieren         (Quelle: Fraunhofer IGCV)
des Hochlaufs einer Rollenoffset-Druckmaschine
erläutert — stellvertretend für die Optimierung
von komplexen physikalischen Maschinenpro-         Solche technischen Systeme, deren Verhalten
zessen. Der Hochlauf ist aufgrund zahlreicher      von zahlreichen Größen und unbekannten
Parameter und Einflussgrößen ein komplexer         Zusammenhängen beeinflusst wird, können nur
Prozess. Wichtig ist hierbei vor allem das Fein-   schwer mit physikalischen Formeln modelliert
justieren der optischen Volltondichte, die vor     werden — sie entziehen sich dadurch häufig der
jedem Produktionsstart manuell parametriert        Prozessoptimierung. In diesem Fall können
werden muss. Wie sich das Ändern der Parame-       maschinelle Lernverfahren hilfreich sein, die das
ter¬ auswirkt, kann jedoch erst nach einem voll-   Systemverhalten erlernen und anschließend
ständigen Durchlauf der Druckmaschine beur-        Vorhersagen über den Prozess treffen können —
teilt werden; deshalb ist dieser Vorgang mit       das wäre die sogenannte adaptive Regelung.
einer Totzeit verbunden, während der möglich-
erweise Ausschussqualität produziert wird.
12 QUICK GUIDE „MACHINE LEARNING“

                            Die Totzeit wird dabei mit einer modellbasierten    Eine große Anzahl von Maschinenmodellen mit
                            adaptiven Regelung überbrückt. Der Zusammen-        Optionen sowie Abhängigkeiten zwischen den
                            hang zwischen Sensordaten und der Qualität          Optionen führt für Hersteller und Kunden
                            der Volltondichte wird aus historischen Daten       schnell zu einer unübersichtlichen Vielfalt von
                            gelernt und als Rückführgröße in der Regelung       Möglichkeiten.
                            genutzt. Dadurch lassen sich die Prozessparame-
                            ter anpassen, noch bevor Messwerte für die          Diese Vielfalt in der Maschinenkonfiguration
                            Dichte vorliegen. Der Einsatz einer prädiktiven     stellt hohe Anforderungen an die Angebotser-
                            Regelung steigerte die Produktivität und die Res-   stellung. Bei hochkomplexen Maschinen kann
                            sourceneffizienz signifikant. Im Mittel konnten     sich der Angebotsprozess mit Produktausprä-
                            der Ausschuss beim Hochfahrprozess um 37 %          gung und Preisbestimmung über mehrere
                            und die erforderliche Zeit um 39 % reduziert        Wochen hinziehen. Dies führt oft zu Verzöge-
                            werden. Diese Art der Regelung nennt man            rungen in der Angebotserstellung und ist für den
                            prädiktive Regelung.                                Kaufabschluss möglicherweise nachteilig. Ein
                                                                                intelligentes Angebotswesen kann die Ange-
                            Das Entwickeln einer adaptiven Regelung             botserstellung in Teilen automatisieren und
                            verlangt in erster Linie ein tiefes Prozessver-     dadurch erheblich beschleunigen und verbilli-
                            ständnis. Darüber hinaus sind Kenntnisse über       gen.
                            den Einsatz von maschinellen Lernverfahren zur
                            Regression von Zeitreihen erforderlich. Das Vor-    Informationen und umfangreiche Daten über
                            gehen zur modellbasierten prädiktiven Regelung      bereits erstellte Angebote, Maschinenkonfigura-
                            lässt sich auf ähnliche Problemstellungen           tionen und Preise können für das halbautomati-
                            übertragen. Ein Ansatz mit maschinellen Lern-       sche Erstellen von künftigen Angeboten genutzt
                            verfahren ist immer dann vielversprechend,          werden. Unter der Annahme, dass ein ähnlich
                            wenn viele messbare Größen den Prozess auf          konfiguriertes Produkt zu einer ähnlichen
                            eine unbekannte Weise beeinflussen. Wie in den      Kostenstruktur führt, wird mithilfe von ML-Algo-
                            anderen Anwendungsfällen ist eine ausrei-           rithmen ein Modell trainiert, das die Zusammen-
                            chende Datenmenge für die adaptive Regelung         hänge zwischen Maschinenkonfiguration und
                            zwingend erforderlich.                              Kosten lernt. Mit diesem Modell werden
                                                                                anschließend die Kosten für eine Maschinenkon-
                            3.3   Intelligentes Angebotswesen                   figuration geschätzt und darauf basierend ein
                                                                                erstes Angebot erstellt (vgl. Abbildung 5). Das
                            Im letzten Jahrzehnt hat sich der Trend der Pro-    schnelle Erstellen von Angeboten kann die Ver-
                            duktindividualisierung weiter fortgesetzt. Im       kaufswahrscheinlichkeit steigern und damit den
                            Rahmen der On-Demand-Produktion bzw. der            Umsatz erhöhen. Weitere Vorteile: Der Ange-
                            Losgröße-1-Produktion nimmt die Produktvari-        botsprozess wird vereinfacht, das Fehlerpoten-
                            antenvielfalt überproportional zu und damit die     zial reduziert.
                            Komplexität. Diese Komplexität zeigt sich auch
                            in den verfügbaren Maschinenkonfigurationen.
QUICK GUIDE „MACHINE LEARNING“ 13

Abbildung 6: Automatisierung in der Angebotserstellung

Wie bei den anderen Anwendungsfällen benö-               3.4   Datengetriebene Innovation
tigt man auch für das intelligente Angebotswe-
sen einen ausreichenden Satz historischer Daten          Am Anfang eines Industrial-Analytics-Projekts
über Maschinenkonfiguration und Kosten. Die              zum Verbessern der Gesamtanlageneffektivität
Angebote müssen in einer strukturierten Form             (Verfügbarkeit, Leistung, Qualität) wird das Opti-
vorliegen, die von einem Algorithmus ein-gele-           mierungspotenzial der Anlage oder der
sen werden kann. Der größte Aufwand dabei:               Maschine bestimmt. Daraus lässt sich der kom-
Die Daten bereinigen und die historischen                merzielle Wert der Daten als Teil des allgemei-
Datenbestände normalisieren. Für das Entwi-              nen Geschäftsverständnisses ableiten. In der
ckeln des Vorhersagemodells sollte man auf die           Sammel-Phase werden Daten aus Automatisie-
Fähigkeiten eines Data Scientist vertrauen.              rungskomponenten und Feldgeräten erfasst. In
                                                         der Analyse-Phase werden die Daten aufberei-
Darüber hinaus sind weitere Einsatzgebiete für           tet, modelliert und mit ML-Algorithmen analy-
ML im Angebotsprozess geeignet, z. B.:                   siert. Ist ein Problem analysiert und verstanden,
                                                         wird es gelöst — wenn möglich durch eine Modi-
 Suche nach ähnlichen Konfigurationen: Mit              fikation innerhalb der Produktion. Falls sich das
  ML-Algorithmen lassen sich die Maschinen-              Problem nicht dauerhaft lösen lässt, soll es aber
  konfiguration bestimmen, die zu ähnlichen              zumindest vorausschauend erkannt werden;
  Kosten/Ergebnissen führt.                              dafür wird mittels einer Streaming-Analytics-
 Geführte Konfiguration: Basierend auf histo-           Implementierung, z. B. eine Anomalie-
  rischen Daten werden zulässige Konfigurati-            Erkennung, eine Lösung gesucht und in der
  onsvarianten bestimmt und dem Angebotser-              Implementierungsphase bereitgestellt.
  steller sukzessive vorgeschlagen.
 Augmented Konfiguration: Basierend auf der             Die Erfahrung zeigt, dass Maschinenbauer und
  aktuellen Maschinenkonfiguration werden                Anlagenbetreiber typischerweise zuerst eine
  die populärsten zusätzlichen Maschinenopti-            existierende Anlage oder Maschine verfügbar
  onen vorgeschlagen.                                    machen oder mit einem reaktiven Industrial-
 Überspezifikation bei der Maschinenkonfigu-            Analytics-Projekt die Qualität verbessern. Erst
  ration vermeiden oder reduzieren: Mit ML-              wenn diese Vorgehensweise erfolgreich war,
  Algorithmen lassen sich die für das Kosten-            erwägt man, sie bei der Entwicklung der
  Leistungs-Verhältnis relevanten Optionen               nächsten Generation für eine Verbesserung der
  bestimmen.                                             Leistung zu übertragen. Die Vorgehensweise ist
                                                         dabei grundsätzlich die gleiche, nicht jedoch die
                                                         Ziele.
14 QUICK GUIDE „MACHINE LEARNING“

                            Bei der klassischen Reihenfolge „Algorithmen ->           Heute kann die Industrial-Analytics-Lösung
                            Daten -> Entscheidungen“ kann die Gesamtanla-             mögliche Korrelationen in den bereitgestellten
                            geneffektivität nicht besser sein als der Mensch,         Daten nur vorschlagen. Der Domänenexperte
                            der sie programmiert. ML-Algorithmen, ange-               des Maschinenbauers oder Anlagenbetreibers
                            wendet auf große Mengen Produktionsdaten,                 bewertet die von den ML-Algorithmen erkann-
                            erkennen dagegen Kausalitäten, die dem Anla-              ten Korrelationen als „Zufall“ oder als tatsächli-
                            genbetreiber oder Maschinenbauer bis dato                 che Kausalität. Auf Basis dieser vom Domänen-
                            verborgen geblieben waren, die aber die                   experten als Kausalität erkannten Zusammen-
                            Gesamtanlageneffektivität verbessern. So lassen           hänge in den Daten werden heute
                            sich nicht nur reaktiv Qualität und Verfügbarkeit         Entscheidungen zur Produktionsoptimierung
                            verbessern, sondern auch proaktiv die Leistung            getroffen. Beim künftigen begleitenden
                            zukünftiger Maschinen.                                    („guided“) Analytics wird die Ausführung der
                                                                                      Datenanalyse durch einen Domänenexperten
                                                                                      initiiert, läuft aber ansonsten automatisiert; bei
                                                                                      der autonomen Analytics ist der gesamte Daten-
                                                                                      analyse-Prozess automatisiert.

                             Abbildung 7: Eine Störung wird erkannt. (Quelle: Softing GmbH)
QUICK GUIDE „MACHINE LEARNING“ 15

4.   Daten als Rohstoff

     Daten entwickeln sich zur wichtigsten Währung           Geschäftsmodelle. Aus der zunehmenden Herr-
     des 21. Jahrhunderts und sind die Grundlage für         schaft der Daten resultiert die Umkehr der
     ML. In den vergangenen zwei Jahren wurden               Reihenfolge von Algorithmen -> Daten ->
     mehr Daten generiert als in der gesamten                Entscheidungen hinzu Daten -> Algorithmen ->
     Geschichte der Menschheit. Daten werden zu-             Entscheidungen“ (Abbildung 7). Das repräsen-
     nehmend zum Produktionsfaktor, zusätzlich zu            tiert die gerade stattfindende Revolution.
     Boden, Kapital und Arbeitskraft. Sie ermöglichen
     Kosteneinsparungen und neue

     Abbildung 8: Von der regelbasierten zur datengetriebenen Entscheidungsfindung. (Quelle: Softing GmbH)

     Seit dem ersten programmierbaren Chip — der             Anlagendaten wurden in der Vergangenheit oft
     Intel 4004 kam 1971 auf den Markt — wird Soft-          gesammelt, aber nicht verarbeitet. Heute
     ware nach dem gleichen Schema entwickelt:               werden sie bei der Produktionsoptimierung
     Zuerst wird das Problem definiert, danach Ziele         eingesetzt, um die Gesamtanlageneffektivität zu
     und Arbeitsschritte festgelegt und schließlich          steigern, die sogenannte Overall Equipment
     die Anwendung als eine Reihenfolge von Algo-            Efficiency (OEE). Daten einer normal funktionie-
     rithmen programmiert. In der Praxis werden              renden Maschine oder Anlage werden genutzt,
     diese Algorithmen mit Daten gefüttert, und              um ein Modell mit Grenzwerten zu trainieren.
     Anwender treffen auf deren Basis Entscheidun-           Sobald das Modell anschließend abweichende
     gen. Diese Vorgehensweise ändert sich                   Daten erhält, schlägt es Alarm, weil die abwei-
     momentan strukturell: Die Daten werden vorher           chenden Daten fehlerhafte Baugruppen,
     gesammelt und im zweiten Schritt mittels allge-         Maschinen oder Prozesse repräsentieren.
     meingültiger Algorithmen analysiert. Daraus
     resultieren Kausalitäten, auf deren Basis Ent-              Wenn ML-Algorithmen den Motor für
     scheidungen getroffen werden, z. B. zur Produk-             künftige Entwicklungen darstellen, dann
     tionsoptimierung. Diese Entscheidungen                      sind Daten der Treibstoff.
     werden im Übrigen immer öfter autonom
     getroffen.
16 QUICK GUIDE „MACHINE LEARNING“

                            ML nimmt seine Lösung nicht aus dem regelba-       Dazu zählen Daten aus Steuerungen, Daten von
                            sierten Software-Code, der von Menschen            Sensoren, Aktoren und Datenbanken sowie Pro-
                            geschrieben wurde. Darin unterscheidet es sich     duktionsflussdaten oder Wetterdaten aus
                            von den klassischen Applikationen. Es ist          zusätzlichen Quellen. Aber woran lässt sich
                            wichtig, das Wesen des Machine Learning zu         erkennen, ob die Menge an Daten aus Automati-
                            kennen: Es existiert ein Muster in Form von        sierungskomponenten und Feldgeräten aus-
                            Daten, das wir im Sinne von: „IF THIS THAN         reicht? Die Antwort ist simpel: Sobald
                            THAT“-Programmzeilen nicht regelbasiert fest-      Algorithmen Muster erkennen, sind sie ausrei-
                            halten können. Algorithmen finden dieses           chend gefüttert.
                            Muster aber in den Daten: In der Produktion ist
                            es typischerweise eine Kausalität zwischen         Es ist somit nicht vorhersehbar, welche Daten
                            Baugruppenzuständen und physikalischen             für die erforderliche Modellqualität und Genau-
                            Messwerten.                                        igkeit erforderlich sind. Mehr Daten führen nicht
                                                                               notwendigerweise zu mehr Mustern, besten-
                            Bei der klassischen Reihenfolge Algorithmen ->     falls zu mehr Korrelationen — jedenfalls nicht
                            Daten -> Entscheidungen kann die OEE nicht         unbedingt zu mehr Kausalitäten. Denn die
                            besser sein als das Verständnis des Menschen,      können nur von einem Domänenexperten
                            der die OEE-Einflussfaktoren programmiert hat.     bestätigt werden.
                            ML-Algorithmen, angewendet auf große
                            Mengen Produktionsdaten, können dagegen            Am Anfang eines ML-Projektes wird das Opti-
                            Kausalitäten finden, welche die OEE verbessern,    mierungspotenzial der Anlage oder der
                            für den Anlagenbetreiber bis dato aber verbor-     Maschine bestimmt und damit der
                            gen waren.                                         kommerzielle Wert der Daten als Teil des allge-
                                                                               meinen Geschäftsverständnisses. In der
                            Welche Daten brauchen wir für ML? Und wie          Sammel-Phase werden Daten erfasst und aufbe-
                            viele? Welche Rolle spielt dabei „Big Data“? Big   reitet. Ausreißer werden gelöscht, Fehleinträge
                            Data ist ein Sammelbegriff für große               eliminiert, Zeitstempel abgeglichen, Metadaten
                            Datenmengen — mit unterschiedlichen                zugefügt, die bereinigten Daten formatiert. In
                            Datentypen aus verschiedenen Quellen, die in       der Analyse-Phase werden die Daten
                            unterschiedlichen Geschwindigkeiten zur Verfü-     aufbereitet, modelliert und analysiert. In der
                            gung gestellt werden.                              Implementierungsphase wird eine datenba-
                                                                               sierte Produktionsoptimierung eingebaut, z. B.
                            Die Menge, die Geschwindigkeit und die Vielfalt    ein Modell zur Anomalie-Erkennung.
                            der aktuellen Produktionsdaten übersteigen die
                            Fähigkeiten des Bedienpersonals und verlangen         Daten sind das A und O des maschinellen
                            nach neuen, datenbasierten Ansätzen. Um ML            Lernens. Ohne Daten gibt es kein ML!
                            aber überhaupt anwenden zu können, ist der
                            Zugang zu qualitativ hochwertigen Daten
                            Voraussetzung.
QUICK GUIDE „MACHINE LEARNING“ 17

5.   Datengetriebene Modellierung

     Ohne Rohöl keine Raffinerie. Ohne Raffinerie        CRISP-DM unterteilt den ML-Analytics-Prozess in
     keine Kosmetik und kein Benzin. Wenn die            sechs Phasen. Bei strukturiertem Vorgehen ist
     Grundvoraussetzung geschaffen ist, und Daten        dieser Prozess uneingeschränkt wiederholbar
     zur Verfügung stehen, stellt sich die nächste       und damit für die agile Entwicklung auf Basis
     Frage: Wie lassen sich daraus nutzenorientiert      der Scrum-Methode geeignet, da er sich in
     Informationen gewinnen? Tech-Unternehmen            Sprints unterteilen lässt.
     aus dem amerikanischen Raum, die bisher in
     B2C-Bereichen aktiv waren, konnten für eine         Die Reihenfolge der Phasen ist nicht streng,
     gesamte Branche die Eine-für-alle-Lösung („One      erforderlich ist ein stetes Hin- und Herbewegen
     size fits all“) anbieten, beispielsweise für den    zwischen den verschiedenen Phasen. Die Pfeile
     Online-Handel oder die Web-Informationssuche.       im Prozessdiagramm zeigen die wichtigsten und
     Sie folgten damit dem Von-oben-nach-unten-          häufigsten Abhängigkeiten zwischen den
     Ansatz (top-down). In der äußerst diversifiziert    Phasen an. Der äußere Kreis im Diagramm sym-
     aufgestellten B2B-Branche des Maschinen- und        bolisiert den zyklischen Charakter des ML-
     Anlagenbaus passen diese Lösungen aber nicht:       Vorgehens selbst. Nach Ablauf eines Zyklus
     Prozesse und Abläufe unterscheiden sich von         können gewonnene Erkenntnisse neue, oft
     Unternehmen zu Unternehmen, auch die                fokussierte Geschäftsfragen auslösen; nachfol-
     Anwendungs- und Geschäftsfälle so-wie die Art       gende ML-Prozesse profitieren von den Erfah-
     der Sensoren weichen voneinander ab. All das        rungen früherer Prozesse.
     verlangt eine Lösung, die für das einzelne Unter-
     nehmen und dessen Geschäftszweck zuge-              Die einzelnen Phasen teilen sich in die folgenden
     schnitten sein muss. Deshalb muss auf dem           6 Schritte:
     Weg zur datengetriebenen Wertschöpfung der
     Von-unten-nach-oben-Ansatz (bot-tom-up)             Geschäftsverständnis
     gewählt werden. Aus einem Modell, das sich in       In dieser ersten Phase geht es darum, die
     vielen Praxisprojekten bewährt hat, ergeben sich    Projektziele und -anforderungen aus der Ge-
     aber Möglichkeiten, den Ablauf eines ML-Prozes-     schäftsperspektive zu verstehen. Mit diesem
     ses zu vereinfachen.                                Wissen wird anschließend das Data-Mining-
                                                         Problem definiert und ein vorläufiger Plan zum
     Gut geeignet ist dafür die Anwendung des bran-      Erreichen der Ziele erarbeitet.
     chenübergreifenden Standardprozesses für Data
     Mining, allgemein bekannt unter dem Akronym         Datenverständnis
     CRISP-DM. Dieses Data-Mining-Prozessmodell          Diese Phase beginnt mit einer ersten Datenerhe-
     beschreibt gängige Ansätze, mit denen Analytik-     bung. Anschließend macht man sich mit den
     Experten Probleme angehen. Dieses Vorgehen          Daten vertraut, identifiziert Datenqualitätsprob-
     lässt sich problemlos auf ML-Projekte               leme und gewinnt erste Einblicke in die Daten,
     übertragen.                                         um interessante Teilmengen zu entdecken.
                                                         Damit lassen sich im Anschluss Hypothesen zu
                                                         versteckten Informationen aufstellen.
18 QUICK GUIDE „MACHINE LEARNING“

                             Abbildung 9: Die sechs Phasen im ML-Analytics-Prozess (Quelle: Wikipedia,
                             https://www.crisp-research.com/publication/machine-learning-im-
                             unternehmenseinsatz-kunstliche-intelligenz-als-grundlage-digitaler-

                            Datenaufbereitung                                         Modellierung
                            Diese Phase umfasst alle Aktivitäten zum Erstel-          In dieser Phase werden Modellierungstechniken
                            len des endgültigen Datensatzes — allen voran             ausgewählt, angewendet und ihre Parameter
                            Daten, die aus den ursprünglichen Rohdaten in             auf optimale Werte kalibriert. Typischerweise
                            die Modellierungswerkzeuge eingespeist                    gibt es mehrere Techniken für denselben Prob-
                            werden. Die Aufgaben: Tabellen, Datensätze                lemtyp. Einige Techniken haben spezifische
                            und Attribute auswählen, Daten für Modellie-              Anforderungen an die Form der Daten. Daher ist
                            rungswerkzeuge transformieren und bereinigen.             es oft notwendig, in die Phase der Datenaufbe-
                            Mit einem Aufwand von 50 bis 70 % des                     reitung zurückzukehren. Sind die Daten korrekt
                            gesamten Analytikprojekts ist dieser Teilprozess          aufbereitet, können in kurzer Zeit mehrere Hun-
                            die größte Aufgabe.                                       derttausend Ansätze oder verschiedenste
                                                                                      Modelle gerechnet werden. Deshalb entstehen
                                                                                      während der gesamten CRISP-DM-basierten
                                                                                      Analysephase in diesem Schritt nur zirka 10 %
                                                                                      des Gesamtaufwandes. Wurde die Datenaufbe-
                                                                                      reitung allerdings nur mittelmäßig
                                                                                      abgeschlossen, sind auch die Ergebnisse aus der
                                                                                      Modellierung mittelmäßig — spätestens nach
                                                                                      der nächsten Phase lassen sich daraus keine
                                                                                      validen Ergebnisse mehr generieren.
QUICK GUIDE „MACHINE LEARNING“ 19

Auswertung                                         Bereitstellung
In diesem Stadium des Projekts werden ein oder     Das fertige Modell ist in der Regel nicht das Ende
mehrere Modelle erstellt, die aus Sicht der        des Projekts. Selbst wenn der Zweck des Modells
Datenanalyse eine hohe Qualität zu haben           darin besteht, die Kenntnis über die Daten zu
scheinen. Bevor man mit der endgültigen Bereit-    erhöhen, muss das gewonnene Wissen organi-
stellung des Modells fortfahren kann, ist das      siert und zum Nutzen des Kunden präsentiert
Modell gründlich zu evaluieren, die Schritte zur   werden. Je nach Anforderung kann die Imple-
Konstruktion des Modells sind zu überprüfen.       mentierungsphase so einfach sein wie das
Nur so ist gewährleistet, dass es die              Erstellen eines Berichts oder so komplex wie das
Unternehmensziele erreicht. Ein Hauptziel:         Implementieren eines wiederholbaren Daten-
Feststellen, ob ein wichtiges Geschäftsproblem     Scorings, z. B. eine Segmentzuordnung. In vielen
nicht ausreichend berücksichtigt wurde. Am         Fällen führt der Kunde die Bereitstellungs-
Ende dieser Phase entscheidet sich, ob und wie     schritte aus, nicht der Datenanalytiker. Selbst
die Analytikergebnisse verwendet werden.           wenn der Analytiker das Modell einsetzt, muss
                                                   der Kunde im Vorfeld die durchzuführenden
                                                   Aktionen verstehen, um die erstellten Modelle
                                                   nutzen zu können.
20 QUICK GUIDE „MACHINE LEARNING“

                    6.      Technische Umsetzung der Anwendungsfälle

                            In diesem Kapitel wird die technische Umset-        Klassische Vision-Systeme werden mit Bildern
                            zung der Anwendungsfälle aus Kapitel 3              von Fehlern, Objekten oder Szenen angelernt.
                            beschrieben.                                        Das System erkennt und klassifiziert genau diese
                                                                                und nur diese Fehler der Objekte oder Szenen —
                            6.1 Menschenähnliche Bildverarbeitung               Abweichungen davon werden nicht als Fehler
                                („Human-like Machine Vision“)                   erkannt. Bei der menschenähnlichen Bildverar-
                                                                                beitung werden die Algorithmen mit Bildern von
                            Klassische Bildbearbeitungs-Systeme stoßen          typischen Gut-Teilen, von korrekten Objekten
                            immer wieder bei Aufgaben an Grenzen, die für       oder Szenen angelernt. Das System lernt, ähnlich
                            den Menschen leicht lösbar sind. Die menschen-      dem Menschen, wie ein Gut-Teil, ein Objekt oder
                            ähnliche Bildverarbeitung wurde mit der Zielset-    eine Szene aussehen kann — mit allen zulässigen
                            zung entwickelt, die Stärken des Menschen in        Streuungen und Variationen. Alles, was von
                            einer Technologie der industriellen Bildverarbei-   diesem sogenannten „Erwartungsbild“
                            tung abzubilden. Entwickelt wurde diese             abweicht, wird sowohl vom Menschen als auch
                            Technologie von Experten aus den Be-reichen         vom System als Auffälligkeit erkannt. Umge-
                            Bildverarbeitung, Datenverarbeitung und Neuro-      kehrt wird alles, was diesem so-genannten
                            nale Netze. Basis waren die Erkennt-nisse von       „Erwartungsbild“ von Gut-Teilen, typischen
                            Neuro-Medizinern zu Funktionalitäten des            Objekten oder Szenen entspricht, so-wohl vom
                            menschlichen Gehirns. Die menschen-ähnliche         Menschen als auch vom System als erwartungs-
                            Bildverarbeitung wurde speziell für das industri-   gemäß eingestuft.
                            elle Analysieren von Bildern entwickelt und
                            optimiert und arbeitet selbstlernend. Sie basiert   6.2   Adaptive Regelung zur Prozessoptimierung
                            auf mehrstufigen neuronalen Netzen, die sich
                            mit wenigen Parametern konfigurieren lassen.        Bei der adaptiven Regelung lernt ein ML-Modell
                            Human-like Machine Vision umfasst drei Werk-        anhand von historischen Daten den Zusammen-
                            zeuge der industriellen Bildverarbeitung, die auf   hang zwischen Prozess-Einflussgrößen und der
                            unterschiedliche Aufgabenstellungen hin entwi-      daraus resultierenden Prozessqualität. Diese
                            ckelt und optimiert wurden:                         geschätzte Prozessqualität wird anschließend
                                                                                über Prozessstellgrößen geregelt, ohne
                              Entdeckung von qualitativen Anomalien für        tatsächlich gemessen zu werden. Zum
                               die Qualitätsinspektion                          Trainieren des Modells kommen Algorithmen
                              Lokalisierung und Identifizierung von            des überwachten Lernens zum Einsatz.
                               einzelnen oder mehreren Merkmalen
                              Klassifizierung von Objekten oder kompletten
                               Szenen
QUICK GUIDE „MACHINE LEARNING“ 21

Im Beispiel der Regelung der Volltondichte        Eingabegrößen für das Modell sind alle kosten-
dienten über zwei Dutzend Einflussparameter       relevanten Konfigurationsoptionen der
wie Feuchtigkeit, Temperatur und Farbeigen-       Maschine. Das Modell lernt daraus die teils sehr
schaften als Eingangsgrößen. Die Ausgangs-        komplexen Zusammenhänge zwischen den
größe des Modells ist die geschätzte Vollton-     Optionen und deren Auswirkung auf die entste-
dichte. Diese wird über Prozessparameter nach-    henden Kosten. Damit kann es für eine Maschi-
geregelt, noch bevor sie tatsächlich gemessen     nenkonfiguration einen ungefähren Preis
wird. Zum Training werden die Messgrößen der      schätzen. Nach diesem ersten ungefähren
Einflussfaktoren und das zugehörige Qualitäts-    Angebot kalkuliert selbstverständlich ein
ergebnis aus mehreren Monaten verwendet.          Experte die exakten Kosten für den definitiven
Eine geeignete Datenvorverarbeitung eliminiert    Preis. Mit diesem Ansatz lassen sich aber nicht
inkonsistente oder nicht eindeutige Datensätze    nur die Kosten von Maschinenkonfigurationen
und generiert geeignete Merkmale. Bedingung:      schätzen; basierend auf historischen Daten
Die Datensätze enthalten nur Beispiele, bei       können mit dem gleichen Ansatz zu erwartende
denen die Volltondichte für die Einflussgrößen    Projektzeiten oder der Output einer Anlage
zufriedenstellend eingestellt waren.              geschätzt werden.

Das Modell ist dann in der Lage, die komplexen    Für das Training des Modells müssen die Ange-
und nicht linearen Zusammenhänge zwischen         botsdaten in einer strukturierten, maschinenles-
den zahlreichen Einflussgrößen und der Vollton-   baren Form vorliegen. Eine Sammlung von
dichte abzubilden. Mithilfe des Modells können    Angeboten in PDF-Form reicht dafür üblicher-
die geeigneten Stellgrößen in vielen Fällen       weise nicht aus. Erforderlich ist eine Datenbank
erfolgreich vorhergesagt werden, selbst unter     von Maschinenkonfiguration und Angebots-
bisher unbekannten Einflüssen oder bei einer      preis. Dabei ist zu berücksichtigen, dass sich
unbekannten Kombination der Einfluss-größen.      Maschinen und Maschinenoptionen weiterent-
Das Modell kann also nicht nur Wissen reprodu-    wickeln und entsprechende Versionen erhalten.
zieren, sondern sein Wissen auch teilweise auf    Im Laufe der Zeit kann sich das Preisgefüge für
neue Fälle übertragen.                            Maschinenoptionen ändern — auch das ist zu
                                                  beachten. Beim intelligenten Angebotswesen
6.3   Intelligentes Angebotswesen                 liegt deshalb neben dem Training ein Schwer-
                                                  punkt auf der Datenbereitstellung und der
Beim intelligenten Angebotswesen lernt ein ML-    Datenbereinigung.
Modell auf Basis historischer Angebotsdaten
den Zusammenhang zwischen Maschinenkonfi-         6.4   Datengetriebene Innovation
guration und Kosten. Diese geschätzten Kosten
werden dann für das Angebot verwendet. Zum        Viele Entscheidungsträger haben ein mulmiges
Trainieren des Modells kommen Algorithmen         Gefühl bei dem Gedanken, ihre Produktionsda-
des überwachten Lernens zum Einsatz. Das          ten nach draußen in die Cloud zu geben. Die
Training wird in regelmäßigen Abständen           Alternative dazu heißt „Edge“-Lösung. Dabei
wiederholt, damit im Lernprozess möglichst        werden die Daten auf einem Standard-IPC dort
aktuelle Daten berücksichtigt werden.             gespeichert, wo sie anfallen, nämlich in der
                                                  Anlage bzw. an der Maschine. Die Gefahr von
                                                  Datendiebstahl oder Datenverlust lässt sich so
                                                  minimieren.
22 QUICK GUIDE „MACHINE LEARNING“

                            Auch einige Cloud-Anbieter haben mittlerweile           „Analytics at the edge“ findet ohne zusätzliche
                            eine „Cloud vor Ort“ oder Edge-Analytics-Lösung         Sicherheitsvorkehrungen innerhalb der Firewall
                            im Angebot. Dabei werden auf einem Gateway              in der Anlage statt. Lediglich die Resultate der
                            in der Anlage vorab Daten analysiert, um                lokal ausgeführten Echtzeit-Analytics können in
                            anschließend mit ihnen mehrere Anlagen und              einer öffentlichen oder einer lokalen Cloud
                            Standorte in der Cloud zu vergleichen. Beim             gesammelt werden. Die Cloud hält für das
                            „Edge“-basierten Industrial-Analytics-Ansatz            Trainieren der Modelle idealerweise eine
                            werden Daten gesammelt, offline analysiert und          größere Auswahl an leistungsfähigen
                            in ein Modell eingespeist. Dieses Modell wird           Algorithmen des maschinellen Lernens
                            anschließend zurück in die Anlage gebracht, um          verfügbar als die Anlage vor Ort oder der
                            die dort eingehenden Datenströme zu bewerten.           Anbieter der Edge-Analytics. Und in der Cloud
                                                                                    lassen sich die Produktionswerte mehrerer
                                                                                    Anlagen vergleichen. „Analytics at the edge“
                                                                                    dagegen verarbeitet die Daten in Echtzeit
                                                                                    (Abbildung 10).

                             Abbildung 10: Echtzeit-Datenverarbeitung (Quelle: Softing GmbH)
QUICK GUIDE „MACHINE LEARNING“ 23

7.   Build or Buy

     Hat man sich entschieden, ML im eigenen Unter-      Datenaufbereitung
     nehmen oder für die eigenen Produkte ein-           Das Aufbereiten der Daten ist häufig der zeitauf-
     zusetzen, stellt sich die nächste Frage: Was        wendigste Teil des Prozesses. Softwareprodukte
     muss ich selber machen, und was kann ich zu-        können hier Zeit einsparen. Allerdings hängt die
     kaufen? Dieses Kapitel gibt einen Überblick über    Dauer und Qualität der Datenaufbereitung stets
     diesen Themenbereich, basierend auf dem             von den eigenen Daten ab und muss deshalb an
     CRISP-DM-Analytikprozess in Kapitel 5. Anschlie-    das eigene Vorhaben angepasst werden. Die
     ßend geht es auf Hardware- und Softwarebau-         zukaufbaren Produkte sind also nur Werkzeuge,
     steine ein, die derzeit am Markt verfügbar sind.    die von einem Datenspezialisten eingesetzt
                                                         werden, um den Prozess zu beschleunigen.
     7.1   Überblick
                                                         Modellierung und Auswertung
     Geschäftsverständnis                                Zukaufbare Produkte gibt es auch für das Entwi-
     Das Geschäftsverständnis ist eine ureigene          ckeln von Algorithmen, mit denen sich zuvor
     Kompetenz des eigenen Unternehmens und              gesammelte Daten analysieren lassen. Im
     muss als solche nicht zugekauft werden. Nun         Angebot sind Entwicklerwerkzeuge, aber auch
     gilt es allerdings nicht nur, das eigene Geschäft   fertige Algorithmen. Nur selten kann man
     zu verstehen. Ein besonderes Augenmerk liegt        fertige Lösung kaufen; üblicherweise werden
     auf den Chancen und Risiken durch die Digitali-     bestehende Lösungen angepasst, bei komplizier-
     sierung und ML. Hier ist es sinnvoll, externe       ten Problemen auch von Grund auf neu entwi-
     Quellen zu konsultieren, um das Wissen in der       ckelt. Die Algorithmen sollte ein Experte im
     Organisation zu vervollständigen und die rich-      Unternehmen entwickeln oder ein Dienstleister.
     tige Geschäftsstrategie zu entwickeln.              Ein Team von Anwendungsexperten und Data
                                                         Scientists bewertet anschließend die entstande-
     Datenverständnis                                    nen Modelle. Die meisten Werkzeuge zum Ent-
     Das Wissen über die eigenen Daten liegt typi-       wickeln von Algorithmen beinhalten auch Tools
     scherweise im Unternehmen selbst. Dennoch           zum Bewerten der entwickelten Algorithmen.
     reicht dieses Wissen häufig nicht aus, um sofort
     neue Lösungen zu entwickeln; es muss zuerst         Bereitstellung
     vertieft werden. Dafür gibt es in der Regel keine   Die entwickelten Modelle in die bestehenden
     zukaufbaren Lösungen. Das Wissen über die           Prozesse zu integrieren ist für Maschinenbauer
     eigenen Daten, deren Bedeutung, Verfügbarkeit       häufig eine große Herausforderung. Sie müssen
     und Qualität muss in interdisziplinärer Zusam-      eine IT-Infrastruktur aufbauen, welche die benö-
     menarbeit von Anwendungsexperten, Data              tigten Daten sammelt, automatisiert durch die
     Scientists und Steuerungsexperten erarbeitet        Modelle auswertet und die Resultate wie-der in
     werden. Bei der Analyse unterstützen eine Reihe     den Prozess einspeist. Je nach IT-Infrastruktur
     von Softwarelösungen — sie ersetzen aber nicht      des eigenen Unternehmens kann das Sammeln
     den eigentlichen Wissensaufbau.                     der Daten von einfach bis äußerst komplex
                                                         ausfallen.
Sie können auch lesen