Aktuelle Themen und Trends im Bereich Data & Analytics - Virtueller 19. INFOMOTION BI Innovation Day

Die Seite wird erstellt Laura John
 
WEITER LESEN
Aktuelle Themen und Trends im Bereich Data & Analytics - Virtueller 19. INFOMOTION BI Innovation Day
Virtueller 19. INFOMOTION
BI Innovation Day
Aktuelle Themen und Trends
im Bereich Data & Analytics

Frankfurt am Main, 13. Mai 2020
Markus Enderlein

© INFOMOTION GmbH   14. Mai 2020
Innovations- und Trendbewertung bei INFOMOTION

           PRODUKTMANAGEMENT                               WISSENSMANAGEMENT

                                                              Business Development
    6               Analysten                                                        3
                                                                    Netzwerke

          Roadmap & Strategie      INFOMOTION Trend-
    7                               und Themenradar             Kompetenzfelder      251
            Produkthersteller

                                    INFOMOTION BI               Wissenschaftliche
              Projekterfahrung                         2
  >5T                               Innovation Day                                   121
                   Kunden                                           Arbeiten
                                       BI
                                                     17           Forschungs-
  248                Vertrieb       Innovation Day                                   1,5
                                                                    projekte

                                                                     Interne
            Expertennetzwerke                                                        16
                                                                Expertengruppen

© INFOMOTION GmbH   14. Mai 2020                                                           2
Seit dem letzten BI Innovation Day im November hat sich einiges getan …
hier ein Überblick über die neuen wissenschaftliche Arbeiten
THEMA               TITEL                                                                                                                           TYP   DATUM

LAUFENDE ARBEITEN
BI                  Linked Open Data Usage in Business Intelligence Systems                                                                         MA    Mai 2020

BI                  Konzeption und Implementierung einer Anwendung zur Analyse von Logausgaben                                                      BA    Mai 2020
                    Migration von On-Premises-DWH-Lösungen in eine Cloud-BI-Umgebung - Konzeptionelle Entwicklung und Evaluation eines Leitfadens
Cloud                                                                                                                                               MA    Juni 2020
                    zur Cloud-BI-Migration auf Basis einer Grounded-Theory-Studie
                    Eine empirische Untersuchung der Datenkompetenzen von Mitarbeitern - eine Fallstudie bei der INFOMOTION GmbH unter
Mngmt.                                                                                                                                              BA    Juni 2020
                    Verwendung von SAP Experience Management
Machine Learning    Absatzprognose auf partieller Datenbasis mittels Deep Learning                                                                  MA    Juni 2020

Machine Learning    Automatisiertes Machine Learning: Feldtest an Beispielen im Einsatz                                                             BA    Aug. 2020

ABGESCHLOSSENE ARBEITEN
BI / Cloud          Evaluation von Data-Platform-as-a-Service-Lösungen mit Amazon Web Services anhand einer prototypischen Implementierung          BA    April 2020

BI                  Konzeption eines Frameworks zur Analyse der Data Literacy                                                                       BA    April 2020
                    Herausforderung und Entwicklung eines Data Warehouses mithilfe von agilen Modellierungsansätzen unter Berücksichtigung der
BI                                                                                                                                                  BA    April 2020
                    Faktoren Kosten, Performanz und Skalierbarkeit
BI                  Konzeption und Implementierung einer DICOM-Schnittstelle in einem Data Lake in der Cloud am Beispiel Microsoft Azure            BA    März 2020

Machine Learning    Unüberwachte Anomalieerkennung in instationären Datenströmen - ein Qualitätsvergleich unterschiedlich komplexer Algorithmen     MA    März 2020
                    Prototypische Implementierung und Evaluation von Machine Learning Algorithmen zur Prognose von Prozessschritten am Beispiel
Machine Learning                                                                                                                                    BA    Feb. 2020
                    eines Accounts Receivable Prozesses
BI                  Evaluation von technologischen Alternativen zur Umsetzung einer modernen integrierten Finanzplanung                             BA    Feb. 2020
© INFOMOTION GmbH   14. Mai 2020                                                                                                                                       3
Homeschooling – Textverständnis – Übung 1
Auszug Einleitung MA „Unüberwachte Anomalieerkennung in instationären Datenströmen - ein Qualitätsvergleich
unterschiedlich komplexer Algorithmen“

Unter Anomalien versteht man Datenpunkte, die sich in signifikanter Weise von den übrigen Observationen eines
Datensatzes unterscheiden. Innerhalb eines Systems treten Anomalien durch atypisches Verhalten des
zugrundeliegenden Datengenerierungsprozesses auf (Aggarwal 2017). Daher lassen sich aus ihnen häufig
nützliche Erkenntnisse über ungewöhnliche, oft kritische Systemzustände gewinnen. Die Identifikation dieser
Datenpunkte wird als Anomalieerkennung (AE) bezeichnet.

Weitere Charakteristika dieser Datenströme ist ihre potenziell unbegrenzte Größe, das Anfallen der
Observationen in konstant hoher Geschwindigkeit und die oftmals instationäre, sich über die Zeit veränderte
Datenverteilung (Khamassi et al. 2018). Hierdurch ist auch das Erstellen von Klassenlabeln und so die
Verwendung überwachter Algorithmen nicht möglich. Aus diesen Gründen ist es für AE-Algorithmen in diesen
Einsatzbereichen erforderlich, dass sie in unüberwachter Weise lernen und sich kontinuierlich an das dynamische
Umfeld anpassen.
Homeschooling – Textverständnis – Übung 2
Auszug Einleitung MA „Unüberwachte Anomalieerkennung in instationären Datenströmen - ein Qualitätsvergleich
unterschiedlich komplexer Algorithmen“

Der Histogram Based Outlier Score (HBOS) verwendet eine auf Histogrammen beruhende Dichteschätzung zur
Ermittlung der Anomaliewerte. Er hat die geringste Komplexität der untersuchten Verfahren. Aufgrund seiner
hohen Zuordnungsgüte in Verbindung mit der geringen Komplexität ist er gut für die Anomalieerkennung in
zeitkritischen Anwendungen mit großen Datenmengen geeignet (Goldstein und Dengel 2012).

Der Local Outlier Factor (LOF) ist der komplexeste der in dieser Arbeit betrachteten Algorithmen, er berechnet
den Anomaliewert eines Punktes indem er dessen lokale Dichte mit den lokalen Dichten seiner nächsten Nachbarn
vergleicht (Breunig et al. 2000).

Der dritte Algorithmus, der Isolation Forest (iForest), wird aus einem Ensemble von Entscheidungsbäumen
gebildet. Die Anomaliewerte des iForests basieren auf der Anzahl an Verzweigungsschritten die für die Isolation
der Datenpunkte in den Baumstrukturen benötigt werden (Liu et al. 2008 - 2008).

Das Standardmaß für die Evaluation von unüberwachten Anomaliedetektoren ist die Area Under The Curve
(AUC). Sie gibt die Wahrscheinlichkeit an, dass ein Algorithmus einem zufälligen gewählten anomalen Punkt eines
Datensatzes einen höheren Anomaliewert zuweist, als einem zufälligen normalen Punkt (Goldstein und Uchida
2016).
Seit dem letzten BI Innovation Day im November hat sich einiges getan …
hier ein Überblick über die gestarteten Kompetenzfelder

TITEL                                                                                        THEMA              BEGINN

Integration von Angular in bestehende Legacy-Projekte                                        Programming        Jan. 2020

Die „SAP Diamond Award“ Anwendung – Umsetzung Mit Cloud-Technologie                          Cloud              Jan. 2020

SAP LAMA (Landscape Management)                                                              Operation          Feb. 2020

MS Azure Data Factory - Datenintegration-Benchmark mit TPC-DI                                Cloud / DWH        Feb. 2020

IBM Cloud Pak for Data                                                                       Cloud              März 2020

Snowflake - Verprobung mit Datenintegration-Benchmark TPC-DI 10 TB                           Cloud / DWH        März 2020

SnapLogic Intelligent Integration Platform (iPaaS) - Datenintegration-Benchmark mit TPC-DI   Cloud              März 2020

Informatica Intelligent Cloud Services (IICS) - Datenintegration-Benchmark mit TPC-DI        Cloud              März 2020

Predictive Analytics SAP – Vergleich / Bewertung der aktuellen Lösungen                      Machine Learning   April 2020

© INFOMOTION GmbH   14. Mai 2020                                                                                             6
INFOMOTION Trend- und Themenradar
Prognose Entwicklung Themen nach der Corona-Krise

                AKTUELL                                   MITTELFRISTIG                           LANGFRISTIG                              ZUKUNFT
                                                                                              Self-Service
   Self-Service BI       BI Competency                 Process              Data                                             Natural Language             Blockchain
                                                                                            Data Preparation
                          Center / ACE           Mining / Intelligence     Science                                              Generation
                                                                                             (Sandboxing)
         Social                                                                                                                                 Augmented
      Intelligence                                  Visual Analytics &      Machine
                                BI & Data                                                     Data Warehouse                   Natural Language Analytics &
                                                     Data Discovery         Learning
                               Governance                                                       Automation                         Question        Data
     Near- / Real-Time                                Collaborative BI                                                            Answering    Management
                                                                              Predictive              Logical Data
     Data Warehousing                Mobile BI                                 Analytics               Warehouse DataOps                      Data
                                                        Text Analytics                                                                                     Immersive
            Planning &                                                                                                                     Storytelling
                                                              Cloud                  IoT (Edge)          Search-Based                                       Analytics
          Consolidation             Embedded BI
                                                          Data & Analytics            Analytics          Data Discovery
          (Simulation &
                                                                                                                                                          Cognitive BI
        Scenario-Analysis)          Geo & Location              Agile BI                Data Hub                   Decision           Data
                                     Intelligence                                                                Management         Literacy
               Reporting                                                Data                Data Lake
                                                                    Virtualization                                        Analytics as         Open &
                                             Information                                                                   a Service
                                                                                                      Big Data                               external Data
                     Dashboards                 Design                     Data Science Labs
                                                                             / Governance                  Event Stream                  Analytical
                           Data Quality              Data Mining                                            Processing                     Apps       Prescriptive

                                                                                                                                                                         Version Q2/2020
                           Management                                                  Operative
                                                                                                                                                       Analytics
                                                                                     BI & Analytics
                                                         Master Data                                                   Analytical /
                                Metadata Mgmt.                                                                    Multimodel Databases
                                                         Management                        Data Catalog
© INFOMOTION GmbH    14. Mai 2020                                                                                                                                                   7
INFOMOTION Trend- und Themenradar
Prognose Entwicklung Themen nach der Corona-Krise

                AKTUELL                                   MITTELFRISTIG                           LANGFRISTIG                              ZUKUNFT
                                                                                              Self-Service
   Self-Service BI       BI Competency                 Process              Data                                             Natural Language             Blockchain
                                                                                            Data Preparation
                          Center / ACE           Mining / Intelligence     Science                                              Generation
                                                                                             (Sandboxing)
         Social                                                                                                                                 Augmented
      Intelligence                                  Visual Analytics &      Machine
                                BI & Data                                                     Data Warehouse                   Natural Language Analytics &
                                                     Data Discovery         Learning
                               Governance                                                       Automation                         Question        Data
     Near- / Real-Time                                Collaborative BI                                                            Answering    Management
                                                                              Predictive              Logical Data
     Data Warehousing                Mobile BI                                 Analytics               Warehouse DataOps                      Data
                                                        Text Analytics                                                                                     Immersive
            Planning &                                                                                                                     Storytelling
                                                              Cloud                  IoT (Edge)          Search-Based                                       Analytics
          Consolidation             Embedded BI
                                                          Data & Analytics            Analytics          Data Discovery
          (Simulation &
                                                                                                                                                          Cognitive BI
        Scenario-Analysis)          Geo & Location              Agile BI                Data Hub                   Decision           Data
                                     Intelligence                                                                Management         Literacy
               Reporting                                                Data                Data Lake
                                                                    Virtualization                                        Analytics as         Open &
                                             Information                                                                   a Service
                                                                                                      Big Data                               external Data
                     Dashboards                 Design                     Data Science Labs
                                                                             / Governance                  Event Stream                  Analytical
                           Data Quality              Data Mining                                            Processing                     Apps       Prescriptive

                                                                                                                                                                         Version Q2/2020
                           Management                                                  Operative
                                                                                                                                                       Analytics
                                                                                     BI & Analytics
                                                         Master Data                                                   Analytical /
                                Metadata Mgmt.                                                                    Multimodel Databases
                                                         Management                        Data Catalog
© INFOMOTION GmbH    14. Mai 2020                                                                                                                                                   8
Unsere Empfehlungen

1. Seien Sie proaktiv und stellen Sie explizit Ihren Anwendern die folgenden Fragen und leiten Sie die sich
   daraus ergebenden Maßnahmen ab:
     › Welche Herausforderungen bzw. Hürden hatten Sie in den letzten Wochen in der Nutzung der Data &
       Analytics-Lösungen?
     › Welche Auswertungen bzw. Analysen konnten nicht durchgeführt werden, obwohl Ihr Bereich diese
       dringend benötigt hätten?
     › Welche ergänzenden konkreten Funktionalitäten würde die Datennutzung in einer kommenden Krise
       deutlich unterstützen?
2. Schneiden Sie alle laufenden und geplanten Maßnahmen zumindest in den nächsten 12 Monaten so, dass
   diese jeweils nach 4 Wochen einen direkten Nutzen realisieren.
   → Wir empfehlen prinzipiell eine agilere Vorgehensweise mit direkterem Nutzen und höherer Anwender-
   beteiligung.
3. Erhöhen Sie kontinuierlich insbesondere die Benutzerautonomie und den Automatisierungsgrad.

© INFOMOTION GmbH   14. Mai 2020                                                                              9
INFOMOTION GmbH

MARKUS ENDERLEIN
Diplom-Wirtschaftsinformatiker (FH)
Business Unit Manager Strategy & Digital Solutions

INFOMOTION GMBH                             T +49 69 56608 3555
Westhafenplatz 1                            M +49 151 22655191
60327 Frankfurt
www.infomotion.de                           markus.enderlein@infomotion.de

Alle Angaben basieren auf dem derzeitigen Kenntnisstand. Änderungen vorbehalten. Dieses Dokument der INFOMOTION GmbH ist ausschließlich für den Adressaten bzw. Auftraggeber bestimmt. Es bleibt bis zu
einer ausdrücklichen Übertragung von Nutzungsrechten Eigentum der INFOMOTION GmbH. Jede Bearbeitung, Verwertung, Vervielfältigung und/oder gewerbsmäßige Verbreitung des Werkes ist nur mit
Einverständnis der INFOMOTION GmbH zulässig.

© INFOMOTION GmbH       14. Mai 2020                                                                                                                                                                 10
Sie können auch lesen