Aktuelle Themen und Trends im Bereich Data & Analytics - Virtueller 19. INFOMOTION BI Innovation Day
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Virtueller 19. INFOMOTION BI Innovation Day Aktuelle Themen und Trends im Bereich Data & Analytics Frankfurt am Main, 13. Mai 2020 Markus Enderlein © INFOMOTION GmbH 14. Mai 2020
Innovations- und Trendbewertung bei INFOMOTION PRODUKTMANAGEMENT WISSENSMANAGEMENT Business Development 6 Analysten 3 Netzwerke Roadmap & Strategie INFOMOTION Trend- 7 und Themenradar Kompetenzfelder 251 Produkthersteller INFOMOTION BI Wissenschaftliche Projekterfahrung 2 >5T Innovation Day 121 Kunden Arbeiten BI 17 Forschungs- 248 Vertrieb Innovation Day 1,5 projekte Interne Expertennetzwerke 16 Expertengruppen © INFOMOTION GmbH 14. Mai 2020 2
Seit dem letzten BI Innovation Day im November hat sich einiges getan … hier ein Überblick über die neuen wissenschaftliche Arbeiten THEMA TITEL TYP DATUM LAUFENDE ARBEITEN BI Linked Open Data Usage in Business Intelligence Systems MA Mai 2020 BI Konzeption und Implementierung einer Anwendung zur Analyse von Logausgaben BA Mai 2020 Migration von On-Premises-DWH-Lösungen in eine Cloud-BI-Umgebung - Konzeptionelle Entwicklung und Evaluation eines Leitfadens Cloud MA Juni 2020 zur Cloud-BI-Migration auf Basis einer Grounded-Theory-Studie Eine empirische Untersuchung der Datenkompetenzen von Mitarbeitern - eine Fallstudie bei der INFOMOTION GmbH unter Mngmt. BA Juni 2020 Verwendung von SAP Experience Management Machine Learning Absatzprognose auf partieller Datenbasis mittels Deep Learning MA Juni 2020 Machine Learning Automatisiertes Machine Learning: Feldtest an Beispielen im Einsatz BA Aug. 2020 ABGESCHLOSSENE ARBEITEN BI / Cloud Evaluation von Data-Platform-as-a-Service-Lösungen mit Amazon Web Services anhand einer prototypischen Implementierung BA April 2020 BI Konzeption eines Frameworks zur Analyse der Data Literacy BA April 2020 Herausforderung und Entwicklung eines Data Warehouses mithilfe von agilen Modellierungsansätzen unter Berücksichtigung der BI BA April 2020 Faktoren Kosten, Performanz und Skalierbarkeit BI Konzeption und Implementierung einer DICOM-Schnittstelle in einem Data Lake in der Cloud am Beispiel Microsoft Azure BA März 2020 Machine Learning Unüberwachte Anomalieerkennung in instationären Datenströmen - ein Qualitätsvergleich unterschiedlich komplexer Algorithmen MA März 2020 Prototypische Implementierung und Evaluation von Machine Learning Algorithmen zur Prognose von Prozessschritten am Beispiel Machine Learning BA Feb. 2020 eines Accounts Receivable Prozesses BI Evaluation von technologischen Alternativen zur Umsetzung einer modernen integrierten Finanzplanung BA Feb. 2020 © INFOMOTION GmbH 14. Mai 2020 3
Homeschooling – Textverständnis – Übung 1 Auszug Einleitung MA „Unüberwachte Anomalieerkennung in instationären Datenströmen - ein Qualitätsvergleich unterschiedlich komplexer Algorithmen“ Unter Anomalien versteht man Datenpunkte, die sich in signifikanter Weise von den übrigen Observationen eines Datensatzes unterscheiden. Innerhalb eines Systems treten Anomalien durch atypisches Verhalten des zugrundeliegenden Datengenerierungsprozesses auf (Aggarwal 2017). Daher lassen sich aus ihnen häufig nützliche Erkenntnisse über ungewöhnliche, oft kritische Systemzustände gewinnen. Die Identifikation dieser Datenpunkte wird als Anomalieerkennung (AE) bezeichnet. Weitere Charakteristika dieser Datenströme ist ihre potenziell unbegrenzte Größe, das Anfallen der Observationen in konstant hoher Geschwindigkeit und die oftmals instationäre, sich über die Zeit veränderte Datenverteilung (Khamassi et al. 2018). Hierdurch ist auch das Erstellen von Klassenlabeln und so die Verwendung überwachter Algorithmen nicht möglich. Aus diesen Gründen ist es für AE-Algorithmen in diesen Einsatzbereichen erforderlich, dass sie in unüberwachter Weise lernen und sich kontinuierlich an das dynamische Umfeld anpassen.
Homeschooling – Textverständnis – Übung 2 Auszug Einleitung MA „Unüberwachte Anomalieerkennung in instationären Datenströmen - ein Qualitätsvergleich unterschiedlich komplexer Algorithmen“ Der Histogram Based Outlier Score (HBOS) verwendet eine auf Histogrammen beruhende Dichteschätzung zur Ermittlung der Anomaliewerte. Er hat die geringste Komplexität der untersuchten Verfahren. Aufgrund seiner hohen Zuordnungsgüte in Verbindung mit der geringen Komplexität ist er gut für die Anomalieerkennung in zeitkritischen Anwendungen mit großen Datenmengen geeignet (Goldstein und Dengel 2012). Der Local Outlier Factor (LOF) ist der komplexeste der in dieser Arbeit betrachteten Algorithmen, er berechnet den Anomaliewert eines Punktes indem er dessen lokale Dichte mit den lokalen Dichten seiner nächsten Nachbarn vergleicht (Breunig et al. 2000). Der dritte Algorithmus, der Isolation Forest (iForest), wird aus einem Ensemble von Entscheidungsbäumen gebildet. Die Anomaliewerte des iForests basieren auf der Anzahl an Verzweigungsschritten die für die Isolation der Datenpunkte in den Baumstrukturen benötigt werden (Liu et al. 2008 - 2008). Das Standardmaß für die Evaluation von unüberwachten Anomaliedetektoren ist die Area Under The Curve (AUC). Sie gibt die Wahrscheinlichkeit an, dass ein Algorithmus einem zufälligen gewählten anomalen Punkt eines Datensatzes einen höheren Anomaliewert zuweist, als einem zufälligen normalen Punkt (Goldstein und Uchida 2016).
Seit dem letzten BI Innovation Day im November hat sich einiges getan … hier ein Überblick über die gestarteten Kompetenzfelder TITEL THEMA BEGINN Integration von Angular in bestehende Legacy-Projekte Programming Jan. 2020 Die „SAP Diamond Award“ Anwendung – Umsetzung Mit Cloud-Technologie Cloud Jan. 2020 SAP LAMA (Landscape Management) Operation Feb. 2020 MS Azure Data Factory - Datenintegration-Benchmark mit TPC-DI Cloud / DWH Feb. 2020 IBM Cloud Pak for Data Cloud März 2020 Snowflake - Verprobung mit Datenintegration-Benchmark TPC-DI 10 TB Cloud / DWH März 2020 SnapLogic Intelligent Integration Platform (iPaaS) - Datenintegration-Benchmark mit TPC-DI Cloud März 2020 Informatica Intelligent Cloud Services (IICS) - Datenintegration-Benchmark mit TPC-DI Cloud März 2020 Predictive Analytics SAP – Vergleich / Bewertung der aktuellen Lösungen Machine Learning April 2020 © INFOMOTION GmbH 14. Mai 2020 6
INFOMOTION Trend- und Themenradar Prognose Entwicklung Themen nach der Corona-Krise AKTUELL MITTELFRISTIG LANGFRISTIG ZUKUNFT Self-Service Self-Service BI BI Competency Process Data Natural Language Blockchain Data Preparation Center / ACE Mining / Intelligence Science Generation (Sandboxing) Social Augmented Intelligence Visual Analytics & Machine BI & Data Data Warehouse Natural Language Analytics & Data Discovery Learning Governance Automation Question Data Near- / Real-Time Collaborative BI Answering Management Predictive Logical Data Data Warehousing Mobile BI Analytics Warehouse DataOps Data Text Analytics Immersive Planning & Storytelling Cloud IoT (Edge) Search-Based Analytics Consolidation Embedded BI Data & Analytics Analytics Data Discovery (Simulation & Cognitive BI Scenario-Analysis) Geo & Location Agile BI Data Hub Decision Data Intelligence Management Literacy Reporting Data Data Lake Virtualization Analytics as Open & Information a Service Big Data external Data Dashboards Design Data Science Labs / Governance Event Stream Analytical Data Quality Data Mining Processing Apps Prescriptive Version Q2/2020 Management Operative Analytics BI & Analytics Master Data Analytical / Metadata Mgmt. Multimodel Databases Management Data Catalog © INFOMOTION GmbH 14. Mai 2020 7
INFOMOTION Trend- und Themenradar Prognose Entwicklung Themen nach der Corona-Krise AKTUELL MITTELFRISTIG LANGFRISTIG ZUKUNFT Self-Service Self-Service BI BI Competency Process Data Natural Language Blockchain Data Preparation Center / ACE Mining / Intelligence Science Generation (Sandboxing) Social Augmented Intelligence Visual Analytics & Machine BI & Data Data Warehouse Natural Language Analytics & Data Discovery Learning Governance Automation Question Data Near- / Real-Time Collaborative BI Answering Management Predictive Logical Data Data Warehousing Mobile BI Analytics Warehouse DataOps Data Text Analytics Immersive Planning & Storytelling Cloud IoT (Edge) Search-Based Analytics Consolidation Embedded BI Data & Analytics Analytics Data Discovery (Simulation & Cognitive BI Scenario-Analysis) Geo & Location Agile BI Data Hub Decision Data Intelligence Management Literacy Reporting Data Data Lake Virtualization Analytics as Open & Information a Service Big Data external Data Dashboards Design Data Science Labs / Governance Event Stream Analytical Data Quality Data Mining Processing Apps Prescriptive Version Q2/2020 Management Operative Analytics BI & Analytics Master Data Analytical / Metadata Mgmt. Multimodel Databases Management Data Catalog © INFOMOTION GmbH 14. Mai 2020 8
Unsere Empfehlungen 1. Seien Sie proaktiv und stellen Sie explizit Ihren Anwendern die folgenden Fragen und leiten Sie die sich daraus ergebenden Maßnahmen ab: › Welche Herausforderungen bzw. Hürden hatten Sie in den letzten Wochen in der Nutzung der Data & Analytics-Lösungen? › Welche Auswertungen bzw. Analysen konnten nicht durchgeführt werden, obwohl Ihr Bereich diese dringend benötigt hätten? › Welche ergänzenden konkreten Funktionalitäten würde die Datennutzung in einer kommenden Krise deutlich unterstützen? 2. Schneiden Sie alle laufenden und geplanten Maßnahmen zumindest in den nächsten 12 Monaten so, dass diese jeweils nach 4 Wochen einen direkten Nutzen realisieren. → Wir empfehlen prinzipiell eine agilere Vorgehensweise mit direkterem Nutzen und höherer Anwender- beteiligung. 3. Erhöhen Sie kontinuierlich insbesondere die Benutzerautonomie und den Automatisierungsgrad. © INFOMOTION GmbH 14. Mai 2020 9
INFOMOTION GmbH MARKUS ENDERLEIN Diplom-Wirtschaftsinformatiker (FH) Business Unit Manager Strategy & Digital Solutions INFOMOTION GMBH T +49 69 56608 3555 Westhafenplatz 1 M +49 151 22655191 60327 Frankfurt www.infomotion.de markus.enderlein@infomotion.de Alle Angaben basieren auf dem derzeitigen Kenntnisstand. Änderungen vorbehalten. Dieses Dokument der INFOMOTION GmbH ist ausschließlich für den Adressaten bzw. Auftraggeber bestimmt. Es bleibt bis zu einer ausdrücklichen Übertragung von Nutzungsrechten Eigentum der INFOMOTION GmbH. Jede Bearbeitung, Verwertung, Vervielfältigung und/oder gewerbsmäßige Verbreitung des Werkes ist nur mit Einverständnis der INFOMOTION GmbH zulässig. © INFOMOTION GmbH 14. Mai 2020 10
Sie können auch lesen