NEXT GENERATION ANALYTICS - BI-SPEKTRUM Topthemen 2021 and beyond - Sigs Datacom
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
NEXT GENERATION ANALYTICS E-Book BI-SPEKTRUM Topthemen 2021 and beyond Autor: Prof. Dr. Carsten Felden tdwi.eu
Herausgeber SIGS DATACOM GmbH Lindlaustraße 2c 53842 Troisdorf info@sigs-datacom.de www.sigs-datacom.de Copyright © 2021 SIGS DATACOM GmbH Lindlaustr. 2c 53842 Troisdorf Die vorliegende Publikation ist urheberrechtlich geschützt. Alle Rechte vorbehalten. Die Verwen- dung der Texte und Abbildungen, auch auszugsweise, ist ohne die schriftliche Zustimmung des He- rausgebers urheberrechtswidrig und daher strafbar. Dies gilt insbesondere für die Vervielfältigung, Übersetzung oder die Verwendung in elektronischen Systemen. Es wird darauf hingewiesen, dass die in der Broschüre verwendeten Soft- und Hardware-Bezeich- nungen sowie Markennamen und Produktbezeichnungen der jeweiligen Firmen im Allgemeinen warenzeichen-, marken- oder patentrechtlichem Schutz unterliegen. Alle Angaben und Program- me in dieser Broschüre wurden mit größter Sorgfalt kontrolliert. Weder Autor noch Herausgeber können jedoch für Schäden haftbar gemacht werden, die im Zusammenhang mit der Verwendung dieser Broschüre stehen. Wo nicht anders angegeben, wurde auf die im Text verlinkten Quellen zurückgegriffen. TDWI E-Book in Kooperation mit
ZUM INHALT Inhalt Vorwort4 1 Einleitung 5 2 Business Intelligence, Analytics, Big Data und Artificial 6 Intelligence im Zeitverlauf 2.1 Historische Entwicklung 6 2.2 Definitorische Abgrenzung 9 2.3 Thematische Trends aus 2021 13 3 BI-SPEKTRUM Digest – die Ausgaben des Jahres 2021 14 im thematischen Überblick 3.1 Data Storytelling 14 3.2 Recommendation Engine 14 3.3 Process Mining 15 3.4 Business-Intelligence-Architekturen 16 3.5 Image Mining 16 4 Ausgewählte Beiträge des BI-SPEKTRUM 2021 18 4.1 Auf dem Weg zur Insight Driven Insurance – 18 Ein Beitrag von Dr. Michael Zimmer und Horst Nussbaumer, erschienen in der BI-SPEKTRUM Ausgabe 01/2021 4.2 Anwendung von DevOps-Prinzipien auf maschinelles Lernen – 23 Ein Beitrag von Prof. Dr. Michael Colombo und Prof. Dr. Christian Schieder, erschienen in der BI-SPEKTRUM Ausgabe 02/2021 4.3 Enterprise Mining – 32 Ein Beitrag von Dr. Helge Heß, erschienen in der BI-SPEKTRUM Ausgabe 03/2021 4.4 Aufbau und Betrieb einer Private-Analytics-Plattform – 40 Ein Beitrag von Fabian Hardt, erschienen in der BI-SPEKTRUM Ausgabe 04/2021 4.5 Deep Learning in der Industrie – 46 Ein Beitrag von Marcel Messerli und Jan Riedo, erschienen in der BI-SPEKTRUM Aufgabe 05/2021 5 Fazit 52 Literatur53 Über unsere Sponsoren 54
ZUM ZUM INHALT Vorwort Das vorliegende E-Book beschäftigt sich mit dem Thema Next Gene- ration Analytics. Bei Business Analytics geht es um das Entdecken, In- terpretieren und Kommunizieren von aussagekräftigen Datenmustern und den Einsatz von Werkzeugen, die es Ihrem gesamten Unternehmen ermöglichen, jede datenbezogene Frage zu stellen, in jeder Umgebung und auf jedem Gerät. Um die gewünschten Ergebnisse zu erzielen, bietet Business Analytics noch mehr Möglichkeiten, zum Beispiel Optimierung, Kostensenkung und Kundenbindung. Heutzutage möchte jedes Unternehmen mehr aus der Analytik heraus- holen – mehr Daten nutzen, um schneller tiefere Einblicke zu generie- ren, und das zu geringeren Kosten. Das Erreichen dieser Ziele erfordert eine robuste Plattform, die den gesamten Analyseprozess mit der er- forderlichen Sicherheit, Flexibilität und Zuverlässigkeit unterstützt. Das Ziel ist es, Ihre Anwender in die Lage zu versetzen, Open-Source-Ana- lysen durchzuführen, ohne die Steuerung zu beeinträchtigen. Und das alles mit einer benutzerfreundlichen Administration. Business Analytics ist heute allgegenwärtig, denn das Ziel jedes Unternehmens ist es, eine bessere Performance zu erreichen und Daten entsprechend zu analysie- ren, um bessere Entscheidungen zu treffen. Zunächst wird ein Blick in die Diskussion der analytischen Trendthemen des Jahres 2021 geworfen. Im Weiteren werden ausgewählte Beiträge aus dem BI-SPEKTRUM neu arrangiert, um einerseits das aktuelle Geschehen zu reflektieren, ande- rerseits einen Ausblick auf die anstehenden Aufgaben zu wagen. 3 4 5
ZUM INHALT 1 Einleitung Was ist das nächste große Ding, mit dem sich Un- schneller tiefere Einblicke zu generieren, und das ternehmen auseinandersetzen müssen? Welches zu geringeren Kosten. Das Erreichen dieser Ziele Konzept, welcher Ansatz treibt den Markt und damit erfordert eine robuste Plattform, die den gesam- IT-Bereiche und Fachbereiche gleichermaßen? Nach ten Analyseprozess mit der erforderlichen Sicher- der schnellen Generierung, Sammlung und Konditi- heit, Flexibilität und Zuverlässigkeit unterstützt. Das onierung der vielfältigen Big Data, um Geschäftsab- Ziel ist es, Ihre Anwender in die Lage zu versetzen, läufe zu transformieren, besteht der nächste Schritt Open-Source-Analysen durchzuführen, ohne die darin, alles zu verstehen, was sich in diesen ge- Steuerung zu beeinträchtigen. Und das alles mit ei- schäftlichen Aktivitäten abspielt. Diese Bemühungen ner benutzerfreundlichen Administration. Business führen zur Nutzung ganzheitlicher Ansichten von Un- Analytics ist heute allgegenwärtig, denn das Ziel je- ternehmensdaten, die zuvor so nicht verfügbar waren. des Unternehmens ist es, eine bessere Performance Plötzlich entdecken Anwender im Self-Service-Mus- zu erreichen und Daten entsprechend zu analysieren, ter Beziehungen und Verbindungen, die Erkenntnisse um bessere Entscheidungen zu treffen. und Basis für Veränderungen in Geschäftsabläufen versprechen. Wir können diese neu gewonnenen Er- Mit Business Analytics unter Verwendung von maschi- kenntnisse nutzen, um unsere Abläufe strategisch zu nellem Lernen und tiefem Domänenwissen können gestalten und aus dieser komplizierten Investition Unternehmen relevante und umsetzbare Erkenntnis- in das Big-Data-Management einen hohen ROI zu se aus Daten in Anwendungen, Data Warehouses und erzielen. Das bedingt jedoch permanente Weiterent- Datenbanken gewinnen. Business-Analytik sollte ein wicklungen und Anpassungen der Architekturen und umfassender Prozess sein, der zum Handeln auffor- angewendeten Konzepte, um Informationsangebot dert. Sobald die Informationen vorliegen, kann ein und -nachfrage auszugleichen und gleichzeitig nach Unternehmen seine Prozesse neu bewerten, neu aus- vorne zu schauen, um das jeweilige Unternehmen führen und neu konfigurieren. Es geht darum, aktiv strategisch zukunftssicher zu positionieren. zu werden. Bei Business Analytics geht es um das Entdecken, In- Nach einem kurzen Abriss über die Historie der ana- terpretieren und Kommunizieren von aussagekräfti- lytischen Systemwelt werden einerseits aktuelle Dis- gen Datenmustern und den Einsatz von Werkzeugen, kussion um die Next Generation Analytics des Jahres die es Ihrem gesamten Unternehmen ermöglichen, 2021 vorgestellt und die Themen der Zeitschrift jede datenbezogene Frage zu stellen, in jeder Umge- BI-SPEKTRUM entsprechend eingeordnet. Ausge- bung und auf jedem Gerät. Um die gewünschten Er- wählte Beiträge des Jahres reflektieren beispielhaft gebnisse zu erzielen, bietet Business Analytics noch die Diskussionen zu den Themen und spiegeln da- mehr Möglichkeiten, zum Beispiel Optimierung, Kos- mit sowohl das aktuelle Geschehen rund um Busi- tensenkung und Kundenbindung. ness-Intelligence- und Analyticsprojekte als auch die schon in der Schublade liegenden, anstehenden Auf- Heutzutage möchte jedes Unternehmen mehr aus gaben wider, die es zu erfüllen gilt, um den Zielen der der Analytik herausholen – mehr Daten nutzen, um digitalen Transformation gerecht zu werden. 4 5 6
ZUM INHALT 2 Business Intelligence, Analytics, Big Data und Artificial Intelligence im Zeitverlauf „Patterns emerge before the reasons for them become apparent.“ –Professor Vasant Dhar 2.1 Historische Entwicklung Sowohl Business Intelligence (BI) als auch Business Vorrangig steht dabei die Unterstützung des Manage- Analytics (BA) sind Begriffe, die am Ende einer langen ments in der Entscheidungssituation an. Die folgende Entwicklungsgeschichte der Managementunterstüt- zeitliche Zuordnung ist nicht trennscharf, da sich die zungssysteme (MUS) stehen. Chronologisch wird die jeweiligen Konzepte überlagern und teilweise latent Genese der MUS in unterschiedliche Phasen einge- existieren. Es wird jeder Epoche lediglich die dominan- teilt, die jeweils vor dem Hintergrund der verfügbaren te Begriffsprägung zugewiesen. Dabei sind die benann- IT-Ressourcen zu sehen sind. Allen Phasen gemeinsam ten Konzepte teilweise deutlich älter, als in den Phasen ist, dass nach Werkzeugen für eine adäquate Informa- repräsentiert wird, da die theoretischen Überlegungen tionsversorgung für das Management gesucht wird. schon vor den ersten Realisierungen lagen. Abb. 1: Historische Entwicklung der Managementunterstützungssysteme Insgesamt stellt der Komplex MUS als Sammelbegriff aller Strömungen ein Kontinuum dar. 5 6 7
ZUM INHALT 2 Business Intelligence, Analytics, Big Data und Artificial Intelligence im Zeitverlauf Phase 1 (1960–1970) Managementinformationssysteme (MIS) erstellten das Management ausgeliefert. Da es sich um vergan- in der Frühzeit der betrieblichen Informationssyste- genheitsbezogene Daten handelte, war der Einsatz me Berichte über abgelaufene Perioden. Die Daten von MIS für Kontrollzwecke und Abweichungsanaly- wurden aus den operativen Datenbanken generiert sen geeignet. Weniger hilfreich waren die Systeme und in Form von starren Papierberichten mit vorde- für zukunftsgerichtete Planungsrechnungen, welche finierten Berichtsinhalten und Berichtsterminen an zusätzlich Prognoseverfahren benötigten. Phase 2 (1970–1980) Entscheidungsunterstützungssysteme (EUS) lassen verfahren (Heuristiken) sowie Statistik und Simu- sich als nachfolgendes Konzept ansehen, da bei dieser lationen (vgl. Kap. 3.3) eingesetzt, um die EUS als Kategorie nicht allein die Datenlieferung gesehen, son- effiziente Werkzeuge für Managementaufgaben zu dern ein Entscheidungsmodell implementiert wurde, nutzen. Damit war der Übergang von der daten- welches eine Zielfunktion und Restriktionen abbilde- orientierten zur modellorientierten Entscheidungs- te und somit den mathematischen Zugang zur Opti- unterstützung vollzogen. Die Euphorie für die com- mierung ermöglichte. Die in dieser Zeit aufkommende putergestützten Systeme zur Entscheidungsfindung Disziplin Operations Research (OR) stellte vielfältige flachte aber ab, da zum einen die Rechnerkapazi- Modelle und Rechenverfahren zur Verfügung, um kom- täten für die Lösung realitätsnaher Problemfelder plexe betriebliche Entscheidungen zu behandeln. wegen der Komplexität der Rechenverfahren nicht ausreichte und zum anderen die Automatisierung Neben der analytisch mathematischen Form der der Entscheidung (Black-Box-Syndrom) zunehmend Entscheidungsrechnung wurden auch Näherungs- auf Ablehnung stieß. Phase 3 (1980–1990) Durch das Aufkommen der Personal Computer unternehmensexterne Informationen zur Verfügung, (PC) und die Verfügbarkeit von Rechnerleistung die in die Management-Dashboards eingearbeitet am Arbeitsplatz des Anwenders entstand in der wurden. Die automatisierte Informationsversorgung dritten Phase das Verlangen nach graphikorien- von den Basissystemen direkt zur strategischen Un- tierten Auswertungen kritischer Erfolgsfaktoren ternehmensebene sorgte für starke organisatorische (Kennzahlensysteme), um die strategische Unter- Veränderungen, denn die erzeugte Transparenz und nehmensplanung und -kontrolle zu unterstützen. die zeitnahe Meldung von relevanten Abweichun- Diese für das Top-Management konzipierten Sys- gen bei kritischen Erfolgsfaktoren setzte das mitt- teme wurden Führungsinformationssysteme (FIS) lere Management unter Druck. Die unidirektionale oder Executive-Information-Systeme (EIS) genannt. Bereitstellung der Daten aus den operativen Unter- Sie versprachen den zeitnahen Zugriff auf hoch- nehmensdatenbanken für die Unternehmensspitze konsolidierte Unternehmensdaten, d. h. es gab ermöglichte zwar eine umfassende und schnelle Be- eine erneute Hinwendung zur datengestützten lieferung, sah aber keine analysierenden Zugriffe auf Ausrichtung der MUS. Neben den unternehmens- die Datenbasis vor. Die Suche nach einem Ausweg internen Informationen standen zunehmend auch führte zur nächsten Phase der MUS. Phase 4 (1990–2000) Zur Sicherstellung von Ad-hoc-Analysen und einem On-line-analytical-processing-Datenbanken (OLAP) Drill Down bis auf die Basisdaten wurden in Phase zur Datennutzung in die betriebliche Informations- 4 neue Architekturkonzepte marktfähig gemacht, die verarbeitung Einzug hielten. als Data Warehouse (DW) zur Datenhaltung und als 6 7 8
ZUM INHALT 2 Business Intelligence, Analytics, Big Data und Artificial Intelligence im Zeitverlauf Die Grundidee bestand in der Zusammenführung al- Produktanbietern einen Milliardenmarkt, sodass ein ler potenziell für einen Entscheidungsfall relevanten starkes Momentum entstand. Daten in eine unternehmensweite Datenbank, deren struktureller Aufbau sich an den Entscheidungsfel- Die Probleme der Datenbewirtschaftung (Informa- dern, nicht – wie bisher üblich – an den Geschäfts- tionslogistik) für das Management mussten ge- prozessen festmachte. Diese Abkehr vom Paradigma meinsam technisch wie auch betriebswirtschaftlich der relationalen Datenbanken zur Transaktionsverar- gelöst werden, was zu einer neuen Qualität der Un- beitung (On-line-transaction-processing/OLTP) hin terstützungssysteme führte. Der Aufbau der Tech- zum multidimensionalen Konzept der Informations- nologien entlang der Architekturebenen war nicht speicherung von Dimensionen und Fakten (OLAP) trivial, aber sobald die Infrastruktur bereitgestellt hatte durchschlagenden Erfolg und führte zu einer war, kamen zunehmend Fragen nach der analy- Massenbewegung in den Unternehmen. Die Instal- tischen Nutzung in den betriebswirtschaftlichen lation von Data-Warehouse-Instanzen versprach die Fachbereichen auf. Dies wiederum führte zu einer Lösung des Problems der fehlenden Informations- neuen Tendenz, die begrifflich stärker auf die fachli- verfügbarkeit und der unzureichenden Navigation chen Domänen abstellte und zur fünften Phase der in den Informationsbeständen, verschaffte aber den MUS führte. Phase 5 (2000–2010) Unter dem Begriff Business Intelligence (BI) wird nutzen, ziehen den primären Nutzen aus BI. Die Zu- die Zusammenführung und analytische Auswertung rechnung der Data-Mining-Verfahren zu BI ist nicht fragmentarischer Unternehmensdaten (intern und unumstritten, ergänzt aber das Nutzerprofil um die extern) verstanden. Die Hinwendung zur „aufklären- Analysten, die statistische Methoden und künstliche den“ Informationsversorgung des Managements mit Intelligenz einsetzen, um interpretationsfähige Da- fachlichen Inhalten und Interpretationshilfen präg- tenmuster zu generieren. te diese Phase. Auf der Basis eines Data Warehouse werden unterschiedliche Nutzergruppen durch BI Derzeit ist noch unklar, ob Phase 5 tatsächlich abge- unterstützt. Dies können Abonnenten von Berichten schlossen und schon in Phase 6 übergegangen ist. sein, die lediglich konsumieren (siehe auch Phase 1 Bleibt man im Beschreibungsmuster der Dekaden, und 3), oder Analytiker, die tief in die Datenbestände so hat sich tatsächlich Phase 6 eingestellt und setzt abtauchen und Hypothesen prüfen bzw. Kausalitäten neue Akzente durch Zukunftsbezug der Entschei- ableiten. Solche Power-User, welche mit Ad-hoc-Ana- dungen und Einsatz von Entscheidungsmodellen lysen die Navigationsmöglichkeiten der OLAP-Würfel (siehe Phase 2). Phase 6 (2010–?) Der Begriffswandel in Business Analytics verspricht Kombination von Methoden der Datenanalyse (Data einen intensiveren Einsatz von Datenanalysen, ver- Science) und Modellen liegen. Die Konvergenz von bunden mit direkten Handlungsempfehlungen, wel- datenorientierten und modellorientierten Verfahren che aus den Analyseergebnissen abgeleitet werden. scheint daher naheliegend und bringt tatsächlich Dabei wird BI nicht diskreditiert, sondern eher in den neue Aspekte in die Betrachtung von MUS auf dem Kontext der performanten Informationslieferung und Zeitstrahl. Ähnlich wie in Phase 2 treten Algorithmen aktiven Analyse gesetzt. Business Analytics hingegen in den Vordergrund, welche automatisierte Entschei- verspricht eine Aufklärung über bestmögliche zukünf- dungsprozesse ermöglichen, die auf großen polystruk- tige Handlungen mittels Algorithmen, womit bekann- turierten Datenbeständen (Big Data) in Echtzeit Emp- te Prognoseverfahren und Optimierungsrechnung fehlungen für bestmögliche Entscheidungen geben (siehe Phase 2) erneut in den Fokus rücken. Die neue oder selbst entscheiden. Noch steht nicht fest, wie Qualität von Business Analytics wird in der sinnvollen diese Phase später bezeichnet werden wird. 7 8 9
ZUM INHALT 2 Business Intelligence, Analytics, Big Data und Artificial Intelligence im Zeitverlauf 2.2 Definitorische Abgrenzung Im Allgemeinen versteht man unter Business Ana- Es ist zu erkennen, dass die von Gartner benannte lytics die Anwendung analytischer Verfahren zur Tätigkeit hier stärker auf die Anwendung statisti- Datenauswertung. Dabei sind sich alle Definitionen scher Analyseverfahren oder auch Optimierungs- insbesondere über die Anwendung von sowohl sta- methoden fokussiert wird. Ergänzend erfolgt ein tischen Verfahren, Data- und Text-Mining-Ansätzen Hinweis auf die Ergebniskommunikation hin zu un- als auch Optimierungs- und Simulationsmethoden terschiedlichen Interessenten, was zu einem weite- einig. Im Folgenden werden zunächst ausgewählte ren Charakteristikum wird. Definitionen, die unterschiedliche Charakteristika der Business Analytics betonen, diskutiert, sodass deren Evan Stubbs präzisiert in seinem Buch The Value of Elemente in die Begriffsbeschreibung überführt wer- Business Analytics: Identifying the Path to Profitability den können, die diesem E-Book zu Grunde liegt. eine andere Facette: Ohne eine Priorisierung der ausgewählten Definiti- „The cornerstone of business analytics is pure ana- onsansätze vorgenommen zu haben, erfolgt im Fol- lytics. Although it is a very broad definition, analytics genden zunächst die Betrachtung der Definition der can be considered any data-driven process that pro- Business Analytics nach Gartner: vides insight. It may report on historical information or it may provide predictions about future events; the „Business analytics is comprised of solutions used end goal of analytics is to add value through insight to build analysis models and simulations to create and turn data into information.“ [Stubbs 2013] scenarios, understand realities and predict future sta- tes. Business analytics includes data mining, predic- Stubbs unterscheidet zusätzlich den zeitlichen Aspekt tive analytics, applied analytics and statistics, and is der betrachteten Daten. Zum einen subsummiert er delivered as an application suitable for a business unter diesem Begriff das Berichtswesen historischer user. These analytics solutions often come with pre- Daten und damit das Reporting beziehungsweise das built industry content that is targeted at an industry Online Analytical Processing (OLAP). Ergänzend wer- business process (for example, claims, underwriting den hier zukunftsorientierte Daten betrachtet. Alle or a specific regulatory requirement).“ [Gartner 2016] Daten sind mit dem Ziel zusammenzustellen, Trans- parenz und ein erhöhtes Verständnis über die Akti- Gartner stellt insbesondere die Tätigkeit an sich in vitäten und zukünftig möglichen Entwicklungen zu den Vordergrund. Diese besteht darin, mittels Algo- schaffen, sodass Business Analytics nicht mehr eine rithmen Analysemodelle zu erzeugen, die in unter- Daten-, sondern eine Informationsnutzung ist, die im schiedlichen Entscheidungsszenarios Einsatz finden Rahmen der Entscheidungsfindung stattfindet. können. Dabei können diese bereits vortrainiert, al- so branchenspezifisch vorbereitet sein, um einen Das Beratungshaus Ernst & Young bringt einen wei- schnelleren Einsatz zu ermöglichen. teren Aspekt in die Diskussion ein: Die New Yorker Stern School of Business vertieft in „How an organization gathers, searches, models, ana- ihrer Beschreibung des MBA-Programms Business lyses and interprets data so as to aid decision-ma- Analytics den algorithmischen Aspekt und beschreibt: king and improve or optimize business processes.“ [Ernst & Young 2016] „Business Analytics is the study of data through statistical and operations analysis, the formation In dieser Definition ist erkennbar, dass die gesam- of predictive models, application of optimization te Organisation gefordert ist, datenorientiert zu techniques and the communication of these results agieren, um eine Entscheidungsunterstützung zu to customers, business partners and colleague exe- Gunsten der Verbesserung der Wertschöpfungspro- cutives.“ [Stern 2016] zesse zu ermöglichen. Allerdings wird nicht weiter 8 9 10
ZUM INHALT 2 Business Intelligence, Analytics, Big Data und Artificial Intelligence im Zeitverlauf vertieft, welche Aspekte einer Organisation explizit Kontext wie zum Beispiel einer strategischen Aus- betroffen sind. richtung benannt wird. Laursen und Thorlund greifen in ihrem Buch Business Wikipedia, als weitere Onlineressource, benennt: Analytics for Managers: Taking Business Intelligence Beyond Reporting das Systemdenken auf und agieren „Business analytics (BA) refers to the skills, tech- dabei auch organisationsorientiert. Sie definieren: nologies, applications and practices for continuous iterative exploration and investigation of past busi- „We look at BA as information systems, consisting of ness performance to gain insight and drive business three elements: 1. The Information systems contain planning. Business analytics focuses on developing a technological element. 2. Human competencies. 3. new insights and understanding of business perfor- The information systems must contain some specific mance based on data and statistical methods.” [Wi- business processes that make use of the information kipedia 2016] or the new knowledge.“ [Laursen; Thorlund 2010] In dieser Begriffsannäherung werden zusätzlich auch Analog dem in der deutschsprachigen Wirtschaftsin- im Kontext der Business Analytics geforderte Fähig- formatik üblichen Mensch-Aufgabe-Technik-Dreieck keiten benannt. Dabei wird jedoch nicht differenziert, wird ein Spannungsfeld beschrieben, in dem Bu- ob es sich um die Fähigkeiten der Mitarbeiter oder siness Analytics wirkt. Wie dieses Wirken gestaltet um Fähigkeiten der Organisation an sich geht. Bei- werden soll, wird nicht näher spezifiziert, sondern le- de sind aber grundsätzlich von Bedeutung, da der diglich darauf verwiesen, dass mit der Steuerung der prozessuale Gedanke der Business Analytics, Daten Systemelemente Informationen oder neu erzeugtes zu sammeln, aufzubereiten und zur Entscheidungs- Wissen nutzbar gemacht werden können. unterstützung zur Verfügung zu stellen, die Orga- nisation dahingehend beeinflusst, datengetrieben Das online verfügbare Business Dictionary als eine zu werden, zum anderen aber in allen Phasen des in der Praxis oftmals genutzte Referenz konzentriert Prozesses qualifizierte Mitarbeiter benötigt, um dies sich bei der begrifflichen Abgrenzung auf die opera- sinnhaft einsetzen zu können. tionale Ebene und damit die einzelnen Tätigkeiten, die im Einzelnen innerhalb eines Prozesses anfallen: In ihrem Buch Business Analytics: A Practitioner’s Guide, betonen Saxena und Srinivasan den Entscheidungs- „Process of determining and understanding the ef- prozess an sich fectiveness of various organizational operations. Bu- siness analytics can be either focused on internal or „Analytics is a vast new terrain that has emerged external processes. Different specializations exist, from the evolution of fields of study that can be inte- encompassing most major aspects of business, inclu- grated to help conceive of, make, and execute smarter ding risk analysis, market analysis, and supply chain decisions or to go from idea to execution in a more analysis.“ [Business Dictionary 2016] rational way, using data, models, and governance pro- cesses that leverage this vast and fast-evolving body In den einzelnen Geschäftsprozessen, ob diese nun of knowledge.“ [Saxena; Srinivasan 2013] intern oder extern bestehen, werden bezogen auf die in den Prozessen vorhandenen Aufgaben (Ope- Dabei geht es den Autoren nicht um die Prozess- rationen) Analysen auf diese selbst bezogen oder schritte an sich, sondern um die Art der Entschei- aufgabenübergreifend ausgeführt, um deren Effek- dungsfindung. Diese wird oftmals nicht nur durch die tivität und damit deren Ausführungsgenauigkeit zu vorhandene Informationslage beeinflusst, sondern bestimmen. Auffallend ist hier, dass die Aufgabenef- darüber hinaus durch persönliche Eindrücke oder fektivität in Geschäftsprozessen betont wird, jedoch Empfindungen der Entscheidungsträger. Business keine Entscheidungsunterstützung im breiteren Analytics soll nun eine rationalere Betrachtung der 9 10 11
ZUM INHALT 2 Business Intelligence, Analytics, Big Data und Artificial Intelligence im Zeitverlauf Sachlage ermöglichen und damit von persönlichen für den Erfolg solcher IT-Investitionen erforderlich. Einflüssen abstrahieren, sodass Entscheidungen auch Solche ergänzenden Parameter liegen beispielswei- für Dritte nachvollziehbarer werden. se in der Organisation, ihrer Kultur und Mitarbeiter- qualifikation begründet. Umfassend nähern sich Davenport und Harris im Buch Competing on Analytics: The New Science of Winning Diese Diskussion verdeutlicht, dass die reine Investi- dem Begriff: tion in Informationstechnologie nicht automatisch zu Produktivitätssteigerungen führt. Nutzenstiftend sind „In that sense, then, ‘business analytics’ can be de- jene Projekte, die auch weitere Parameter wie organi- fined as the broad use of data within organizations. It satorische Auswirkungen und Mitarbeiterqualifizie- encompasses query and reporting but aspires to gre- rung einkalkulieren und im Informationsmanagement ater levels of mathematical sophistication. It inclu- berücksichtigen. Auch das in den letzten Jahren zu- des analytics, of course, but involves harnessing them nehmend diskutierte System Thinking [Meadows; to meet defined business objectives. Business ana- Booth Sweeney 2013] greift den Gedanken auf, dass lytics empowers people in the organization to ma- Informationstechnologie nur ein Element im System ke better decisions, improve processes and achieve ist und weitere beeinflussende Elemente existieren, desired outcomes. It brings together the best of data die es zu identifizieren und zu steuern gilt. Somit ist management, analytic methods, and the presentation der Gedanke der Mensch-Aufgabe-Technik-Systeme of results—all in a closed-loop cycle for continuous gegeben, welcher das Zusammenspiel der Elemente learning and improvement.“ [Davenport; Harris 2007] und damit die Grundlage des Informationsmanage- ments auch für die Business Analytics gültig abstra- Zunächst lässt sich in dieser Beschreibung der Prozess- hiert beschreibt. aspekt identifizieren, der organisational zu reflektie- ren ist, da sonst kein dauerhaftes Lernen und keine Zunächst einmal ist bei der Business-Analytics-Ein- dauerhafte Verbesserung möglich sind. Im Weiteren führung der Mehrwert für das Unternehmen zu be- wird auf die Qualifikation abgestellt, die Mitarbei- stimmen, da der erworbene Nutzen den Aufwand ter haben müssen, um Business Analytics überhaupt rechtfertigen muss. Eine weitere Facette ist die zu sinnhaft einsetzen zu können. Und dies bedingt, dass Grunde liegende projektorientierte und prozessuale sich Mitarbeiter mit analytischen Verfahren, aber Betrachtung. Das Charakteristikum „projektorientiert“ auch der Ergebnispräsentation (= Visualisierung) und entsteht daraus, dass es in der Natur beispielswei- nicht nur dem Berichtswesen, auseinanderzusetzen se von Data-Mining-Ansätzen liegt, kein Regelkreis haben, um die Entscheidungsprozesse positiv zu be- zu sein. Für die jeweiligen wertstiftenden Aufga- einflussen und eine wissensbasierte Organisation zu benstellungen sind Daten jeweils neu zusammenzu- schaffen. stellen, zielorientierte Analyseoptionen für die dann zu Grunde liegenden Daten zu evaluieren und dies Fasst man diese Diskussion zusammen und behält auszuführen, um die Ergebnisse im täglichen Ge- man im Blick, dass viele weitere Definitionsansätze schäftsbetrieb einsetzen zu können. Dies erfordert existieren, ist in nahezu allen Begriffsannäherungen entsprechende Fähigkeiten, zum einen in der Verfüg- die Konzentration auf analytische Verfahren enthal- barkeit entsprechender Technik, zum anderen aber ten. Dies wird gegebenenfalls um den Hinweis erwei- auch im Know-how der Mitarbeiter bezüglich der Da- tert, dass schon das Berichtswesen beziehungsweise tenaufbereitung sowie der anzuwendenden Algorith- Online Analytical Processing ein Bestandteil dessen mik und der Ergebnisinterpretation. Insbesondere an ist. Ergänzende Facetten sind eher selten zu finden. dieser Stelle wird das Schnittstellendasein der hier- Insbesondere diese ergänzenden Parameter [Laudon; mit betrauten Mitarbeiter zwischen Fachlichkeit und Laudon; Schoder 2015] sind aber erfahrungsgemäß Technik deutlich. 10 11 12
ZUM INHALT 2 Business Intelligence, Analytics, Big Data und Artificial Intelligence im Zeitverlauf Des Weiteren ist die Visualisierung des Ergebnis- durchführen [Ware 2000, S. 212 ff.]. Anforderungen ses ein bedeutendes Thema. Diese muss eine Kom- einer Analyseunterstützung der Anwender werden munikation der Ergebnisse zu unterschiedlichen durch die dynamische Abfragetechnik als visuelle Empfängern in einer Form ermöglichen, dass die Alternative zur Structured Query Language (SQL) Ergebnisse direkt verstanden und in Handlungen als Abfragesprache erfüllt. Visual Analytics unter- umgesetzt werden können. Informationsvisuali- stützt als exploratives Verfahren die drei Stufen der sierung kombiniert die Stärken der interaktiven Problemlösung Vorbereitung, Entscheidungsgene- Datenanalyse mit der menschlichen Fähigkeit, rierung und Entscheidung. Muster oder Trends visuell erfassen zu können. Ei- ne kognitive Unterstützung muss als Semiautoma- Fasst man nun diese einzelnen Aspekte zusammen, tismus gestaltet sein, sodass Steuerinformationen stellt der in der nachfolgenden Abbildung dargestell- entsprechende Änderungen in der Visualisierung te Prozess die Essenz der Ausführungen dar. Abb. 2: Prozess der Business Analytics Grundsätzlich ist eine Datenquellenbewirtschaftung führen, die wiederum Gegenstand der Datenerhebung in dem Sinne erforderlich, als dass mögliche inter- sein sollen; zum einen, um das Ergebnis im Sinne der essante Muster immer wieder zu identifizieren und Bestätigung der Nützlichkeit zu bestimmen, zum an- bezüglich aktueller Inhalte zu überwachen sind. Aus deren, um wiederum Eingaben in einen neuerlichen internen und externen Quellen lassen sich Daten Business-Analytics-Prozess darzustellen. Es sind in aufgabenorientiert zusammenstellen, um mittels un- allen Phasen des Prozesses angemessene Informa- terschiedlicher Algorithmen Entscheidungsmodelle tionstechnologie und eine entsprechende Qualität aufzustellen. Nach deren Ergebnisevaluation sind die der Mitarbeiter erforderlich, um dies nutzenstiftend geeigneten Ergebnisse in eine angemessene Visua- umsetzen zu können. Die genutzte Technik, aber auch lisierung zu übertragen, sodass ein Entscheidungs- die Mitarbeiter können unternehmensintern oder -ex- träger sie direkt verwerten kann. Letztlich sollen die tern positioniert sein, was gegebenenfalls ein voll- Entscheidungen zu unternehmerischen Handlungen ständiges oder partielles Outsourcing der Business 11 12 13
ZUM INHALT 2 Business Intelligence, Analytics, Big Data und Artificial Intelligence im Zeitverlauf Analytics mit sich bringt. Insbesondere Cloud Compu- Technologien, Algorithmen, Anwendungen, Visuali- ting ist ein zu nennender Themenkomplex, da dieser sierungen und Prozessen, die nutzenstiftend unter- Begriff unterschiedliche Formen der Auslagerung von nehmensintern oder -extern Anwendung finden, um der Datenhaltung bis hin zur Datenanalyse beschreibt. auf Basis von unternehmensinternen und -externen Zusätzlich wäre immer die Frage zu klären, ob ein Un- Daten einen Einblick in die Geschäftstätigkeit zu ge- ternehmen das fachliche Know-how im Unternehmen winnen. Der projektorientierte Einsatz erfolgt in ei- aufbaut oder es bei Bedarf von außen zukauft. nem Prozess, um unternehmensweite Aktivitäten zu bewerten, sodass Erkenntnisse über Abteilungs- und Basierend auf diesen Erkenntnissen möchten wir für Unternehmensgrenzen hinweg als Entscheidungs- den weiteren Verlauf dieses E-Books die nachstehen- basis gesammelt werden, um aktuelle Maßnahmen de Definition zu Grunde legen: und zukunftsorientierte Handlungen daraus abzulei- ten, welche die Unternehmensperformance positiv Business Analytics ist die Kombination von Menschen, beeinflussen und die langfristige Unternehmensent- Aufgaben und Technik und damit von Fähigkeiten, wicklung sichern. 2.3 Thematische Trends 2021 Seit geraumer Zeit werden die disruptiven Auswir- Jahres. Da gibt es dann mit Datenqualitätsmanage- kungen der Digitalisierung auf die Zukunftsfähigkeit ment oder Data Governance natürlich Daueraufga- bestehender Geschäftsmodelle, aber auch auf den ben, aber auch die immer weiter voranschreitenden Wandel ganzer industrieller Sektoren sowie der Ge- technischen Entwicklungen verbunden mit ihren samtwirtschaft diskutiert. Heute ist erkennbar, dass ubiquitären Verfügbarkeiten einerseits und den fach- Wertschöpfungsketten aufbrechen und sich neu kon- lichen Anforderungen andererseits lassen immer figurieren. Digitale Plattformen ermöglichen neue Ge- wieder neue Themen entstehen, die auf die IT-Agen- schäftskonzepte, Unternehmen agieren zunehmend in da eines Unternehmens gelangen. Neben den zuvor mehreren Netzwerken gleichzeitig. Die Digitalisierung genannten Aufgaben rund um die Verfügbar- und verändert nicht nur die industrielle Landschaft, son- Nutzbarmachung von Daten kamen im BI-SPEKTRUM dern auch die Arbeitsmärkte, die urbane Infrastruktur, unterschiedliche Themenschwerpunkte auf die Agen- Mobilität, Wohnen und unser gesellschaftliches Leben. da. Diese waren: Data Storytelling, Recommendation All diese Veränderungen wären ohne neue Technologi- Engine, Process Mining, BI-Architekturen und Image en nicht möglich, die es erlauben, ein immer schneller Mining. Mit dieser im Jahr 2020 getroffenen Auswahl wachsendes Datenvolumen zu erfassen, auszuwerten reflektierte der BI-SPEKTRUM-Herausgeberkreis die und auf vielfältige Weise zu nutzen. prognostizierten Trendthemen wie Data Discovery und Visualisierung, Embedded BI und Analytics, inte- Mit neueren Anwendungsfeldern wie Internet of grierte Plattformen für Process Mining und Analytics, Things (IoT), Industrie 4.0 oder Social-Media-Mar- Cloud et cetera, die unter anderem von Computer- keting haben anspruchsvollere analytische Ansätze Weekly, InformationWeek, Barc, BigData-Insider oder an Stellenwert gewonnen, die mit Architekturinno- Forbes formuliert wurden. Dazu kommen Diskussi- vationen wie Big Data oder Cloud Computing ein- onen rund um Master Data Management und auch hergehen. Jedes Jahr wagen Analysten und Journale Cloud Business Intelligence beziehungsweise Cloud den Vorausblick auf die jeweiligen Trendthemen des Analytics. 12 13 14
ZUM INHALT 3 BI Spektrum Digest – die Ausgaben des Jahres 2021 im thematischen Überblick Im Folgenden werden die einzelnen Hefte mit thematischen Auszügen der Editorials vorgestellt und mit Schlagworten der Themenvorhersagen eingeordnet. 3.1 Data Storytelling Data Discovery und Visualisierung Data Storytelling dürfte nach wie vor zu den am meis- können. Der Schritt vom Entdecken zum Nutzen ge- ten unterschätzten Methoden in den Unternehmen lingt aber nur dann, wenn man ein entsprechendes gehören, obwohl es richtig eingesetzt signifikant zur Narrativ findet, um den Mehrwert der Daten und ihre Wertschöpfung beitragen kann, etwa für neue Data Bedeutung für die Wertschöpfung im Unternehmen Driven Products oder das Erschließen neuer Kunden- aufzuzeigen. Und je komplexer die Daten und größer segmente. Die Technik des „Data Storytelling“ ist noch die Datenmengen, umso wichtiger wird dieses Narra- relativ jung und bislang wenig verbreitet. In der heu- tiv, da es nur damit gelingt, den Entscheidungsprozess tigen Zeit von IoT, Big Data und Data Science/KI gilt zu fördern. Daher kommt dem Storytelling in der da- sehr gutes Datenverständnis als Grundvoraussetzung tengetriebenen Welt von heute eine so große Rolle für eine zielgerichtete Auswertung der vorhandenen in den Unternehmen zu. Die Technik des Storytelling Daten. In einer BARC-Studie zum Thema Storytelling kann und sollte in modernen Unternehmen auf zahl- heißt es aber darüber hinaus treffend: „Data relies on reichen Ebenen genutzt werden, damit Möglichkeiten, us to give it a voice.“ Den Daten eine Stimme zu ge- die sich aus den Daten ergeben, schneller erkannt ben bedeutet nichts anderes, als die in ihnen verbor- und der entsprechende Handlungsbedarf konkreti- genen Geschichten zu finden und zu erzählen. siert werden kann. Leider lässt sich feststellen, dass Storytelling vielfach noch immer stark unterschätzt, Ebenso wie es Humboldt vor über 200 Jahren gelang, ja sogar belächelt wird. Man sollte die Wirkmächtig- komplexe Zusammenhänge darzustellen, müssen heu- keit einer guten Geschichte niemals unterschätzen; te Insights vermittelt werden, die sich in Big Data ver- vor allem dann nicht, wenn sie uns effizienter und bergen und durch ML und andere Methoden zunächst effektiver durch den Ozean der Daten navigiert und entdeckt werden müssen, bevor sie genutzt werden auf vielversprechenden Routen zu neuen Häfen führt! 3.2 Recommendation Engine Embedded BI und Analytics Empfehlungssysteme haben das Ziel, (potenziellen) so viele Aufgaben erledigt werden müssen, um tat- Kunden dort Angebote zu machen, wo diese gerade sächlichen Nutzen bringen zu können. Im Themenbe- thematisch oder zeitlich gefordert sind und die Kon- reich der Artificial Intelligence und damit im Kern der kurrenz, die im Internet nun einmal nur einen Klick Prozessautomation in Unternehmen sind Recommen- entfernt ist, noch nicht aktiv geworden ist. Damit soll dation Engines ein Baustein der organisationalen Di- kurzfristig der eigene Umsatz entwickelt, langfristig gitalisierungsaktivitäten. Sie sind dann nicht nur als die Kundenbindung erhöht werden. Diese Engines Empfehlungen à la: „diejenigen, die Produkt A erwor- sind schon seit vielen Jahren präsent, jedoch selten ben haben, kauften auch Produkt B“ sichtbar, sondern ein Thema, das die Diskussion dominiert. Das ist da- beispielsweise auch in Chatbots, wo sie in einem in- hingehend überraschend, als dass drum herum noch teraktiven Dialog passende Empfehlungen geben. 13 14 15
ZUM INHALT 3 BI Spektrum Digest – die Ausgaben des Jahres 2021 im thematischen Überblick Doch tun sich hier schnell, wie so oft bei Ana- tatsächliche Entscheidungsunterstützung entsteht. lytics-Projekten, zwei zunächst nicht im Fokus Das kann in Analytics-Projekten, wie es auch der Auf- stehende Themen auf, die allerdings große Auswir- bau einer Recommendation Engine ist, nicht anders kungen auf den späteren Erfolg haben. Zunächst sein. Unternehmensinterne und -externe Daten müs- einmal ist die Frage zu klären, wie der neue Prozess sen identifiziert und sinnhaft zusammengebracht aussehen soll, in dem die Recommendation Engi- werden, um themen- und zeitgerechte Empfehlun- ne aktiv werden soll. Automation verändert immer gen geben zu können. Das erfordert eine Datenstra- das Arbeiten und verlangt in diesem Zusammen- tegie inklusive einer Datenquellenbewirtschaftung hang auch andere Kenntnisse der Beteiligten. Ein genauso wie die Abkehr von Ideen, alles in einen erfolgreicher Wechsel in den Ablaufstrukturen muss großen Datensee zu füllen, in dem man dann man- also entsprechend geplant sein. Und ich denke, Sie gels Organisation auch nichts mehr finden kann. alle wissen, was es bedeutet, Ablaufstrukturen in Eigentlich eine Erfahrung, die schon in frühen Da- einem Unternehmen zu verändern. Neben dieser ta-Warehouse-Projekten nicht gut funktionierte. Sie Herausforderung ist die Herrschaft über die Daten sehen also: Wie so oft sind es die Nebenaufgaben, wichtig. Schon in den ETL-Strecken der Business-In- die über Wohl und Wehe der eigentlich betrachte- telligence-Projekte zeigte sich der Aufwand, stimmi- ten Ansätze entscheiden. Deshalb ist es uns wichtig, ge und richtige Daten so zu integrieren, dass eine dies in unseren Beiträgen aufzuzeigen. 3.3 Process Mining Integrierte Plattformen für Process Mining und Analytics Process Mining verbindet Geschäftsprozessmanage- Bei dieser analytischen Disziplin des Erkennens, ment (GPM) und Geschäftsprozessmodellierung mit Überwachens und Verbesserns realer Prozesse fällt nicht-prozessorientiertem Data Mining. Dessen Me- in der Praxis aber auf, dass kein Regelkreis aus Trans- thoden und Algorithmen werden genutzt, um die parenz, Anpassung und anschließender erneuter vorhandenen Datenbestände aus Event-Logs, Trans- Optimierung entstanden ist. In der Realität ist nach aktions- und Vorgangsdaten des Unternehmens der ersten Anpassung Schluss. Das zeigt sich bereits auszuwerten. Auf Basis dieser gespeicherten tatsäch- daran, dass Process Mining in der Regel als Projekt lichen Vorgänge und Transaktionen können Prozes- aufgesetzt wird und weniger in Form von Rollen im se automatisiert erkannt, überprüft und verbessert Sinne einer Verstetigung in der Organisation. Obwohl werden. [Vgl. Ralf Peters, Markus Nauroth: Process schon in den Qualitätsansätzen der 1970er-Jahre die Mining. Springer Gabler, 2020] stetige Verbesserung das wahre Ziel war, also ein Zeitraumbezug vorlag, kommt beim Process Mining Als Wil van der Aalst um 2005 herum das Thema aus ein Zeitpunktbezug zum Tragen. seinen Arbeiten zum Geschäftsprozessmanagement an der TU Eindhoven entwickelte, zielte es zunächst Anscheinend begnügen sich Entscheidungsträ- auf Transparenz – in einer zunehmend digitalisierten ger damit, einmalige Anpassungen vorzunehmen. Welt sollten Daten effizient genutzt werden. Die neue Den Mehrwert in kontinuierlicher Prozessüberwa- Sichtbarkeit zeigte aber, dass nicht nur Ineffizienzen chung, -steuerung und -justierung erkennen sie lei- bei der Datennutzung vorlagen, sondern Abläufe im der nicht. Aus vereinzelten Gesprächen ergab sich, wirklichen Leben anders strukturiert sind, als sie ur- dass sie Aufwand und insbesondere die Kosten der sprünglich geplant waren. Da stellt sich die Frage, kontinuierlichen Prozessüberwachung und Opti- wieso es zu solchen Unterschieden zwischen Pla- mierung höher einschätzen als den Nutzen. Dabei nung und gelebtem Prozess kommt. Damit tritt das ist es im Zuge der Digitalisierungsoffensiven in Warum plötzlich in den Vordergrund der Betrachtung. Unternehmen ratsam, ein aktives verantwortliches 14 15 16
ZUM INHALT 3 BI Spektrum Digest – die Ausgaben des Jahres 2021 im thematischen Überblick Prozessgremium zu haben. Ansonsten laufen Un- verlangen Strukturen, um den Status quo und die He- ternehmen Gefahr, ihre bestehenden Prozesse 1:1 rausforderungen in Prozessen kennenzulernen. Erst zu digitalisieren. Aber ineffiziente Prozesse bleiben dann lassen sich die Themen zielorientiert in einem auch digital ineffizient. Gesamtsystem weiterentwickeln. Sie werden es alle schon selbst erlebt haben: Die einzelnen Prozesse Auch mit Process Mining verwandte Ansätze wie Robot anzufassen und zielorientiert weiterzuentwickeln, Process Automation (RPA) oder Process Intelligence verlangt mehr als sie nur neu aufzuzeichnen. 3.4 Business-Intelligence-Architekturen Cloud Computing Die digitale Transformation und die intensivere Nut- Business-Intelligence- und Analytics-Architekturen zung von Data Science in Unternehmen bedingen bilden das Gerüst für die unterschiedlichen Ausprä- die intensive Auseinandersetzung mit analytischen gungen des datengetriebenen Handelns in Unter- Architekturen. Dabei ist das kein Bereich, wo schlicht nehmen. Auch, wenn in der Literatur gerne von der von einem Status quo in einen anderen gewechselt disruptiven Rolle der Architekten gesprochen wird, werden sollte. Stattdessen gilt es, in steter Bewegung um neue Ansätze in einem Unternehmen zu integrie- zu bleiben, um den Anforderungen der Nutzer gerecht ren, ist es in der Praxis oftmals eher ein Reagieren auf zu werden. Digitalisierungsszenarios wie Self-Ser- die zuvor genannten Veränderungen, das Einfangen vice, Robot Process Automation, Artificial Intelligence von Schatten-IT-Aktivitäten etc. Auch hier zeigt sich etc. sind ohne eine passende Architektur nicht vor- aber, dass der Austausch aller Beteiligten notwendig stellbar. Die Fähigkeiten eines IT-Bereichs zeigen ist, um das Potenzial, die Kraft einer Architektur zur sich hier, wenn er in immer kürzer werdenden Zyklen Entfaltung zu bringen und damit den Anwendern zu die Nachfragen der Daten- und Informationskonsu- ermöglichen, ihre individuellen Anforderungen im menten bedienen kann. Diese Leistungen verdienen Sinne des Self-Service umzusetzen. großen Respekt: längerfristige Transformationspro- jekte so zu arrangieren, dass die Schnelllebigkeit der Anwenderinteressen abbildbar ist. 3.5 Image Mining Internet of Things Die kontinuierlichen Verbesserungen in den Berei- Bilddaten zu generieren. Das beliebteste Konzept chen Erfassung, Speicherung und Verarbeitung von in diesem Bereich heißt Computer Vision, aber auch Bilddaten wie der weitere Fortschritt analytischer das Konzept des Image Mining wird aktuell disku- Methoden bieten zahlreiche Möglichkeiten für ziel- tiert. Beide Konzepte kombinieren Methoden und gerichtete Szenarios des Image Mining. Landwirt- Techniken der Bildverarbeitung und Datenanalyse, schaft, Bildung, Industrie, autonome Fahrzeuge oder um aus Bilddaten Wissen zu generieren. Wir freuen medizinische Diagnosen sind nur einige Beispiele uns, im letzten Heft des Jahres einen Fokus zu set- für mögliche Anwendungsgebiete. Technologien zen, der ein analytisches Thema in de Vordergrund und Methoden der Bildverarbeitung und Datenana- stellt, dass der Automation in Prozessabläufen Un- lyse werden kombiniert, um Wissen auf Basis von terstützung bieten kann. 15 16 17
ZUM INHALT 3 BI Spektrum Digest – die Ausgaben des Jahres 2021 im thematischen Überblick Image Mining ist eine Kombination aus Data Mining und Interpretation von Bildern. Ziel des Konzepts ist es, und Bildverarbeitungsmethoden und deren Technolo- ein übergeordnetes Verständnis von Objekten, Merk- gien, die es ermöglichen, Muster und Zusammenhän- malen oder Aktivitäten zu generieren, die in digitalen ge in digitalen Bildsammlungen zu erkennen und so Bildern sichtbar sind. Computer Vision ist ein Teilge- Wissen zu generieren. Die erste Grundlage des Kon- biet der Computervisualisierung, das Computergrafik zepts leitet sich aus dem Data Mining ab, das dem und die Visualisierung komplexer Daten umfasst. Dies Ziel folgt, Muster in riesigen Datensammlungen mit beinhaltet Theorie und Technologie der Bilderfassung, algorithmischen Methoden zu erkennen. Identifi- -speicherung, -verarbeitung und -analyse. Ein Compu- zierte Muster, Strukturen und Beziehungen werden ter-Vision-System besteht im Wesentlichen aus einem in den Bilddatensätzen verwendet, um semantische bildgebenden Sensor, einer Schnittstelle zur Übertra- Schlussfolgerungen ziehen zu können. Daher werden gung des Bildes und einer Recheneinheit zur Verarbei- Techniken und Methoden wie künstliche Intelligenz, tung und Analyse. Der Computer-Vision-Ansatz folgt maschinelles Lernen, Bildabruf, Computer Vision, Da- einem Prozess, der darauf abzielt, Wissen über ein tenbanktechnologien und so weiter subsumiert. Das einzelnes Bild oder ein Objekt innerhalb eines Bildes Hauptaugenmerk liegt auf dem Erkennen von Mustern zu gewinnen. Dennoch sind Techniken, um aus einer oder anderen Zusammenhängen, die auf den ersten Reihe von Bildern ein Verständnis eines einzelnen Bil- Blick nicht sichtbar und somit nicht erkennbar sind. des abzuleiten, auch Teil der Computer Vision. Dabei Der Prozess des Image Mining besteht aus Vorver- liegt der Fokus auf der Unterstützung von Problemen arbeitung, Transformation, Merkmalsextraktion, der wie Objekterkennung, Bewegungsverfolgung, Aktions- Anwendung von Algorithmen aus dem Bereich Data erkennung, menschlicher Posenabschätzung oder se- Mining sowie Interpretation und Auswertung. Der Pro- mantischer Segmentierung. zess folgt der Idee, implizit vorhandenes Wissen auf- zudecken. Anschließend kann das generierte Wissen Als analytisches Thema, das im Sinne einer Digita- auf ein einzelnes Bild angewendet werden, was Rück- lisierung menschlich ausgeführte Tätigkeiten durch schlüsse und Interpretationen zulässt. Das Konzept Technik ausführen lässt, ist Image Mining ein poten- von Computer Vision umfasst verschiedene Methoden zialreiches Anwendungsgebiet zur Unterstützung der und Techniken zur Erfassung, Verarbeitung, Analyse Automation in Prozessabläufen. 16 17 18
ZUM INHALT 4 Ausgewählte Beiträge des BI-SPEKTRUM 2021 Im weiteren Verlauf wird ein Beitrag eines jeden Hefts noch einmal vorgestellt, der das jeweilige Thema be- ziehungsweise eine besondere Perspektive auf das Thema in den Vordergrund stellt. 4.1 Auf dem Weg zur Insight Driven Insurance Ein Beitrag von Dr. Michael Zimmer und Horst Nussbaumer, erschienen in der BI-SPEKTRUM Ausgabe 01/2021 Innerhalb der letzten Jahre hat das Thema Datenstra- tegie und -Governance vermehrt an Bedeutung ge- wonnen. Die Gründe hierfür lassen sich hauptsächlich auf den Einsatz von Data Science und KI zurückführen. War eine Datenstrategie in der Vergangenheit meist auf DWH-basierte Ansätze fokussiert, ändert sie sich durch Big Data und KI jetzt grundlegend. Für die Zurich Gruppe Deutschland – nachfolgend nur noch als Zurich bezeich- net –, eine der führenden Versicherungen in Deutsch- land, sind Daten seit jeher elementarer Bestandteil des Kerngeschäfts. Um dies zu zeigen, wird im Artikel darauf eingegangen, welche Handlungsfelder innerhalb der Datenstrategie für Zurich von Bedeutung sind und wie diese helfen, in Zukunft noch datenzentrierter als Insight [Sch19]). Da die Verwendung von Daten in diesem Driven Insurance (IDI) die Customer Experience der Zu- Zusammenhang von großer Bedeutung ist, liegt der rich Gruppe Deutschland zu verbessern. Fokus darauf, diese übergeordneten Ziele mit einer geeigneten Datenstrategie zu fördern. Zurich hat sich Generell verfolgen Unternehmen im Rahmen ihres hierbei entschieden, die Themen als Chance zu sehen Geschäfts strategische Ziele, um langfristig erfolg- und eine offensive Datenstrategie zu wählen, um die reich auf dem Markt zu interagieren. So verfolgt Zu- relevanten Themen proaktiv als Erfolgsfaktor anzu- rich beispielsweise als zwei ihrer zehn strategischen gehen. Bei einem defensiven Vorgehen wären hinge- Imperative die Ziele, die Kundenzufriedenheit zu gen nur minimal notwendige Standards vorgegeben Data Analytics erhöhen & KI-Strategie und Innovationen zu beschleunigen (vgl. worden (vgl. hierzu auch [Dav17], Tabelle 1). Ausgewählte Dimensionen und ihr Bezug zu den vier Pfeilern der Datenstrategie Prozesse/Organisation Erhöhung von Abschlusswahrscheinlichkeiten Verkürzung der Durchlaufzeiten Finanzen Reduzierung von Abschlusskosten KI als „Entscheider“ für Dunkelverarbeitung & Automatisierung Verbesserte Preiskalkulation Einsatz der Sachbearbeiter für kritische Themen Verbesserte Schaden- & Leistungsprävention Zusammenführung der Daten der Bereiche Verbessertes Kundenverständnis & Fokussierung auf den Kunden Aufbau relevanter Daten- und KI-Fähigkeiten Kunde / Markt Mitarbeiter Personalisierte Ansprache Befähigung der Mitarbeiter auf dem Weg zur datenzentrierten Versicherung Erfüllung digitaler Grundanforderungen Individuelle und innovative neue Produkte mit Positionierung als innovativer Arbeitgeber klarem Kundenfokus Abb. 1: Handlungsfelder und Werttreiber INTERNAL USE ONLY 1 17 18 19
ZUM INHALT 4 Ausgewählte Beiträge des BI-SPEKTRUM 2021 Zur besseren Strukturierung der Datenstrategie wur- einfachere oder schnellere Ansprache optimiert den vier Handlungsfelder identifiziert, mit deren werden können (vgl. die Fallstudie von Zurich in Hilfe die Datenstrategie anhand konkreter Maßnah- [Han21]. In diesem Zusammenhang wurden auch men kurz,- mittel- und langfristig bewusst gestaltet neue Rollen und Verantwortlichkeiten geschaffen wird. Um den Nutzen durch eine Datenstrategie an- und das Thema KI als Labor direkt unter einem zudeuten, sind in Abbildung 1 auch Werttreiber wie Vorstandsressort im Fachbereich angesiedelt. Finanzen, Kunde/Markt oder Mitarbeiter dargestellt. 3. Für eine Versicherung, die mit dem Aktuar den Bei den vier relevanten Handlungsfeldern von Zurich Archetypen eines Data Scientist hervorgebracht handelt es sich um die folgenden: hat, ist es essenziell, die Datenfähigkeiten im Un- 1. Mit Vertrauenswürdige Daten und abgeleitete Er- ternehmen an neue analytische Methoden anzu- kenntnisse wird ein Kernthema einer IDI adressiert. passen und den Mitarbeitern zu vermitteln, auch Daten, deren Richtigkeit und deren Verfügbarkeit weiterhin zukunftsfähig Data Science und KI an- sind entscheidend, um nachhaltig Informationen zuwenden (vgl. [Han20], S. 22ff.). über Kunden zu generieren und diese erfolgreich, 4. Unter Data & Analytics Excellence versteht Zu- beispielsweise im Rahmen der Customer Journey, rich den Aufbau geeigneter organisatorischer einzusetzen. Das Handlungsfeld umfasst aber Formen, um die Datenstrategie nachhaltig im auch technische Themen wie Datenarchitekturen Unternehmen zu verankern, weiterzuentwickeln oder Echtzeitanbindung, die notwendig sind, um und letztlich auch compliant umzusetzen (vgl. relevante Erkenntnisse zum richtigen Zeitpunkt hierzu auch das aktuelle TDWI Buch zu Gover- bereitstellen zu können (vgl. [Han20], S. 18ff.). nance [Glu20]). 2. Der Einsatz von AI und Machine Learning ist für Diese Handlungsfelder stehen nicht für sich, sondern Zurich von großer Bedeutung, da auf diese Wei- müssen in eine Metrik zur Erfolgsmessung eingebet- se bestehende analytische Methoden verbessert tet werden. Hierzu eignen sich aus den Werttreibern oder Prozesse durch verbesserte Interaktion und abgeleitete KPIs. Datenleitlinien von Zurich Aufgrund der großen Bedeutung von Daten für Zu- übergeordneten Vision abgeleitet und werden inner- Unsere sechs Leitlinien sind die Grundlage rich wurden im Rahmen der Datenstrategie auch zurvon halb Verwendung vonAbbildung 2). Zurich gelebt (siehe DatenDatenleitlinien bei der ZGD erarbeitet. Diese sind aus der Leitlinie Beschreibung ▪ Daten sind standardisiert oder standardisiert abgelegt, um konsistente Ergebnisse zu ermöglichen. Daten sind ein kritischer ▪ Daten und Analysen müssen vertrauenswürdig sein. Erfolgsfaktor, kein ▪ Die Daten werden auf der niedrigsten verfügbaren Granularität gespeichert. Abfallprodukt ▪ Gespeicherte Daten basieren auf den Quellsystemen. ▪ Wir fördern eine Kultur der „Wiederverwendung“. Daten werden einmal ▪ Die Daten aus den Quellsystemen werden einmal erfasst und für unterschiedliche Anwendungen zentral verfügbar gemacht. erfasst und wieder- ▪ Dadurch werden redundante und voneinander abweichende Daten vermieden. verwendet ▪ Kritische Daten (insbesondere mit Kundenbezug) werden vor unangemessenem, unbefugtem, unbeabsichtigtem oder vorsätzlichem Daten werden verwaltet, Missbrauch geschützt. Hier erfolgt ein enger Austausch mit dem Datenschutz. überwacht und gesichert ▪ Die Verarbeitung der Daten muss allen gesetzlichen und regulatorischen Anforderungen entsprechen. ▪ Bei der Bereitstellung von Daten ist ein Abwägen zwischen Kosten und Nutzen erforderlich. Daten werden nicht zum Selbstzweck Daten sollen gespeichert. Geschäftsnutzen stiften ▪ Aktuelle Initiativen aus dem Business werden bei der Datenbereitstellung aktiv eingebunden. ▪ Es ist eine Balance zwischen Quick Wins und langfristigem Nutzen zu finden. ▪ Alle Mitarbeiter sind für das Management von Daten verantwortlich. Jeder ist für Daten ▪ Wir wollen unsere Daten für nachhaltiges Wachstum einsetzen. verantwortlich ▪ Das Wissen über Daten sollte für alle Mitarbeiter inhärent sein und sowohl im täglichen Geschäft als auch bei strategischen Themen abgerufen werden. ▪ Wir schaffen Transparenz über Daten, Verantwortlichkeiten und Ergebnisse. Wir ermöglichen einen ▪ Wir helfen beim Verständnis der Daten. einfachen Zugriff auf Daten ▪ Wir bilden eine Kontrollinstanz für dezentral entwickelte Lösungen. Abb. 2: Datenleitlinien 2 TERNAL USE ONLY 18 19 20
Sie können auch lesen