Smart Data bei der Berliner Sparkasse - Dr. Matthias Nolte Leiter Business Intelligence Services 25.02.2015

Die Seite wird erstellt Moritz Weidner
 
WEITER LESEN
Smart Data bei der Berliner Sparkasse - Dr. Matthias Nolte Leiter Business Intelligence Services 25.02.2015
Smart Data bei der Berliner Sparkasse

Dr. Matthias Nolte
Leiter Business Intelligence Services
25.02.2015
Smart Data bei der Berliner Sparkasse - Dr. Matthias Nolte Leiter Business Intelligence Services 25.02.2015
Inhalt

  1      Begriffsabgrenzung SMART Data
  2      Strategie als Startpunkt
  3      Metriken und Daten
  4      Aufbau von Analytik
  5      Reporting Results
  6      Transform Business

                                         Smart Data in der Berliner Sparkasse   25.02.2015   -2-
Smart Data bei der Berliner Sparkasse - Dr. Matthias Nolte Leiter Business Intelligence Services 25.02.2015
BIG DATA – kein weiterer Versuch der Definition

                                                           Timo Elliot´s                                                            Opentracker
                                                           Business Analytics Blog

          1 Definition                                    7 Definitionen                                             30+ Definitionen

            Es gibt schlichtweg zu viele Definitionen und jeder hat wahrscheinlich Recht

http://en.wikipedia.org/wiki/Big_data                                                                                              http://www.opentracker.net/article/definitions-big-data
                                        http://timoelliott.com/blog/2013/07/7-definitions-of-big-data-you-should-know-about.html
                                                                                                                           Smart Data in der Berliner Sparkasse    25.02.2015         -3-
Smart Data bei der Berliner Sparkasse - Dr. Matthias Nolte Leiter Business Intelligence Services 25.02.2015
„Smart“ als Vorgehensmodell unserer Analytischen Weiterentwicklung

Volume                 Datenmanagement

Variety
                       Datenintegration

                       Qualität
                                                             mart Data
                                                             S   Start with Strategy
Velocity               Anreicherung
                                            Konkrete         M   Measure Metrics and Data
                                            Adressierung
                       Governance           der relevanten
                                                             A   Apply Analytics
Veracity                                    Facetten         R   Reporting Results
                       (Ad hoc) Analytics
                                                             T   Transform Business
Visualisation          Tools                                              in loser Anlehnung an Bernhard Marr

                       Applikationen
Value

                                                                   Smart Data in der Berliner Sparkasse   25.02.2015   -4-
Smart Data bei der Berliner Sparkasse - Dr. Matthias Nolte Leiter Business Intelligence Services 25.02.2015
Inhalt

  1      Begriffsabgrenzung SMART Data
  2      Strategie als Startpunkt
  3      Metriken und Daten
  4      Aufbau von Analytik
  5      Reporting Results
  6      Transform Business

                                         Smart Data in der Berliner Sparkasse   25.02.2015   -5-
Smart Data bei der Berliner Sparkasse - Dr. Matthias Nolte Leiter Business Intelligence Services 25.02.2015
Strategie                                                                             SMART
                                Vision?             Mission?

               Wie komme ich           Was sind die theoretischen
               zu einer Strategie?     nächsten Entwicklungsschritte?

            Wo stehen wir?     Was sind die tatsächlichen
                               Entwicklungslinien?

                             Was tun wir NICHT?

                                              Smart Data in der Berliner Sparkasse   25.02.2015   -6-
Smart Data bei der Berliner Sparkasse - Dr. Matthias Nolte Leiter Business Intelligence Services 25.02.2015
Maturity Assessments zur Standortbestimmung – die Qual der Wahl                                                     SMART
z.B. für BI                      TDWI Big Data Maturity Assessment              Maturity Awareness
Steria Mummert biMA

                                                                                         •     BI- Maturity
                                                                                         •     Big Data &
                                                                                               Analytics Maturity

Andere Beratungsgesellschaften        + jeder namhafte
                                       Software-Hersteller, hier z.B. SAP

                                                                                 Ableitung der theoretischen
                                                                                 nächsten Entwicklungsschritte

                                                                            Smart Data in der Berliner Sparkasse   25.02.2015   -7-
Smart Data bei der Berliner Sparkasse - Dr. Matthias Nolte Leiter Business Intelligence Services 25.02.2015
Tatsächliche Entwicklung ist häufig determiniert durch drei Faktoren                                       SMART
                                                  Am Anfang steht üblicherweise ein Use Case !

                   Use Cases
                                                  In Kombination mit den
                                                  vorhandenen/aufzubauenden

                                                  •   Skills
         Skills      Metriken/Daten/
                                                  •   Technogien/Daten/Metriken
                      Technologien

                                                  ergeben sich dann die konkreten
                                                  Entwicklungslinien.

    Shift nötig!                   Shift nötig!

                                                                   Smart Data in der Berliner Sparkasse   25.02.2015   -8-
Smart Data bei der Berliner Sparkasse - Dr. Matthias Nolte Leiter Business Intelligence Services 25.02.2015
Inhalt

  1      Begriffsabgrenzung SMART Data
  2      Strategie als Startpunkt
  3      Metriken und Daten
  4      Aufbau von Analytik
  5      Reporting Results
  6      Transform Business

                                         Smart Data in der Berliner Sparkasse   25.02.2015   -9-
Aktueller Change-Auftrag Inhouse:
  Optimierung der gesamten BI-Architektur, Reduktion der Komplexität                                                                          S  MART
         Addressiert aktuell ausschließlich die Dimensionen Volume und Variety

                                                                                      Analytisches Ökosystem

                                                                                                               BI-Nutzungsschicht
                                                                          Daten-
                                                                       Drehscheiben-
                                                                         Funktion
                                                                                                          BI-Funktionen

                                                      -Governance
                                                      Information
                                                                                       Datenvirtualisierung
                                                                                                                                          Analy-
                                                                                                                                          tisches
                                                                                                                                           Labor
                                                                    Komplexe
                                                                      Event-                   DWH-Komponenten
                                                                    Steuerung

                                                                                               Datenquellen
BI-Systeme vor Change
                                                   Vgl. Analytical Ecosystem of the Future, Steria Mummert Consulting

                   Horizontale und vertikale Integration
                   vorhandener BI-Lösungen sowie
                   Füllung der „weißen Flecken“

                                                                                                       Smart Data in der Berliner Sparkasse   25.02.2015   - 10 -
“Managed Data” bekommt unter Big-/Smart-Data-Gesichtspunkten
einen anderen Stellenwert                                                                                                                      S  MART
                                                                                                                Neue Fragestellung:
                                Tools für
                Predictive                           Statistik         Predictive            Data
                                Predictive
                Analytics                                              Modeling              Mining
                                Analytics                                                                        Wenn insbes.
                                                                                                                 Velocity und Veracity
informationen

                                BI Suite
 Mangement-

                Business        Metadaten-Ebene
                Intelligence    (alle Daten auswertbar)                 Analysen, Qualitätssicherung,
                                                                            Redaktion, Reports,                  für uns ein Thema werden,
                                                                                Dashboards                       müssen wir die Architektur
                                                                                                                 anpassen?
                Business
                Warehouse                         Managed Data (100% korrekt)
                                                     kontinuierlich, “trusted”                                             “trusted enough?”
                Golden Source
                                             Relevante Rohdaten (100% vollständig)
daten
Roh-

                Operative                                                                     Abwick-
                                 OSPlus      CRM          FIBU           Kosten     Risiko
                Systeme                                          ...                           lung

                                                                                                        Smart Data in der Berliner Sparkasse   25.02.2015   - 11 -
Use Case: Prognose von Produktaffinitäten                                                                                           Use Cases

                                                                                                                                          Metriken/
                                                                                                                                Skills     Daten/
Individual-Ansprache                                                                                                                     Technologie

      Hebung von Cross-/Up-Selling - Potenzialen:

      Im Zuge des telefonischen Kundenkontakts (In-/Outbound) soll der
      Kundenbetreuer eine aktuellen Hinweis auf potentielle Cross-/Up-Selling
      Produkte erhalten, für die der Kunde aufgrund seines Profils eine besonders
      hohe Affinität aufweist und damit eine hohe Abschlusswahrscheinlichkeit
      besteht.

Kampagnen-Ansprache
      Optimierung von Produkt - Kampagnen:
      Im Rahmen von Produktkampagnen sollen vorrangig Kunden mit einer
      hohen Affinität zum Kampagnenprodukt angesprochen werden, um
      einerseits den Ansprachefehler zu minimieren und andererseits bei
                                                                                    Kurzfristziel im Projekt (2014):
      gleichzeitiger Reduktion des monetären und personellen
      Kampagnenaufwandes den Kampagnenerfolg zu erhöhen.                            Lauffähiger Prototyp für 10
                                                                                    priorisierte Verkaufsereignisse

                                                                                        Smart Data in der Berliner Sparkasse   25.02.2015      - 12 -
Zukunftsorientierte Prognosemodelle:                                                                                                Use Cases
Weiterentwicklung der klassischen BI
                                                                                                                                         Metriken/
                                                                                                                               Skills     Daten/
                                                                                                                                        Technologie
                                                                           Bis 2014 gab es keine vom BICC
   Hoch
                                                                           zentral bereitgestellte Technologie
                                                                           für Predictive Analytics.

                                                                                                            Shift nötig!
     Komplexität

                                                        Prognose
                                                                                   Analytische Komponente
                                                           Was könnte
                                           Monitoring      passieren?                 Predictive Analytics
                                              Was
                               Analyse       passiert
                                             aktuell?                                  Dashboards,
                                Warum
                                ist es
                                                                                       Scorecards
                                                                                       Exploration,            Klassische
                               passiert?
                   Reporting                                                           Visualisierung              BI
                    Was ist                                                            Queries,
                   passiert?                                                           Reportings

     Niedrig                          Business Value                    Hoch
                                            analog: TDWI
                                                                                       Smart Data in der Berliner Sparkasse   25.02.2015     - 13 -
Skills: It´s time we face reality…..                                                 Use Cases

                                                                                          Metriken/
                                                                                Skills     Daten/
                                                                                         Technologie

                                                          Skill-Shift nötig!
                                                          Aber wir zielen nicht auf den
                                                          „Modern Data Scientist“ ab!

                                  vs.

                                        Smart Data in der Berliner Sparkasse   25.02.2015      - 14 -
Erweiterung des Analytischen Ökosystems                                                                 S  MART
                                      Notwendiger Shift wurde durch Technologie-
                                      Investition eingeleitet.
            Use Cases
                                      1.   Toolevaluierung
                                      2.   Auswahl von SAP InfiniteInsight                                    Ende
                                                                                                              2013
                                      3.   Technischer POC
                                      4.   Fachlicher POC unter „Livebedingungen“
                                                                                                              Anfang
   Skills     Metriken/Daten/         5.   Investitionsentscheidung                                           2014
               Technologien           6.   Prototypische Modellierung anhand                                  Herbst
                                                                                                              2014
                                           erster Testkampagne
                                      7.   Produktion in Linie                                                2015

                                                                 Smart Data in der Berliner Sparkasse   25.02.2015     - 15 -
Was war für uns bei SAP Infinite Insight entscheidend?                                                    S  MART
          Einfache Bedienung                         Gute Visualisierung
      •     Drag & drop für Datenselektion,          •   Vielfältige Visualisierungsmöglichkeiten
            Anreicherung, Processing                 •   Drillbar
      •     Fördert kollaboratives Modelling         •   LUMIRA Library
      • Geeignet für Business
        Analysten
                                                                            Support für R
                                                                            •   Problemlose Einbindung
                                                                            •   12 R Algorithmen bereits beinhaltet
Umfangreiche                                                                •   Breite Community: 3,500+ R Libraries
                                                                                im Netz
Modellierungs-Funktionen
  •       Classification
  •       Regression
  •       Anomaly Detection
                                                                           Integration
  •       Attribute Importance                                         •    Sybase IQ - DB
  •       Association Rules                                            •    Einfache Kommunikation mit
  •       Clustering                                                        SAP BO-Content
  •       Feature extraction

                                                                     Smart Data in der Berliner Sparkasse   25.02.2015   - 16 -
Inhalt

  1      Begriffsabgrenzung SMART Data
  2      Strategie als Startpunkt
  3      Metriken und Daten
  4      Aufbau von Analytik
  5      Reporting Results
  6      Transform Business

                                         Smart Data in der Berliner Sparkasse   25.02.2015   - 17 -
Modellierung mit InfiniteInsight                                                                                SM     ART
Modellentwicklung                                           (Vertriebs-)
                                                               DWH
                                                                                     SAP InfiniteInsight
   Modelle werden iterative erstellt, ohne dass der User
    statistisches Spezialwissen besitzen muss ->
    Toolunterstützter, automatisierter Prozess
   Zur Validierung der Modell-Güte und –Robustheit
    werden die Kennziffern KI und KR herangezogen.

 KI (KXEN Information Indicator)
   misst den Erklärungsgehalt der Inputvariablen
    in Bezug auf die Zielvariable
   Werte von 0 (kein Einfluss) to 1 (ideales Modell)

 KR (KXEN Robustness Indicator)
   misst die Fähigkeit des Modells dieselbe Prognosegüte
    bei neuen Daten wie im Trainings-Set zu erreichen
   Werte liegen zwischen 0 und 1,
    Modellgüten über 0.95 werden als “gut” eingestuft

                                                                           Smart Data in der Berliner Sparkasse   25.02.2015   - 18 -
Ergebnis: Kunden-Produkt-Matrix                                                                                                            SM     ART
                                                                                                Kunde 4713 hat für das
                                                             Produkt-Kampagne                  Verkaufsereignis (VE) 4 in
                                                              Im Rahmen der                 den nächsten 3 Monaten einen
                                                               Kampagne für                        P-Score von 0,46
                                                               Produkt (VE) 2                    (nicht zu verwechseln
                                                             werden die Kunden
                                                              mit den höchsten             mit Abschlusswahrscheinlichkeit !)
                                                                  P-Scores
                                                               angesprochen.

                                    P-Scores         VE 1         VE 2           VE 3     VE 4               VE 5          …          VE 10

                                  Kunde 4711        0,085         0,047          0,023    0,077             Nutzer                    0,216

                                  Kunde 4712        0,321         0,462          Nutzer   0,184              0,114                    0,512

                                  Kunde 4713        Nutzer        0,147          0,731    0,460              0,657                    0,302

                                  Kunde 4714        0,315         Nutzer         0,788    0,268              0,199                    0,001

                                  Kunde 4715        Nutzer         0,24          0,055    Nutzer             1,132                    0,479
             Im In-/Outbound-
            Gespräch wird der     Kunde 4716         0,68         0,017          0,671    0,148              0,628                    Nutzer
Ansprache
 Ad-hoc-

              Kunde 4717 auf
             das/die Produkt/e    Kunde 4717         0,34         0,083          0,440    0,287             Nutzer                    0,075
               (VE) mit den
            höchsten P-Scores     Kunde 4718         0,54          0,97          0,267    0,050              0,128                    0,241
              angesprochen.
                                  Kunde 4719         1,92          1,72          Nutzer   0,096              0,771                    0,610

                                  Kunde 4720         0,82          0,55          0,312    0,145              0,009                    0,263

                                 VE = Verkaufsereignis
                                                                                                   Smart Data in der Berliner Sparkasse   25.02.2015   - 19 -
Analyse-Prozess und fachliche Folgeprozesse                                                                     SM     ART
                        Sparkassenindividuelle BI                          Sparkassen-Standard

ERP                                                                         CRM
                                   BI Dashboards                        Applikationen                   Kontaktdaten
          (Vertriebs-)
oCRM         DWH

           Kunden,
           Konten,                                                          Marketing
WEB                                      SAP InfiniteInsight               Automation
            Trans-                                                                                      Kontaktdaten
           aktionen                    SAP Predictive Analysis
 …                                    Predictive Analytics

                                                Closed loop
                    •      Analytische Unterstützung des operativen Vertriebs
                    •      Systematische Analyse der Vertriebsereignisse
                    •      Rückspielen der Kontaktdaten in das Vertriebs-DHW
                           zur verbesserten Analyse und Optimierung der Modelle

                                             Steigerung von
                                   Vertriebseffizienz und Profitabilität
                                                                        Smart Data in der Berliner Sparkasse   25.02.2015   - 20 -
Inhalt

  1      Begriffsabgrenzung SMART Data
  2      Strategie als Startpunkt
  3      Metriken und Daten
  4      Aufbau von Analytik
  5      Reporting Results
  6      Transform Business

                                         Smart Data in der Berliner Sparkasse   25.02.2015   - 21 -
„Report the Results“                                                                             SMA         RT
                  466           63 Kunden mit Abschluss
                Kunden                ( = 13,5 %)
                 ohne
               Produkt-
               affinitäts-
                              403 Kunden ohne Abschluss
 2.017           Score
                                     ( = 86,5 %)
 Kunden
  ange-                                                    Grundgesamtheit der Analyse
sprochen         1.551        306 Kunden mit Abschluss
                Kunden               ( = 19,7 %)            Im Durchschnitt ist bei jedem
                                                            5. Kampagnenkunden (19,7%)
                   mit
                                                            ein Abschluss erfolgt (Random).
               Produkt-
               affinitäts-   1.245 Kunden ohne Abschluss
                 Score                ( = 80,3 %)

                                                           Smart Data in der Berliner Sparkasse   25.02.2015   - 22 -
„Kumulierte Abschlußquoten vs. Random“                                                                                   SMA         RT
                              60%
 Kumulierte Abschluss-Quote

                              50%

                                              39,6%
                              40%

                              30%                                            Kampagne

                              20%                                                                                       Random

                                          „Top 122-Kunden“
                              10%

                              0%
                                    0   200      400    600    800    1000   1200           1400           1600

                                                        Anzahl Kampagnenkunden

                                                                                 Smart Data in der Berliner Sparkasse   25.02.2015   - 23 -
Gain-Chart zur Abbildung der Prognosegüte                                                                                                   SMA         RT
 Kumulierte Abschluss-Quote   350

                              300
                                                     100%
                              250

                              200
                                                                          40%
                              150

                              100

                               50

                                0
                                    0       200       400        600       800        1000      1200           1400           1600
                                                                 Anzahl Kampagnenkunden

                                Wizard (grüne Linie) entspricht einem „optimalen Modell“. Der Informationsgewinn des Wizards
                                ggü. dem Zufall (rote Linie) ist maximal (100%). Der Informationsgehalt des tatsächlichen
                                Modells (blaue Linie) ggü. dem Zufall liegt bei 40%.

                                                                                                    Smart Data in der Berliner Sparkasse   25.02.2015   - 24 -
Inhalt

  1      Begriffsabgrenzung SMART Data
  2      Strategie als Startpunkt
  3      Metriken und Daten
  4      Aufbau von Analytik
  5      Reporting Results
  6      Transform Business

                                         Smart Data in der Berliner Sparkasse   25.02.2015   - 25 -
Leistet Predictive Analytics einen Beitrag zur Business Transformation?                                     SMAR         T

Analytische Untestützung            “Sinnvolle Unterstützung der Saleseinheit” ,
ist im Vertrieb gut angekommen      “Können wir die einzelnen Treibergrößen sehen?”,
                                    “In den kommenden Kampagnen beschränken wir
                                     uns auf hohe P-Scores”
Reorganisation des bisherigen
Kampagnenprozesses denkbar.

Zukünftige Kundensegmentierung
nach Produktaffinitäten(Cluster)?

Ausweitung des Verfahrens auf weitere
Unternehmeneinheiten und Kundengruppen.

                                                       Einfache Antwort: Ja !
                                                                     Smart Data in der Berliner Sparkasse   25.02.2015   - 26 -
Kampagnen können hinsichtlich Vertriebszeit effizienter und hinsichtlich
des Kampagnenerfolges effektiver gestaltet werden.                                                                                                 SMAR         T
                                                                                                     Bei gleicher Vertriebszeit können 70% mehr
                                                                                                     Kampagnen-Abschlüsse generiert werden
                                                                                                     (z.B. durch 3 parallele, gleichartige Kampagnen)

                                                                                                     Bei gleicher Vertriebszeit können 50% mehr
                                                                                                     Kampagnen-Abschlüsse generiert werden
                                                                                                     (z.B. durch 2 parallele, gleichartige Kampagnen)

                             350
Kumulierte Abschluss-Quote

                             300

                             250

                             200
                                                                 Mit der Hälfte der Vertriebszeit können 75% der
                             150                                 Kampagnen-Abschlüsse generiert werden.

                             100
                                                       Mit einem Drittel der Vertriebszeit können 50% der
                              50                       Kampagnen-Abschlüsse generiert werden.

                              0
                                   0   200   400   600    800   1000 1200            1400     1600
                                                   Anzahl Kampagnenkunden

                                                                                                            Smart Data in der Berliner Sparkasse   25.02.2015   - 27 -
Good Practice                                                                                                 SMAR         T
Was ist das Ziel von Predictive   Häufig wird behauptet, dass mittels PA unbekannte
Analytics?                        Zusammenhänge aufgedeckt werden sollen. M.E. geht es primär
                                  darum, bekannte Zusammenhänge präziser zu quantifizieren, als
                                  dass über “Expertenschätzungen” gemacht werden kann.

                                  -> Zuerst das Bekannte, danach das Unbekannte!

Vorhersagen für das               Entwickeln Sie Modelle für vorhersagbare Phänomene!
Vorhersagbare !                   Predictive Analysis sollte die “signal-to-noise-ratio” verbessern,
                                  dennoch braucht man ein “Signal”.

Experientieren Sie!               Wenn Sie noch nie gescheitert sind, haben Sie zu wenig
                                  experimentiert! Verbessern Sie permanent Ihre Modelle.
                                  A/B Tests sind lediglich der Start.

Stellen Sie den Value Added       Im CRM zählt der “uplift”:
sicher!                           Abschlussquote der Kampagne minus Abschlussquote der
                                  Kontrollgruppe.

                                                                       Smart Data in der Berliner Sparkasse   25.02.2015   - 28 -
Good Practice                                                                                          SMAR         T
Vermeiden Sie              Auch die beste Analyse eliminiert nicht das Risiko von
“Paralyse durch Analyse”   Fehlentscheidungen.

Bauen Sie                  CRM erfordert häufig schnelle Lösungen.
Langfristlösungen!         Arbeiten Sie aber frühzeitig an einer Langfristlösung.

Automatisieren Sie!        Viele Dinge können und sollten automatisiert werden.

Balancieren Sie die        Trusted Data ist die Basis guter Analytik. Bleiben Sie pragmatisch.
Datenqualität aus          100%-ige Datenqualität kann “teuer” sein.

Keep It Simple             Starten Sie mit 100 Variablen, die Ihnen am wichtigsten erscheinen.
                           Wählen Sie Variablen aus, die für die meisten Datensätze vorliegen..

Liefern Sie regelmäßig     Entwickeln Sie Ihre Modelle in verlässlichen Entwicklungszyklen.
                           Liefern Sie stets verbesserte neue Versionen aus:
                           Neue Modelle, Inputvariablen, Targets.

„Next best Question“?      Finden und beantworten Sie die nächste geschäftsrelevante
                           Fragestellung.
                                                                Smart Data in der Berliner Sparkasse   25.02.2015   - 29 -
Sie können auch lesen