KÜNSTLICHE INTELLIGENZ IM BANKING: DEEP LEARNING VS. GRADIENT BOOSTING - Eine Gegenüberstellung - CORE.SE

Die Seite wird erstellt Niclas Hofmann
 
WEITER LESEN
KÜNSTLICHE INTELLIGENZ IM BANKING: DEEP LEARNING VS. GRADIENT BOOSTING - Eine Gegenüberstellung - CORE.SE
KÜNSTLICHE INTELLIGENZ IM
BANKING: DEEP LEARNING VS.
GRADIENT BOOSTING

Eine Gegenüberstellung

Christoph Sonn, Julius Heitmann

30.10.2018
COREtechmonitor | Blogpost
Copyright © CORE GmbH
http://www.coretechmonitor.com
KÜNSTLICHE INTELLIGENZ IM BANKING: DEEP LEARNING VS. GRADIENT BOOSTING - Eine Gegenüberstellung - CORE.SE
Key Facts

    Datenanalyse und Künstliche Intelligenz von zunehmender gesellschaftlicher w ie w irtschaftlicher Relevanz
    Deep Learning als hoch performantes Modell der Künstlichen Intelligenz häufig im Mittelpunkt der Diskus-
    sion
    Gradient Boosting auf Basis von Entscheidungsbäumen als performantes (Funktion) und interpretierbares
    (Transparenz) Modell als Alternative in der Finanzindustrie

Report                                                bei täglichen Problemen. Huaw ei und Baidu
                                                      auf    dem   chinesischen      Markt   kündigen
„Künstliche Intelligenz“ ist eines der aktuell
                                                      Konurrenzprodukte noch für 2018 an. Die
meistdiskutierten Themen in der Öffentlich-
                                                      Folge ist eine stetig w achsende Datenbasis
keit. Geschehnisse w ie die Ausw ertung von
                                                      dieser Unternehmen; dies w iederum ermög-
Wählerdaten durch die Cambridge Analytica
                                                      licht ihnen die kontinuierliche Präzisierung
für die US-Präsidentschaftsw ahl 2016 oder
                                                      von Aussagen über künftiges Kundenverhal-
die Erzeugung einer durch viele Beteiligte als
                                                      ten.
menschlich eingeschätzte Konversation mit
                                                      Auch in der Finanzbranche gew innt Daten-
der neuen Generation des Google Assisten-
                                                      analyse zunehmend an Bedeutung und w ird
ten schüren zw ar Befürchtungen w ie Begeis-
                                                      als zukünftig differenzierender Wettbew erbs-
terung für die neue Technologie; jedoch er-
                                                      faktor   angesehen.   Beispielsw eise     führte
laubt erst die Unterscheidung einzelner Me-
                                                      JPMorgan     Chase jüngst die Anw endung
thoden der Künstlichen Intelligenz sinnvolle
                                                      „Contract Intelligence“ ein. Damit ist eine se-
Anw endungsfälle und Nutzenaspekte        kri-
                                                      kundenschnelle Analyse von 12.000 kom-
tisch zu diskutieren, d.h. ihre Leistung und
                                                      merziellen   Kreditverträgen     zur Extraktion
Grenzen in w irtschaftlicher Dimension einzu-
                                                      w ichtiger Datenpunkte und Klauseln möglich.
schätzen und vor dem Hintergrund sozialer
                                                      Das manuelle Vertragsreview w ürde etwa
und rechtlicher Kontexte zu beurteilen.
                                                      360.000 Stunden in Anspruch nehmen. Un-
                                                      ternehmen w ie Scalable Capital nutzen Algo-
                                                      rithmen, um das Trading von ETF-Portfolios
Einsatz Künstlicher Intelligenz in der                zu automatisieren und manuelle Prozesse zu
Wirtschaft                                            minimieren. Zusätzlich profitiert Scalable Ca-
Die Geschäftsmodelle der Technologierie-              pital von den Fähigkeiten der Algorithmen,
sen Google, Apple, Facebook und Amazon                aus großen Mengen an Informationen syste-
(GAFAs) genauso w ie die von Baidu, Alibaba           matisch und im Sekundenbruchteil zu abstra-
und Tencent (BATs) w erden durch Künstli-             hieren. Dadurch w erden schnelle Reaktions -
che Intelligenz erst ermöglicht. Die Analyse          zeiten bei komplexer Informationsbasis er-
kundenseitiger    Daten, z.B. Stamm-, Nut-            möglicht, um so die Rendite zu steigern.
zungs- oder Transaktionsdaten erlaubt die
passenden Interaktionen, Empfehlungen o-              Deep Learning- vs.                Gradient
der Suchergebnisse kundenindividuell zu er-           Boosting-Modell
mitteln. Mit ihren Produkten im Bereich Per-          Die Technologie, die bei dieser Diskussion

sonal Assistance (Siri, Alexa und Google              am stärksten im Fokus steht, ist das Deep

Home) bringen sie Künstliche Intelligenz in           Learning, ein künstliches neuronales Netz,

den Alltag der Kunden und unterstützen sie
                                                                                                         2
http://www.coretechmonitor.com                                                Copy right © CORE 2018
KÜNSTLICHE INTELLIGENZ IM BANKING: DEEP LEARNING VS. GRADIENT BOOSTING - Eine Gegenüberstellung - CORE.SE
bei dem Funktionselemente – auch als Neu-         seiner Komplexität nicht mehr nachvollzieh-
ronen bezeichnet – in einem geschichteten         bar sei und daher auch nicht mehr aufsicht-
Netzaufbau dazu genutzt w erden, Informati-       lich geprüft w erden könne, nicht akzeptiert.
onen sukzessive zu verarbeiten. Seit dem          Deep Learning-Netze bieten mit ihrer hohen
Jahr 2006 sind diese Modelle auf dem Gebiet       Anzahl an Neuronen und Verknüpfungen
der hochdimensionalen Klassifikation – der        eine hohe Lernkapazität. Doch genau dieser
Zuordnung von Datenpunkten zu einer be-           Vorteil verhindert, dass eine Entscheidung
grenzten Anzahl an Klassen bei einer viele        eines Netzes leicht bzw . überhaupt nachvoll-
Variablen umfassenden Problemstellung        –    zogen w erden kann.
nicht mehr w egzudenken. Besonders auf            Eine     vielversprechende    Alternative   zum
dem Gebiet der Bild-, Sprach- und Hand-           Deep Learning-Ansatz bildet das Ensemble
schrifterkennung gibt es aktuell kaum Alter-      Learning, in dessen Rahmen verschiedene
nativen zu Deep Learning. Ihre Stärke hin-        Methoden und Algorithmen kombiniert w er-
sichtlich der Lösung von Problemstellu ngen       den und das insbesondere im Kontext von
beziehen diese Modelle aus ihrem geschich-        Entscheidungsbäumen      eingesetzt w ird. In
teten Aufbau. Hierbei w ird die komplexe In-      den letzten Jahren hat sich als Unterart das
formation Schicht für Schicht abstrahiert, bis    Gradient Boosting in verschiedenen öffentli-
schließlich in der letzten Schicht eine Ent-      chen Ausschreibungen durchsetzen können.
scheidung bzgl. einer vorher definierten          Statt die Entscheidung entlang eines einzel-
Problemstellung getroffen w ird.                  nen, großen Entscheidungsbaums zu treffen,
Warum aber w ird diese Technologie nicht bei      vereint Gradient Boosting eine Menge kleine-
jeder Künstlichen Intelligenz implementier t?     rer Entscheidungsbäume, die jew eils trainiert
Der komplexe Aufbau eines Deep Learning-          w erden, die Schw ächen anderer Bäume zu
Netzes birgt auch Nachteile. Um den schich-       mitigieren. Die Ergebnisse des jew eiligen
tenbasierten Aufbau zu trainieren, w ird in Ab-   Baumes w erden gew ichtet und mit den Er-
hängigkeit der Tiefe des Modells, d.h. der        gebnissen der w eiteren Bäume zu einer ge-
Anzahl der implementierten Schichten, eine        meinsamen      Entscheidung     zusammenge-
vergleichsw eise große Menge an Daten und         führt.
ein hoher Einsatz an Rechenleistung benö-         Metaphorisch gesprochen bildet diese Me-
tigt. Zudem kann es abhängig vom Anw en-          thode eine Gruppenentscheidung von Exper-
dungsfall erforderlich sein, die Gründe für       ten ab, w obei jeder Teilexperte für einen be-
eine durch das Netz getroffene Entscheidung       stimmten Bereich des Lösungsraums optimal
nachvollziehen zu können. Gerade in gesetz-       entscheidet und seine Entscheidung gew ich-
lich stärker reglementierten Kontexten, wie       tet in die Gesamtentscheidung eingeht. Dies
Banken    oder Versicherungsunternehmen,          führt im Gegensatz zu Deep Learning-Model-
kann die Nachvollziehbarkeit eine zw ingende      len dazu, dass eine Entscheidung des Mo-
Voraussetzung sein. Hier trifft es sich, dass     dells nachvollzogen w erden kann, indem die
die BaFin in ihrer aktuellen Publikation aus      Bäume mit dem höchsten Beitrag zur Ent-
der Reihe BaFin Perspektiven 1/2018 un-           scheidung identifiziert w erden, w obei die
missverständlich klargestellt hat, dass die       Entscheidungen der Teilbäume leicht nach-
Aufsicht eine Argumentation, w onach die          zuvollziehen sind. Zudem w ird die Komplex i-
Funktionsw eise eines Algorithmus aufgrund        tät der Einzelbäume     im Training of t be-
                                                  schränkt, w odurch die Nachvollziehbarkeit
                                                  w eiter verbessert w ird. Diese beschränkte

                                                                                                    3
 http://www.coretechmonitor.com                                           Copy right © CORE 2018
Komplexität bildet einen w eiteren Vorteil ge-
genüber dem Deep Learning-Ansatz, da w e-
niger Daten zum Training benötigt w erden.
Zudem w eist das Gradient Boosting einen re-
lativ geringen Trainingsaufw and zu anderen
hochdimensionalen     Klassifikatoren auf. Im
Ergebnis verspricht Gradient Boosting, mit
einem kleinen Datensatz zu einem konver-
gierten Trainingsergebnis zu führen.

                                                                          4
 http://www.coretechmonitor.com                  Copy right © CORE 2018
Resümee                                            einer Differenzierung der Modelle neben der
                                                   Vorhersagequalität führen können. Hier hat
Eine Aussage zu Dominanz eines der bei-
                                                   die BaFin    möglicherw eise   bereits   eine
den angesprochenen Modelle auf einem be-
                                                   Marktvorentscheidung erzw ungen.
stimmten Gebiet ist nicht möglich. Beide
                                                   Abhängig von Use Case und verfügbarer
Modelle leisten gute Ergebnisse bei der
                                                   Daten kann Gradient Boosting zu präferiern
Klassifikation   hochdimensionaler      Daten,
                                                   sein, da es für spezifische Anw endungsfälle
w obei die Performance abhängig ist von zu-
                                                   und hinsichtlich Transparenz zu besseren
grundeliegenden Daten und den darin ent-
                                                   Ergebnissen als Deep Learning führt. An-
haltenen Mustern. Einen Spezialfall stellt
                                                   hand verschiedener Use Cases sollen da-
dabei die Aufgabe der Sprach-, Bild- und
                                                   her die speziellen Vorteile und die Leistung
Handschrifterkennung dar, bei dem in na-
                                                   des etw as außerhalb des Rampenlichts ste-
hezu allen System heutzutage Deep Nets
                                                   henden Gradient Boosting-Modells aufge-
implementiert w erden.
                                                   zeigt und anhand von Analysen quantifiziert
Eine w eitere zu beachtende Entscheidungs -
                                                   w erden. Der nächste Blogpost w ird den
dimension - insbesondere in der Finanzw elt
                                                   Santander Customer Satisfaction Use Case
– stellen    Nebenbedingungen        des   Use
                                                   vertiefen, einem im Jahr 2016       öffentlich
Cases dar in Form von Nachvollziehbarkeit
                                                   ausgeschriebenen Wettbew erb zur Prog-
der Modellentscheidung oder Konvergenz-
                                                   nose von Kundenabw anderung, auch be-
geschw indigkeit (Menge der Daten, die be-
                                                   kannt als Churn Case.
nötigt w ird bis zum trainierten Modell), die zu

                                                                                                    5
 http://www.coretechmonitor.com                                            Copy right © CORE 2018
Quellen

Cam bridge Analytica
[German only] “Facebook informiert nach Datenskandal die betroffenen Nutzer”, 10. April 2018:
https://www.wi wo.de/unternehmen/it/cambridge-analytica-facebook-informiert-nach-datenskan-
dal-die-betroffenen-nutzer/21160858.html

Engel, C.
“Artificial Intelligence: The Weapon of Choice in Banks’ Fight for Survival”, 07. March 2018:
https://thefinancialbrand.com/71108/artificial-intelligence-banking-machine-learning/

Kaggle: Stantander Custom er Satisfaction
“Santander Customer Satisfaction - Which customers are happy customers?”:
https://www.kaggle.com/c/santander-customer-satisfaction

Bundesanstalt für Finanzdienstleistungsaufsicht (BaFin)
“BaFin Perspektiven. Ausgabe 1/2018”:
https://www.bafin.de/SharedDocs/Downloads/DE/BaFinPerspektiven/2018/bp_18-1_digitalisie-
rung.pdf;jsessionid=88AC19BE9AD943AE14AB8A3B8BDE0EBA.1_cid372?__blob=publication-
File&v=17

                                                                                                       6
 http://www.coretechmonitor.com                                               Copy right © CORE 2018
Christoph Sonn ist Transformation        Manager    bei
                                 CORE. Er verfügt über einen doppelten Abschluss in
                                 Wirtschaftsw issenschaften und Chemie und hat seinen
                                 fachlichen Schw erpunkt im Bereich der Entw icklung in-
                                 novativer Produkte und Digitalisierungslösungen      für
                                 Banken, Versicherungen und Biotechnologieunter neh-
                                 men. Von der strategischen Konzeption bis zum Go-liv e
                                 innovativer IT Transformationen entw ickelt Christoph
                                 Lösungen für Unternehmen, um sich im Markt zu positi-
                                 onieren.

                                 Mail: Christoph.Sonn@core.se

                                 Als Expert Manager unterstützt Julius Heitm ann bei
                                 CORE im Schw erpunkt die Konzeption komplexer IT-
                                 Transformationen. In der Automobilindustrie hat er um-
                                 fangreiche Erfahrungen im Umgang mit Big Data und
                                 Data Analytics sammeln können. Diese bringt er insbe-
                                 sondere in Projekten zur Analyse und Optimierung gro-
                                 ßer Datenmengen ein und entw ickelt passgenaue Steu-
                                 erungssysteme für die Datenverarbeitung vor allem im
                                 Finanzsektor.

                                 Mail: Julius.Heitm ann@core.se

                                                                                            7
http://www.coretechmonitor.com                                     Copy right © CORE 2018
COREinstitute                          COREtransform GmbH
Am Sandw erder 21-23                   Am Sandw erder 21-23
14109 Berlin | Germany                 14109 Berlin | Germany
https://institute.core.se              https://w ww.core.se
Phone: +49 30 26344 020                Phone: +49 30 26344 020
office@coreinstitute.org               office@coretransform.de

COREtransform GmbH                     COREtransform Ltd.
Limmatquai 1                           One Canada Square
8001 Zürich | Helvetia                 London E14 5DY | Great Britain
https://w ww.core.se                   https://w ww.core.se
Phone: +41 442 610 143                 Phone: +44 203 319 0356
office@coretransform.ch                office@coretransform.co.uk

COREtransform MEA LLC
DIFC – 105, Currency House, Tow er 1
P.O. Box 506656 Dubai I UAE
https://w ww.core.se
office@coretransform.ae

                                                                                                 8
http://www.coretechmonitor.com                                          Copy right © CORE 2018
Sie können auch lesen