KÜNSTLICHE INTELLIGENZ IM BANKING: DEEP LEARNING VS. GRADIENT BOOSTING - Eine Gegenüberstellung - CORE.SE
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
KÜNSTLICHE INTELLIGENZ IM BANKING: DEEP LEARNING VS. GRADIENT BOOSTING Eine Gegenüberstellung Christoph Sonn, Julius Heitmann 30.10.2018 COREtechmonitor | Blogpost Copyright © CORE GmbH http://www.coretechmonitor.com
Key Facts Datenanalyse und Künstliche Intelligenz von zunehmender gesellschaftlicher w ie w irtschaftlicher Relevanz Deep Learning als hoch performantes Modell der Künstlichen Intelligenz häufig im Mittelpunkt der Diskus- sion Gradient Boosting auf Basis von Entscheidungsbäumen als performantes (Funktion) und interpretierbares (Transparenz) Modell als Alternative in der Finanzindustrie Report bei täglichen Problemen. Huaw ei und Baidu auf dem chinesischen Markt kündigen „Künstliche Intelligenz“ ist eines der aktuell Konurrenzprodukte noch für 2018 an. Die meistdiskutierten Themen in der Öffentlich- Folge ist eine stetig w achsende Datenbasis keit. Geschehnisse w ie die Ausw ertung von dieser Unternehmen; dies w iederum ermög- Wählerdaten durch die Cambridge Analytica licht ihnen die kontinuierliche Präzisierung für die US-Präsidentschaftsw ahl 2016 oder von Aussagen über künftiges Kundenverhal- die Erzeugung einer durch viele Beteiligte als ten. menschlich eingeschätzte Konversation mit Auch in der Finanzbranche gew innt Daten- der neuen Generation des Google Assisten- analyse zunehmend an Bedeutung und w ird ten schüren zw ar Befürchtungen w ie Begeis- als zukünftig differenzierender Wettbew erbs- terung für die neue Technologie; jedoch er- faktor angesehen. Beispielsw eise führte laubt erst die Unterscheidung einzelner Me- JPMorgan Chase jüngst die Anw endung thoden der Künstlichen Intelligenz sinnvolle „Contract Intelligence“ ein. Damit ist eine se- Anw endungsfälle und Nutzenaspekte kri- kundenschnelle Analyse von 12.000 kom- tisch zu diskutieren, d.h. ihre Leistung und merziellen Kreditverträgen zur Extraktion Grenzen in w irtschaftlicher Dimension einzu- w ichtiger Datenpunkte und Klauseln möglich. schätzen und vor dem Hintergrund sozialer Das manuelle Vertragsreview w ürde etwa und rechtlicher Kontexte zu beurteilen. 360.000 Stunden in Anspruch nehmen. Un- ternehmen w ie Scalable Capital nutzen Algo- rithmen, um das Trading von ETF-Portfolios Einsatz Künstlicher Intelligenz in der zu automatisieren und manuelle Prozesse zu Wirtschaft minimieren. Zusätzlich profitiert Scalable Ca- Die Geschäftsmodelle der Technologierie- pital von den Fähigkeiten der Algorithmen, sen Google, Apple, Facebook und Amazon aus großen Mengen an Informationen syste- (GAFAs) genauso w ie die von Baidu, Alibaba matisch und im Sekundenbruchteil zu abstra- und Tencent (BATs) w erden durch Künstli- hieren. Dadurch w erden schnelle Reaktions - che Intelligenz erst ermöglicht. Die Analyse zeiten bei komplexer Informationsbasis er- kundenseitiger Daten, z.B. Stamm-, Nut- möglicht, um so die Rendite zu steigern. zungs- oder Transaktionsdaten erlaubt die passenden Interaktionen, Empfehlungen o- Deep Learning- vs. Gradient der Suchergebnisse kundenindividuell zu er- Boosting-Modell mitteln. Mit ihren Produkten im Bereich Per- Die Technologie, die bei dieser Diskussion sonal Assistance (Siri, Alexa und Google am stärksten im Fokus steht, ist das Deep Home) bringen sie Künstliche Intelligenz in Learning, ein künstliches neuronales Netz, den Alltag der Kunden und unterstützen sie 2 http://www.coretechmonitor.com Copy right © CORE 2018
bei dem Funktionselemente – auch als Neu- seiner Komplexität nicht mehr nachvollzieh- ronen bezeichnet – in einem geschichteten bar sei und daher auch nicht mehr aufsicht- Netzaufbau dazu genutzt w erden, Informati- lich geprüft w erden könne, nicht akzeptiert. onen sukzessive zu verarbeiten. Seit dem Deep Learning-Netze bieten mit ihrer hohen Jahr 2006 sind diese Modelle auf dem Gebiet Anzahl an Neuronen und Verknüpfungen der hochdimensionalen Klassifikation – der eine hohe Lernkapazität. Doch genau dieser Zuordnung von Datenpunkten zu einer be- Vorteil verhindert, dass eine Entscheidung grenzten Anzahl an Klassen bei einer viele eines Netzes leicht bzw . überhaupt nachvoll- Variablen umfassenden Problemstellung – zogen w erden kann. nicht mehr w egzudenken. Besonders auf Eine vielversprechende Alternative zum dem Gebiet der Bild-, Sprach- und Hand- Deep Learning-Ansatz bildet das Ensemble schrifterkennung gibt es aktuell kaum Alter- Learning, in dessen Rahmen verschiedene nativen zu Deep Learning. Ihre Stärke hin- Methoden und Algorithmen kombiniert w er- sichtlich der Lösung von Problemstellu ngen den und das insbesondere im Kontext von beziehen diese Modelle aus ihrem geschich- Entscheidungsbäumen eingesetzt w ird. In teten Aufbau. Hierbei w ird die komplexe In- den letzten Jahren hat sich als Unterart das formation Schicht für Schicht abstrahiert, bis Gradient Boosting in verschiedenen öffentli- schließlich in der letzten Schicht eine Ent- chen Ausschreibungen durchsetzen können. scheidung bzgl. einer vorher definierten Statt die Entscheidung entlang eines einzel- Problemstellung getroffen w ird. nen, großen Entscheidungsbaums zu treffen, Warum aber w ird diese Technologie nicht bei vereint Gradient Boosting eine Menge kleine- jeder Künstlichen Intelligenz implementier t? rer Entscheidungsbäume, die jew eils trainiert Der komplexe Aufbau eines Deep Learning- w erden, die Schw ächen anderer Bäume zu Netzes birgt auch Nachteile. Um den schich- mitigieren. Die Ergebnisse des jew eiligen tenbasierten Aufbau zu trainieren, w ird in Ab- Baumes w erden gew ichtet und mit den Er- hängigkeit der Tiefe des Modells, d.h. der gebnissen der w eiteren Bäume zu einer ge- Anzahl der implementierten Schichten, eine meinsamen Entscheidung zusammenge- vergleichsw eise große Menge an Daten und führt. ein hoher Einsatz an Rechenleistung benö- Metaphorisch gesprochen bildet diese Me- tigt. Zudem kann es abhängig vom Anw en- thode eine Gruppenentscheidung von Exper- dungsfall erforderlich sein, die Gründe für ten ab, w obei jeder Teilexperte für einen be- eine durch das Netz getroffene Entscheidung stimmten Bereich des Lösungsraums optimal nachvollziehen zu können. Gerade in gesetz- entscheidet und seine Entscheidung gew ich- lich stärker reglementierten Kontexten, wie tet in die Gesamtentscheidung eingeht. Dies Banken oder Versicherungsunternehmen, führt im Gegensatz zu Deep Learning-Model- kann die Nachvollziehbarkeit eine zw ingende len dazu, dass eine Entscheidung des Mo- Voraussetzung sein. Hier trifft es sich, dass dells nachvollzogen w erden kann, indem die die BaFin in ihrer aktuellen Publikation aus Bäume mit dem höchsten Beitrag zur Ent- der Reihe BaFin Perspektiven 1/2018 un- scheidung identifiziert w erden, w obei die missverständlich klargestellt hat, dass die Entscheidungen der Teilbäume leicht nach- Aufsicht eine Argumentation, w onach die zuvollziehen sind. Zudem w ird die Komplex i- Funktionsw eise eines Algorithmus aufgrund tät der Einzelbäume im Training of t be- schränkt, w odurch die Nachvollziehbarkeit w eiter verbessert w ird. Diese beschränkte 3 http://www.coretechmonitor.com Copy right © CORE 2018
Komplexität bildet einen w eiteren Vorteil ge- genüber dem Deep Learning-Ansatz, da w e- niger Daten zum Training benötigt w erden. Zudem w eist das Gradient Boosting einen re- lativ geringen Trainingsaufw and zu anderen hochdimensionalen Klassifikatoren auf. Im Ergebnis verspricht Gradient Boosting, mit einem kleinen Datensatz zu einem konver- gierten Trainingsergebnis zu führen. 4 http://www.coretechmonitor.com Copy right © CORE 2018
Resümee einer Differenzierung der Modelle neben der Vorhersagequalität führen können. Hier hat Eine Aussage zu Dominanz eines der bei- die BaFin möglicherw eise bereits eine den angesprochenen Modelle auf einem be- Marktvorentscheidung erzw ungen. stimmten Gebiet ist nicht möglich. Beide Abhängig von Use Case und verfügbarer Modelle leisten gute Ergebnisse bei der Daten kann Gradient Boosting zu präferiern Klassifikation hochdimensionaler Daten, sein, da es für spezifische Anw endungsfälle w obei die Performance abhängig ist von zu- und hinsichtlich Transparenz zu besseren grundeliegenden Daten und den darin ent- Ergebnissen als Deep Learning führt. An- haltenen Mustern. Einen Spezialfall stellt hand verschiedener Use Cases sollen da- dabei die Aufgabe der Sprach-, Bild- und her die speziellen Vorteile und die Leistung Handschrifterkennung dar, bei dem in na- des etw as außerhalb des Rampenlichts ste- hezu allen System heutzutage Deep Nets henden Gradient Boosting-Modells aufge- implementiert w erden. zeigt und anhand von Analysen quantifiziert Eine w eitere zu beachtende Entscheidungs - w erden. Der nächste Blogpost w ird den dimension - insbesondere in der Finanzw elt Santander Customer Satisfaction Use Case – stellen Nebenbedingungen des Use vertiefen, einem im Jahr 2016 öffentlich Cases dar in Form von Nachvollziehbarkeit ausgeschriebenen Wettbew erb zur Prog- der Modellentscheidung oder Konvergenz- nose von Kundenabw anderung, auch be- geschw indigkeit (Menge der Daten, die be- kannt als Churn Case. nötigt w ird bis zum trainierten Modell), die zu 5 http://www.coretechmonitor.com Copy right © CORE 2018
Quellen Cam bridge Analytica [German only] “Facebook informiert nach Datenskandal die betroffenen Nutzer”, 10. April 2018: https://www.wi wo.de/unternehmen/it/cambridge-analytica-facebook-informiert-nach-datenskan- dal-die-betroffenen-nutzer/21160858.html Engel, C. “Artificial Intelligence: The Weapon of Choice in Banks’ Fight for Survival”, 07. March 2018: https://thefinancialbrand.com/71108/artificial-intelligence-banking-machine-learning/ Kaggle: Stantander Custom er Satisfaction “Santander Customer Satisfaction - Which customers are happy customers?”: https://www.kaggle.com/c/santander-customer-satisfaction Bundesanstalt für Finanzdienstleistungsaufsicht (BaFin) “BaFin Perspektiven. Ausgabe 1/2018”: https://www.bafin.de/SharedDocs/Downloads/DE/BaFinPerspektiven/2018/bp_18-1_digitalisie- rung.pdf;jsessionid=88AC19BE9AD943AE14AB8A3B8BDE0EBA.1_cid372?__blob=publication- File&v=17 6 http://www.coretechmonitor.com Copy right © CORE 2018
Christoph Sonn ist Transformation Manager bei CORE. Er verfügt über einen doppelten Abschluss in Wirtschaftsw issenschaften und Chemie und hat seinen fachlichen Schw erpunkt im Bereich der Entw icklung in- novativer Produkte und Digitalisierungslösungen für Banken, Versicherungen und Biotechnologieunter neh- men. Von der strategischen Konzeption bis zum Go-liv e innovativer IT Transformationen entw ickelt Christoph Lösungen für Unternehmen, um sich im Markt zu positi- onieren. Mail: Christoph.Sonn@core.se Als Expert Manager unterstützt Julius Heitm ann bei CORE im Schw erpunkt die Konzeption komplexer IT- Transformationen. In der Automobilindustrie hat er um- fangreiche Erfahrungen im Umgang mit Big Data und Data Analytics sammeln können. Diese bringt er insbe- sondere in Projekten zur Analyse und Optimierung gro- ßer Datenmengen ein und entw ickelt passgenaue Steu- erungssysteme für die Datenverarbeitung vor allem im Finanzsektor. Mail: Julius.Heitm ann@core.se 7 http://www.coretechmonitor.com Copy right © CORE 2018
COREinstitute COREtransform GmbH Am Sandw erder 21-23 Am Sandw erder 21-23 14109 Berlin | Germany 14109 Berlin | Germany https://institute.core.se https://w ww.core.se Phone: +49 30 26344 020 Phone: +49 30 26344 020 office@coreinstitute.org office@coretransform.de COREtransform GmbH COREtransform Ltd. Limmatquai 1 One Canada Square 8001 Zürich | Helvetia London E14 5DY | Great Britain https://w ww.core.se https://w ww.core.se Phone: +41 442 610 143 Phone: +44 203 319 0356 office@coretransform.ch office@coretransform.co.uk COREtransform MEA LLC DIFC – 105, Currency House, Tow er 1 P.O. Box 506656 Dubai I UAE https://w ww.core.se office@coretransform.ae 8 http://www.coretechmonitor.com Copy right © CORE 2018
Sie können auch lesen