Fake versus Real Mit Künstlicher Intelligenz gefälschte Ware erkennen - Opitz Consulting

 
WEITER LESEN
Fake versus Real Mit Künstlicher Intelligenz gefälschte Ware erkennen - Opitz Consulting
TITELTHEMA

                                                                                                                  Sonderdruck aus
                                                                                                                  BI-SPEKTRUM 5/2021

                                                                                                             Bild: Shutterstock

Mit Künstlicher Intelligenz gefälschte Ware erkennen

Fake versus Real
Jeder weiß es: Beliebte Produkte sind fälschbar! Die Lieblingskategorien der Fälscher sind hoch-             Ein Beitrag von C
                                                                                                                             ­ harlotte
wertige Technik, teure Accessoires und Luxury-Mode. Steht auf den Labeln „Adibas“ oder „CUGCI“,              Grade und Arpine
                                                                                                             ­Ayvazyan
ist schnell klar, dass es sich um eine Fälschung handelt. Es gibt aber auch gute Fälschungen, die ein
menschliches Auge nicht sofort oder teilweise gar nicht erkennen kann. Hier können Bilderkennungs-
methoden eine Lösung darstellen, um gefälschte Produkte zu identifizieren.

Mit Fälschungen hochpreisiger Produkte sehen            Deep Learning als möglicher
sich nicht nur Hersteller konfrontiert. Unternehmen
und Marken verlieren dadurch viel Geld. Bereits im
                                                        ­Lösungsansatz
Jahr 2017 erlitten die Luxusmarken Verluste von         Kann Künstliche Intelligenz hier Abhilfe schaffen?
323 Milliarden US-Dollar [GBC18]. Gleichzeitig ist      Mit Hilfe welcher Bilderkennungsmethoden kön-
es für den öffentlichen Bereich (zum Beispiel das       nen Produktfälschungen identifiziert werden? Eig-
Zollamt) schwer, Fälschungen zu erkennen und zu         nen sich dafür Image Mining, Object Recognition,
beschlagnahmen. Auch E-Commerce-Plattformen             Image Classification etc.? Das haben wir in unse-
des rasant wachsenden Luxus-Secondhand-Mark-            rem Forschungsprojekt „Fake vs. Real: Mit KI ge-
tes, wie Zalando Zircle, Vite EnVogue, StockX oder      fälschte Ware erkennen“ herausgefunden.
About You, müssen Schnittstellen einbauen, die              Künstliche Intelligenz (KI), bei der es darum
Fälschungen auf Bildern von Nutzer*innen mel-           geht, einem Computer menschliches Verhalten bei-
den.                                                    zubringen, bildete dabei den Rahmen. Mit einer
   Wir stehen hier vor einem komplexen Problem,
an dessen Lösung neben Herstellern und Verbrau-
chern auch der Handel und der Zoll interessiert           Amazon Rekognition Image ist ein mit Deep Learning ausgestatteter
sind. Sie alle benötigen eine Lösung, die dabei hel-      Bilderkennungsservice, der Objekte, Szenen, Gesichter, Text, bekannte
fen soll, Fälschungen zu entlarven, und in der L­ age     Persönlichkeiten und weitere Bildinhalte erkennt [Rek21].
sein soll, echte Produkte einwandfrei zu identifizie-
ren.
BI-SPEKTRUM 5/2021
Fake versus Real Mit Künstlicher Intelligenz gefälschte Ware erkennen - Opitz Consulting
TITELTHEMA

Abb. 1: Künstliche Intelli-   Deep-Learning-Architektur sind wir tief in die Tech-      ([Wik21], siehe Abbildung 1). Kleinste Abwei-
genz, Machine Learning,       nologie eingetaucht. Die Architektur entwickelten         chungen auf Bildern zu erkennen ist mit Deep
Deep Learning [Ort20]         wir in der AWS Cloud [Rek21], wo uns eine pas-            Learning kaum noch ein Problem!
                              sende IT-Infrastruktur für diesen Use-Case zur Ver-    Beim Deep Learning nutzen wir große Datenmen-
                              fügung stand.                                          gen und künstliche neuronale Netze mit zahlrei-
                                 Kurze Rekapitulation: Worin unterscheiden           chen Zwischenschichten. Eingabeschicht, Aus-
                              sich Künstliche Intelligenz (KI), Maschinelles Ler-    gabeschicht und verborgene Zwischenschichten
                              nen und Deep Learning? Hier eine kurze Definition      (sogenannte „Hidden Layers“) bilden eine um-
                              im Überblick:                                          fangreiche innere Struktur. Darüber sind Infor-
                              • Künstliche Intelligenz bezeichnet das Anlernen       mationen zu verarbeiten und zu reduzieren. Die
                                 von Computersystemen mit dem Ziel, menschli-        neuronalen Netze bilden die Lernalgorithmen. Sie
                                 ches Verhalten nachzubilden.                        bestehen aus mehreren Reihen von Datenkno-
                              • Maschinelles Lernen ist eine Unterkategorie          ten, die über gewichtete Verknüpfungen mitein-
                                 der Künstlichen Intelligenz. Darunter sind Tech-    ander vernetzt sind. Das Gewichtungsverhältnis
                                 niken zu verstehen, die es Computern ermögli-       zwischen den Neuronenschichten ist immer wie-
                                 chen, Wissen und Erkenntnisse aus Daten he­         der neu anzupassen [Wik21]. Auf diesem Weg ent-
                                 rauszufiltern.                                      steht ein Modell, das für diverse Anwendungsfälle
                              • Deep Learning versteht sich wiederum als Un-         nutzbar ist.
                                 terkategorie des maschinellen Lernens und              Amazon Rekognition ist ein Framework, das mit
                                 ist für komplexe Fragestellungen interessant        Deep Learning arbeitet. Damit lassen sich Modelle
                                                                                     trainieren, die helfen, Bilder zu erkennen, um aus
                                                                                     diesem generierten Wissen automatisiert fundier-
                                                                                     te Entscheidungen treffen zu können [IKS21]. Das
                                                                                     Tool passte zu unserem Use-Case.

                                                                                     Ein einfacher Use-Case:
                                                                                     Eine Chanel-Tasche
                                                                                     Die Entwicklung der Architekturstrecken für un-
                                                                                     seren Fall hielten wir einfach. Als Beispielprodukt
                                                                                     diente uns eine Chanel-Tasche. Damit unser Algo-
                                                                                     rithmus herausfinden konnte, ob das Logo auf die-
                                                                                     ser Tasche echt ist, benötigten wir Originalbilder
Abb. 2: Manuelle Analyse                                                             und Abgleichbilder. Die Originalbilder konnten wir
der Schuhe (basiert auf                                                              von der offiziellen Chanel-Website herunterladen.
mehreren Quellen wie                                                                 Doch wie findet man eine Produktfälschung? Da-
Farfetch, GQ Magazine,                                                               für nahmen wir eine umfassende Recherche vor.
Aliexpress)                                                                          Bei diversen inländischen und ausländischen Pro-
                                                                                                                    BI-SPEKTRUM 5/2021
Fake versus Real Mit Künstlicher Intelligenz gefälschte Ware erkennen - Opitz Consulting
TITELTHEMA

duktanbietern luden wir schließlich eine Vielzahl           CHARLOTTE GRADE arbeitet als Business-
an Bildern mit falschen Chanel-Taschen herunter.            und IT-Analystin bei der OPITZ CONSULTING
Dabei hieß es, keine Zeit zu verlieren, denn einige         Deutschland GmbH am Standort Hamburg.
dieser Web-Links verschwanden bereits unmittel-
                                                            Dort fungiert sie als Schnittstelle zwischen
bar nach dem Erstaufruf.
    Amazon Rekognition arbeitet beim Training des           IT, Fachbereich und externen Dienstleis-
Modells mit Bild- und Videoanalysen. Machine-               tern. Wenn es darum geht, Kunden bei der
Learning- oder KI-Know-how setzt AWS nicht vo­              Entwicklung von Analysen und Reports für
raus. Für die Verwendung bedarf es lediglich ei-            ihre Geschäftsdaten zu unterstützen oder
ner ausreichenden Menge an Bildern – in diesem
                                                            eine Business-Analyse bis hin zur Daten-
Fall an Bildern von echten und gefälschten Chanel-­
Taschen.                                                    visualisierung zu unterstützen, ist sie zur
    In der AWS Cloud konnten wir einzelne Bilder            Stelle. Besonders interessiert sie sich für
hochladen und klassifizieren. Zusätzlich haben wir          die Entwicklung von Fachkonzepten, vor
weitere AWS-Services angebunden. So konnten wir             allem für datenschutzbezogene
ein S3-Bucket verwenden, um verschiedene Ordner
                                                            Anforderungen beim Reporting.
anzulegen, das uns bei der anschließenden Grup-
pierung helfen sollte [Rek21].                              E-Mail: charlotte.grade@opitz-consulting.com
    Ist also der Abgleich eines Originalprodukts mit
einem potenziellen Fälschungsprodukt gewünscht,
sind diese innerhalb eines S3-Buckets über ent-                                  ARPINE AYVAZYAN ist Business Analyst und
sprechende Ordner zu klassifizieren und zu iden-                                 Consultant im Umfeld von BI und Data Analytics
tifizieren [Rek21].                                                              bei der OPITZ CONSULTING Deutschland GmbH.
    Für die Identifizierung nutzten wir Custom La-
                                                                                 Sie berät Kunden bei der fachlichen und strate-
bel. Dies ist ein zusätzlicher AWS Service, den wir
einfach hinzufügten. Custom Label übernimmt das                                  gischen Entwicklung von Analysen ihrer Ge-
manuelle Labeln der Objekte in einem Bild, das für                               schäftsdaten und begleitet sie von der Business-
unerfahrene Deep Learner sehr zeitaufwendig ist                                  Analyse bis hin zur Datenvisualisierung. Frau
[Rek21].                                                                         Ayvazyan ist leidenschaftliche KI- und Machine-
    Der Label-Vorgang hilft, Nähte und Logos auf
                                                                                 Learning-Enthusiastin und arbeitet seit über drei
Produkten als solche identifizieren zu können. So
entsteht innerhalb weniger Stunden ein stabiles                                  Jahren in diversen IT- und Analytics-Teams an
Bildanalysemodell. Die Nutzer*innen können auf                                   Projekten in unterschiedlichen Industriezweigen,
diesem Weg ein benutzerdefiniertes Rekognition-                                  vom Start-up bis zum Konzern.
Modell ohne besondere KI-Kenntnisse trainieren                                   E-Mail: Arpine.Ayvazyan@opitz-consulting.com
[Rek21].
    Je nach Anwendungsfall und geforderter Er-
kennungsqualität braucht man weniger oder
mehr Bilder. Im Einzelfall sind bereits ein bis            Bevor wir unser KI-Modell mit neuen Bildern
zwei Trainingsdaten ausreichend. Für einen mitt-       weiterentwickeln konnten, haben wir die Fäl-
leren Projektrahmen, denkbar in E-Commerce-            schungen selbst im Detail in Augenschein ge-
Bereichen, sollte das Trainingsset aus mindes-         nommen und eine manuelle Analyse durchge-
tens zehn bis hundert Einheiten bestehen, um           führt, um die Gemeinsamkeiten und vor allem die
eine hochwertige Identifizierung sicherzustellen       Unterschiede der jeweiligen Modelle aufzuzeigen.
[Rek21].                                               Nur so konnten wir das Modell optimal trainie-
                                                       ren.
25.000-Euro-Schuhe                                         Der Vergleich ergab, dass die Fälschungen teil-
                                                       weise eine sehr schlechte Verarbeitungsqualität
von Nike und Dior                                      aufwiesen. Außerdem gab es Unterschiede bei der
Der Sneaker „Nike Air Jordan Dior“ sollte unser        Qualität der Schnürsenkel. Ein weiteres Merkmal
nächstes Analyseprodukt sein, das wir unter die        bei diesem Sneaker ist die Sohle beziehungswei-
Lupe nahmen. Dieser Freizeitschuh hat eine sehr        se die Platzierung der Air Dior Wings auf der Soh-
schmale Serienreife von nur 8.500 limitierten Ex-      le. Bei Fälschungen erscheint das Logo nicht rich-
emplaren erreicht und ging zur Zeit unseres Pro-       tig. Auch die Farben sind ein wichtiges Merkmal.
jekts für rund 1.850 Euro über die Ladentheke.         Je nach Beleuchtung können diese aber auch bei
Entsprechend beliebt sind diese Schuhe auf dem         Originalschuhen auf Bildern abweichen (siehe Ab-
Secondhand-Markt: Dort bringen sie mitunter über       bildung 2).
25.000 Euro ein [Sto21] – ein gefundenes Fressen
für Produktfälscher.
    Fälschungen dieses Nike-Schuhs finden sich zum       AWS Lambda ist ein Datenverarbeitungsservice, der serverlos arbeitet.
Beispiel in chinesischen Online-Shops. Hier kosten       Das erspart eine Menge Ressourcen. So gelingt es, einen bestimmten
die Schuhe gerade einmal 40 bis 50 Euro. Einige          Code auszuführen und die zugrunde liegenden Datenverarbeitungsres-
Exemplare haben offensichtliche Fehler. Viele sind       sourcen automatisiert zu verwalten [Lam1].
allerdings mit dem bloßen Auge nicht zu erkennen.
BI-SPEKTRUM 5/2021
Fake versus Real Mit Künstlicher Intelligenz gefälschte Ware erkennen - Opitz Consulting
TITELTHEMA

                         Abb. 3: AWS-Architektur für unseren PoC

                             Nach dieser Analyse suchten wir gezielt nach       nen Wahrscheinlichkeitswert aus. Dieser hilft, das
                         geeigneten Bildern. Wie bei der Chanel-Tasche          Produkt einzuordnen. Bei einer Übereinstimmung
                         mussten wir recherchieren, um passende Bilder          von weniger als 80 Prozent ist von einer möglichen
                         zu finden. Das hat einiges an Zeit gekostet, denn      Fälschung auszugehen.
                         die Internetseiten verschwanden schon nach we-            Die Nutzer*innen benötigen dafür keinen AWS-
                         nigen Sekunden. Am Ende hatten wir die pas-            Account. Technische Fähigkeiten sind ebenfalls
                         senden Bilder aber gesichert und gingen daran,         nicht notwendig. Sie testen einfach das Modell und
                         das KI-Modell erneut zu trainieren. Auch dies-         helfen, den Algorithmus weiterzuentwickeln.
                         mal planten wir genug Zeit für die Trainingspha-          AWS bietet die Möglichkeit, schnell und un-
                         se ein und testeten immer wieder die Robustheit        kompliziert Modelle und Architekturen in der AWS
                         der KI.                                                Cloud zu entwickeln.
                             Für die Automatisierung der Gesamtarchitektur
                         brauchten wir einen weiteren Service: Unsere Wahl      Grenzen der Bilderkennung
                         fiel auf AWS Lambda.
                             In dieser Phase unseres Projekts dachten wir
                                                                                und unsere Lessons Learned
                         vor allem an Endnutzer*innen solcher Lösun-            Bilderkennungsmodelle haben Grenzen. Logi-
                         gen. Deshalb haben wir die Lösung komplett im          scherweise kann die KI die Qualität der verwende-
                         „AWS-Universum“ konzipiert. Wer würde diese            ten Materialien nicht wie in der realen Welt prü-
                         Lösung aber in der Praxis nutzen und vor allem         fen. Ein billiges Material können die Käufer*innen
                         wie?                                                   fühlen oder riechen oder über den Verschleiß er-
                             In AWS lassen sich auch externe Applikationen      kennen. Das kann die Bilderkennung nicht leis-
                         anbinden. Mit Google Flutter starteten wir einen       ten.
                         Versuch in diese Richtung. Um die Nutzer*innen            Es ist wichtig, zu Projektbeginn ausreichend
                         in der Flutter-Applikation zu verwalten, eignet sich   Zeit für das Trainieren des Modells einzuplanen.
                         Amazon Cognito (siehe Abbildung 3).                    Auch das Sammeln der Bilder kann aufwendig
                             Cognito ist für Millionen von Benutzer*innen       sein – insbesondere, wenn es um die Klassifizie-
                         skalierbar. Es unterstützt die Anmeldung über di-      rung von Produktfälschungen geht. So kam es
                         verse soziale Identitätsanbieter, wie zum Beispiel     vor, dass Web-Links kurz nach dem Erscheinen
                         Facebook, Google oder Amazon. Ebenso ist es            des Produkts auf dem Bildschirm direkt wieder
                         möglich, Unternehmens-Identitätsanbieter über          verschwunden sind. Aufgrund vielfältiger Anwen-
                         SAML 2.0 und OpenID Connect zu integrieren             dungsfälle ist es wichtig, einen Fall einzugrenzen
                         [Cog21].                                               und die Projektverläufe und -ergebnisse zu doku-
                             Aber wie profitiert eine Person, die den echten    mentieren.
                         Luxus-Sneaker kaufen möchte, von dieser Lösung?           Drei weitere Stolperfallen sind erwähnenswert:
                         Ganz einfach: Sie lädt sich eine App herunter, die     1. Bilder sind als unstrukturierte Daten zu verste-
                         die Echtheit des Sneakers prüft. Die App wirft ei-        hen. Das bildet die Basis für die korrekte Wahl
                                                                                   der Metrik. Zudem ist eine sehr gute Teamkom-
                                                                                   munikation für den Projekterfolg maßgeblich.
 Flutter ist ein Open-Source-UI-Entwicklungs-Kit. Es ermöglicht die Ent-           Nur so ist es möglich, mit der zum Teil intrans-
 wicklung von Cross-Plattform-Apps, wie zum Beispiel Android und iOS               parenten Ordnerstruktur in AWS umzugehen –
 [Flu21]. Der Flutter-Code lässt sich in ARM- oder Intel-Maschinencode             vor allem wenn es um das gemeinsame Aufsu-
 sowie in JavaScript kompilieren, um eine schnelle Leistung auf jedem              chen von Bildern im S3-Bucket geht.
 Gerät zu gewährleisten.                                                        2. Die AWS-Ressourcen sind so zu verstehen, dass
                                                                                   zumindest ein Teammitglied die AWS-Skalie-
                                                                                                               BI-SPEKTRUM 5/2021
TITELTHEMA

   rung im Blick behält. Eine umfassende Prüfung
   und Sicherung der IT-Architektur ist wichtig.         Amazon Cognito ist ein Web-Service zur Registrierung, Anmeldung
   Das verhindert, dass die Kosten ungewollt in die      und Zugriffskontrolle der Benutzer*innen [Cog21]. Er kann für Millionen
   Höhe schnellen.                                       von Benutzern skaliert werden und unterstützt die Anmeldung sowohl
3. Die AWS-Benutzerrichtlinien sind stets zu be-         über soziale Identitätsanbieter wie Apple, Facebook, Google und Ama-
   rücksichtigen. AWS Rekognition Image verar-           zon als auch durch Unternehmens-Identitätsanbieter.
   beitet zum Beispiel nicht alle Arten von Bild-
   dateien. Das bereits vor dem Labeln zu wissen
   vermeidet Unmut während der Projektarbeit.             Angesichts der Terabytes an Bilder- und Video­
                                                       daten, die jeden Tag neu zu finden sind, erschei-
Fazit: Neue Lösungen,                                  nen die Möglichkeiten von KI-Projekten unendlich.
                                                       Deswegen ist es wichtig, immer wieder neue Ide-
die uns weiterbringen                                  en und Technologien zu testen. Es ist wichtig, in
Heutzutage ist Bilderkennung mit KI Realität.          verschiedene Richtungen zu experimentieren. Und
Fachzeitschriften schreiben täglich über unzähli-      es ist wichtig, diverse Anwendungsfälle zu konzi-
ge Anwendungsbereiche im privaten und öffent-          pieren. Nur so entstehen neue Lösungen, die uns
lichen Sektor. Dennoch sind Bilder als unstruktu-      weiterbringen.
rierte Daten weiterhin eine Herausforderung für
die Verarbeitung und die Analyse. Die Ergebnis-        Literatur
se solcher Projekte können sich jedoch sehen las-
sen!                                                   [Cog] Amazon Web Service: Amazon Cognito. https://aws.amazon.com/de/cognito/,
    E-Commerce-Plattformen wie About You Second        abgerufen am 15.10.2021
Love, Zalando Zircle, Vestaire Collective oder Posh-   [Flu21] Flutter, https://flutter.dev/, abgerufen am 3.11.2021
mark können von solchen Lösungen profitieren. Es       [GBC18] Global Brand Counterfeiting Report, 2018. https://www.researchandmarkets.
ist denkbar, Bilder beim Hochladen einer Art „Fäl-     com/reports/4438394/global-brand-counterfeiting-report-2018, abgerufen am
schungsprüfung“ zu unterziehen. Ähnlich kann           2.11.2021
auch das Zollamt bei der Prüfung von Importwa-         [IKS21] Fraunhofer IKS: „Künstliche Intelligenz (KI) und maschinelles Lernen“, 2021.
ren eine App zu Rate ziehen.                           https://www.iks.fraunhofer.de/de/themen/kuenstliche-intelligenz.html, abgerufen
    Egal in welche Richtung man überlegt, es gibt      am 13.10.2021
überall spannende Anwendungsszenarien: Bei-            [Lam21] Amazon Web Service: Amazon Lambda. https://aws.amazon.com/de/
spielsweise könnten Unternehmen die Repara-            lambda/, abgerufen am 15.10.2021
tur- und Arbeitszeiten neuer Mitarbeiter*innen         [Ort20] Ortiz, C.: „KI, ML, DL – was genau war das doch gleich noch mal?“ Oracle
beschleunigen. Eine App muss nur die richtigen         Blog, 9.1.2020. https://blogs.oracle.com/de-cloud/der-unterschied-zwischen-ki-ml-dl,
Ersatzteile automatisch erkennen und vorschla-         abgerufen am 14.10.2021
gen. Vor allem für neue und auch komplexe Ge-          [Rek21] Amazon Web Service: Amazon Rekognition. https://aws.amazon.com/de/
räte mit einer Vielzahl von Modellvariationen          rekognition/, abgerufen am 15.10.2021
können wir die Hilfe eines Deep-Learning-Mo-           [Sto21] Stockx: Jordan 1 Retro High Dior. https://stockx.com/de-de/air-jordan-1-retro-
dells gut gebrauchen. Aber auch bei alltäglichen       high-dior, abgerufen am 15.10.2021
Produkten sind Lösungen für die Konsumenten            [Wik21] Wikipedia: „Künstliche Intelligenz“. https://de.wikipedia.org/wiki/
denkbar.                                               K%C3%BCnstliche_Intelligenz, abgerufen am 12.10.2021

BI-SPEKTRUM 5/2021
Sie können auch lesen