Fake versus Real Mit Künstlicher Intelligenz gefälschte Ware erkennen - Opitz Consulting
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
TITELTHEMA Sonderdruck aus BI-SPEKTRUM 5/2021 Bild: Shutterstock Mit Künstlicher Intelligenz gefälschte Ware erkennen Fake versus Real Jeder weiß es: Beliebte Produkte sind fälschbar! Die Lieblingskategorien der Fälscher sind hoch- Ein Beitrag von C harlotte wertige Technik, teure Accessoires und Luxury-Mode. Steht auf den Labeln „Adibas“ oder „CUGCI“, Grade und Arpine Ayvazyan ist schnell klar, dass es sich um eine Fälschung handelt. Es gibt aber auch gute Fälschungen, die ein menschliches Auge nicht sofort oder teilweise gar nicht erkennen kann. Hier können Bilderkennungs- methoden eine Lösung darstellen, um gefälschte Produkte zu identifizieren. Mit Fälschungen hochpreisiger Produkte sehen Deep Learning als möglicher sich nicht nur Hersteller konfrontiert. Unternehmen und Marken verlieren dadurch viel Geld. Bereits im Lösungsansatz Jahr 2017 erlitten die Luxusmarken Verluste von Kann Künstliche Intelligenz hier Abhilfe schaffen? 323 Milliarden US-Dollar [GBC18]. Gleichzeitig ist Mit Hilfe welcher Bilderkennungsmethoden kön- es für den öffentlichen Bereich (zum Beispiel das nen Produktfälschungen identifiziert werden? Eig- Zollamt) schwer, Fälschungen zu erkennen und zu nen sich dafür Image Mining, Object Recognition, beschlagnahmen. Auch E-Commerce-Plattformen Image Classification etc.? Das haben wir in unse- des rasant wachsenden Luxus-Secondhand-Mark- rem Forschungsprojekt „Fake vs. Real: Mit KI ge- tes, wie Zalando Zircle, Vite EnVogue, StockX oder fälschte Ware erkennen“ herausgefunden. About You, müssen Schnittstellen einbauen, die Künstliche Intelligenz (KI), bei der es darum Fälschungen auf Bildern von Nutzer*innen mel- geht, einem Computer menschliches Verhalten bei- den. zubringen, bildete dabei den Rahmen. Mit einer Wir stehen hier vor einem komplexen Problem, an dessen Lösung neben Herstellern und Verbrau- chern auch der Handel und der Zoll interessiert Amazon Rekognition Image ist ein mit Deep Learning ausgestatteter sind. Sie alle benötigen eine Lösung, die dabei hel- Bilderkennungsservice, der Objekte, Szenen, Gesichter, Text, bekannte fen soll, Fälschungen zu entlarven, und in der L age Persönlichkeiten und weitere Bildinhalte erkennt [Rek21]. sein soll, echte Produkte einwandfrei zu identifizie- ren. BI-SPEKTRUM 5/2021
TITELTHEMA Abb. 1: Künstliche Intelli- Deep-Learning-Architektur sind wir tief in die Tech- ([Wik21], siehe Abbildung 1). Kleinste Abwei- genz, Machine Learning, nologie eingetaucht. Die Architektur entwickelten chungen auf Bildern zu erkennen ist mit Deep Deep Learning [Ort20] wir in der AWS Cloud [Rek21], wo uns eine pas- Learning kaum noch ein Problem! sende IT-Infrastruktur für diesen Use-Case zur Ver- Beim Deep Learning nutzen wir große Datenmen- fügung stand. gen und künstliche neuronale Netze mit zahlrei- Kurze Rekapitulation: Worin unterscheiden chen Zwischenschichten. Eingabeschicht, Aus- sich Künstliche Intelligenz (KI), Maschinelles Ler- gabeschicht und verborgene Zwischenschichten nen und Deep Learning? Hier eine kurze Definition (sogenannte „Hidden Layers“) bilden eine um- im Überblick: fangreiche innere Struktur. Darüber sind Infor- • Künstliche Intelligenz bezeichnet das Anlernen mationen zu verarbeiten und zu reduzieren. Die von Computersystemen mit dem Ziel, menschli- neuronalen Netze bilden die Lernalgorithmen. Sie ches Verhalten nachzubilden. bestehen aus mehreren Reihen von Datenkno- • Maschinelles Lernen ist eine Unterkategorie ten, die über gewichtete Verknüpfungen mitein- der Künstlichen Intelligenz. Darunter sind Tech- ander vernetzt sind. Das Gewichtungsverhältnis niken zu verstehen, die es Computern ermögli- zwischen den Neuronenschichten ist immer wie- chen, Wissen und Erkenntnisse aus Daten he der neu anzupassen [Wik21]. Auf diesem Weg ent- rauszufiltern. steht ein Modell, das für diverse Anwendungsfälle • Deep Learning versteht sich wiederum als Un- nutzbar ist. terkategorie des maschinellen Lernens und Amazon Rekognition ist ein Framework, das mit ist für komplexe Fragestellungen interessant Deep Learning arbeitet. Damit lassen sich Modelle trainieren, die helfen, Bilder zu erkennen, um aus diesem generierten Wissen automatisiert fundier- te Entscheidungen treffen zu können [IKS21]. Das Tool passte zu unserem Use-Case. Ein einfacher Use-Case: Eine Chanel-Tasche Die Entwicklung der Architekturstrecken für un- seren Fall hielten wir einfach. Als Beispielprodukt diente uns eine Chanel-Tasche. Damit unser Algo- rithmus herausfinden konnte, ob das Logo auf die- ser Tasche echt ist, benötigten wir Originalbilder Abb. 2: Manuelle Analyse und Abgleichbilder. Die Originalbilder konnten wir der Schuhe (basiert auf von der offiziellen Chanel-Website herunterladen. mehreren Quellen wie Doch wie findet man eine Produktfälschung? Da- Farfetch, GQ Magazine, für nahmen wir eine umfassende Recherche vor. Aliexpress) Bei diversen inländischen und ausländischen Pro- BI-SPEKTRUM 5/2021
TITELTHEMA duktanbietern luden wir schließlich eine Vielzahl CHARLOTTE GRADE arbeitet als Business- an Bildern mit falschen Chanel-Taschen herunter. und IT-Analystin bei der OPITZ CONSULTING Dabei hieß es, keine Zeit zu verlieren, denn einige Deutschland GmbH am Standort Hamburg. dieser Web-Links verschwanden bereits unmittel- Dort fungiert sie als Schnittstelle zwischen bar nach dem Erstaufruf. Amazon Rekognition arbeitet beim Training des IT, Fachbereich und externen Dienstleis- Modells mit Bild- und Videoanalysen. Machine- tern. Wenn es darum geht, Kunden bei der Learning- oder KI-Know-how setzt AWS nicht vo Entwicklung von Analysen und Reports für raus. Für die Verwendung bedarf es lediglich ei- ihre Geschäftsdaten zu unterstützen oder ner ausreichenden Menge an Bildern – in diesem eine Business-Analyse bis hin zur Daten- Fall an Bildern von echten und gefälschten Chanel- Taschen. visualisierung zu unterstützen, ist sie zur In der AWS Cloud konnten wir einzelne Bilder Stelle. Besonders interessiert sie sich für hochladen und klassifizieren. Zusätzlich haben wir die Entwicklung von Fachkonzepten, vor weitere AWS-Services angebunden. So konnten wir allem für datenschutzbezogene ein S3-Bucket verwenden, um verschiedene Ordner Anforderungen beim Reporting. anzulegen, das uns bei der anschließenden Grup- pierung helfen sollte [Rek21]. E-Mail: charlotte.grade@opitz-consulting.com Ist also der Abgleich eines Originalprodukts mit einem potenziellen Fälschungsprodukt gewünscht, sind diese innerhalb eines S3-Buckets über ent- ARPINE AYVAZYAN ist Business Analyst und sprechende Ordner zu klassifizieren und zu iden- Consultant im Umfeld von BI und Data Analytics tifizieren [Rek21]. bei der OPITZ CONSULTING Deutschland GmbH. Für die Identifizierung nutzten wir Custom La- Sie berät Kunden bei der fachlichen und strate- bel. Dies ist ein zusätzlicher AWS Service, den wir einfach hinzufügten. Custom Label übernimmt das gischen Entwicklung von Analysen ihrer Ge- manuelle Labeln der Objekte in einem Bild, das für schäftsdaten und begleitet sie von der Business- unerfahrene Deep Learner sehr zeitaufwendig ist Analyse bis hin zur Datenvisualisierung. Frau [Rek21]. Ayvazyan ist leidenschaftliche KI- und Machine- Der Label-Vorgang hilft, Nähte und Logos auf Learning-Enthusiastin und arbeitet seit über drei Produkten als solche identifizieren zu können. So entsteht innerhalb weniger Stunden ein stabiles Jahren in diversen IT- und Analytics-Teams an Bildanalysemodell. Die Nutzer*innen können auf Projekten in unterschiedlichen Industriezweigen, diesem Weg ein benutzerdefiniertes Rekognition- vom Start-up bis zum Konzern. Modell ohne besondere KI-Kenntnisse trainieren E-Mail: Arpine.Ayvazyan@opitz-consulting.com [Rek21]. Je nach Anwendungsfall und geforderter Er- kennungsqualität braucht man weniger oder mehr Bilder. Im Einzelfall sind bereits ein bis Bevor wir unser KI-Modell mit neuen Bildern zwei Trainingsdaten ausreichend. Für einen mitt- weiterentwickeln konnten, haben wir die Fäl- leren Projektrahmen, denkbar in E-Commerce- schungen selbst im Detail in Augenschein ge- Bereichen, sollte das Trainingsset aus mindes- nommen und eine manuelle Analyse durchge- tens zehn bis hundert Einheiten bestehen, um führt, um die Gemeinsamkeiten und vor allem die eine hochwertige Identifizierung sicherzustellen Unterschiede der jeweiligen Modelle aufzuzeigen. [Rek21]. Nur so konnten wir das Modell optimal trainie- ren. 25.000-Euro-Schuhe Der Vergleich ergab, dass die Fälschungen teil- weise eine sehr schlechte Verarbeitungsqualität von Nike und Dior aufwiesen. Außerdem gab es Unterschiede bei der Der Sneaker „Nike Air Jordan Dior“ sollte unser Qualität der Schnürsenkel. Ein weiteres Merkmal nächstes Analyseprodukt sein, das wir unter die bei diesem Sneaker ist die Sohle beziehungswei- Lupe nahmen. Dieser Freizeitschuh hat eine sehr se die Platzierung der Air Dior Wings auf der Soh- schmale Serienreife von nur 8.500 limitierten Ex- le. Bei Fälschungen erscheint das Logo nicht rich- emplaren erreicht und ging zur Zeit unseres Pro- tig. Auch die Farben sind ein wichtiges Merkmal. jekts für rund 1.850 Euro über die Ladentheke. Je nach Beleuchtung können diese aber auch bei Entsprechend beliebt sind diese Schuhe auf dem Originalschuhen auf Bildern abweichen (siehe Ab- Secondhand-Markt: Dort bringen sie mitunter über bildung 2). 25.000 Euro ein [Sto21] – ein gefundenes Fressen für Produktfälscher. Fälschungen dieses Nike-Schuhs finden sich zum AWS Lambda ist ein Datenverarbeitungsservice, der serverlos arbeitet. Beispiel in chinesischen Online-Shops. Hier kosten Das erspart eine Menge Ressourcen. So gelingt es, einen bestimmten die Schuhe gerade einmal 40 bis 50 Euro. Einige Code auszuführen und die zugrunde liegenden Datenverarbeitungsres- Exemplare haben offensichtliche Fehler. Viele sind sourcen automatisiert zu verwalten [Lam1]. allerdings mit dem bloßen Auge nicht zu erkennen. BI-SPEKTRUM 5/2021
TITELTHEMA Abb. 3: AWS-Architektur für unseren PoC Nach dieser Analyse suchten wir gezielt nach nen Wahrscheinlichkeitswert aus. Dieser hilft, das geeigneten Bildern. Wie bei der Chanel-Tasche Produkt einzuordnen. Bei einer Übereinstimmung mussten wir recherchieren, um passende Bilder von weniger als 80 Prozent ist von einer möglichen zu finden. Das hat einiges an Zeit gekostet, denn Fälschung auszugehen. die Internetseiten verschwanden schon nach we- Die Nutzer*innen benötigen dafür keinen AWS- nigen Sekunden. Am Ende hatten wir die pas- Account. Technische Fähigkeiten sind ebenfalls senden Bilder aber gesichert und gingen daran, nicht notwendig. Sie testen einfach das Modell und das KI-Modell erneut zu trainieren. Auch dies- helfen, den Algorithmus weiterzuentwickeln. mal planten wir genug Zeit für die Trainingspha- AWS bietet die Möglichkeit, schnell und un- se ein und testeten immer wieder die Robustheit kompliziert Modelle und Architekturen in der AWS der KI. Cloud zu entwickeln. Für die Automatisierung der Gesamtarchitektur brauchten wir einen weiteren Service: Unsere Wahl Grenzen der Bilderkennung fiel auf AWS Lambda. In dieser Phase unseres Projekts dachten wir und unsere Lessons Learned vor allem an Endnutzer*innen solcher Lösun- Bilderkennungsmodelle haben Grenzen. Logi- gen. Deshalb haben wir die Lösung komplett im scherweise kann die KI die Qualität der verwende- „AWS-Universum“ konzipiert. Wer würde diese ten Materialien nicht wie in der realen Welt prü- Lösung aber in der Praxis nutzen und vor allem fen. Ein billiges Material können die Käufer*innen wie? fühlen oder riechen oder über den Verschleiß er- In AWS lassen sich auch externe Applikationen kennen. Das kann die Bilderkennung nicht leis- anbinden. Mit Google Flutter starteten wir einen ten. Versuch in diese Richtung. Um die Nutzer*innen Es ist wichtig, zu Projektbeginn ausreichend in der Flutter-Applikation zu verwalten, eignet sich Zeit für das Trainieren des Modells einzuplanen. Amazon Cognito (siehe Abbildung 3). Auch das Sammeln der Bilder kann aufwendig Cognito ist für Millionen von Benutzer*innen sein – insbesondere, wenn es um die Klassifizie- skalierbar. Es unterstützt die Anmeldung über di- rung von Produktfälschungen geht. So kam es verse soziale Identitätsanbieter, wie zum Beispiel vor, dass Web-Links kurz nach dem Erscheinen Facebook, Google oder Amazon. Ebenso ist es des Produkts auf dem Bildschirm direkt wieder möglich, Unternehmens-Identitätsanbieter über verschwunden sind. Aufgrund vielfältiger Anwen- SAML 2.0 und OpenID Connect zu integrieren dungsfälle ist es wichtig, einen Fall einzugrenzen [Cog21]. und die Projektverläufe und -ergebnisse zu doku- Aber wie profitiert eine Person, die den echten mentieren. Luxus-Sneaker kaufen möchte, von dieser Lösung? Drei weitere Stolperfallen sind erwähnenswert: Ganz einfach: Sie lädt sich eine App herunter, die 1. Bilder sind als unstrukturierte Daten zu verste- die Echtheit des Sneakers prüft. Die App wirft ei- hen. Das bildet die Basis für die korrekte Wahl der Metrik. Zudem ist eine sehr gute Teamkom- munikation für den Projekterfolg maßgeblich. Flutter ist ein Open-Source-UI-Entwicklungs-Kit. Es ermöglicht die Ent- Nur so ist es möglich, mit der zum Teil intrans- wicklung von Cross-Plattform-Apps, wie zum Beispiel Android und iOS parenten Ordnerstruktur in AWS umzugehen – [Flu21]. Der Flutter-Code lässt sich in ARM- oder Intel-Maschinencode vor allem wenn es um das gemeinsame Aufsu- sowie in JavaScript kompilieren, um eine schnelle Leistung auf jedem chen von Bildern im S3-Bucket geht. Gerät zu gewährleisten. 2. Die AWS-Ressourcen sind so zu verstehen, dass zumindest ein Teammitglied die AWS-Skalie- BI-SPEKTRUM 5/2021
TITELTHEMA rung im Blick behält. Eine umfassende Prüfung und Sicherung der IT-Architektur ist wichtig. Amazon Cognito ist ein Web-Service zur Registrierung, Anmeldung Das verhindert, dass die Kosten ungewollt in die und Zugriffskontrolle der Benutzer*innen [Cog21]. Er kann für Millionen Höhe schnellen. von Benutzern skaliert werden und unterstützt die Anmeldung sowohl 3. Die AWS-Benutzerrichtlinien sind stets zu be- über soziale Identitätsanbieter wie Apple, Facebook, Google und Ama- rücksichtigen. AWS Rekognition Image verar- zon als auch durch Unternehmens-Identitätsanbieter. beitet zum Beispiel nicht alle Arten von Bild- dateien. Das bereits vor dem Labeln zu wissen vermeidet Unmut während der Projektarbeit. Angesichts der Terabytes an Bilder- und Video daten, die jeden Tag neu zu finden sind, erschei- Fazit: Neue Lösungen, nen die Möglichkeiten von KI-Projekten unendlich. Deswegen ist es wichtig, immer wieder neue Ide- die uns weiterbringen en und Technologien zu testen. Es ist wichtig, in Heutzutage ist Bilderkennung mit KI Realität. verschiedene Richtungen zu experimentieren. Und Fachzeitschriften schreiben täglich über unzähli- es ist wichtig, diverse Anwendungsfälle zu konzi- ge Anwendungsbereiche im privaten und öffent- pieren. Nur so entstehen neue Lösungen, die uns lichen Sektor. Dennoch sind Bilder als unstruktu- weiterbringen. rierte Daten weiterhin eine Herausforderung für die Verarbeitung und die Analyse. Die Ergebnis- Literatur se solcher Projekte können sich jedoch sehen las- sen! [Cog] Amazon Web Service: Amazon Cognito. https://aws.amazon.com/de/cognito/, E-Commerce-Plattformen wie About You Second abgerufen am 15.10.2021 Love, Zalando Zircle, Vestaire Collective oder Posh- [Flu21] Flutter, https://flutter.dev/, abgerufen am 3.11.2021 mark können von solchen Lösungen profitieren. Es [GBC18] Global Brand Counterfeiting Report, 2018. https://www.researchandmarkets. ist denkbar, Bilder beim Hochladen einer Art „Fäl- com/reports/4438394/global-brand-counterfeiting-report-2018, abgerufen am schungsprüfung“ zu unterziehen. Ähnlich kann 2.11.2021 auch das Zollamt bei der Prüfung von Importwa- [IKS21] Fraunhofer IKS: „Künstliche Intelligenz (KI) und maschinelles Lernen“, 2021. ren eine App zu Rate ziehen. https://www.iks.fraunhofer.de/de/themen/kuenstliche-intelligenz.html, abgerufen Egal in welche Richtung man überlegt, es gibt am 13.10.2021 überall spannende Anwendungsszenarien: Bei- [Lam21] Amazon Web Service: Amazon Lambda. https://aws.amazon.com/de/ spielsweise könnten Unternehmen die Repara- lambda/, abgerufen am 15.10.2021 tur- und Arbeitszeiten neuer Mitarbeiter*innen [Ort20] Ortiz, C.: „KI, ML, DL – was genau war das doch gleich noch mal?“ Oracle beschleunigen. Eine App muss nur die richtigen Blog, 9.1.2020. https://blogs.oracle.com/de-cloud/der-unterschied-zwischen-ki-ml-dl, Ersatzteile automatisch erkennen und vorschla- abgerufen am 14.10.2021 gen. Vor allem für neue und auch komplexe Ge- [Rek21] Amazon Web Service: Amazon Rekognition. https://aws.amazon.com/de/ räte mit einer Vielzahl von Modellvariationen rekognition/, abgerufen am 15.10.2021 können wir die Hilfe eines Deep-Learning-Mo- [Sto21] Stockx: Jordan 1 Retro High Dior. https://stockx.com/de-de/air-jordan-1-retro- dells gut gebrauchen. Aber auch bei alltäglichen high-dior, abgerufen am 15.10.2021 Produkten sind Lösungen für die Konsumenten [Wik21] Wikipedia: „Künstliche Intelligenz“. https://de.wikipedia.org/wiki/ denkbar. K%C3%BCnstliche_Intelligenz, abgerufen am 12.10.2021 BI-SPEKTRUM 5/2021
Sie können auch lesen