Modernisieren Sie Ihr Data Warehouse und Ihren Data Lake in der Cloud
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Lösungsübersicht Modernisieren Sie Ihr Data Warehouse und Ihren Data Lake in der Cloud Hauptvorteile Nutzen Sie das Potenzial Ihrer Analytics-Initiativen optimal – mit • Erhöhen Sie die Flexibilität mit Metadaten-basiertem Cloud intelligentem, automatisiertem Cloud Lakehouse Data Management Lakehouse Data Management, das Datenintegration und Unternehmen handeln heute aufgrund der digitalen Transformation immer stärker datenbasiert, Datenqualität mit Governance um die Amortisierungszeit zu verkürzen, Kosten zu reduzieren, die Effizienz zu steigern und bietet zuverlässige Erkenntnisse für die Entscheidungsfindung zu gewinnen. Um diese Ziele zu • Verringern Sie mit KI-basierten erreichen, modernisieren Unternehmen ihre Analytics-Initiativen entweder durch Erstellung Funktionen Kosten, weil die neuer Cloud Data Warehouses und Data Lakes oder durch die Konsolidierung von On-Premise manuelle Programmierung wegfällt Data Warehouses in der Cloud. Unternehmen nutzen zudem moderne Cloud-Technologien, um • Verbessern Sie die Agilität mit Data Warehouses und Data Lakes in einer zentralen Datenplattform zusammenzufassen, die als programmierfreier Integration „Lakehouse“ bezeichnet wird. und einsatzfertiger Konnektivität für Hunderte von Anwendungen Das Data Management ist die Voraussetzung dafür, den Business Value, der sich aus Cloud • Erhöhen Sie die Produktivität Analytics-Projekten ergibt, zu maximieren. Um die Agilität, Flexibilität und Skalierbarkeit der Cloud der Software-Entwicklung durch vollständig zu nutzen und Probleme zu vermeiden, die in On-Premise-Umgebungen auftreten, Automatisierung und KI benötigen Unternehmen einen systematischen Ansatz für Datenqualität und Data Management • Unterstützen Sie Self-Service- Datenzugriff und Analytics für ihre Cloud Data Warehouses, Data Lakes und Lakehouses. durch Suchfunktionen basierend auf natürlicher Sprache Indem Unternehmen eine intelligente, automatisierte Lösung für das Enterprise Cloud Lakehouse Data Management nutzen, um Workloads in der Cloud zu erstellen und zu verwalten, können sie die Datentransparenz verbessern, verschiedene Datenquellen anbinden und immer komplexere hybride und Multi-Cloud-Umgebungen verwalten. Dank dieses Ansatzes können Mitarbeiter in Ihrem gesamten Unternehmen – von Business-Analysten bis zu Data Scientists und Data Engineers – schnell und problemlos hochwertige Daten für ihre Analytics-Initiativen abrufen und Innovation vorantreiben, um Wettbewerbsvorteile zu gewinnen. 1
Ein schrittweiser Modernisierungsansatz Zu Beginn richten Unternehmen oft ein Cloud Data Warehouse für ein abteilungsinternes Projekt ein, um die Lösung und Cloud-Optionen zu testen. Sobald das Projekt erfolgreich umgesetzt wurde und Mehrwert erreicht worden ist, besteht der nächste Schritt darin, traditionellere On-Premise Data Warehouse-Projekte in die Cloud zu migrieren oder einen Cloud Data Lake hinzuzufügen. Dort werden dann Rohdaten bereitgestellt, die von Data Scientists für Experimente genutzt werden können, sowie auch neue Datenquellen. Einige Unternehmen entscheiden sich bei ihrer Journey to Cloud für manuelle Prozesse, wie die manuelle Programmierung, doch dieser Ansatz führt dazu, dass das IT-Team schnell überlastet wird. Zudem ist die Wartung dieses Ansatzes kostspielig und er lässt sich kaum erweitern. Andere Unternehmen entscheiden sich für begrenzte Lösungen, um spezifischen Anforderungen an das Data Management gerecht zu werden. Doch der Nachteil ist, dass es zu vielen verschiedenen, fragmentierten Ansätzen kommt, wodurch die Komplexität steigt und unnötige Kosten und Risiken entstehen. Informatica® hilft Unternehmen dabei, diese Fehler zu vermeiden und stattdessen ihre Cloud Data Warehouse- und Data Lake-Initiativen mithilfe der branchenführenden, unabhängigen, modernen Cloud Lakehouse Data Management-Lösung von Informatica zu beschleunigen – Intelligent Cloud ServicesSM (IICS). IICS ist eine moderne, auf Microservices basierende, Metadaten- und KI-gestützte, cloudnative Data Management-Lösung für Cloud Data Warehouses und Data Lakes, unabhängig von der Cloud-Plattform oder dem Technologie-Anbieter (darunter Amazon, Microsoft, Snowflake, Databricks und Google). Hauptfunktionen Cloud Lakehouse Data Management Damit Cloud Data Warehouses und Data Lakes erfolgreich genutzt werden können, bietet Informatica als einziger Anbieter eine Komplettlösung für Katalogisierung, Einspeisung, Integration, Bereinigung und Verwaltung von Daten. Für andere Lösungen sind oftmals verschiedene Komponenten erforderlich, oft von unterschiedlichen Anbietern. IICS bietet umfassende, auf KI basierende, integrierte, cloudnative Funktionen für Cloud Data Integration, Cloud Data Quality und Metadata Management, die alle auf einer intelligenten Plattform basieren. IICS bietet auch auf KI basierende Automatisierung mit minimalen Installations- und Setup- Anforderungen, automatischen Upgrades, einem voll integrierten Technologie-Stack für eine hohe Verfügbarkeit und zertifizierter Zuverlässigkeit (z. B. SOC, SOC2, HIPAA, ISO/IEC 27001, Cloud Security Alliance, Privacy Shield Framework und noch weitere). 2
Datenintegration Integrieren und speisen Sie schnell alle möglichen Datentypen mithilfe einer intuitiven, visuellen Entwicklungsumgebung ein, um Daten-Pipelines zu erstellen, die Daten für Ihr Cloud Data Warehouse und Ihren Data Lake bereitstellen. IICS Cloud Data Integration bietet vorgefertigte, cloudnative Konnektivität für nahezu alle Arten von Unternehmensdaten in Multi-Cloud- und On-Premise-Umgebungen. Cloud Data Integration wurde für Skalierbarkeit und Performance entwickelt und bietet wichtige Funktionen zur Optimierung, darunter auch Pushdown-Optimierung, damit Sie die Daten effizient verarbeiten können. Cloud Data Integration Elastic ermöglicht die serverlose Spark-Verarbeitung für mehr Skalierbarkeit und Kapazität On-Demand. Abbildung 1: Cloud Data Integration unterstützt die Erstellung von Data-Pipelines mit Click-and-Drag-Funktionalität. Mithilfe von Assistenten und einsatzfertigen, vordefinierten Integrationen, intelligenter Data Discovery, automatischem Parsing komplexer Dateien und Empfehlungen für die auf KI basierende Transformation können Sie schnell Daten-Pipelines errichten. So können Sie schnell Daten ermitteln, die in Ihr Cloud Data Warehouse und Ihren Data Lake transferiert werden sollen und sind in der Lage, die Daten-Pipelines für andere Projekte zu verwenden. IICS Cloud Mass Ingestion unterstützt die Einspeisung von Daten aus verschiedensten Quellen, beispielsweise aus Dateien, Datenbanken, Change Data Capture und Streaming von Echtzeitdaten. 3
Data Quality Stellen Sie sicher, dass sich nur zuverlässige Daten in Ihrem Cloud Data Warehouse befinden und dass Ihr Data Lake nicht zu einem Data Swamp wird. Informatica Cloud Data Quality bietet cloudnative Funktionen, damit Sie einen ganzheitlichen Ansatz verfolgen können, um Data Profiling durchzuführen, Probleme mit der Datenqualität zu erkennen, zu beheben und zu überwachen, bevor die Daten in Ihr Cloud Data Warehouse oder Ihren Data Lake transferiert werden. Mithilfe von Cloud Data Quality können Sie Daten umwandeln, um alle Daten zu bereinigen, zu standardisieren und anzureichern. Sie können einen umfassenden Satz an vorgefertigten Datenqualitätsregeln ohne zusätzlichen Programmieraufwand nutzen, um sicherzustellen, dass zuverlässige Daten bereitgestellt und für Analytics verwendet werden können. Abbildung 2: Cloud Data Quality erkennt automatisch Regeln für Ihre Profile. Cloud Data Quality umfasst Geschäftsregeln und Funktionen für Standardisierung, Abgleich, die Bereinigung weltweiter Adressen, und flexible Verwaltung der Datenqualität für alle Projekttypen. Die CLAIRE® Engine stellt auf Metadaten basierende künstliche Intelligenz zur Verfügung, so dass intelligente Empfehlungen für Datenqualitätsregeln erstellt werden können. Diese Regeln basieren darauf, wie ähnliche Daten verwaltet werden. 4
Metadatenverwaltung Nur Informatica bietet eine einheitliche, unternehmensweite Grundlage für die Metadatenverwaltung, um die Zusammenarbeit zu fördern und End-to-End-Workstreams für die auf KI basierende Datenintegration, Datenqualität, Datenkatalogisierung und Data Governance zu unterstützen. IICS bietet einen auf Metadaten basierenden Ansatz zur Erstellung von Daten-Pipelines mithilfe einer visuellen Entwicklungsumgebung. Dieser Ansatz kann für alle gängigen Cloud-Plattformen (Amazon Web Services, Microsoft Azure und Google Cloud Platform) und die neuesten Verarbeitungs- Engines (Spark) genutzt werden, ohne dass eine Neuprogrammierung Ihrer vorhandenen Pipelines erforderlich ist. Mit diesem Ansatz können Sie Daten automatisch ermitteln, kennzeichnen, in Beziehung zueinander setzen und in Ihrem Cloud Data Warehouse und Data Lake bereitstellen. Abbildung 3: Enterprise Data Catalog bietet End-to-End Data Lineage. Informatica bietet einen Enterprise Data Catalog für Ihre Datenbestände und dazugehörige Beziehungen, indem Metadaten aus allen Unternehmenssystemen gescannt und erfasst werden, Metadaten verwaltet und durch Geschäftskontext angereichert und Beziehungen und Data Lineage abgeleitet werden. Im Folgenden werden die Kategorien an Metadaten vorgestellt, die erfasst und analysiert werden: • Technische Metadaten: Datenbank-Schemata, Mappings und Code, Umwandlungen und Qualitätsüberprüfungen • Betriebliche Metadaten: Glossareinträge, Governance-Prozesse, Anwendungs- und Geschäftskontext • Operationelle und Infrastruktur-Metadaten: Statistiken zur Laufzeit, Zeitstempel, Volumenmetrik, Protokollinformationen, System- und Standortinformationen • Verwendungsbezogene Metadaten: Nutzerbewertungen, Kommentare und Zugriffsmuter Mithilfe der Metadaten dieser vier Kategorien wird eine gemeinsame Grundlage erstellt. Informatica sorgt dafür, dass diese Metadaten aktiv genutzt werden können, indem KI und Machine Learning darauf angewendet und über den Technologie-Stack hinweg integriert werden. 5
Hauptvorteile Höhere Produktivität und geringere Kosten Die umfassende und integrierte Cloud Lakehouse Data Management Lösung von Informatica kann die Produktivität erhöhen und das Risiko von Projekten anhand von KI, Automatisierung und Effizienz verringern. Mit serverloser, skalierbarer Verarbeitung mithilfe von Spark können Sie die Betriebskosten verringern und die Ressourcennutzung optimieren. Sie können eine umfassende Ansicht für die Entscheidungsfindung nutzen. Zudem hilft die Lösung Ihnen dabei, hochwertige Daten zu ermitteln, einzuspeisen, zu integrieren, zu bereinigen, zu verwalten, zu regulieren, zu schützen und samt Governance auch allen Nutzern bereitzustellen. • Datenanalysten, Data Scientists und Data Stewards können die Daten durch detaillierte End-to- End-Data Lineage, Datenqualitätsprofile, Crowd Sourcing und KI-basierte Kennzeichnung besser verstehen, so dass sie sich auf die Analyse der Daten und die Erstellung von Machine Learning- Modellen konzentrieren können. • Data Engineers können innerhalb des Enterprise Data Catalog teilweise oder sogar vollständig automatisierte Implementierungsaufgaben nutzen, beispielsweise Empfehlungen zu den nächsten Umwandlungsschritten, automatisierte Erstellung von Datenpipelines, automatisierte Data Warehouse Hydration, automatisches Parsing komplexer Dateien, wie IoT und Daten aus Webprotokollen. • Datensicherheits- und Datenschutzexperten können Datenmissbrauch einfacher erkennen, sensible Daten besser schützen und nachweisen, dass bei der automatisierten Erkennung sensibler Daten und der Verbreitung in verschiedene Systeme und über Landesgrenzen hinaus angemessene Kontrollen umgesetzt werden. Erhöhte Flexibilität und Skalierbarkeit Informatica ist der einzige unabhängige Enterprise Cloud Lakehouse Data Management-Anbieter, der branchenführende, innovative Funktionen für Datenintegration, Datenqualität, Data Governance und Metadaten-Management bietet. Dadurch vermeiden Sie die Integration verschiedener Multi-Point- Tools, die Ihre Data Management-Funktionen erheblich einschränken und Risiken und Kosten erhöhen können. Informatica Cloud Lakehouse Data Management sorgt dafür, dass Ihre sich schnell ändernden Multi-Cloud-Umgebungen und sich weiterentwickelnde Analytics-Stacks zukunftssicher sind, damit Sie Ihr Cloud Data Warehouse oder Ihren Data Lake flexibel einsetzen können. Sie können verschiedene Anwendungen und Datenquellen On-Premise und in der Cloud anbinden, große Datenmengen nahtlos integrieren und Analytics-Workloads problemlos verwalten. Informatica unterstützt die native Anbindung fast aller Datenquellen und die Einspeisung von ETL- und Push-Down-Verarbeitung für Cloud Data Warehouses. Wenn Sie sich also dazu entscheiden, Ihre Cloud-Plattform zu ändern, lässt sich die Migration ohne erneute Programmierung umsetzen, so dass Sie Ihre Investitionen schützen. Die serverlose Cloud Data Integration von Spark dient nur der Konfiguration Ihrer Anforderungen. Cloud Data Integration Elastic stellt die Kapazität zur Verfügung, die Sie benötigen, samt optimierter Ressourcenverwaltung und Skalierbarkeit. 6
Informationen zu Informatica Höhere Agilität Die digitale Transformation Durch IICS profitieren Sie von der schnellen Umsetzung von Aufgaben, minimalem Installations- verändert unsere und Setup-Aufwand, automatischen Upgrades, schnellem Onboarding von Daten und einem Erwartungshaltung hin zu integrierten Technologie-Stack für die agile Entwicklung und minimale Ausfallzeit. Starten Sie besserem Service und schnellerer Lieferung zu geringeren Kosten. sofort, ohne sich zuerst einarbeiten zu müssen, indem Sie die einsatzfertige Konnektivität nutzen, Unternehmen müssen sich neu die Einblick in Hunderte von Anwendungen bietet, sowie programmierfreie Integration und orientieren, um wettbewerbsfähig skalierbare Masseneinspeisung für große Workloads. zu bleiben. Dabei spielen Daten eine zentrale Rolle. Nutzen Sie die Agilität der Cloud für die Integration neuer Funktionen, verkürzen Sie die Als führender Anbieter Markteinführungszeit und erhöhen Sie den ROI Ihrer Technologie-Investitionen dank einer für Enterprise Cloud Data Management unterstützt kürzeren Amortisierungszeit. Schließen Sie Projekte schneller ab, um Business Value schneller Informatica Sie dabei, sich umzusetzen, bieten Sie verwaltete Self-Service-Funktionen, verringern Sie Projektkosten und als intelligenter Vorreiter zu senken Sie das Risiko mithilfe der integrierten Funktion für Geschäftskontinuität. etablieren – völlig unabhängig davon, in welcher Branche, Kategorie oder Nische Sie Business-Analysten und Data Scientists können dank der Google-ähnlichen Semantiksuche tätig sind. Wir ermöglichen schnell auf umfangreiche, zuverlässige Daten zugreifen. CLAIRE bietet relevante Empfehlungen es Ihnen, agiler zu werden, zu neuen Datenbeständen, um Analytics zu verbessern. Dadurch steigt die Agilität und Ihre neue Wachstumsmöglichkeiten Datennutzer können Ad-hoc und Data Science Analytics durchführen – ohne Mithilfe der IT. wahrzunehmen und Innovationen voranzutreiben. Informatica ist zu 100 % auf Daten fokussiert, Jetzt können Sie sicherstellen, dass Ihr Data Warehouse- oder Data Lake-Projekt erfolgreich sein und bietet Unternehmen wird, da die Amortisierungszeit verkürzt und der ROI dank Cloud Lakehouse Data Management vielseitige Lösungen, um sich verbessert wird, das auf KI und Automatisierung basiert. am Markt durchzusetzen. Wir laden Sie ein, das gesamte Angebot von Informatica zu Die nächsten Schritte erkunden – und das Potenzial Kontaktieren Sie uns, uns um mehr über Informatica Cloud Lakehouse Data Management zu erfahren. der Daten zu nutzen um Ihre nächste intelligente Innovation Testen Sie Informatica Cloud Data Warehouse – Teil des Informatica Cloud Data Integration auf den Weg zu bringen. Service – 30 Tage lang kostenlos und melden Sie sich jetzt an. an Local Headquarters Ingersheimer Str. 10, 70499 Stuttgart Tel: +49 (0) 711 139 84-0 Gebührenfrei in den USA: 1.800.653.3871 IN17_0420_03569 © Copyright Informatica LLC 2020. Informatica, das Logo von Informatica, Informatica Intelligent Cloud Services und CLAIRE sind Marken oder eingetragene Marken von Informatica LLC in den USA und in anderen Ländern. Die aktuelle Liste mit Marken von Informatica ist hier zu finden: https://www.informatica.com/de/trademarks.html. Alle weiteren Firmen- und Produktbezeichnungen können Handelsnamen oder Marken ihrer jeweiligen Eigentümer sein. Die in diesem Dokument enthaltenen Informationen können sich ohne vorherige Ankündigung ändern und werden „wie gesehen“ und ohne jegliche ausdrückliche oder stillschweigende Gewährleistung bereitgestellt.
Sie können auch lesen