Tableau und Big Data auf Exasol
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
DEMO Welche Medikamente werden in England am häufigsten verschrieben und wie haben sich die Kosten im Laufe der Zeit entwickelt?
Was ist Exasol? Exasol ist eine relationale Datenbank für die Analyse von großen und/oder komplexen Daten. In-memory trifft auf MPP. Kompatibel mit vorhandenen Einsatz von R, Python, Lua und Zentralisiertes Authentifizierungs- Kompression auf Anwendungen und Java direkt in der Datenbank Management spaltenbasierte Speicherung. Datenstrukturen. durch User Defined Functions Modernste Datenschutzmethoden Ideal für Reporting, Analysen (UDF). Feingranulares Datenzugriffs- und Advanced Analytics großer Management Datenmengen. Die weltweit schnellste analytische Datenbank und die Plattform für flexible Integrationen und Erweiterungen. 5
Leistungsvorsprung von Exasol im TPC-H Benchmark Sept ´14 5,246,338 May´18 MS SQL Server 2017 1,009,065 Mar ´16 Mar ´16 MS SQL Server 2016 678,492 Bei einem Datenvolumen von 1TB, ist Exasol is über 5x Dec ´14 MS SQL Server 2014 588,831 schneller als der nächstschnellste Wettbewerber Mar ´14 Actian Vector 585,319 Mar ´16 MS SQL Server 2016 543,102 • TPC-H Benchmarks veranschaulichen die Wettbewerbsfähigkeit von Analyse- Apr ´14 MS SQL Server 2014 519,976 Datenbanken • Exasol ist Technologieführer #1 bei allen Jun ´14 Actian Vector 485,242 Skalierungsfaktoren • Bestes Preis-Leistungs-Verhältnis Sep ´14 MS SQL Server 2014 390,590 Quelle: www.tpc.org 1. Juli 2018 Feb ´14 Oracle 11g 326,454 QphH@1000 GB 1,000,000 2,000,000 3,000,000 4,000,000 Abfragen pro Stunde 6
DEMO Einzelhandel in Deutschland Wo machen wir Umsatz und wie können wir die Daten einfach und effektiv visualisieren?
Open-Source-basierte Integrations-Frameworks • Integrations-Framework Database Migration • Maximale Konnektivität Automation • Integration mit jeder anderen Plattform Virtual Schema Adapters Beispiele: Script Plugins C++, Julia, … • Virtual Schemas Commercial Core • IMPORT/EXPORT Database • Script Plugins • Open-source Quellcode für zahlreiche SQL Varianten • Scripts für die automatische Migration Hadoop Integration Monitoring Tools 10
Cloud und on premise Lösungen Private Cloud Public Cloud On premise / Hybrid 11
DEMO Taxis in New York – eine kurze Analyse des Taxi Markts und Wettbewerbs in New York City
Data Science mit Big Data auf Exasol Die intelligente Integration von Data Science Programmiersprachen direkt im Kern der Datenbank ist bei Exasol einzigartig. Die enge Verknüpfung mit der SQL Engine ermöglicht es Unternehmen, von den in-memory Prozessen zu profitieren und die Daten direkt abzufragen, ohne sie zu replizieren oder zu verschieben. UDF Framework Umgebung Skalierbarkeit Integration 14
DEMO Wind und Sonne – welche Orte in den USA sind am windigsten oder am sonnigsten und wie können wir unser ‚Optimum‘ auswählen?
Skyline: Das Optimum bestimmen Herausforderungen: • Datenflut • Leere Ergebnisse • Dimensionen lassen sich nicht korrelieren SELECT * FROM funds PREFERRING HIGH performance PLUS LOW volatility; 17
Tableau & Exasol – wie funktioniert das eigentlich? OLTP, ERP, CRM IoT Live Verbindung Web traffic, social Daten Beladung Data Lake 18
Architektur Optionen für Tableau Umgebungen mit Exasol Eine typische Tableau Umgebung: Data Warehouse Data Mart Extrakte Tableau Option 1 – Beschleunigung Option 2 – Datenverwaltung und Geschwindigkeit Option 3 – Skalierbarkeit und High Performance Live Live Live Acceleration Data Mart Data Warehouse Data Mart Tableau Data Warehouse Tableau Data Warehouse Views Tableau Layer in Exasol in Exasol in Exasol Exasol als ACCELERATION LAYER zur Beschleunigung Exasol für GOVERNANCE & GESCHWINDIGKEIT Exasol für SKALIERBARKEIT & HIGH PERFORMANCE 19
Tableau Server and Exasol einrichten – Best Practices Exasol ermöglicht einen reibungslosen und effektiven Datenfluss von den ursprünglichen Systemen bis hin zum Endnutzer. Dabei werden Datenanalyse und Reporting beschleunigt und Data Science Kapazitäten können direkt in der Datenbank angewandt werden. Analysen können auf größere Datenmengen ausgeweitet werden, so dass Data Analysts und Scientists sich nicht auf aggregierte Daten oder Teilmengen beschränken müssen. Tableau Server (Web) Source Tableau Server System 1 Exasol connector in Tableau Exasol Database Tableau Desktop Source System 2 Tableau Desktop .tds files werden .tds files werden Source veröffentlicht erstellt System 3 Live Verbindung zu .tds files Source System 4 Datenbeladung 20
Extrakte oder Live Verbindung in Tableau? Wann Datenextrakte sinnvoll sind Wann eine Live Verbindung sinnvoll ist • Wenn eine Live Verbindung zur Datenquelle nicht möglich • Wenn eine performante Datenbank zur Verfügung steht ist, z.B. aus Performance oder Sicherheitsgründen • Wenn große Datenmengen bearbeitet werden • Wenn offline gearbeitet werden muss, z.B. unterwegs • Wenn kleine Datenmengen benutzt werden, die nur selten aktualisiert werden müssen (z.B. monatliches Reporting) Warum sind Live Verbindungen zu empfehlen? • Sie verringern den administrativen Aufwand beim Tableau Server • Man vermeidet, dass große Datenmengen oder auch das ganze Data Warehouse auf dem Tableau Server dupliziert werden • Optimale Ausnutzung der Investition in Tableau Server • Daten sind immer aktuell • Datenzugriff, -struktur und –berechtigungen können einfach zentral verwaltet werden 21
Test it for yourself www.exasol.com/dataviz
Analytics Wie verändert sich der Markt für Data Analysts und Data Scientists, wie können wir talentierte Mitarbeiter finden und fördern und welche Rolle spielt dabei die Tableau Community?
makeovermonday.co.uk
viz for social good
EVA MURRAY Head of BI, Tableau Zen Master @TriMyData eva.murray@exasol.com www.exasol.com
Sie können auch lesen