Tableau und Big Data auf Exasol

Die Seite wird erstellt Manuel Schuster
 
WEITER LESEN
Tableau und Big Data auf Exasol
Tableau und Big Data auf Exasol

© 2018 Exasol AG
Tableau und Big Data auf Exasol
EVA MURRAY
Head of BI, Tableau Zen Master |

    @TriMyData
eva.murray@exasol.com
Tableau und Big Data auf Exasol
DEMO
 Welche Medikamente werden in England am
häufigsten verschrieben und wie haben sich die
     Kosten im Laufe der Zeit entwickelt?
Tableau und Big Data auf Exasol
Tableau und Big Data auf Exasol
Was ist Exasol?

Exasol ist eine relationale Datenbank für die Analyse von großen und/oder komplexen Daten.

In-memory trifft auf MPP.      Kompatibel mit vorhandenen      Einsatz von R, Python, Lua und   Zentralisiertes Authentifizierungs-
Kompression auf                Anwendungen und                 Java direkt in der Datenbank     Management
spaltenbasierte Speicherung.   Datenstrukturen.                durch User Defined Functions     Modernste Datenschutzmethoden
                               Ideal für Reporting, Analysen   (UDF).                           Feingranulares Datenzugriffs-
                               und Advanced Analytics großer                                    Management
                               Datenmengen.

Die weltweit schnellste analytische Datenbank und die Plattform für flexible Integrationen und Erweiterungen.

5
Tableau und Big Data auf Exasol
Leistungsvorsprung von Exasol im TPC-H Benchmark

    Sept ´14                                                                                               5,246,338

    May´18                                    MS SQL Server 2017       1,009,065
               Mar ´16

    Mar ´16              MS SQL Server 2016             678,492                                                        Bei einem Datenvolumen von
                                                                                                                       1TB, ist Exasol is über 5x
    Dec ´14          MS SQL Server 2014                 588,831                                                        schneller als der nächstschnellste
                                                                                                                       Wettbewerber
    Mar ´14         Actian Vector                       585,319

    Mar ´16        MS SQL Server 2016                   543,102                                                         • TPC-H Benchmarks veranschaulichen die
                                                                                                                          Wettbewerbsfähigkeit von Analyse-
    Apr ´14        MS SQL Server 2014                   519,976                                                           Datenbanken
                                                                                                                        • Exasol ist Technologieführer #1 bei allen
     Jun ´14     Actian Vector                          485,242                                                           Skalierungsfaktoren
                                                                                                                        • Bestes Preis-Leistungs-Verhältnis
    Sep ´14     MS SQL Server 2014                      390,590
                                                                                                                                                    Quelle: www.tpc.org
                                                                                                                                                             1. Juli 2018
    Feb ´14    Oracle 11g                               326,454

QphH@1000 GB                1,000,000                      2,000,000               3,000,000   4,000,000

                                                            Abfragen pro Stunde

6
Tableau und Big Data auf Exasol
DEMO
           Einzelhandel in Deutschland
Wo machen wir Umsatz und wie können wir die Daten
        einfach und effektiv visualisieren?
Tableau und Big Data auf Exasol
Tableau und Big Data auf Exasol
Wie wird Exasol im Unternehmen integriert?

                                  The Heart of Your Analytics

9
Open-Source-basierte Integrations-Frameworks
                                                                         •    Integrations-Framework
                                    Database
                                    Migration                            •    Maximale Konnektivität
                                   Automation
                                                                         •    Integration mit jeder anderen Plattform
                                                        Virtual Schema
                                                           Adapters

                                                                         Beispiele:
     Script Plugins
      C++, Julia, …                                                      •   Virtual Schemas
                         Commercial Core                                 •   IMPORT/EXPORT
                            Database                                     •   Script Plugins
                                                                         •   Open-source Quellcode für zahlreiche SQL Varianten
                                                                         •   Scripts für die automatische Migration
                                                  Hadoop
                                                Integration

                      Monitoring
                        Tools

10
Cloud und on premise Lösungen

        Private Cloud           Public Cloud   On premise / Hybrid

11
DEMO
Taxis in New York – eine kurze Analyse des Taxi Markts
          und Wettbewerbs in New York City
Data Science mit Big Data auf Exasol
Die intelligente Integration von Data Science Programmiersprachen direkt im Kern der Datenbank ist bei Exasol einzigartig.
Die enge Verknüpfung mit der SQL Engine ermöglicht es Unternehmen, von den in-memory Prozessen zu profitieren und die Daten direkt
abzufragen, ohne sie zu replizieren oder zu verschieben.

       UDF Framework                          Umgebung                          Skalierbarkeit                       Integration

14
DEMO
   Wind und Sonne – welche Orte in den USA sind am
windigsten oder am sonnigsten und wie können wir unser
                 ‚Optimum‘ auswählen?
Skyline: Das Optimum bestimmen

Herausforderungen:
• Datenflut
• Leere Ergebnisse
• Dimensionen lassen sich
  nicht korrelieren

                SELECT * FROM funds PREFERRING HIGH performance PLUS LOW volatility;

17
Tableau & Exasol – wie funktioniert das eigentlich?

          OLTP, ERP,
            CRM

              IoT
                                                      Live Verbindung

          Web traffic,
            social

                          Daten Beladung
           Data Lake

18
Architektur Optionen für Tableau Umgebungen mit Exasol

Eine typische Tableau Umgebung:

                                                                   Data Warehouse            Data Mart                   Extrakte      Tableau

                      Option 1 – Beschleunigung                                     Option 2 – Datenverwaltung und Geschwindigkeit                   Option 3 – Skalierbarkeit und High Performance

                                                  Live                                                                Live                                                         Live

                                      Acceleration                                                       Data Mart
     Data Warehouse      Data Mart                       Tableau                      Data Warehouse                         Tableau                   Data Warehouse      Views          Tableau
                                     Layer in Exasol                                                      in Exasol
                                                                                                                                                          in Exasol

       Exasol als ACCELERATION LAYER zur Beschleunigung                             Exasol für GOVERNANCE & GESCHWINDIGKEIT                      Exasol für SKALIERBARKEIT & HIGH PERFORMANCE

19
Tableau Server and Exasol einrichten – Best Practices
Exasol ermöglicht einen reibungslosen und effektiven Datenfluss von den ursprünglichen Systemen bis hin zum Endnutzer. Dabei werden
Datenanalyse und Reporting beschleunigt und Data Science Kapazitäten können direkt in der Datenbank angewandt werden.
Analysen können auf größere Datenmengen ausgeweitet werden, so dass Data Analysts und Scientists sich nicht auf aggregierte Daten oder
Teilmengen beschränken müssen.

                                                                                                                                                         Tableau Server (Web)
                Source                                                                                             Tableau Server
               System 1
                                                            Exasol connector in
                                                                 Tableau

                                          Exasol Database                    Tableau Desktop
                Source
               System 2

                                                                                                                                                           Tableau Desktop
                                                              .tds files werden                .tds files werden
                Source                                                                           veröffentlicht
                                                                    erstellt
               System 3
                                                                                                                                    Live Verbindung zu
                                                                                                                                          .tds files

                Source
               System 4

                          Datenbeladung

20
Extrakte oder Live Verbindung in Tableau?

Wann Datenextrakte sinnvoll sind                            Wann eine Live Verbindung sinnvoll ist

• Wenn eine Live Verbindung zur Datenquelle nicht möglich   • Wenn eine performante Datenbank zur Verfügung steht
  ist, z.B. aus Performance oder Sicherheitsgründen
                                                            • Wenn große Datenmengen bearbeitet werden
• Wenn offline gearbeitet werden muss, z.B. unterwegs

• Wenn kleine Datenmengen benutzt werden, die nur selten
  aktualisiert werden müssen (z.B. monatliches Reporting)   Warum sind Live Verbindungen zu empfehlen?

                                                            • Sie verringern den administrativen Aufwand beim Tableau Server

                                                            • Man vermeidet, dass große Datenmengen oder auch das ganze Data
                                                              Warehouse auf dem Tableau Server dupliziert werden

                                                            • Optimale Ausnutzung der Investition in Tableau Server

                                                            • Daten sind immer aktuell

                                                            • Datenzugriff, -struktur und –berechtigungen können einfach zentral
                                                              verwaltet werden

21
Test it for yourself
www.exasol.com/dataviz
Analytics
Wie verändert sich der Markt für Data Analysts und Data Scientists,
 wie können wir talentierte Mitarbeiter finden und fördern und
        welche Rolle spielt dabei die Tableau Community?
makeovermonday.co.uk
viz for social good
EVA MURRAY
Head of BI, Tableau Zen Master
@TriMyData
eva.murray@exasol.com

www.exasol.com
Sie können auch lesen