Smart Data - Potenziale und Herausforderungen - Arbeitsgruppe 2 Projektgruppe Smart Data - div ...

Die Seite wird erstellt Bettina Krause
 
WEITER LESEN
Smart Data - Potenziale und Herausforderungen - Arbeitsgruppe 2 Projektgruppe Smart Data - div ...
Arbeitsgruppe 2
Vernetzte Anwendungen und Plattformen
für die digitale Gesellschaft

Projektgruppe
Smart Data

Smart Data – Potenziale
und Herausforderungen
Smart Data – Potenziale
                                                         und Herausforderungen

Inhalt
1     Einleitung................................................................................................................................................ 3

2     Hauptaussagen....................................................................................................................................... 3

3     Potenziale von Smart Data......................................................................................................................              4
      Smart Data für kleine und mittlere Unternehmen.....................................................................................                          4
      Beispiel: Ohne Smart Data keine Energiewende.......................................................................................                          4
      Beispiel: Industrie 4.0.............................................................................................................................         5
      Beispiel: Smart Data für IT-Sicherheit und Betrugserkennung...................................................................                               5
      Beispiel: Impulse für die personalisierte Medizin......................................................................................                      6

4     Technologische Grundlagen..................................................................................................................... 7
      Datenplattformen.................................................................................................................................... 7
      Technologiekomponenten........................................................................................................................ 9

5     Allgemeine Hürden und Hindernisse bei Smart Data................................................................................                             12
      Datenschutz und Privatsphäre.................................................................................................................                12
      Umsetzung von Smart-Data-Projekten.....................................................................................................                      12
      Mangel an Experten................................................................................................................................           13
      Einheitliche Analyse von Unternehmensdaten..........................................................................................                         13

6     Branchenspezifische Chancen und Herausforderungen bei Smart Data....................................................                                         14
      Einzelhandel...........................................................................................................................................      14
      Energie...................................................................................................................................................   14
      Forschung und Wissenschaft...................................................................................................................                15
      Gesundheit.............................................................................................................................................      15
      Industrie 4.0...........................................................................................................................................     16

7     Handlungsempfehlungen......................................................................................................................... 17

8     Übersicht der Beteiligten an der Projektgruppe Smart Data..................................................................... 18

Arbeitsgruppe 2 im Nationalen IT-Gipfel                        –2–                                                                       Projektgruppe Smart Data
Smart Data – Potenziale
                                          und Herausforderungen

  1      Einleitung

In Gesellschaft und Wirtschaft gewinnen digitale Daten       die drei folgenden Wesensmerkmale: a) sehr große
zunehmend an Bedeutung. Die fortschreitende Digita-          ­Datenmenge, b) große Datenwachstumsraten und c) in
lisierung in allen Lebens- und Unternehmensbereichen          der Regel geringe Informationsdichte bei jedoch großer
führt zu einem rasanten Wachstum von Datenbestän-             Vielfalt bezüglich der Datenquellen und Datenformate.
den: Verbraucher äußern sich in Online-Foren oder so-         Unter „Smart Data“ wollen wir die intelligente Nutzung
zialen Netzwerken über Produkte und Services, medi-           aller Daten verstehen, die einem Unternehmen zur
zinische Kleinstgeräte überwachen Vitalfunktionen von         Verfügung stehen. Dazu gehören auch neue Datenarten,
Patienten, in Industrieanlagen erfassen Sensoren Para-        die heute unter dem Begriff „Big Data“ subsummiert
meter von Produktionsabläufen, durch das Internet der         werden, sowie alle bisherigen Daten, die in Unternehmen
Dinge und Dienste kommt es zu einer immer stärkeren           und Behörden bereits aktiv benutzt werden. „Smart
Vernetzung aller Bereiche.                                    Data“ versucht dem Rechnung zu tragen und
Der Begriff „Big Data“ steht für eine neue Komplexität von    berücksichtigt neue, nicht nur technische, Aspekte sowie
Daten sowie deren Analyse, welche die Möglichkeiten           die wertschöpfende Datenanalyse zur Erlangung von
gängiger technischer Lösungen übersteigt. Es ergeben          Wissensvorteilen und zur Entscheidungsunterstützung.
sich etwa steigende Anforderungen bezüglich Daten­            Dazu gehören die Datensicherheit, der ­Datenschutz und
volumen, Datenraten, Datenheterogenität s­           owie     der Kontext, in dem die Daten erhoben wurden. Dank
Daten­ qualität. „Big Data“ ist charakterisiert durch         dieser holistischen Sicht wird der gesellschaftliche und
                                                              wirtschaftliche Nutzen dieser neuen Form von Daten
                                                              hervorgehoben.

  2      Hauptaussagen

In diesem Strategiepapier werden Potenziale                    vergangenen Jahre in Bezug auf Cloud Computing
aufgezeigt, die sich aus Smart Data für die Wirtschaft         sowie bei Datenmarktplätzen haben hier die
in Deutschland in ausgewählten Branchen, unter                 Einstiegshürden verkleinert. Dennoch ist eine
anderem in Einzelhandel, Gesundheit, Energie und
­                                                              Förderung weiterhin unabdingbar.
Industrie, ergeben. Zusätzlich werden allgemeine             • Wir wollen die große Vielfalt von Daten für
und branchenspezifische Herausforderungen und                  unsere Gesellschaft und für das Individuum
Hindernisse zusammengetragen, welche die Umsetzung             deutlich stärker nutzbar machen. Dafür müssen
von Smart-Data-Projekten in Deutschland erschweren.            intelligente Lösungen zur Anwendung kommen,
Aus Sicht der Projektgruppe bedarf es einer                    die ein hohes Maß an Flexibilität zulassen und
gemeinsamen Aktion von Wirtschaft und Politik, um die          das Prinzip der digitalen Selbstbestimmung
folgenden Kernpunkte weiter voranzutreiben:                    stützen, wie etwa Pseudonymisierungs- oder
• Kleine und mittlere Unternehmen stehen beim                  Anonymisierungslösungen.
    Einsatz von Smart-Data-Projekten vor besonderen          • Es braucht eine verstärkte Förderung in der
    Herausforderungen. Die Entwicklungen der                   universitären sowie berufsbegleitenden Ausbildung
                                                               um dem Mangel an Experten für den Umgang mit
                                                               Smart Data entgegenzuwirken.

Arbeitsgruppe 2 im Nationalen IT-Gipfel       –3–                                                 Projektgruppe Smart Data
Smart Data – Potenziale
                                                und Herausforderungen

    3     Potenziale von Smart Data

Die Verwendung von Smart Data ermöglicht die Erken-                   Beispiel: Ohne Smart Data keine
nung von Zusammenhängen und Mustern, damit bes-                       ­Energiewende
sere Entscheidungen oder Vorhersagen für die Zukunft
getroffen werden können. Entscheidend ist hierbei die                 Mit einer Optimierung des privaten Verbrauchs von
Datenqualität. Nur qualitativ hochwertige Daten können                Elektroenergie unter Nutzung von Smart Metering in
die Basis für korrekte Entscheidungen bilden. Im Fol-                 deutschen Haushalten könnte ein bedeutender Bei-
genden werden die Potenziale von Smart-Data-Anwen-                    trag zur Energiewende geleistet werden. Im vorigen
dungen an ausgewählten Anwendungsfällen vorgestellt.                  Jahr stellte das Bundesministerium für Wirtschaft und
                                                                      Energie eine Studie zum flächendeckenden Einsatz
                                                                      von Smart Metering in Deutschland vor. Ein Szenario
Smart Data für kleine und mittlere                                    geht davon aus, dass bis 2022 mehr als zehn Millionen
­Unternehmen                                                          digitale Zähler installiert und somit rund zwei Drittel
                                                                      aller Haushalte und Unternehmen von der Innovation
Es gibt zwei bedeutende Entwicklungen, die es kleinen                 erfasst werden.
und mittleren Unternehmen ermöglichen, die Potenziale                 Smart Meter bilden die Grundlage für ein intelligentes
von Smart Data zur Entscheidungsunterstützung                         Stromnetz der Zukunft, auch Smart Grid genannt.
genauso erfolgreich zu nutzen, wie es Großunternehmen                 Das intelligente Stromnetz verbindet Erzeuger und
bereits tun. Zum einen werden die technischen und                     Verbraucher sowie Energiespeicher und ermöglicht
finanziellen Anforderungen für die Einführung von                     den Austausch von Zustandsinformationen. So wird es
Smart-Data-Technologien in den Unternehmen dank                       möglich, Angebot und Nachfrage besser aufeinander
voranschreitender Etablierung von Cloud-Computing-                    abzustimmen und zeitnah auf Schwankungen zu
Lösungen (Infrastructure, Platform sowie Software as a                reagieren. Dies kann nur funktionieren, wenn es gelingt,
Service) immer geringer. Zum anderen gibt es mit den                  die Daten von Millionen Verbrauchern in kurzer Zeit zu
aufkommenden Informationsmarktplätzen zunehmend                       verarbeiten. Benötigt wird auch eine Rückkopplung an
bessere Möglichkeiten zum gegenseitigen Austausch                     die Verbraucher, z. B. in Form von Preisinformationen,
von Daten, was zur Folge hat, dass auch kleinen Unter­                um die Motivation zur Verminderung des Verbrauchs
nehmen immer mehr Daten zur Verfügung stehen.                         in Zeiten von vergleichsweise geringem Angebot
Durch politische Rahmenbedingungen können sich hier                   zu stärken. Das intelligente Stromnetz der Zukunft
Wettbewerbsvorteile für den deutschen Mittelstand                     besteht aus einer großen Zahl von technischen
einstellen. Diese Rahmenbedingungen müssen vor                        Systemen, die durch Daten-Dienste miteinander
allem die rechtlichen (Datenschutz, Datensicherheit
­                                                                     verbunden sind. Dazu gehören die Erfassung,
und Datenaustausch) sowie personellen Anforderungen                   Speicherung, Verarbeitung und Visualisierung aller
berücksichtigen. 1                                                    technischen und betriebswirtschaftlichen Daten und
                                                                      komplexe Optimierungsrechnungen. Smart Data
                                                                      und Cloud Computing gehören zu den Technologien,
                                                                      die im intelligenten Stromnetz eingesetzt werden.
                                                                      Energieunternehmen können Smart-Grid-Lösungen

1   Ein Ergebnis der vom BMWi in Auftrag gegebenen Innovationspotenzialanalyse in Bezug auf Technologien zum Verwalten und Analysieren
    von großen Datenmengen (Big Data Management); http://www.dima.tu-berlin.de/menue/research/big_data_management_report/.

Arbeitsgruppe 2 im Nationalen IT-Gipfel              –4–                                                        Projektgruppe Smart Data
Smart Data – Potenziale
                                          und Herausforderungen

in der Cloud mit Ketten von modular aufgebauten           Beispiel: Smart Data für IT-Sicherheit
IT-Services umsetzen. Smart-Data-Analysen können
­                                                         und Betrugserkennung
eingesetzt werden, um die Energiepreise besser auf
bestimmte Kundengruppen auszurichten.                     Smart-Data-Technologien lassen sich bei der Aufspü-
                                                          rung von hochentwickelten Bedrohungen, Insider-An-
                                                          griffen oder Konto-Übernahmen nutzen. Hier ist die
Beispiel: Industrie 4.0                                   Echtzeitfähigkeit von besonderer Bedeutung, da auch
                                                          Kriminelle mit steigender Geschwindigkeit Verbrechen
Seit einiger Zeit macht der Verband Deutscher             begehen. Mit Smart Data lassen sich Muster von Über-
Maschinen- und Anlagenbau (VDMA) auf neue                 griffen herausarbeiten – so könnten Organisationen
Wettbewerber aufmerksam: Chinesische Maschinen­           sich schnell ein Bild über die Sicherheitslage in ihrem
bauer sind nicht mehr nur im Segment der preiswerten      Unternehmen machen und damit zeitnah auf Bedro-
Massenware t­ätig. Sie dringen schrittweise in die        hungen reagieren.
Segmente der Qualitätsspitzenprodukte ein – seit          Ein konkreter Anwendungsfall stellt beispielsweise
Jahrzehnten eine Festung der deutschen Hersteller.        die Verwaltung von Server-Logdaten dar, wobei
Aus diesem Grund müssen deutsche Maschinenbauer           große ­  Volumen an computergenerierten Daten
mit innovativen Produkten immer mindestens einen          anfallen. Es umfasst das Sammeln, die zentrale
Schritt voraus sein.                                      Aggregation, die Langzeitspeicherung, die Analyse
Diese Chance bietet sich mit Industrie 4.0. Mit           der Logdaten in Echtzeit sowie die Suche in den
Intelligenz ausgestattete Produktionsanlagen werden       Logdaten und daraus generierten Berichten. Nicht
über das Internet miteinander vernetzt, verschiedene      nur die großen Logvolumina, sondern auch die Zahl
Wertschöpfungsstufen horizontal und vertikal zu           der unterschiedlichen Logformate stellen hierbei
hochflex­ iblen Fertigungs- und Logistiksystemen          erhebliche Herausforderungen dar. Die Möglichkeit
integriert. Smart Data, Cloud Computing, RFID, Internet   einer sinnvollen manuellen Auswertung und Analyse
der Dinge und Dienste – alle diese Technologien           wird dagegen immer geringer. Dies gilt besonders dann,
gehören zu den Treibern. Das Konzept Industrie            wenn Logdaten miteinander korreliert werden müssen,
4.0 wird im kommenden Jahrzehnt schrittweise              um Beurteilungen einer Situation oder Auswertungen
umgesetzt. Prototypische Realisierungen einzelner         von Fehlerzuständen vorzunehmen. Verdächtige
Komponenten lassen sich in der Wirtschaft bereits         Veränderungen oder Vorgänge möglichst rasch und
besichtigen. Schrittweise entstehen Smart Factories,      am besten in Echtzeit zu erkennen ist der Anspruch
in denen intelligente Produktionsanlagen, Produkte        von IT-Sicherheitsexperten. Solche Anwendungen
und Ressourcen sowie Menschen interagieren und            stehen zurzeit noch am Anfang, werden jedoch in ihrer
mit anderen intelligenten Systemen – Smart Grids,         Verbreitung und Bedeutung stark zunehmen, da die
Smart Logistics – in Verbindung stehen. In allen          Auswertung von Logdaten mittels Smart Data einen
Prozessschritten einer so hochintegrierten Produktion     sehr guten Ansatzpunkt dafür bietet.
entstehen massenhaft Daten, die durch Smart-Data-
Technologien erfasst, gespeichert und verarbeitet sowie
für Optimierungen und Simulationen genutzt werden.
Aus all diesen Gründen scheint es gerechtfertigt, von
grundlegenden Veränderungen in der Art zu sprechen,
wie Produkte und Dienstleistungen entwickelt,
produziert und auch konsumiert werden.

Arbeitsgruppe 2 im Nationalen IT-Gipfel     –5–                                              Projektgruppe Smart Data
Smart Data – Potenziale
                                          und Herausforderungen

Beispiel: Impulse für die personalisierte                  helfen IT-gestützte DNA-Analysen dabei potenziell
Medizin                                                    wirkungslose Behandlungsmethoden mit jedoch
                                                           immensen Nebenwirkungen für den Patienten zu
Besonders mit Blick auf die alternde Gesellschaft in       vermeiden.
Deutschland werden Smart-Data-Anwendungen in der           Ein weiteres Beispiel stellt die Behandlung der
Medizin für viele Menschen immer wichtiger. Konkret        Erbkrankheit Mukoviszidose dar. Diese Krankheit
helfen Smart-Data-Analysen bei der Überwachung von         behindert die Lungenfunktion, rund die Hälfte der
Vitalparametern, personalisierter Medizin sowie der        Patienten mit dieser Diagnose erreicht nicht das
­Erforschung von Erbkrankheiten.                           vierzigste Lebens­jahr. Die Fortschritte bei der Gen­
 Die personalisierte Medizin ermöglicht eine an den        sequenz­  ierung und bei den Smart-Data-Methoden
 einzelnen Patienten angepasste Behandlung und             erlauben es, eine auf den Patienten zugeschnittene
 ­Prognose von Krankheiten. Erhebliche Fortschritte im     Therapie zu entwickeln und ihnen so ein deutlich
  Bereich der Molekularbiologie sowie der Biotechnologie   längeres und besseres Leben zu ermöglichen.
  haben die personalisierte Medizin als eine praktikable   Smart Data kann auch für Infarkt-Betroffene nützlich
  Alternative ermöglicht. Besonders die Kombination        sein. So erlaubt es die automatische Analyse von EKG-
  der Biotechnologie mit IT-gestützten Analysen und        Daten von Infarkt-Betroffenen, frühzeitig Abweich­
  Prozessen birgt vielversprechende Potenziale. Darüber    ungen von einem „normalen“ Verlauf zu erkennen, die
  hinaus eröffnet die personalisierte Medizin für          das Risiko vervielfachen, innerhalb eines Jahres einen
  Krankenkassen die Möglichkeit einer verbesserten und     erneuten Infarkt zu erleiden.
  individuelleren Versorgung von Patienten.                Als letztes Beispiel seien Analysen der DNA von an
  Beispielsweise ermöglicht die personalisierte Medizin    Parkinson-Erkrankten genannt. So bauen Forscher
  bei Krebspatienten besser angepasste und wirkungs­       mit prominenter Unterstützung des selbst betroffenen
  vollere Therapien. Heutzutage spricht nur ein Teil       Schwergewichtsweltmeisters Muhammad Ali und das
  der Patienten tatsächlich auf die Chemotherapie-         Unternehmen 23andMe die weltweit größte Datenbank
  Behandlung an. Da sich jeder Tumor von den anderen       für die Parkinson-Forschung auf. Erste bahnbrechende
  unterscheidet, beispielweise von seinem genetischen      Erkenntnisse sind schon vorhanden: Zwei Gene w   ­ urden
  Material her, müssen die behandelnden Ärzte die          identifiziert, die mit der Krankheit verknüpft sind, und
  individuellen Aspekte der Erkrankung bei der Therapie    ein Gen wurde gefunden, das Schutz gegen Parkinson
  berücksichtigen, damit sie Wirkung zeigt. Hierbei        bietet.

Arbeitsgruppe 2 im Nationalen IT-Gipfel     –6–                                                Projektgruppe Smart Data
Smart Data – Potenziale
                                                 und Herausforderungen

    4     Technologische Grundlagen

Dieses Kapitel umreißt den Stand der Technik. Es                       Programmiermodell und -Ausführungssystem. HDFS
­werden die wichtigsten Arten von Plattformen für das                  ist in der Lage, sehr große Mengen von Daten in
 Speichern und Analysieren von Smart Data beschrieben                  beliebigen Formaten verteilt und fehlertolerant auf
 sowie deren typische Komponenten erläutert.2                          tausenden von Rechnern zu speichern. Dabei werden
                                                                       individuelle Dateien redundant im Rechnerverbund
                                                                       gehalten.     Das     MapReduce-Programmiermodell
Datenplattformen                                                       ermög­licht eine einfache Spezifikation von parallelen
                                                                       Analyse­­
                                                                               programmen, bei denen der Nutzer die
In den vergangenen Jahren wurden eine Reihe von                        normaler­weise sehr komplexen Aspekte der parallelen
Datenplattformen entwickelt, die den Betrieb und                       Programmierung nicht zu berücksichtigen braucht.
das Management der neuen Datenklassen auf eine                         Diese Spezifikation folgt einem strikten Schema,
möglichst effiziente und kostengünstige Art und Weise                  das sich jedoch für vielfältige Anwendungsfälle
ermöglichen. Dazu gehören Technologien wie Hadoop                      als gut geeignet erwiesen hat. Es können nahezu
und noSQL-Datenbanken, die sich einen festen Platz                     beliebige Operationen auf beliebig strukturierten
in Smart-Data-Architekturen gesichert haben. Diese                     Daten ausgeführt werden und das parallel und
Technologien sind exzellente Ergänzungen zu den                        kostengünstig auf bis zu tausenden von Rechnern. Da
bisherigen Datenhaltungssystemen, die den Großteil der                 das MapReduce-Ausführungssystem für Batch-basierte
heute in Unternehmen zur Analyse anstehenden Daten                     Analysevorgänge mit sehr großen Datenmengen
verwalten. Diese Data-Warehouse-Systeme verfügen                       optimiert wurde, ist eine interaktive Datenanalyse
in der Regel über exzellente analytische Verfahren und                 mit kurzen Antwortzeiten im Sekundenbereich nicht
Algorithmen und eine breite Basis. Nahezu alle diese                   möglich. Üblich sind Ausführungszeiten im Bereich von
Systeme verfügen über entsprechende In-Memory-                         Minuten bis Stunden.
Technologien, die für eine schnelle Auswertung                         Eine andere Innovation ist der High-Performance
unabdingbar sind. In Abbildung 1 sind die entsprechenden               Computing Cluster (HPCC), eine Open-Source-
Technologiekomponenten dargestellt. Entscheidend für                   Supercomputing-Plattform für datenintensive Anwen­
den Erfolg von Smart Data wird u. a. sein, ob es gelingt,              dungen, die Unternehmen dabei unterstützt, Smart-Data-
diese unterschiedlichen Datenhaltungs-Technologien                     Probleme zu lösen. Die HPCC-Plattform zeichnet sich
auf einfache Art und Weise interagieren zu lassen. Daten               insbesondere durch ihre konsistente, datenzentrierte
jedweder Art und Daten aus unterschiedlichen Quellen,                  Programmiersprache (ECL) sowie eine Architektur aus,
wie beispielsweise Hadoop, noSQL, relationale Systeme                  die eine effiziente Datenverarbeitung ermöglicht. Sie
und Dateisysteme, müssen gemeinsam nutzbar sein.                       bietet damit Geschwindigkeit, Skalierbarkeit und eine
                                                                       schnelle Analyse großer Datenmengen.
Massiv parallele Systeme: Eine hervorzuhebende
Plattform ist Hadoop der Apache Software Foundation.                   noSQL-Datenbanksysteme: noSQL-Datenbanksysteme
Hadoop bildet zunehmend die Grundlage von
­                                                                      („noSQL“ steht für „Not only SQL“) dienen, ähnlich
Systemen und Teilkomponenten für das Speichern und                     wie Hadoop, der Speicherung großer Mengen von
Verarbeiten von Smart Data, die in offen verfügbaren                   Daten mit geringer Dichte und besitzen im Gegensatz
sowie kommerziellen Lösungen Anwendung finden.                         zu relationalen Systemen keine Schemabindung. In den
Konzeptionell beruht Hadoop auf dem verteilten                         letzten Jahren hat sich eine Reihe von unterschiedlichen
Dateisystem HDFS sowie dem MapReduce-                                  noSQL-Datenbanken ausgebildet, wobei die Key-Value-

2   Für weiterführende Details wird auf den BITKOM-Leitfaden „Big-Data-Technologien – Wissen für Entscheider“ verwiesen.

Arbeitsgruppe 2 im Nationalen IT-Gipfel               –7–                                                        Projektgruppe Smart Data
Smart Data – Potenziale
                                          und Herausforderungen

Store-Technologie am weitesten verbreitet ist. Daneben   Analytische Datenbanken: Diese Systeme bilden im
sind weitere Kategorien zu nennen wie z. B. Document-,   Wesentlichen die heutige Basis für Data-Warehouse-
Column- oder Graph-Store-Datenbanken. Ähnlich wie        und      Business-Intelligence-Anwendungen.      Dabei
bei Hadoop können noSQL-Datenbanken auf einem Netz       werden aus unterschiedlichsten Quellen Daten
von Standard-Rechnersystemen ausgeführt werden, was      unterschiedlichster Art in einem Data Warehouse (oder
den Betrieb großer Systeme sehr kosteneffizient macht.   Data Mart) konsolidiert und mit unterschiedlichsten
                                                         Algorithmen (Data ­Mining, Analytics etc.) ausgewertet.
Hauptspeicher-Datenbanksysteme (In-Memory-Daten-         Zunehmend verfügen diese Systeme über optimierte
banksysteme): Für Anwendungsfälle, in denen eine in-     spaltenorientierte Hauptspeicherdatenbanken, die für
teraktive Analyse von Daten notwendig ist, die im re-    Near-Realtime-Analytics unabdingbar sind. Des Weiteren
lationalen Datenschema abgebildet werden können,         hat sich gezeigt, dass eine Einbindung von Hadoop- und
haben sich relationale, spaltenbasierte Hauptspeicher-   noSQL-Datenquellen in eine bestehende oder neu zu
Datenbanksysteme etabliert. Diese Datenbanksysteme       schaffende analytische Datenbankumgebung eine sehr
halten ihren Datenbestand primär im zuletzt deutlich     effiziente und äußerst tragfähige Anwendungsplattform
günstiger gewordenen Hauptspeicher der Rechner vor,      schaffen kann.
was gegenüber Festplatten die Latenzen für Datenzu-
griffe verringert, Datendurchsätze steigert und somit
eine sehr effiziente Analyse ermöglicht.

Abbildung 1: Taxonomie von Smart-Data-Plattformen

Arbeitsgruppe 2 im Nationalen IT-Gipfel       –8–                                           Projektgruppe Smart Data
Smart Data – Potenziale
                                          und Herausforderungen

Technologiekomponenten                                      Batch Processing: Bei der Batchverarbeitung oder auch
                                                            Stapelverarbeitung werden Geschäftsvorfälle gesammelt
Der Zweck jeder Smart-Data-Plattform ist es, Daten in       und – in häufig nächtlichen, vom Online-Betrieb freien –
entscheidungsrelevante Informationen umzuwandeln.           Batch-Läufen verarbeitet. So werden durch Batch-Skripte­
Voraussetzung dafür ist, dass es sich um qualitativ hoch-   und Werkzeuge für ETL (Extract, Transform, Load) immer
wertige Daten handelt. Die Vielfalt an Einsatzszenarien     wiederkehrend die neu angefallenen Daten aus den
erfordert vielfältige Werkzeuge auf jeder Ebene.            ­operativen Systemen abgezogen und für entsprechende
Abbildung 1 stellt eine sehr vereinfachte Taxonomie der      analytische Zielsysteme aufbereitet. Die neu berechnete
Technologien dar, die für eine Komplettlösung benötigt       Datenbasis steht den Analysenwerkzeugen mit zeitlicher
werden. Die Darstellung ist als modularer Baukasten          Verzögerung zur Verfügung. Zur Reduzierung dieser
zu verstehen. Die Schichten 1 bis 4 repräsentieren den       Verzögerung beim Laden von Daten müssen die Batch-
Weg von den Rohdaten zu geschäftsrelevanten Erkennt-         Läufe weiter parallelisiert und optimiert werden.
nissen. Dieser Weg wird flankiert von den Schichten 5        In einem Smart-Data-Szenario stößt man schnell an
(Datenintegration) und 6 (Datensicherheit sowie -Gover-      die Grenzen der traditionellen Batch-Verarbeitung. Ein
nance), die auf ein harmonisches Zusammenspiel von           ­Hadoop-basierter Sammelspeicher hingegen vereinigt
Smart-Data-Plattformen mit existierenden Technologien,        die Zwischenspeicherung der Originaldaten aus den
Standards, Prozessen und Compliance-Vorgaben zielen.          Quellsystemen im HDFS mit deren Transformation mit
                                                              Hilfe der schnellen parallelen Batch-Verarbeitung.
Schicht 1: Datenhaltung
Viele Unternehmen sind von der Vielfalt, Geschwindigkeit    Streaming und Complex Event Processing: Der tradi­
und Menge an Daten überfordert. Ein echter Mehrwert         tionelle Ansatz von Data Warehousing analysiert
für das Geschäft kann aus diesen Daten nur gewonnen         ruhende Daten, in denen der Anwender mit
werden, wenn es gelingt: a) die Daten kostengünstig         verschiedenen Techniken nach den gewünschten
zu speichern, b) die Daten auf vielfältige und flexible     Informationen sucht. Die Überwachung und Steuerung
Weise zu „befragen“, um wertvolle und umsetzbare            dynamischer Prozesse bedarf eines anderen Ansatzes.
Erkenntnisse zu gewinnen und c) diese Erkenntnisse          Hierbei werden zeitlich geordnete Ereignisse
zeitnah zur Verfügung zu stellen. Die kostengünstigen,      überwacht, verdichtet, gefiltert und korreliert. Muster
exponentiell wachsenden Kapazitäten von Online-             und Regel sind hier konstant, die Daten dagegen in
Storage ermöglichen die Speicherung immer größerer          schneller Bewegung, daher auch der Begriff Streaming.
Datenmengen als Basis für analytische Fragestellungen.
                                                            Schicht 3: Analytische Verarbeitung
Schicht 2: Datenzugriff                                     Text- und Semantische Analyse, Video- und Audio-Analyse:
Was typischerweise nicht wächst, ist die zur Verfügung      Neben Datenströmen, die z. B. aus der Vernetzung von
stehende Zeit für die Beantwortung aufkommender             Geräten stammen oder von Sensoren generiert werden,
Fragen. Die technische Herausforderung besteht also         stellt die Auswertung von Daten, die in textueller
­darin, eine massiv zunehmende Menge an Eingabedaten        Form vorliegen, ein großes wirtschaftliches Potenzial
 zu verarbeiten, ohne dabei den zur Verfügung stehenden     für Unternehmen dar. So lassen sich beispielsweise
 Zeitrahmen zu überschreiten. Ein solches System hat        in Social-Media-Daten Produkttrends erkennen oder
 die Verarbeitung und den Datenfluss einer großen           Dokumente mit Hilfe von Textanalyse und semantischen
 Datenmenge zu organisieren. Hier seien zwei Verfahren      Technologien durch Zusatzinformation anreichern, so
 beispielhaft genannt:                                      dass die angereicherten Daten neue Möglichkeiten für
                                                            Anwendungen und Analysen bieten.

Arbeitsgruppe 2 im Nationalen IT-Gipfel      –9–                                                Projektgruppe Smart Data
Smart Data – Potenziale
                                          und Herausforderungen

Neben den Datenströmen, die unmittelbar auf Text-­          Predictive Analytics: Mithilfe von Predictive Analytics
Dokumenten basieren, wachsen insbesondere Audio-            können aus einem Datensatz Trends und Verhaltens-
und Video-Inhalte explosionsartig an. Nach Extraktion       muster abgeleitet und vorhergesagt werden. Hierbei
der Text-Informationen lassen sich diese Schätze unter      kommen je nach Anwendungszenario verschiedene sta-
Nutzung linguistischer und semantischer Verfahren           tistische Algorithmen und Modellierungs-Techniken zum
heben.                                                      Einsatz, die darauf abzielen, Muster in aktuellen oder
                                                            historischen Daten zu erkennen und daraus Ableitungen
Orts- und raumbezogene Datenanalyse: Viele Daten            für das zukünftige Verhalten treffen zu können.
weisen einen Ortsbezug auf. Die schnell steigenden
Nutzerzahlen von Smartphones und Digitalkameras             Data Mining und Machine Learning: Data Mining ist ein
bieten die Möglichkeit, viele Informationen zusammen        bildlicher Oberbegriff für eine Vielzahl von verschie­denen
mit GPS-Koordinaten zu erheben. So sind z. B. im            Methoden, Verfahren und Techniken, der die Intention
Handel Analysen zur Bewertung neuer Standorte unter         zusammenfasst – geradezu im Sinne eines „Daten-
Einbeziehung der räumlichen Dimension seit vielen           Bergbaus“ – Schätze, also verwertbares Wissen, aus
Jahren Standard. In die Absatzprognosen für einzelne        den Daten des Unternehmens zu fördern. Insbesondere
Artikel gehen Wettermodelle ebenso ein wie die              bezeichnet Data Mining das intelligente, größtenteils
Einwohnerverteilung bestimmter Einkommensklassen.           automatisierte Aufspüren und die Extraktion von
Versicherungen ermitteln anhand von Geolokationen           wirtschaftlich nutzbaren Mustern und Zusammenhängen
zusammen mit Überflutungsmodellen die Schadens­             in großen Datenbeständen. Der Begriff Machine
risiken von Immobilien. Mit Smart-Data-Methoden             Learning beschreibt eine Vielzahl von Anwendungen und
werden nun auch andere Daten, die nur implizit über         Methoden, in denen Computerprogramme selbständig
einen Ortsbezug verfügen, mit Geoinformationen              neues Wissen erwerben.
verknüpft.
                                                            Schicht 4: Visualisierung
Web-Analyse: Führende Online-Händler experimen­             Das Hauptziel der Visualisierung ist die Multiplikation
tieren täglich auf ihren Seiten. Sie wollen herausfinden,   des analytischen Potenzials von Mensch und Computer
ob die Änderungen zu gewünschten Kundenreaktionen           durch eine effektive Kombination interaktiver Visuali­
führen. Die Vielzahl an Erkenntnissen hinsichtlich          sierungstechniken mit rechnergestützter Daten­ana­lyse.
einzelner Benutzergruppen wird dazu genutzt, um             Bei der visuellen Analyse kommen unterschiedliche
in Echtzeit den Inhalt einer Webseite anhand der            Techniken zum Einsatz. Sie lassen sich nach folgenden
Zuordnung eines Benutzers zu einer gewissen                 Kriterien unterscheiden: a) Visualisierung zur
Benutzergruppe dynamisch anzupassen.                        Informations­bereitstellung versus visuelle Analyse zur
Graphbasierte Methoden eignen sich zur Modellierung         Wissensaufbereitung, b) Visuali­sierungsnutzung durch
der Web-Daten, um mehr als die offensichtlichen             den Entscheidungsträger versus durch den Analysten
Abhängigkeiten z. B. von Produkten im Webshop zu            und Domänen-Experten sowie c) Informationskonsum
erkennen und so Benutzer über die Platzierung von           oder Analyse ortsgebunden am Arbeitsplatz versus
Angeboten gezielter zu steuern. Des Weiteren wird die       mobil.
Web-Analyse immer mehr mit anderen Analysetechniken
wie z. B. Predictive Analytics verknüpft, um nicht nur
das Verhalten eines Kunden zu analysieren und damit
Webseiten zu optimieren, sondern auch Voraussagen
über seine nächsten Schritte zu treffen und ihm speziell
zugeschnittene Angebote zu präsentieren.

Arbeitsgruppe 2 im Nationalen IT-Gipfel      – 10 –                                               Projektgruppe Smart Data
Smart Data – Potenziale
                                          und Herausforderungen

Schicht 5: Datenintegration                                einfach abzufragende APIs, Webserver protokollieren
Die herkömmlichen Technologien zur Integration             die Benutzerzugriffe sehr umfangreich und die Daten
von Anwendungen und Daten sind für Smart-                  liegen oftmals in Form von Textdateien bereits vor.
Data-Lösungen weiterhin von Bedeutung. Diese               Folgt man dem Paradigma „Speichere jetzt – Verarbeite
Technologien sind heute im unternehmensweiten              später“, dann reduziert sich das Laden der Daten
produktiven Einsatz in verschiedenen Business-             (Load) auf einen einfachen Transportvorgang. Die
Intelligence-, SOA-, Anwendungs- und B2B-                  Transformationen schließlich werden aufwendiger.
Integrations­ szenarien. Eine Wiederverwendung in          Die Verarbeitung wenig strukturierter Daten lässt sich
Smart-Data-Architekturen ist notwendig, da die             schlechter optimieren und verbraucht deutlich mehr
meisten werthaltigen Unternehmensdaten heute in            Ressourcen. Selbst wenn die Daten nicht in eine
strukturierter Form in existierenden Anwendungen           strukturierte Form gebracht werden müssen, so sind
(z. B. ERP, CRM) und Datenbanken vorliegen. ­Etablierte    doch auch für statistische und andere Datenanalysen oft
Integrationstechnologien sind in der Lage, zahlreiche      umfangreiche Vorverarbeitungen erforderlich. In einer
Datenquellen zu integrieren und sie einer Smart-           massiv parallelen Umgebung, die viel Rechenleistung
Data-Umgebung zur Verfügung zu stellen. Durch den          zur Verfügung stellt, können diese Transformationen
Einsatz von Integrations-Middleware können diese           auch bei großen Datenmengen noch hinreichend schnell
unterschiedlichen Datenquellen über standardisierte        durchgeführt werden.
Schnittstellen zugänglich gemacht werden. Hier
haben sich Enterprise-Service-Bus-Technologien (ESB)       Schicht 6: Datensicherheit und -Governance
etabliert.                                                 Datensicherheit: Bei der Umsetzung von Smart-
Die andere wesentliche Technologie zur Anbindung           Data-Projekten sind die Themen Datenschutz und
verschiedener Datenquellen sind Datenintegrations-         IT-Sicherheit stark in den Vordergrund gerückt. Im
oder ETL-Plattformen. Im Unterschied zu einem ESB          Entwurf der Datenschutz-Grundverordnung sind zudem
liegt bei ETL-Plattformen der Fokus auf dem Transfer und   die Anforderungen an „Data protection by design and
der Transformation von großen und komplexen Daten­         by default“ ausdrücklich verankert.
mengen, die häufig im Batch-Verfahren durchgeführt
werden.                                                    Daten-Governance: Unter Daten-Governance versteht
Im Rahmen von Smart Data kommen zu den                     man eine Kombination von Prozessen, Technologien
existierenden Integrationslösungen neue Konnek­            und Wissen, mit der sich nachhaltig wertvolle und
tivitäts-Anforderungen hinzu. Die beschrie­       benen    qualitativ hochwertige Informationen gewinnen lassen.
Faktoren – hohe Datenvolumina und -Raten, unvoll­
ständige Schemata – führen insgesamt zu einer Neu­
definition der Datenintegration: weg vom Vorgehen
des „Extract-Transform-Load“, hin zu einem „Extract-
Load-Transform“ (ELT). In einem Smart-Data-Umfeld ist
der Aufwand für Extraktion (Extract) der Daten häufig
vernachlässigbar. Sensorik-Daten werden bereits in
großen Mengen geliefert, Social-Media-Dienste haben

Arbeitsgruppe 2 im Nationalen IT-Gipfel     – 11 –                                            Projektgruppe Smart Data
Smart Data – Potenziale
                                                und Herausforderungen

    5     Allgemeine Hürden und Hindernisse bei Smart Data

Die Umsetzung von Smart-Data-Projekten birgt große                   müssen intelligente Lösungen zur Anwendung kommen,
Potenziale für Unternehmen in Deutschland, jedoch                    die ein hohes Maß an Flexibilität zulassen und das Prinzip
treffen viele Projekte auf dieselben Hindernisse. Des                der digitalen Selbstbestimmung stützen, wie etwa
Weiteren fehlt es an Experten für die Datenanalyse.                  Pseudonymisierungs- und Anonymisierungslösungen.
                                                                     Auch freiwillige Lösungen der Industrie können in diesem
                                                                     Zusammenhang eine sinnvolle Lösung darstellen.
Datenschutz und Privatsphäre                                         Neben einer notwendigen Expertise im Bereich der
                                                                     technischen Verarbeitung sind klare Regeln und
Bei Smart-Data-Anwendungen, bei denen personenbe-                    Leitlinien beim Umgang mit allen Daten, insbesondere
zogene Daten verwendet werden, muss wie auch bei                     bei personenbezogenen Daten, unverzichtbar. Dazu
anderen Datenverarbeitungsprozessen das deutsche                     gehört nicht nur der technische Datenschutz, sondern
Datenschutzrecht berücksichtigt werden. Deutsches                    auch die Implementierung von Datenschutzregeln
Datenschutzrecht ist auch dann anwendbar, wenn ein                   in der eigenen Organisation, z. B. in Form von
nicht in der EU ansässiges Unternehmen im Inland Da-                 innerbetrieblichen Richtlinien und Schulungen der
ten erhebt, verarbeitet oder nutzt. Um sowohl für Unter-             Mitarbeiter zum Umgang mit Daten.
nehmen als auch für Verbraucher zu größerer Rechts-
sicherheit beizutragen, können intensivere Aufklärung
und, sofern im Einzelfall gewünscht, auch Unterstützung              Umsetzung von Smart-Data-Projekten
bei der Rechtsanwendung sinnvoll sein. Hierzu gehört
auch, dass illegale Datennutzungen und Datenmiss-                    „Datenspeicherung, -management, -sicherheit und -be-
brauch effektiv verfolgt und geahndet werden.                        reitstellung fordern von Unternehmen einen Aufwand,
Dies gilt auch für die teilweise vorgebrachten                       den einige von ihnen scheuen“, berichtet IDC in einer
Forderungen nach einer Nutzung der Daten nur nach                    seiner aktuellen Umfragen.3 Dass Investitionen bei der
Einwilligung des Betroffenen oder einer generellen                   Einführung von Smart-Data-Analysen anfallen ist klar,
Anonymisierung der Daten. Diese Vorgaben, die                        jedoch ist für deren Durchführung nicht automatisch der
zudem selbst vom deutschen Datenschutzrecht                          Austausch vorhandener Systeme erforderlich. Häufig ist
nicht vorgesehen sind, würden aber den Einsatz von                   es nur eine gezielte Ergänzung. Die Kosten hängen dabei
Big-Data-Anwendungen in wesentlichen Bereichen                       von den individuellen Anforderungen und Gegebenhei-
verunmöglichen. Hier gilt es, sachgerechte Lösungen                  ten des jeweiligen Anwenderunternehmens ab.
zu finden, die einen hohen Schutz der Privatsphäre des               Die Menge an Daten, die Unternehmen im Blick haben
Einzelnen ermöglichen, aber gleichzeitig die Nutzung                 müssen, wächst unaufhaltsam, etwa in Form von Ma-
der erheblichen gesellschaftlichen und wirtschaftlichen              schinendaten oder Informationen aus sozialen Netzwer-
Potenziale von Smart Data nicht ausschließen.                        ken. Diese Daten können bei der Produktentwicklung
Dies sollte auch bei der derzeitigen Überarbeitung                   hilfreich bzw. unverzichtbar sein und damit die Pro-
des EU-Datenschutzrechts berücksichtigt werden.                      dukteinführungszeit für neue Produkte verkürzen. Doch
Wichtig ist auch hier, dass Ansätze gefunden werden,                 für die Analyse der riesigen Datenmengen fehlen häufig
die hinreichend flexibel sind, um Innovationen und                   die technischen Möglichkeiten und Fähigkeiten. Dieses
Wachstum in der EU weiterhin zu ermöglichen. Dafür                   Problem kann durch die Verbindung von Smart Data mit

3   IDC-Studie: Big Data – Business Value in deutschen Unternehmen auf dem Prüfstand, Frankfurt am Main, 13. Dezember 2013.

Arbeitsgruppe 2 im Nationalen IT-Gipfel             – 12 –                                                     Projektgruppe Smart Data
Smart Data – Potenziale
                                                 und Herausforderungen

Elementen des Cloud Computings gelöst werden. Bei                       Einheitliche Analyse von
Cloud-Lösungen stehen IT-Ressourcen schnell, skalier-                   ­Unternehmensdaten
bar und nahezu in unbegrenztem Umfang zur Verfügung.
                                                                        Neben fehlendem Expertenwissen sind die fehlende
                                                                        ­unternehmensweite Datensammlung sowie mangelhafte
Mangel an Experten                                                       Datenintegration große Hürden. Jedoch ist genau
                                                                         dies der Schlüssel für ein umfassendes Auswerten
Ein großes Hemmnis bei der Umsetzung von Smart-Da-                       der Unternehmens- und Kundendaten im Rahmen
ta-Projekte ist der Mangel an Experten, die in der Lage                  der gesetzlichen Regelungen. Meist führen einzelne
sind, entsprechende Analysen mit großen und hetero-                      Abteilungen ihre eigenen Datenbanken, auf die jedoch
genen Datenmengen durchzuführen.4 Häufig werden                          kein anderer Bereich Zugriff hat. Für die Durchführung
stattdessen Personen aus den eigenen IT-Reihen des                       einer unternehmensweiten Analyse der Daten ist die
Unternehmens eingesetzt, die noch keine oder wenig                       Infrastruktur vieler Unternehmen jedoch noch nicht
Erfahrung mit Smart-Data-Projekten haben. Es ist drin-                   ausgereift. Nicht nur der Datenfluss zwischen den
gend zu empfehlen, dass Unternehmen erst mit kleinen                     Abteilungen ist eingeschränkt, auch unterschiedliche
und mittleren Smart-Data-Lösungen starten. So können                     Prioritäten der Smart-Data-Anwendungen verzögern das
Mitarbeiter reale Erfahrung sammeln und diese in späte-                  Implementieren.
ren größeren Projekten erweitern.                                        Eine zusätzliche Herausforderung ist die große Vielfalt
Die „Datenwissenschaft“ ist ein relativ neues und ein                    der Daten und Datenformate. Dies ist eine Problematik,
sehr komplexes Thema, das Wissen aus unterschiedli-                      die nicht erst durch Smart-Data-Analysen akut wurde,
chen Bereichen voraussetzt. Hier treffen sich Informa-                   sondern bereits seit der Einführung von Data-Warehou-
tik, Mathematik, Statistik, Datenschutz, Sicherheit und                  ses eine entscheidende Herausforderung darstellt.
im besten Fall spezifisches Branchenwissen. Häufig
werden Mitarbeiter für Smart-Data-Projekte eingestellt,
die Experten in ihrem speziellen Bereich sind, aber kein
nötiges Branchenwissen aufweisen. Dies führt dazu,
dass Smart-Data-Anwendungen im schlimmsten Falle
nicht den gewünschten inhaltlichen oder monetären
Erfolg bringen.

4   Teradata-Umfrage: Big Data Analytics ist Chefsache, Oktober 2013.

Arbeitsgruppe 2 im Nationalen IT-Gipfel              – 13 –                                                 Projektgruppe Smart Data
Smart Data – Potenziale
                                          und Herausforderungen

  6 Branchenspezifische Chancen und Herausforderungen bei Smart Data

Neben allgemeinen Hürden und Hindernissen bei            auch neue innovative Geschäftsmodelle ermöglichen,
Smart-Data-Projekten gibt es zahlreiche spezifische      beispielsweise personalisierte Angebote und Werbung.
Herausforderungen in den einzelnen Branchen. Im
­
Folgenden werden spezifische Hürden und Hindernisse
für die Branchen Energie, Forschung, Gesundheit,         Energie
Einzelhandel und Industrie 4.0 zusammengetragen.
                                                         Die Energiewirtschaft in Deutschland ist nach § 7 EnWG
                                                         entbündelt, d. h., das Netz (Transport- und Verteilnetz),
Einzelhandel                                             der Vertrieb, die Energieerzeugung und der Energiehan-
                                                         del sind rechtlich und operationell voneinander entfloch-
In Zeiten einer wachsenden Digitalisierung von           ten. Ein freier Datenaustausch insbesondere zwischen
Handelspartnern und Konsumenten steht der                dem Netzbetreiber und den anderen Gesellschaften
Einzelhandel vor neuen Herausforderungen. Es geht        der Energieversorgung ist ausschließlich im Rahmen
nicht nur darum, die klassischen Stärken, wie z. B.      der rechtlichen Notwendigkeiten erlaubt. Beispielswei-
die Verfügbarkeit der Waren, zu verbessern, sondern      se werden Zählerdaten bei Privat- und Gewerbekunden
darum, dem Kunden am Point of Sale über existierende     vom Netzbetreiber erhoben und mittels marktüblicher
und neue Vertriebskanäle, wie zum Beispiel über mobile   Prozesse an den jeweils zuständigen Energievertrieb
Geräte, hinweg einen Mehrwert zu bieten.                 zwecks Erstellung einer Energieabrechnung weitergelei-
Die Bereitstellung und Verknüpfung von geeigneten        tet. Dem Netzbetreiber ist es nicht gestattet, die von
Kanälen soll die Zukunfts- und Wettbewerbs­fähigkeit     ihm erhobenen Daten ohne Zustimmung des Kunden für
verbessern, die Kundenorientierung erhöhen und eine      andere Zwecke zu nutzen.
stärkere Ausrichtung an eine sich schnell ändernde       Im Gegensatz zum Übertragungsnetz ist das Verteilnetz
digitalisierte   Konsumentenwelt       gewährleisten.    bisher mit wenig Sensorik ausgestattet. Der Grund hier-
So kann Smart Data u. a. die Entwicklung einer           für liegt in der räumlich begrenzten Ausdehnung mög-
umfassenderen Sicht auf den Kunden und eines             licher Netzstörungen und der damit verbundenen Not-
besseren Markt­  verständnisses sowie die Durch­         wendigkeit, Netzzustände zeitnah zu erfassen. Aufgrund
führung von Echtzeitanalysen über alle Absatz­kanäle     der zunehmenden dezentralen Einspeisung durch EEG-
oder eine dynamische Sortiments- oder Preisplanung       Anlagen und der damit teilweise verbundenen Notwen-
unterstützen.                                            digkeit der Steuerung des Netzes (Smart Grid) wird es
Der Einsatz von Smart Data im Einzelhandel muss          in Zukunft aber notwendig sein, Netzzustandsdaten zu
einhergehen mit der Integration von heterogen            erheben und diese dann weiter zu verarbeiten.
gewachsenen und dezentral verteilten ERP-Geschäfts­      Die Steuerung der Betriebselemente sowohl im
anwendungen, welche die heutigen Kernprozesse            Übertragungs- als auch im Verteilnetz erfolgt über
und -funktionalitäten abbilden. Zur Ausnutzung des       ein separates Kommunikationsnetz (PDV-Netz), das
Potenzials von Smart Data muss ein Verständnis           vom öffent­lichen Kommunikationsnetz abgetrennt ist.
gewonnen werden, welche Konsumentendaten relevant        Der Grund hierfür liegt im vorbeugenden Schutz der
und unter Berücksichtigung der datenschutzrechtlichen    Energienetze vor möglichen Manipulationsangriffen
Rahmenbedingungen nutzbar sind sowie einen               aus öffentlichen Kommunikationsnetzen heraus. Die
Mehrwert für das operative Geschäft bringen können.      Daten aus dem PDV-Netz werden bisher für öffentliche
Smart Data kann sowohl die herkömmlichen Prozesse,       Analysen nicht zur Verfügung gestellt. Die sichere
wie zum Beispiel die Sortimentsplanung, optimieren als   Energieversorgung steht bisher über allen Bedürfnissen,
                                                         mit analytischen Methoden weitergehende Erkenntnisse

Arbeitsgruppe 2 im Nationalen IT-Gipfel     – 14 –                                            Projektgruppe Smart Data
Smart Data – Potenziale
                                                und Herausforderungen

zu sammeln, dabei aber mögliche Sicherheitsrisiken                   Ein Beispiel für eine positive Zusammenarbeit zwischen
in Kauf zu nehmen. Die Nutzung netzrelevanter Daten                  Wirtschaft und Wissenschaft ist das Smart Data
mittels Data-Analytics-Anwendungen für das Transport-                Innovation Lab. Das Smart Data Innovation Lab (SDIL)
und Verteilnetz muss gegen die Sicherheitsrisiken                    wurde gegründet7, um die Nutzung von Smart Data
abgewogen werden. Zukünftige steuerungsrelevante                     zu ermöglichen, deren Potenzial für die Industrie zu
Einheiten zur Einspeisebegrenzung von EEG-Strom im                   erschließen und exzellente Forschung zu unterstützten.
Verteilnetz werden aber die Frage nach der Trennung                  Die im SDIL angelegte enge Zusammenarbeit von
und den Schnittstellen der beiden Kommunikationsnetze                Industrie und Wissenschaft schafft hier verbesserte
neu stellen.                                                         Voraussetzungen für Spitzenforschung und Innovation im
                                                                     Bereich Data Engineering und Data Analytics für Smart
                                                                     Data. Um diese Zusammenarbeit zu beschleunigen,
Forschung und Wissenschaft                                           hat sich das SDIL zum Ziel gesetzt die Hürden bei der
                                                                     Zusammenarbeit zwischen Wirtschaft und Wissenschaft
Die Menge der in Wissenschaft und Forschung                          zu identifizieren und anzugehen. Im SDIL können
anfallenden Daten hat in den vergangenen Jahren                      geschlossene Netzwerke von Wirtschaft und Wissenschaft
erheblich zugenommen. Die Auswertung und Analyse                     schnell eingerichtet werden, sodass die Kooperation in
der riesigen Datenmengen könnte dabei helfen,                        einem abgesicherten Rechtsrahmen vonstatten gehen
Antworten auf grundlegende Fragen zu finden und                      kann. Die Bereitstellung von technischer Ausrüstung und
neue wissenschaftliche Erkenntnisse zu gewinnen.                     professionellem Personal ist ebenso entscheidend wie
Entscheidungen, die bislang auf der Basis von                        klare und einfache Prozesse bei der Durchführung von
Schätzungen oder theoretischen Modellen getroffen                    Smart-Data-Analysen.
werden mussten, können heute auf der Basis
von konkreten Daten gefällt werden. Smart-Data-
Anwendungen bieten daher ein erhebliches Potenzial                   Gesundheit
für Wissenschaft und Forschung. Einen ersten Eindruck,
welches Potenzial in der Analyse großer ­Datenmengen                 Steigende Kosten und der zunehmende Wunsch nach ei-
steckt, vermitteln etwa Projekte in der Astrophysik, wie             ner effizienteren und individualisierten Versorgung stellen
der Sloan Digital Sky Survey5, aber auch Projekte in der             die modernen Gesundheitssysteme vor große Herausfor-
Medizin, wie das Human Brain Project6. Auch anderen                  derungen. Smart-Data-Anwendungen bieten in diesem Zu-
Disziplinen eröffnen Smart-Data-Anwendungen die                      sammenhang das Potenzial, die Qualität der medizinischen
Möglichkeit, die Art der wissenschaftlichen Erkenntnis­              Versorgung zu erhöhen und zu einer Verringerung der
gewinnung von Grund auf zu revolutionieren.                          Kosten beizutragen. Egal ob in der Diagnostik, im Behand-
Eine der Haupthürden bei der Zusammen­arbeit z­ wischen              lungsprozess oder der Prävention - im Versorgungsprozess
Wirtschaft und Wissenschaft bei der Nutzung der                      rund um den Versicherten werden heutzutage eine Menge
Potenziale von Smart Data ist die Unsicherheit bei der               Daten generiert, die es sinnvoll zu nutzen gilt. Die Analy-
Weitergabe von Daten. Hier sind klare, aber standardisierte          se und Integration dieser Daten mit weiteren Daten kann
technische Prozesse und juristische Regulierungen                    dazu beitragen, die Versorgung in höherem Maße patien-
notwendig, die sowohl eine vertrauensvolle und rechtlich             tenorientiert und personalisiert zu gestalten. Smart-Data-
abgesicherte Grundlage als auch eine Basis zur zeitnahen             Anwendungen spielen dabei eine wichtige Rolle. Auch die
Aufnahme der Zusammenarbeit zwischen Industrie und                   sogenannte evidenzbasierte Medizin profitiert erheblich
Wissenschaft ermöglichen. Dass dazu hohe technische                  von einer umfassenden Analyse unterschiedlicher Daten.
Sicherheit gehört, versteht sich von selbst.

5   Ein Projekt zur Vermessung und Kartierung des Himmels: http://sdss.org
6   Ein Projekt zur computerbasierten Modellierung und Simulation des menschlichen Gehirns: https://www.humanbrainproject.eu
7   Smart Data Innovation Lab: http://www.sdil.de.

Arbeitsgruppe 2 im Nationalen IT-Gipfel              – 15 –                                                 Projektgruppe Smart Data
Smart Data – Potenziale
                                          und Herausforderungen

Bei der Entwicklung und Erprobung neuer Medikamente        lagen für die Erhebung, Verbreitung und Nutzung von
können Smart-Data-Anwendungen zu effektiveren              Gesundheits­daten. Auch das ärztliche Berufsrecht
Wirkungs­ analysen und klinischen Studien von              muss im Sinne einer modernen, vernetzten Behandlung
Medikamenten beitragen. Auch die tägliche Arbeit der       („Fernbehandlungsverbot“) geändert werden.
Beteiligten am Versorgungsprozess des Versicherten         Nicht zuletzt wirft die Integration und Analyse von
kann durch Smart-Data-Anwendungen positiv beeinflusst      Gesundheits­daten auch ethische und gesell­ schafts­
werden: Strukturierte Datenanalysen und effiziente         politische Fragen auf. In Zukunft wird es daher
digitale Programme bieten die Chance, zeitintensive        entscheidend darauf ankommen, Lösungen zu finden,
Verwaltungstätigkeiten effektiver zu gestalten und durch   die eine Balance zwischen den mit einer Verarbeitung
daten­ bankgestützte Anwendungen personalisierte           von Gesundheitsdaten einhergehenden Bedenken und
Thera­pien und Behandlungen besser zu unterstützen.        der durch die Technologie ermöglichten verbesserten
Eine große Herausforderung für die Nutzung von Smart-      Versorgung herstellen.
Data-Anwendungen im Gesundheitswesen ist die Hete-
rogenität und Fragmentierung der medizinischen Syste-
me und Anwendungen. Dringend gebraucht werden in           Industrie 4.0
Deutschland verlässliche Standards, um Daten seman-
tisch interoperabel nutzen zu können. Verpflichtende       Durch die zunehmende Digitalisierung von Maschinen,
Standards fördern Innovation und geben der Industrie       Infrastrukturen, Dienstleistungen und Management-
Investitions- und Planungssicherheit. Dabei darf es kei-   prozessen bis hin zu HR-Prozessen entstehen neue
ne deutsche Sonderlösung geben - internationale aner-      Möglichkeiten einer intelligenten und vernetzten Pro-
kannte Standards müssen lediglich verbindlich und ver-     duktions- und Prozessautomatisierung. Das Konzept
pflichtend festgelegt werden. Hinzu kommt, dass eine       Industrie 4.0 soll durch die gezielte Unterstützung von
Integration der Daten oftmals aus anderen Gründen          Informations- und Kommunikationstechnologien ein
scheitert, wie etwa wegen des Standortes oder der Ver-     neues Innovations- und Wachstumspotenzial ermögli-
bindung, über welche die Daten weiter verarbeitet wer-     chen. Smart Data spielt in diesem Zusammenhang eine
den, oder auch wegen rechtlicher und regulatorischer       wichtige Rolle, da ein nutzenorientiertes Zusammen-
Beschränkungen der Verarbeitung der Daten.                 spiel aller Industrie-4.0-Komponenten nur durch eine
Die im Gesundheitswesen anfallenden Daten enthalten        leistungsstarke, sichere und flexible Daten-Infrastruktur
sogenannte Sozialdaten, dies sind stets personenbezo-      voll ausgeschöpft werden kann. Auf Basis dieser Infra-
gene und datenschutzrechtlich sensible Informationen,      struktur können neue wettbewerbsfähige Produkte und
so dass ihre Verarbeitung höheren Anforderungen unter-     Dienstleistungen schneller entwickelt werden.
liegt. Pseudonymisierung und Anonymisierung kommen         Der Einsatz von Smart Data in Industrie-4.0-Unterneh-
in diesem Zusammenhang ein hoher Stellenwert zu und        men trifft auf eine sehr heterogen geprägte Landschaft
sie bilden die Grundlage für neue Ansätze einer Public-    von Software-Systemen und Maschinen. Diese ist ge-
Health Versorgungsforschung. Sowohl die Telematikinf-      prägt von unterschiedlichen Technologieparadigmen
rastruktur als auch alle geplanten und zukünftigen An-     und einer Vielzahl unterschiedlicher Kommunikations-
wendungen der Gesundheitskarte müssen und werden           protokolle, auf deren Basis Produktionsanlagen heute
die höchsten Sicherheitsstandards erfüllen. Welche An-     Daten bereitstellen oder austauschen. Smart Data muss
wendungen aber jeder Patient individuell nutzen möch-      mit dieser Heterogenität sowie mit immensen Daten-
te, hat der Gesetzgeber jedem Einzelnen selbst zuge-       mengen und Kommunikationsgeschwindigkeiten um-
standen. Der Patient ist Herr seiner Daten.                gehen können, ohne die Industrieunternehmen mit der
Klarheit geschaffen werden muss allerdings bei der         IT-Komplexität zu überfordern. Speziell in kleinen und
Weiterentwicklung bestehender Gesetze. So enthalten
­                                                          mittelständischen Unternehmen ist die Verfügbarkeit
das Bundesdatenschutzgesetz sowie andere Daten­            von IT-Spezialisten und von notwendigen IT-Systemen
schutzvorschriften keine ausreichenden Rechts­    grund­   nur bedingt gegeben.

Arbeitsgruppe 2 im Nationalen IT-Gipfel     – 16 –                                              Projektgruppe Smart Data
Sie können auch lesen