Smart Data - Potenziale und Herausforderungen - Arbeitsgruppe 2 Projektgruppe Smart Data - div ...
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
Arbeitsgruppe 2 Vernetzte Anwendungen und Plattformen für die digitale Gesellschaft Projektgruppe Smart Data Smart Data – Potenziale und Herausforderungen
Smart Data – Potenziale und Herausforderungen Inhalt 1 Einleitung................................................................................................................................................ 3 2 Hauptaussagen....................................................................................................................................... 3 3 Potenziale von Smart Data...................................................................................................................... 4 Smart Data für kleine und mittlere Unternehmen..................................................................................... 4 Beispiel: Ohne Smart Data keine Energiewende....................................................................................... 4 Beispiel: Industrie 4.0............................................................................................................................. 5 Beispiel: Smart Data für IT-Sicherheit und Betrugserkennung................................................................... 5 Beispiel: Impulse für die personalisierte Medizin...................................................................................... 6 4 Technologische Grundlagen..................................................................................................................... 7 Datenplattformen.................................................................................................................................... 7 Technologiekomponenten........................................................................................................................ 9 5 Allgemeine Hürden und Hindernisse bei Smart Data................................................................................ 12 Datenschutz und Privatsphäre................................................................................................................. 12 Umsetzung von Smart-Data-Projekten..................................................................................................... 12 Mangel an Experten................................................................................................................................ 13 Einheitliche Analyse von Unternehmensdaten.......................................................................................... 13 6 Branchenspezifische Chancen und Herausforderungen bei Smart Data.................................................... 14 Einzelhandel........................................................................................................................................... 14 Energie................................................................................................................................................... 14 Forschung und Wissenschaft................................................................................................................... 15 Gesundheit............................................................................................................................................. 15 Industrie 4.0........................................................................................................................................... 16 7 Handlungsempfehlungen......................................................................................................................... 17 8 Übersicht der Beteiligten an der Projektgruppe Smart Data..................................................................... 18 Arbeitsgruppe 2 im Nationalen IT-Gipfel –2– Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen 1 Einleitung In Gesellschaft und Wirtschaft gewinnen digitale Daten die drei folgenden Wesensmerkmale: a) sehr große zunehmend an Bedeutung. Die fortschreitende Digita- Datenmenge, b) große Datenwachstumsraten und c) in lisierung in allen Lebens- und Unternehmensbereichen der Regel geringe Informationsdichte bei jedoch großer führt zu einem rasanten Wachstum von Datenbestän- Vielfalt bezüglich der Datenquellen und Datenformate. den: Verbraucher äußern sich in Online-Foren oder so- Unter „Smart Data“ wollen wir die intelligente Nutzung zialen Netzwerken über Produkte und Services, medi- aller Daten verstehen, die einem Unternehmen zur zinische Kleinstgeräte überwachen Vitalfunktionen von Verfügung stehen. Dazu gehören auch neue Datenarten, Patienten, in Industrieanlagen erfassen Sensoren Para- die heute unter dem Begriff „Big Data“ subsummiert meter von Produktionsabläufen, durch das Internet der werden, sowie alle bisherigen Daten, die in Unternehmen Dinge und Dienste kommt es zu einer immer stärkeren und Behörden bereits aktiv benutzt werden. „Smart Vernetzung aller Bereiche. Data“ versucht dem Rechnung zu tragen und Der Begriff „Big Data“ steht für eine neue Komplexität von berücksichtigt neue, nicht nur technische, Aspekte sowie Daten sowie deren Analyse, welche die Möglichkeiten die wertschöpfende Datenanalyse zur Erlangung von gängiger technischer Lösungen übersteigt. Es ergeben Wissensvorteilen und zur Entscheidungsunterstützung. sich etwa steigende Anforderungen bezüglich Daten Dazu gehören die Datensicherheit, der Datenschutz und volumen, Datenraten, Datenheterogenität s owie der Kontext, in dem die Daten erhoben wurden. Dank Daten qualität. „Big Data“ ist charakterisiert durch dieser holistischen Sicht wird der gesellschaftliche und wirtschaftliche Nutzen dieser neuen Form von Daten hervorgehoben. 2 Hauptaussagen In diesem Strategiepapier werden Potenziale vergangenen Jahre in Bezug auf Cloud Computing aufgezeigt, die sich aus Smart Data für die Wirtschaft sowie bei Datenmarktplätzen haben hier die in Deutschland in ausgewählten Branchen, unter Einstiegshürden verkleinert. Dennoch ist eine anderem in Einzelhandel, Gesundheit, Energie und Förderung weiterhin unabdingbar. Industrie, ergeben. Zusätzlich werden allgemeine • Wir wollen die große Vielfalt von Daten für und branchenspezifische Herausforderungen und unsere Gesellschaft und für das Individuum Hindernisse zusammengetragen, welche die Umsetzung deutlich stärker nutzbar machen. Dafür müssen von Smart-Data-Projekten in Deutschland erschweren. intelligente Lösungen zur Anwendung kommen, Aus Sicht der Projektgruppe bedarf es einer die ein hohes Maß an Flexibilität zulassen und gemeinsamen Aktion von Wirtschaft und Politik, um die das Prinzip der digitalen Selbstbestimmung folgenden Kernpunkte weiter voranzutreiben: stützen, wie etwa Pseudonymisierungs- oder • Kleine und mittlere Unternehmen stehen beim Anonymisierungslösungen. Einsatz von Smart-Data-Projekten vor besonderen • Es braucht eine verstärkte Förderung in der Herausforderungen. Die Entwicklungen der universitären sowie berufsbegleitenden Ausbildung um dem Mangel an Experten für den Umgang mit Smart Data entgegenzuwirken. Arbeitsgruppe 2 im Nationalen IT-Gipfel –3– Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen 3 Potenziale von Smart Data Die Verwendung von Smart Data ermöglicht die Erken- Beispiel: Ohne Smart Data keine nung von Zusammenhängen und Mustern, damit bes- Energiewende sere Entscheidungen oder Vorhersagen für die Zukunft getroffen werden können. Entscheidend ist hierbei die Mit einer Optimierung des privaten Verbrauchs von Datenqualität. Nur qualitativ hochwertige Daten können Elektroenergie unter Nutzung von Smart Metering in die Basis für korrekte Entscheidungen bilden. Im Fol- deutschen Haushalten könnte ein bedeutender Bei- genden werden die Potenziale von Smart-Data-Anwen- trag zur Energiewende geleistet werden. Im vorigen dungen an ausgewählten Anwendungsfällen vorgestellt. Jahr stellte das Bundesministerium für Wirtschaft und Energie eine Studie zum flächendeckenden Einsatz von Smart Metering in Deutschland vor. Ein Szenario Smart Data für kleine und mittlere geht davon aus, dass bis 2022 mehr als zehn Millionen Unternehmen digitale Zähler installiert und somit rund zwei Drittel aller Haushalte und Unternehmen von der Innovation Es gibt zwei bedeutende Entwicklungen, die es kleinen erfasst werden. und mittleren Unternehmen ermöglichen, die Potenziale Smart Meter bilden die Grundlage für ein intelligentes von Smart Data zur Entscheidungsunterstützung Stromnetz der Zukunft, auch Smart Grid genannt. genauso erfolgreich zu nutzen, wie es Großunternehmen Das intelligente Stromnetz verbindet Erzeuger und bereits tun. Zum einen werden die technischen und Verbraucher sowie Energiespeicher und ermöglicht finanziellen Anforderungen für die Einführung von den Austausch von Zustandsinformationen. So wird es Smart-Data-Technologien in den Unternehmen dank möglich, Angebot und Nachfrage besser aufeinander voranschreitender Etablierung von Cloud-Computing- abzustimmen und zeitnah auf Schwankungen zu Lösungen (Infrastructure, Platform sowie Software as a reagieren. Dies kann nur funktionieren, wenn es gelingt, Service) immer geringer. Zum anderen gibt es mit den die Daten von Millionen Verbrauchern in kurzer Zeit zu aufkommenden Informationsmarktplätzen zunehmend verarbeiten. Benötigt wird auch eine Rückkopplung an bessere Möglichkeiten zum gegenseitigen Austausch die Verbraucher, z. B. in Form von Preisinformationen, von Daten, was zur Folge hat, dass auch kleinen Unter um die Motivation zur Verminderung des Verbrauchs nehmen immer mehr Daten zur Verfügung stehen. in Zeiten von vergleichsweise geringem Angebot Durch politische Rahmenbedingungen können sich hier zu stärken. Das intelligente Stromnetz der Zukunft Wettbewerbsvorteile für den deutschen Mittelstand besteht aus einer großen Zahl von technischen einstellen. Diese Rahmenbedingungen müssen vor Systemen, die durch Daten-Dienste miteinander allem die rechtlichen (Datenschutz, Datensicherheit verbunden sind. Dazu gehören die Erfassung, und Datenaustausch) sowie personellen Anforderungen Speicherung, Verarbeitung und Visualisierung aller berücksichtigen. 1 technischen und betriebswirtschaftlichen Daten und komplexe Optimierungsrechnungen. Smart Data und Cloud Computing gehören zu den Technologien, die im intelligenten Stromnetz eingesetzt werden. Energieunternehmen können Smart-Grid-Lösungen 1 Ein Ergebnis der vom BMWi in Auftrag gegebenen Innovationspotenzialanalyse in Bezug auf Technologien zum Verwalten und Analysieren von großen Datenmengen (Big Data Management); http://www.dima.tu-berlin.de/menue/research/big_data_management_report/. Arbeitsgruppe 2 im Nationalen IT-Gipfel –4– Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen in der Cloud mit Ketten von modular aufgebauten Beispiel: Smart Data für IT-Sicherheit IT-Services umsetzen. Smart-Data-Analysen können und Betrugserkennung eingesetzt werden, um die Energiepreise besser auf bestimmte Kundengruppen auszurichten. Smart-Data-Technologien lassen sich bei der Aufspü- rung von hochentwickelten Bedrohungen, Insider-An- griffen oder Konto-Übernahmen nutzen. Hier ist die Beispiel: Industrie 4.0 Echtzeitfähigkeit von besonderer Bedeutung, da auch Kriminelle mit steigender Geschwindigkeit Verbrechen Seit einiger Zeit macht der Verband Deutscher begehen. Mit Smart Data lassen sich Muster von Über- Maschinen- und Anlagenbau (VDMA) auf neue griffen herausarbeiten – so könnten Organisationen Wettbewerber aufmerksam: Chinesische Maschinen sich schnell ein Bild über die Sicherheitslage in ihrem bauer sind nicht mehr nur im Segment der preiswerten Unternehmen machen und damit zeitnah auf Bedro- Massenware tätig. Sie dringen schrittweise in die hungen reagieren. Segmente der Qualitätsspitzenprodukte ein – seit Ein konkreter Anwendungsfall stellt beispielsweise Jahrzehnten eine Festung der deutschen Hersteller. die Verwaltung von Server-Logdaten dar, wobei Aus diesem Grund müssen deutsche Maschinenbauer große Volumen an computergenerierten Daten mit innovativen Produkten immer mindestens einen anfallen. Es umfasst das Sammeln, die zentrale Schritt voraus sein. Aggregation, die Langzeitspeicherung, die Analyse Diese Chance bietet sich mit Industrie 4.0. Mit der Logdaten in Echtzeit sowie die Suche in den Intelligenz ausgestattete Produktionsanlagen werden Logdaten und daraus generierten Berichten. Nicht über das Internet miteinander vernetzt, verschiedene nur die großen Logvolumina, sondern auch die Zahl Wertschöpfungsstufen horizontal und vertikal zu der unterschiedlichen Logformate stellen hierbei hochflex iblen Fertigungs- und Logistiksystemen erhebliche Herausforderungen dar. Die Möglichkeit integriert. Smart Data, Cloud Computing, RFID, Internet einer sinnvollen manuellen Auswertung und Analyse der Dinge und Dienste – alle diese Technologien wird dagegen immer geringer. Dies gilt besonders dann, gehören zu den Treibern. Das Konzept Industrie wenn Logdaten miteinander korreliert werden müssen, 4.0 wird im kommenden Jahrzehnt schrittweise um Beurteilungen einer Situation oder Auswertungen umgesetzt. Prototypische Realisierungen einzelner von Fehlerzuständen vorzunehmen. Verdächtige Komponenten lassen sich in der Wirtschaft bereits Veränderungen oder Vorgänge möglichst rasch und besichtigen. Schrittweise entstehen Smart Factories, am besten in Echtzeit zu erkennen ist der Anspruch in denen intelligente Produktionsanlagen, Produkte von IT-Sicherheitsexperten. Solche Anwendungen und Ressourcen sowie Menschen interagieren und stehen zurzeit noch am Anfang, werden jedoch in ihrer mit anderen intelligenten Systemen – Smart Grids, Verbreitung und Bedeutung stark zunehmen, da die Smart Logistics – in Verbindung stehen. In allen Auswertung von Logdaten mittels Smart Data einen Prozessschritten einer so hochintegrierten Produktion sehr guten Ansatzpunkt dafür bietet. entstehen massenhaft Daten, die durch Smart-Data- Technologien erfasst, gespeichert und verarbeitet sowie für Optimierungen und Simulationen genutzt werden. Aus all diesen Gründen scheint es gerechtfertigt, von grundlegenden Veränderungen in der Art zu sprechen, wie Produkte und Dienstleistungen entwickelt, produziert und auch konsumiert werden. Arbeitsgruppe 2 im Nationalen IT-Gipfel –5– Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen Beispiel: Impulse für die personalisierte helfen IT-gestützte DNA-Analysen dabei potenziell Medizin wirkungslose Behandlungsmethoden mit jedoch immensen Nebenwirkungen für den Patienten zu Besonders mit Blick auf die alternde Gesellschaft in vermeiden. Deutschland werden Smart-Data-Anwendungen in der Ein weiteres Beispiel stellt die Behandlung der Medizin für viele Menschen immer wichtiger. Konkret Erbkrankheit Mukoviszidose dar. Diese Krankheit helfen Smart-Data-Analysen bei der Überwachung von behindert die Lungenfunktion, rund die Hälfte der Vitalparametern, personalisierter Medizin sowie der Patienten mit dieser Diagnose erreicht nicht das Erforschung von Erbkrankheiten. vierzigste Lebensjahr. Die Fortschritte bei der Gen Die personalisierte Medizin ermöglicht eine an den sequenz ierung und bei den Smart-Data-Methoden einzelnen Patienten angepasste Behandlung und erlauben es, eine auf den Patienten zugeschnittene Prognose von Krankheiten. Erhebliche Fortschritte im Therapie zu entwickeln und ihnen so ein deutlich Bereich der Molekularbiologie sowie der Biotechnologie längeres und besseres Leben zu ermöglichen. haben die personalisierte Medizin als eine praktikable Smart Data kann auch für Infarkt-Betroffene nützlich Alternative ermöglicht. Besonders die Kombination sein. So erlaubt es die automatische Analyse von EKG- der Biotechnologie mit IT-gestützten Analysen und Daten von Infarkt-Betroffenen, frühzeitig Abweich Prozessen birgt vielversprechende Potenziale. Darüber ungen von einem „normalen“ Verlauf zu erkennen, die hinaus eröffnet die personalisierte Medizin für das Risiko vervielfachen, innerhalb eines Jahres einen Krankenkassen die Möglichkeit einer verbesserten und erneuten Infarkt zu erleiden. individuelleren Versorgung von Patienten. Als letztes Beispiel seien Analysen der DNA von an Beispielsweise ermöglicht die personalisierte Medizin Parkinson-Erkrankten genannt. So bauen Forscher bei Krebspatienten besser angepasste und wirkungs mit prominenter Unterstützung des selbst betroffenen vollere Therapien. Heutzutage spricht nur ein Teil Schwergewichtsweltmeisters Muhammad Ali und das der Patienten tatsächlich auf die Chemotherapie- Unternehmen 23andMe die weltweit größte Datenbank Behandlung an. Da sich jeder Tumor von den anderen für die Parkinson-Forschung auf. Erste bahnbrechende unterscheidet, beispielweise von seinem genetischen Erkenntnisse sind schon vorhanden: Zwei Gene w urden Material her, müssen die behandelnden Ärzte die identifiziert, die mit der Krankheit verknüpft sind, und individuellen Aspekte der Erkrankung bei der Therapie ein Gen wurde gefunden, das Schutz gegen Parkinson berücksichtigen, damit sie Wirkung zeigt. Hierbei bietet. Arbeitsgruppe 2 im Nationalen IT-Gipfel –6– Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen 4 Technologische Grundlagen Dieses Kapitel umreißt den Stand der Technik. Es Programmiermodell und -Ausführungssystem. HDFS werden die wichtigsten Arten von Plattformen für das ist in der Lage, sehr große Mengen von Daten in Speichern und Analysieren von Smart Data beschrieben beliebigen Formaten verteilt und fehlertolerant auf sowie deren typische Komponenten erläutert.2 tausenden von Rechnern zu speichern. Dabei werden individuelle Dateien redundant im Rechnerverbund gehalten. Das MapReduce-Programmiermodell Datenplattformen ermöglicht eine einfache Spezifikation von parallelen Analyse programmen, bei denen der Nutzer die In den vergangenen Jahren wurden eine Reihe von normalerweise sehr komplexen Aspekte der parallelen Datenplattformen entwickelt, die den Betrieb und Programmierung nicht zu berücksichtigen braucht. das Management der neuen Datenklassen auf eine Diese Spezifikation folgt einem strikten Schema, möglichst effiziente und kostengünstige Art und Weise das sich jedoch für vielfältige Anwendungsfälle ermöglichen. Dazu gehören Technologien wie Hadoop als gut geeignet erwiesen hat. Es können nahezu und noSQL-Datenbanken, die sich einen festen Platz beliebige Operationen auf beliebig strukturierten in Smart-Data-Architekturen gesichert haben. Diese Daten ausgeführt werden und das parallel und Technologien sind exzellente Ergänzungen zu den kostengünstig auf bis zu tausenden von Rechnern. Da bisherigen Datenhaltungssystemen, die den Großteil der das MapReduce-Ausführungssystem für Batch-basierte heute in Unternehmen zur Analyse anstehenden Daten Analysevorgänge mit sehr großen Datenmengen verwalten. Diese Data-Warehouse-Systeme verfügen optimiert wurde, ist eine interaktive Datenanalyse in der Regel über exzellente analytische Verfahren und mit kurzen Antwortzeiten im Sekundenbereich nicht Algorithmen und eine breite Basis. Nahezu alle diese möglich. Üblich sind Ausführungszeiten im Bereich von Systeme verfügen über entsprechende In-Memory- Minuten bis Stunden. Technologien, die für eine schnelle Auswertung Eine andere Innovation ist der High-Performance unabdingbar sind. In Abbildung 1 sind die entsprechenden Computing Cluster (HPCC), eine Open-Source- Technologiekomponenten dargestellt. Entscheidend für Supercomputing-Plattform für datenintensive Anwen den Erfolg von Smart Data wird u. a. sein, ob es gelingt, dungen, die Unternehmen dabei unterstützt, Smart-Data- diese unterschiedlichen Datenhaltungs-Technologien Probleme zu lösen. Die HPCC-Plattform zeichnet sich auf einfache Art und Weise interagieren zu lassen. Daten insbesondere durch ihre konsistente, datenzentrierte jedweder Art und Daten aus unterschiedlichen Quellen, Programmiersprache (ECL) sowie eine Architektur aus, wie beispielsweise Hadoop, noSQL, relationale Systeme die eine effiziente Datenverarbeitung ermöglicht. Sie und Dateisysteme, müssen gemeinsam nutzbar sein. bietet damit Geschwindigkeit, Skalierbarkeit und eine schnelle Analyse großer Datenmengen. Massiv parallele Systeme: Eine hervorzuhebende Plattform ist Hadoop der Apache Software Foundation. noSQL-Datenbanksysteme: noSQL-Datenbanksysteme Hadoop bildet zunehmend die Grundlage von („noSQL“ steht für „Not only SQL“) dienen, ähnlich Systemen und Teilkomponenten für das Speichern und wie Hadoop, der Speicherung großer Mengen von Verarbeiten von Smart Data, die in offen verfügbaren Daten mit geringer Dichte und besitzen im Gegensatz sowie kommerziellen Lösungen Anwendung finden. zu relationalen Systemen keine Schemabindung. In den Konzeptionell beruht Hadoop auf dem verteilten letzten Jahren hat sich eine Reihe von unterschiedlichen Dateisystem HDFS sowie dem MapReduce- noSQL-Datenbanken ausgebildet, wobei die Key-Value- 2 Für weiterführende Details wird auf den BITKOM-Leitfaden „Big-Data-Technologien – Wissen für Entscheider“ verwiesen. Arbeitsgruppe 2 im Nationalen IT-Gipfel –7– Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen Store-Technologie am weitesten verbreitet ist. Daneben Analytische Datenbanken: Diese Systeme bilden im sind weitere Kategorien zu nennen wie z. B. Document-, Wesentlichen die heutige Basis für Data-Warehouse- Column- oder Graph-Store-Datenbanken. Ähnlich wie und Business-Intelligence-Anwendungen. Dabei bei Hadoop können noSQL-Datenbanken auf einem Netz werden aus unterschiedlichsten Quellen Daten von Standard-Rechnersystemen ausgeführt werden, was unterschiedlichster Art in einem Data Warehouse (oder den Betrieb großer Systeme sehr kosteneffizient macht. Data Mart) konsolidiert und mit unterschiedlichsten Algorithmen (Data Mining, Analytics etc.) ausgewertet. Hauptspeicher-Datenbanksysteme (In-Memory-Daten- Zunehmend verfügen diese Systeme über optimierte banksysteme): Für Anwendungsfälle, in denen eine in- spaltenorientierte Hauptspeicherdatenbanken, die für teraktive Analyse von Daten notwendig ist, die im re- Near-Realtime-Analytics unabdingbar sind. Des Weiteren lationalen Datenschema abgebildet werden können, hat sich gezeigt, dass eine Einbindung von Hadoop- und haben sich relationale, spaltenbasierte Hauptspeicher- noSQL-Datenquellen in eine bestehende oder neu zu Datenbanksysteme etabliert. Diese Datenbanksysteme schaffende analytische Datenbankumgebung eine sehr halten ihren Datenbestand primär im zuletzt deutlich effiziente und äußerst tragfähige Anwendungsplattform günstiger gewordenen Hauptspeicher der Rechner vor, schaffen kann. was gegenüber Festplatten die Latenzen für Datenzu- griffe verringert, Datendurchsätze steigert und somit eine sehr effiziente Analyse ermöglicht. Abbildung 1: Taxonomie von Smart-Data-Plattformen Arbeitsgruppe 2 im Nationalen IT-Gipfel –8– Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen Technologiekomponenten Batch Processing: Bei der Batchverarbeitung oder auch Stapelverarbeitung werden Geschäftsvorfälle gesammelt Der Zweck jeder Smart-Data-Plattform ist es, Daten in und – in häufig nächtlichen, vom Online-Betrieb freien – entscheidungsrelevante Informationen umzuwandeln. Batch-Läufen verarbeitet. So werden durch Batch-Skripte Voraussetzung dafür ist, dass es sich um qualitativ hoch- und Werkzeuge für ETL (Extract, Transform, Load) immer wertige Daten handelt. Die Vielfalt an Einsatzszenarien wiederkehrend die neu angefallenen Daten aus den erfordert vielfältige Werkzeuge auf jeder Ebene. operativen Systemen abgezogen und für entsprechende Abbildung 1 stellt eine sehr vereinfachte Taxonomie der analytische Zielsysteme aufbereitet. Die neu berechnete Technologien dar, die für eine Komplettlösung benötigt Datenbasis steht den Analysenwerkzeugen mit zeitlicher werden. Die Darstellung ist als modularer Baukasten Verzögerung zur Verfügung. Zur Reduzierung dieser zu verstehen. Die Schichten 1 bis 4 repräsentieren den Verzögerung beim Laden von Daten müssen die Batch- Weg von den Rohdaten zu geschäftsrelevanten Erkennt- Läufe weiter parallelisiert und optimiert werden. nissen. Dieser Weg wird flankiert von den Schichten 5 In einem Smart-Data-Szenario stößt man schnell an (Datenintegration) und 6 (Datensicherheit sowie -Gover- die Grenzen der traditionellen Batch-Verarbeitung. Ein nance), die auf ein harmonisches Zusammenspiel von Hadoop-basierter Sammelspeicher hingegen vereinigt Smart-Data-Plattformen mit existierenden Technologien, die Zwischenspeicherung der Originaldaten aus den Standards, Prozessen und Compliance-Vorgaben zielen. Quellsystemen im HDFS mit deren Transformation mit Hilfe der schnellen parallelen Batch-Verarbeitung. Schicht 1: Datenhaltung Viele Unternehmen sind von der Vielfalt, Geschwindigkeit Streaming und Complex Event Processing: Der tradi und Menge an Daten überfordert. Ein echter Mehrwert tionelle Ansatz von Data Warehousing analysiert für das Geschäft kann aus diesen Daten nur gewonnen ruhende Daten, in denen der Anwender mit werden, wenn es gelingt: a) die Daten kostengünstig verschiedenen Techniken nach den gewünschten zu speichern, b) die Daten auf vielfältige und flexible Informationen sucht. Die Überwachung und Steuerung Weise zu „befragen“, um wertvolle und umsetzbare dynamischer Prozesse bedarf eines anderen Ansatzes. Erkenntnisse zu gewinnen und c) diese Erkenntnisse Hierbei werden zeitlich geordnete Ereignisse zeitnah zur Verfügung zu stellen. Die kostengünstigen, überwacht, verdichtet, gefiltert und korreliert. Muster exponentiell wachsenden Kapazitäten von Online- und Regel sind hier konstant, die Daten dagegen in Storage ermöglichen die Speicherung immer größerer schneller Bewegung, daher auch der Begriff Streaming. Datenmengen als Basis für analytische Fragestellungen. Schicht 3: Analytische Verarbeitung Schicht 2: Datenzugriff Text- und Semantische Analyse, Video- und Audio-Analyse: Was typischerweise nicht wächst, ist die zur Verfügung Neben Datenströmen, die z. B. aus der Vernetzung von stehende Zeit für die Beantwortung aufkommender Geräten stammen oder von Sensoren generiert werden, Fragen. Die technische Herausforderung besteht also stellt die Auswertung von Daten, die in textueller darin, eine massiv zunehmende Menge an Eingabedaten Form vorliegen, ein großes wirtschaftliches Potenzial zu verarbeiten, ohne dabei den zur Verfügung stehenden für Unternehmen dar. So lassen sich beispielsweise Zeitrahmen zu überschreiten. Ein solches System hat in Social-Media-Daten Produkttrends erkennen oder die Verarbeitung und den Datenfluss einer großen Dokumente mit Hilfe von Textanalyse und semantischen Datenmenge zu organisieren. Hier seien zwei Verfahren Technologien durch Zusatzinformation anreichern, so beispielhaft genannt: dass die angereicherten Daten neue Möglichkeiten für Anwendungen und Analysen bieten. Arbeitsgruppe 2 im Nationalen IT-Gipfel –9– Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen Neben den Datenströmen, die unmittelbar auf Text- Predictive Analytics: Mithilfe von Predictive Analytics Dokumenten basieren, wachsen insbesondere Audio- können aus einem Datensatz Trends und Verhaltens- und Video-Inhalte explosionsartig an. Nach Extraktion muster abgeleitet und vorhergesagt werden. Hierbei der Text-Informationen lassen sich diese Schätze unter kommen je nach Anwendungszenario verschiedene sta- Nutzung linguistischer und semantischer Verfahren tistische Algorithmen und Modellierungs-Techniken zum heben. Einsatz, die darauf abzielen, Muster in aktuellen oder historischen Daten zu erkennen und daraus Ableitungen Orts- und raumbezogene Datenanalyse: Viele Daten für das zukünftige Verhalten treffen zu können. weisen einen Ortsbezug auf. Die schnell steigenden Nutzerzahlen von Smartphones und Digitalkameras Data Mining und Machine Learning: Data Mining ist ein bieten die Möglichkeit, viele Informationen zusammen bildlicher Oberbegriff für eine Vielzahl von verschiedenen mit GPS-Koordinaten zu erheben. So sind z. B. im Methoden, Verfahren und Techniken, der die Intention Handel Analysen zur Bewertung neuer Standorte unter zusammenfasst – geradezu im Sinne eines „Daten- Einbeziehung der räumlichen Dimension seit vielen Bergbaus“ – Schätze, also verwertbares Wissen, aus Jahren Standard. In die Absatzprognosen für einzelne den Daten des Unternehmens zu fördern. Insbesondere Artikel gehen Wettermodelle ebenso ein wie die bezeichnet Data Mining das intelligente, größtenteils Einwohnerverteilung bestimmter Einkommensklassen. automatisierte Aufspüren und die Extraktion von Versicherungen ermitteln anhand von Geolokationen wirtschaftlich nutzbaren Mustern und Zusammenhängen zusammen mit Überflutungsmodellen die Schadens in großen Datenbeständen. Der Begriff Machine risiken von Immobilien. Mit Smart-Data-Methoden Learning beschreibt eine Vielzahl von Anwendungen und werden nun auch andere Daten, die nur implizit über Methoden, in denen Computerprogramme selbständig einen Ortsbezug verfügen, mit Geoinformationen neues Wissen erwerben. verknüpft. Schicht 4: Visualisierung Web-Analyse: Führende Online-Händler experimen Das Hauptziel der Visualisierung ist die Multiplikation tieren täglich auf ihren Seiten. Sie wollen herausfinden, des analytischen Potenzials von Mensch und Computer ob die Änderungen zu gewünschten Kundenreaktionen durch eine effektive Kombination interaktiver Visuali führen. Die Vielzahl an Erkenntnissen hinsichtlich sierungstechniken mit rechnergestützter Datenanalyse. einzelner Benutzergruppen wird dazu genutzt, um Bei der visuellen Analyse kommen unterschiedliche in Echtzeit den Inhalt einer Webseite anhand der Techniken zum Einsatz. Sie lassen sich nach folgenden Zuordnung eines Benutzers zu einer gewissen Kriterien unterscheiden: a) Visualisierung zur Benutzergruppe dynamisch anzupassen. Informationsbereitstellung versus visuelle Analyse zur Graphbasierte Methoden eignen sich zur Modellierung Wissensaufbereitung, b) Visualisierungsnutzung durch der Web-Daten, um mehr als die offensichtlichen den Entscheidungsträger versus durch den Analysten Abhängigkeiten z. B. von Produkten im Webshop zu und Domänen-Experten sowie c) Informationskonsum erkennen und so Benutzer über die Platzierung von oder Analyse ortsgebunden am Arbeitsplatz versus Angeboten gezielter zu steuern. Des Weiteren wird die mobil. Web-Analyse immer mehr mit anderen Analysetechniken wie z. B. Predictive Analytics verknüpft, um nicht nur das Verhalten eines Kunden zu analysieren und damit Webseiten zu optimieren, sondern auch Voraussagen über seine nächsten Schritte zu treffen und ihm speziell zugeschnittene Angebote zu präsentieren. Arbeitsgruppe 2 im Nationalen IT-Gipfel – 10 – Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen Schicht 5: Datenintegration einfach abzufragende APIs, Webserver protokollieren Die herkömmlichen Technologien zur Integration die Benutzerzugriffe sehr umfangreich und die Daten von Anwendungen und Daten sind für Smart- liegen oftmals in Form von Textdateien bereits vor. Data-Lösungen weiterhin von Bedeutung. Diese Folgt man dem Paradigma „Speichere jetzt – Verarbeite Technologien sind heute im unternehmensweiten später“, dann reduziert sich das Laden der Daten produktiven Einsatz in verschiedenen Business- (Load) auf einen einfachen Transportvorgang. Die Intelligence-, SOA-, Anwendungs- und B2B- Transformationen schließlich werden aufwendiger. Integrations szenarien. Eine Wiederverwendung in Die Verarbeitung wenig strukturierter Daten lässt sich Smart-Data-Architekturen ist notwendig, da die schlechter optimieren und verbraucht deutlich mehr meisten werthaltigen Unternehmensdaten heute in Ressourcen. Selbst wenn die Daten nicht in eine strukturierter Form in existierenden Anwendungen strukturierte Form gebracht werden müssen, so sind (z. B. ERP, CRM) und Datenbanken vorliegen. Etablierte doch auch für statistische und andere Datenanalysen oft Integrationstechnologien sind in der Lage, zahlreiche umfangreiche Vorverarbeitungen erforderlich. In einer Datenquellen zu integrieren und sie einer Smart- massiv parallelen Umgebung, die viel Rechenleistung Data-Umgebung zur Verfügung zu stellen. Durch den zur Verfügung stellt, können diese Transformationen Einsatz von Integrations-Middleware können diese auch bei großen Datenmengen noch hinreichend schnell unterschiedlichen Datenquellen über standardisierte durchgeführt werden. Schnittstellen zugänglich gemacht werden. Hier haben sich Enterprise-Service-Bus-Technologien (ESB) Schicht 6: Datensicherheit und -Governance etabliert. Datensicherheit: Bei der Umsetzung von Smart- Die andere wesentliche Technologie zur Anbindung Data-Projekten sind die Themen Datenschutz und verschiedener Datenquellen sind Datenintegrations- IT-Sicherheit stark in den Vordergrund gerückt. Im oder ETL-Plattformen. Im Unterschied zu einem ESB Entwurf der Datenschutz-Grundverordnung sind zudem liegt bei ETL-Plattformen der Fokus auf dem Transfer und die Anforderungen an „Data protection by design and der Transformation von großen und komplexen Daten by default“ ausdrücklich verankert. mengen, die häufig im Batch-Verfahren durchgeführt werden. Daten-Governance: Unter Daten-Governance versteht Im Rahmen von Smart Data kommen zu den man eine Kombination von Prozessen, Technologien existierenden Integrationslösungen neue Konnek und Wissen, mit der sich nachhaltig wertvolle und tivitäts-Anforderungen hinzu. Die beschrie benen qualitativ hochwertige Informationen gewinnen lassen. Faktoren – hohe Datenvolumina und -Raten, unvoll ständige Schemata – führen insgesamt zu einer Neu definition der Datenintegration: weg vom Vorgehen des „Extract-Transform-Load“, hin zu einem „Extract- Load-Transform“ (ELT). In einem Smart-Data-Umfeld ist der Aufwand für Extraktion (Extract) der Daten häufig vernachlässigbar. Sensorik-Daten werden bereits in großen Mengen geliefert, Social-Media-Dienste haben Arbeitsgruppe 2 im Nationalen IT-Gipfel – 11 – Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen 5 Allgemeine Hürden und Hindernisse bei Smart Data Die Umsetzung von Smart-Data-Projekten birgt große müssen intelligente Lösungen zur Anwendung kommen, Potenziale für Unternehmen in Deutschland, jedoch die ein hohes Maß an Flexibilität zulassen und das Prinzip treffen viele Projekte auf dieselben Hindernisse. Des der digitalen Selbstbestimmung stützen, wie etwa Weiteren fehlt es an Experten für die Datenanalyse. Pseudonymisierungs- und Anonymisierungslösungen. Auch freiwillige Lösungen der Industrie können in diesem Zusammenhang eine sinnvolle Lösung darstellen. Datenschutz und Privatsphäre Neben einer notwendigen Expertise im Bereich der technischen Verarbeitung sind klare Regeln und Bei Smart-Data-Anwendungen, bei denen personenbe- Leitlinien beim Umgang mit allen Daten, insbesondere zogene Daten verwendet werden, muss wie auch bei bei personenbezogenen Daten, unverzichtbar. Dazu anderen Datenverarbeitungsprozessen das deutsche gehört nicht nur der technische Datenschutz, sondern Datenschutzrecht berücksichtigt werden. Deutsches auch die Implementierung von Datenschutzregeln Datenschutzrecht ist auch dann anwendbar, wenn ein in der eigenen Organisation, z. B. in Form von nicht in der EU ansässiges Unternehmen im Inland Da- innerbetrieblichen Richtlinien und Schulungen der ten erhebt, verarbeitet oder nutzt. Um sowohl für Unter- Mitarbeiter zum Umgang mit Daten. nehmen als auch für Verbraucher zu größerer Rechts- sicherheit beizutragen, können intensivere Aufklärung und, sofern im Einzelfall gewünscht, auch Unterstützung Umsetzung von Smart-Data-Projekten bei der Rechtsanwendung sinnvoll sein. Hierzu gehört auch, dass illegale Datennutzungen und Datenmiss- „Datenspeicherung, -management, -sicherheit und -be- brauch effektiv verfolgt und geahndet werden. reitstellung fordern von Unternehmen einen Aufwand, Dies gilt auch für die teilweise vorgebrachten den einige von ihnen scheuen“, berichtet IDC in einer Forderungen nach einer Nutzung der Daten nur nach seiner aktuellen Umfragen.3 Dass Investitionen bei der Einwilligung des Betroffenen oder einer generellen Einführung von Smart-Data-Analysen anfallen ist klar, Anonymisierung der Daten. Diese Vorgaben, die jedoch ist für deren Durchführung nicht automatisch der zudem selbst vom deutschen Datenschutzrecht Austausch vorhandener Systeme erforderlich. Häufig ist nicht vorgesehen sind, würden aber den Einsatz von es nur eine gezielte Ergänzung. Die Kosten hängen dabei Big-Data-Anwendungen in wesentlichen Bereichen von den individuellen Anforderungen und Gegebenhei- verunmöglichen. Hier gilt es, sachgerechte Lösungen ten des jeweiligen Anwenderunternehmens ab. zu finden, die einen hohen Schutz der Privatsphäre des Die Menge an Daten, die Unternehmen im Blick haben Einzelnen ermöglichen, aber gleichzeitig die Nutzung müssen, wächst unaufhaltsam, etwa in Form von Ma- der erheblichen gesellschaftlichen und wirtschaftlichen schinendaten oder Informationen aus sozialen Netzwer- Potenziale von Smart Data nicht ausschließen. ken. Diese Daten können bei der Produktentwicklung Dies sollte auch bei der derzeitigen Überarbeitung hilfreich bzw. unverzichtbar sein und damit die Pro- des EU-Datenschutzrechts berücksichtigt werden. dukteinführungszeit für neue Produkte verkürzen. Doch Wichtig ist auch hier, dass Ansätze gefunden werden, für die Analyse der riesigen Datenmengen fehlen häufig die hinreichend flexibel sind, um Innovationen und die technischen Möglichkeiten und Fähigkeiten. Dieses Wachstum in der EU weiterhin zu ermöglichen. Dafür Problem kann durch die Verbindung von Smart Data mit 3 IDC-Studie: Big Data – Business Value in deutschen Unternehmen auf dem Prüfstand, Frankfurt am Main, 13. Dezember 2013. Arbeitsgruppe 2 im Nationalen IT-Gipfel – 12 – Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen Elementen des Cloud Computings gelöst werden. Bei Einheitliche Analyse von Cloud-Lösungen stehen IT-Ressourcen schnell, skalier- Unternehmensdaten bar und nahezu in unbegrenztem Umfang zur Verfügung. Neben fehlendem Expertenwissen sind die fehlende unternehmensweite Datensammlung sowie mangelhafte Mangel an Experten Datenintegration große Hürden. Jedoch ist genau dies der Schlüssel für ein umfassendes Auswerten Ein großes Hemmnis bei der Umsetzung von Smart-Da- der Unternehmens- und Kundendaten im Rahmen ta-Projekte ist der Mangel an Experten, die in der Lage der gesetzlichen Regelungen. Meist führen einzelne sind, entsprechende Analysen mit großen und hetero- Abteilungen ihre eigenen Datenbanken, auf die jedoch genen Datenmengen durchzuführen.4 Häufig werden kein anderer Bereich Zugriff hat. Für die Durchführung stattdessen Personen aus den eigenen IT-Reihen des einer unternehmensweiten Analyse der Daten ist die Unternehmens eingesetzt, die noch keine oder wenig Infrastruktur vieler Unternehmen jedoch noch nicht Erfahrung mit Smart-Data-Projekten haben. Es ist drin- ausgereift. Nicht nur der Datenfluss zwischen den gend zu empfehlen, dass Unternehmen erst mit kleinen Abteilungen ist eingeschränkt, auch unterschiedliche und mittleren Smart-Data-Lösungen starten. So können Prioritäten der Smart-Data-Anwendungen verzögern das Mitarbeiter reale Erfahrung sammeln und diese in späte- Implementieren. ren größeren Projekten erweitern. Eine zusätzliche Herausforderung ist die große Vielfalt Die „Datenwissenschaft“ ist ein relativ neues und ein der Daten und Datenformate. Dies ist eine Problematik, sehr komplexes Thema, das Wissen aus unterschiedli- die nicht erst durch Smart-Data-Analysen akut wurde, chen Bereichen voraussetzt. Hier treffen sich Informa- sondern bereits seit der Einführung von Data-Warehou- tik, Mathematik, Statistik, Datenschutz, Sicherheit und ses eine entscheidende Herausforderung darstellt. im besten Fall spezifisches Branchenwissen. Häufig werden Mitarbeiter für Smart-Data-Projekte eingestellt, die Experten in ihrem speziellen Bereich sind, aber kein nötiges Branchenwissen aufweisen. Dies führt dazu, dass Smart-Data-Anwendungen im schlimmsten Falle nicht den gewünschten inhaltlichen oder monetären Erfolg bringen. 4 Teradata-Umfrage: Big Data Analytics ist Chefsache, Oktober 2013. Arbeitsgruppe 2 im Nationalen IT-Gipfel – 13 – Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen 6 Branchenspezifische Chancen und Herausforderungen bei Smart Data Neben allgemeinen Hürden und Hindernissen bei auch neue innovative Geschäftsmodelle ermöglichen, Smart-Data-Projekten gibt es zahlreiche spezifische beispielsweise personalisierte Angebote und Werbung. Herausforderungen in den einzelnen Branchen. Im Folgenden werden spezifische Hürden und Hindernisse für die Branchen Energie, Forschung, Gesundheit, Energie Einzelhandel und Industrie 4.0 zusammengetragen. Die Energiewirtschaft in Deutschland ist nach § 7 EnWG entbündelt, d. h., das Netz (Transport- und Verteilnetz), Einzelhandel der Vertrieb, die Energieerzeugung und der Energiehan- del sind rechtlich und operationell voneinander entfloch- In Zeiten einer wachsenden Digitalisierung von ten. Ein freier Datenaustausch insbesondere zwischen Handelspartnern und Konsumenten steht der dem Netzbetreiber und den anderen Gesellschaften Einzelhandel vor neuen Herausforderungen. Es geht der Energieversorgung ist ausschließlich im Rahmen nicht nur darum, die klassischen Stärken, wie z. B. der rechtlichen Notwendigkeiten erlaubt. Beispielswei- die Verfügbarkeit der Waren, zu verbessern, sondern se werden Zählerdaten bei Privat- und Gewerbekunden darum, dem Kunden am Point of Sale über existierende vom Netzbetreiber erhoben und mittels marktüblicher und neue Vertriebskanäle, wie zum Beispiel über mobile Prozesse an den jeweils zuständigen Energievertrieb Geräte, hinweg einen Mehrwert zu bieten. zwecks Erstellung einer Energieabrechnung weitergelei- Die Bereitstellung und Verknüpfung von geeigneten tet. Dem Netzbetreiber ist es nicht gestattet, die von Kanälen soll die Zukunfts- und Wettbewerbsfähigkeit ihm erhobenen Daten ohne Zustimmung des Kunden für verbessern, die Kundenorientierung erhöhen und eine andere Zwecke zu nutzen. stärkere Ausrichtung an eine sich schnell ändernde Im Gegensatz zum Übertragungsnetz ist das Verteilnetz digitalisierte Konsumentenwelt gewährleisten. bisher mit wenig Sensorik ausgestattet. Der Grund hier- So kann Smart Data u. a. die Entwicklung einer für liegt in der räumlich begrenzten Ausdehnung mög- umfassenderen Sicht auf den Kunden und eines licher Netzstörungen und der damit verbundenen Not- besseren Markt verständnisses sowie die Durch wendigkeit, Netzzustände zeitnah zu erfassen. Aufgrund führung von Echtzeitanalysen über alle Absatzkanäle der zunehmenden dezentralen Einspeisung durch EEG- oder eine dynamische Sortiments- oder Preisplanung Anlagen und der damit teilweise verbundenen Notwen- unterstützen. digkeit der Steuerung des Netzes (Smart Grid) wird es Der Einsatz von Smart Data im Einzelhandel muss in Zukunft aber notwendig sein, Netzzustandsdaten zu einhergehen mit der Integration von heterogen erheben und diese dann weiter zu verarbeiten. gewachsenen und dezentral verteilten ERP-Geschäfts Die Steuerung der Betriebselemente sowohl im anwendungen, welche die heutigen Kernprozesse Übertragungs- als auch im Verteilnetz erfolgt über und -funktionalitäten abbilden. Zur Ausnutzung des ein separates Kommunikationsnetz (PDV-Netz), das Potenzials von Smart Data muss ein Verständnis vom öffentlichen Kommunikationsnetz abgetrennt ist. gewonnen werden, welche Konsumentendaten relevant Der Grund hierfür liegt im vorbeugenden Schutz der und unter Berücksichtigung der datenschutzrechtlichen Energienetze vor möglichen Manipulationsangriffen Rahmenbedingungen nutzbar sind sowie einen aus öffentlichen Kommunikationsnetzen heraus. Die Mehrwert für das operative Geschäft bringen können. Daten aus dem PDV-Netz werden bisher für öffentliche Smart Data kann sowohl die herkömmlichen Prozesse, Analysen nicht zur Verfügung gestellt. Die sichere wie zum Beispiel die Sortimentsplanung, optimieren als Energieversorgung steht bisher über allen Bedürfnissen, mit analytischen Methoden weitergehende Erkenntnisse Arbeitsgruppe 2 im Nationalen IT-Gipfel – 14 – Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen zu sammeln, dabei aber mögliche Sicherheitsrisiken Ein Beispiel für eine positive Zusammenarbeit zwischen in Kauf zu nehmen. Die Nutzung netzrelevanter Daten Wirtschaft und Wissenschaft ist das Smart Data mittels Data-Analytics-Anwendungen für das Transport- Innovation Lab. Das Smart Data Innovation Lab (SDIL) und Verteilnetz muss gegen die Sicherheitsrisiken wurde gegründet7, um die Nutzung von Smart Data abgewogen werden. Zukünftige steuerungsrelevante zu ermöglichen, deren Potenzial für die Industrie zu Einheiten zur Einspeisebegrenzung von EEG-Strom im erschließen und exzellente Forschung zu unterstützten. Verteilnetz werden aber die Frage nach der Trennung Die im SDIL angelegte enge Zusammenarbeit von und den Schnittstellen der beiden Kommunikationsnetze Industrie und Wissenschaft schafft hier verbesserte neu stellen. Voraussetzungen für Spitzenforschung und Innovation im Bereich Data Engineering und Data Analytics für Smart Data. Um diese Zusammenarbeit zu beschleunigen, Forschung und Wissenschaft hat sich das SDIL zum Ziel gesetzt die Hürden bei der Zusammenarbeit zwischen Wirtschaft und Wissenschaft Die Menge der in Wissenschaft und Forschung zu identifizieren und anzugehen. Im SDIL können anfallenden Daten hat in den vergangenen Jahren geschlossene Netzwerke von Wirtschaft und Wissenschaft erheblich zugenommen. Die Auswertung und Analyse schnell eingerichtet werden, sodass die Kooperation in der riesigen Datenmengen könnte dabei helfen, einem abgesicherten Rechtsrahmen vonstatten gehen Antworten auf grundlegende Fragen zu finden und kann. Die Bereitstellung von technischer Ausrüstung und neue wissenschaftliche Erkenntnisse zu gewinnen. professionellem Personal ist ebenso entscheidend wie Entscheidungen, die bislang auf der Basis von klare und einfache Prozesse bei der Durchführung von Schätzungen oder theoretischen Modellen getroffen Smart-Data-Analysen. werden mussten, können heute auf der Basis von konkreten Daten gefällt werden. Smart-Data- Anwendungen bieten daher ein erhebliches Potenzial Gesundheit für Wissenschaft und Forschung. Einen ersten Eindruck, welches Potenzial in der Analyse großer Datenmengen Steigende Kosten und der zunehmende Wunsch nach ei- steckt, vermitteln etwa Projekte in der Astrophysik, wie ner effizienteren und individualisierten Versorgung stellen der Sloan Digital Sky Survey5, aber auch Projekte in der die modernen Gesundheitssysteme vor große Herausfor- Medizin, wie das Human Brain Project6. Auch anderen derungen. Smart-Data-Anwendungen bieten in diesem Zu- Disziplinen eröffnen Smart-Data-Anwendungen die sammenhang das Potenzial, die Qualität der medizinischen Möglichkeit, die Art der wissenschaftlichen Erkenntnis Versorgung zu erhöhen und zu einer Verringerung der gewinnung von Grund auf zu revolutionieren. Kosten beizutragen. Egal ob in der Diagnostik, im Behand- Eine der Haupthürden bei der Zusammenarbeit z wischen lungsprozess oder der Prävention - im Versorgungsprozess Wirtschaft und Wissenschaft bei der Nutzung der rund um den Versicherten werden heutzutage eine Menge Potenziale von Smart Data ist die Unsicherheit bei der Daten generiert, die es sinnvoll zu nutzen gilt. Die Analy- Weitergabe von Daten. Hier sind klare, aber standardisierte se und Integration dieser Daten mit weiteren Daten kann technische Prozesse und juristische Regulierungen dazu beitragen, die Versorgung in höherem Maße patien- notwendig, die sowohl eine vertrauensvolle und rechtlich tenorientiert und personalisiert zu gestalten. Smart-Data- abgesicherte Grundlage als auch eine Basis zur zeitnahen Anwendungen spielen dabei eine wichtige Rolle. Auch die Aufnahme der Zusammenarbeit zwischen Industrie und sogenannte evidenzbasierte Medizin profitiert erheblich Wissenschaft ermöglichen. Dass dazu hohe technische von einer umfassenden Analyse unterschiedlicher Daten. Sicherheit gehört, versteht sich von selbst. 5 Ein Projekt zur Vermessung und Kartierung des Himmels: http://sdss.org 6 Ein Projekt zur computerbasierten Modellierung und Simulation des menschlichen Gehirns: https://www.humanbrainproject.eu 7 Smart Data Innovation Lab: http://www.sdil.de. Arbeitsgruppe 2 im Nationalen IT-Gipfel – 15 – Projektgruppe Smart Data
Smart Data – Potenziale und Herausforderungen Bei der Entwicklung und Erprobung neuer Medikamente lagen für die Erhebung, Verbreitung und Nutzung von können Smart-Data-Anwendungen zu effektiveren Gesundheitsdaten. Auch das ärztliche Berufsrecht Wirkungs analysen und klinischen Studien von muss im Sinne einer modernen, vernetzten Behandlung Medikamenten beitragen. Auch die tägliche Arbeit der („Fernbehandlungsverbot“) geändert werden. Beteiligten am Versorgungsprozess des Versicherten Nicht zuletzt wirft die Integration und Analyse von kann durch Smart-Data-Anwendungen positiv beeinflusst Gesundheitsdaten auch ethische und gesell schafts werden: Strukturierte Datenanalysen und effiziente politische Fragen auf. In Zukunft wird es daher digitale Programme bieten die Chance, zeitintensive entscheidend darauf ankommen, Lösungen zu finden, Verwaltungstätigkeiten effektiver zu gestalten und durch die eine Balance zwischen den mit einer Verarbeitung daten bankgestützte Anwendungen personalisierte von Gesundheitsdaten einhergehenden Bedenken und Therapien und Behandlungen besser zu unterstützen. der durch die Technologie ermöglichten verbesserten Eine große Herausforderung für die Nutzung von Smart- Versorgung herstellen. Data-Anwendungen im Gesundheitswesen ist die Hete- rogenität und Fragmentierung der medizinischen Syste- me und Anwendungen. Dringend gebraucht werden in Industrie 4.0 Deutschland verlässliche Standards, um Daten seman- tisch interoperabel nutzen zu können. Verpflichtende Durch die zunehmende Digitalisierung von Maschinen, Standards fördern Innovation und geben der Industrie Infrastrukturen, Dienstleistungen und Management- Investitions- und Planungssicherheit. Dabei darf es kei- prozessen bis hin zu HR-Prozessen entstehen neue ne deutsche Sonderlösung geben - internationale aner- Möglichkeiten einer intelligenten und vernetzten Pro- kannte Standards müssen lediglich verbindlich und ver- duktions- und Prozessautomatisierung. Das Konzept pflichtend festgelegt werden. Hinzu kommt, dass eine Industrie 4.0 soll durch die gezielte Unterstützung von Integration der Daten oftmals aus anderen Gründen Informations- und Kommunikationstechnologien ein scheitert, wie etwa wegen des Standortes oder der Ver- neues Innovations- und Wachstumspotenzial ermögli- bindung, über welche die Daten weiter verarbeitet wer- chen. Smart Data spielt in diesem Zusammenhang eine den, oder auch wegen rechtlicher und regulatorischer wichtige Rolle, da ein nutzenorientiertes Zusammen- Beschränkungen der Verarbeitung der Daten. spiel aller Industrie-4.0-Komponenten nur durch eine Die im Gesundheitswesen anfallenden Daten enthalten leistungsstarke, sichere und flexible Daten-Infrastruktur sogenannte Sozialdaten, dies sind stets personenbezo- voll ausgeschöpft werden kann. Auf Basis dieser Infra- gene und datenschutzrechtlich sensible Informationen, struktur können neue wettbewerbsfähige Produkte und so dass ihre Verarbeitung höheren Anforderungen unter- Dienstleistungen schneller entwickelt werden. liegt. Pseudonymisierung und Anonymisierung kommen Der Einsatz von Smart Data in Industrie-4.0-Unterneh- in diesem Zusammenhang ein hoher Stellenwert zu und men trifft auf eine sehr heterogen geprägte Landschaft sie bilden die Grundlage für neue Ansätze einer Public- von Software-Systemen und Maschinen. Diese ist ge- Health Versorgungsforschung. Sowohl die Telematikinf- prägt von unterschiedlichen Technologieparadigmen rastruktur als auch alle geplanten und zukünftigen An- und einer Vielzahl unterschiedlicher Kommunikations- wendungen der Gesundheitskarte müssen und werden protokolle, auf deren Basis Produktionsanlagen heute die höchsten Sicherheitsstandards erfüllen. Welche An- Daten bereitstellen oder austauschen. Smart Data muss wendungen aber jeder Patient individuell nutzen möch- mit dieser Heterogenität sowie mit immensen Daten- te, hat der Gesetzgeber jedem Einzelnen selbst zuge- mengen und Kommunikationsgeschwindigkeiten um- standen. Der Patient ist Herr seiner Daten. gehen können, ohne die Industrieunternehmen mit der Klarheit geschaffen werden muss allerdings bei der IT-Komplexität zu überfordern. Speziell in kleinen und Weiterentwicklung bestehender Gesetze. So enthalten mittelständischen Unternehmen ist die Verfügbarkeit das Bundesdatenschutzgesetz sowie andere Daten von IT-Spezialisten und von notwendigen IT-Systemen schutzvorschriften keine ausreichenden Rechts grund nur bedingt gegeben. Arbeitsgruppe 2 im Nationalen IT-Gipfel – 16 – Projektgruppe Smart Data
Sie können auch lesen