Illumina Connected Analytics - Wachsende Datenbestände für Erkenntnisgewinn nutzen

 
WEITER LESEN
Illumina Connected Analytics - Wachsende Datenbestände für Erkenntnisgewinn nutzen
DATENBLATT

Illumina
Connected
Analytics
Wachsende Datenbestände
für Erkenntnisgewinn nutzen

• Optimierte Reads-zu-Ergebnisse-Lösung
  zur Verarbeitung von Multiomik-Workflows
  in großem Maßstab
• Anwenderspezifische Benutzeroberflächen
  für individuell konfigurierte Worfkflows und
  fortschrittliche Datenwissenschaftstools
• Sichere, im Hinblick auf Datenschutz konzipierte
  Umgebung

Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren.   986-2020-009-A DEU   | 1
Illumina Connected Analytics - Wachsende Datenbestände für Erkenntnisgewinn nutzen
ILLUMINA CONNECTED ANALYTICS

Einleitung                                                        Tabelle 1: Übersicht über ICA

                                                                                                  Merkmal                            Vorteil
Fortschritte bei der NGS-Technologie (Next-Generation                                                               Einhaltung lokaler, regionaler und globaler

                                                                 Sicherheit und Datenschutz
Sequencing, Sequenzierung der nächsten Generation)                                            Compliance
                                                                                                                    gesetzlicher Vorgaben, des HIPPA und
                                                                                                                    der DSGVO sowie der Zertifizierung nach
haben die Taktfrequenz in den Biowissenschaften und                                                                 ISO13485 und ISO27001
in der klinischen Forschung deutlich erhöht. Mit der
                                                                                                                    Strikte Datentrennung, Verschlüsselung
steigenden Sequenzierungsgeschwindigkeit und den                                              Sicherheits­
                                                                                                                    mit TLS 1.2 (Übertragung) und AES 256
                                                                                              maßnahmen
zugleich sinkenden Kosten übersteigen die Kapazitäten                                                               (Speicherung)
zur Generierung von Daten die Kapazitäten zur                                                                       Aktivitätsprotokoll mit Verfolgung, wer
                                                                                              Auditpfad
Gewinnung biologischer und klinischer Erkenntnisse aus                                                              wann welche Daten aufgerufen hat
diesen Daten deutlich. Die Herausforderungen in Bezug                                                               Nutzung einrichtungsspezifischer
                                                                                              Single Sign-on
auf sicheres Datenmanagement, Zusammenarbeit, die                                             (SSO) (optional)
                                                                                                                    Anmelde­informationen für die
                                                                                                                    Zugriffskontrolle
Analyse komplexer Daten und die Auswertung von Daten
in großem Maßstab lassen sich nur bewältigen, wenn                                            Computing-            Geringere Kosten, indem nur Computing-
                                                                                              Ressourcen            Ressourcen in der Pipeline-Engine
sich der Schritt von der Generierung zur Interpretation                                       on demand             abgerechnet werden
der Daten einfach vollziehen lässt. Illumina Connected           Resourcing
                                                                                                                    Skalierung von Cloudspeicherplatz
Analytics (ICA) wurde speziell für das Management,                                            Skalierung
                                                                                                                    und Computing-Kapazitäten je nach
                                                                                              on demand
die Analyse und die Interpretation dieser enormen                                                                   aktuellem Bedarf
Datenmengen entwickelt.                                                                       Plattform- und        Anzeigen des Ressourcenbedarfs zur
                                                                                              Nutzungs-             effizienten Übersicht, Verwaltung und
                                                                                              Dashboard             Anforderungsprognose

Bei ICA handelt es sich um eine umfassende cloud­                                                                   Präzise Datenschutzeinstellungen durch
                                                                                              Projekt- und
                                                                                                                    die Verwaltung von Benutzerzugriff
basierte Plattform für Datenmanagement und -analyse,                                          Benutzer­verwaltung
                                                                                                                    und -aktivität
                                                                 Verwaltung

über die Wissenschaftler große Mengen von Multiomik-
                                                                                                                    Weltweite Zusammenarbeit in großem
Daten in einer sicheren, skalierbaren und flexiblen                                           Gemeinsame
                                                                                                                    Maßstab dank der Überwindung von
                                                                                              Nutzung von Daten
Umgebung sammeln, untersuchen und teilen können                                                                     Datensilos

(Abbildung 1, Tabelle 1). Vorteile von ICA:                                                                         Kostensenkung durch die Archivierung
                                                                                              Datenarchiv           nicht verwendeter Daten in günstigeren
                                                                                                                    Speicherebenen
• Direkte Integration in den Datengenerierungs-
  Workflow, einschließlich Illumina-Sequenziersystemen                                        Direkte Integration
                                                                                                                    Unmittelbare Übertragung der Daten
                                                                                              von Sequenzier­
                                                                                                                    von Illumina-Sequenziersystemen
• Leistungsstarke Sekundäranalyse auf der DRAGEN™                                             systemen
  Bio-IT-Plattform1
                                                                 Anwenderfreundlichkeit

                                                                                              Grafischer            Erstellung von Pipelines ohne
                                                                                              Pipeline-Builder      Programmierung
• Skalierbare Aggregation und sichere Speicherung
  von Daten                                                                                   Tools und Pipelines
                                                                                                                    Nutzung von vorgefertigten Pipelines
                                                                                                                    und Drittanbieter-Tools
• Dynamische, interaktive Datenwissenschaftsumge­
                                                                                                                    Programmgesteuerte Verknüpfung
  bung für Machine Learning und künstliche Intelligenz                                        APIs und CLI          der Plattform mit vom Anwender
                                                                                                                    bevorzugten Tools

                                                                                              „Bring your own
Optimierter Workflow
                                                                                                                    Verknüpfung der privaten Cloud
                                                                                              Cloud“-Konto

                                                                                                                    Erstellung dynamischer Diagramme und
                                                                                              Datenvisualisierung   interaktiver Web-Apps zur Darstellung
                                                                                                                    von Daten mit R- und Python-Paketen
Bei ICA handelt es sich um eine zentrale Komponente
                                                                                                                    Programmierung von Pipelines in einer
für Labore, die Illumina-Sequenziersysteme für NGS-                                           Unterstützung für
                                                                                                                    gemeinsamen Workflow-Sprache und
                                                                 Fortschrittliche Tools

                                                                                              Docker und CWL
Studien nutzen. Dank der Vorteile, die die Flexibilität der                                                         einfacher Start von Analysen in der Cloud
Rechenkapazitäten beim Cloud-Computing bietet, eignet                                                               Programmgesteuerter Zugriff auf Tools
                                                                                              GA4GH-konforme
sich ICA mit derselben Architektur für Anwendungen                                            RESTful-APIs
                                                                                                                    und Daten sowie Kompatibilität mit
                                                                                                                    anderen Softwareumgebungen
jeden Umfangs – vom gelegentlichen Screening Zehn­
tausender Zellen in komplexen Einzelzellprojekten bis                                         JupyterLab-
                                                                                                                    Ausführung erweiterter Datenanalysen:
                                                                                                                    Erstellen und Trainieren von KI-/
hin zur Gesamtgenomsequenzierung bei Populationen.                                            Integration
                                                                                                                    ML-Modellen mit R und Python
Über BaseSpace™ Sequence Hub2 können Anwender
                                                                                              Datenaggregation      Datenabfragen auf Populationsebene
ihre Sequenzierungsplattform und entsprechende                                                und -abfrage          mithilfe von SQL
Daten direkt in die ICA-Umgebung integrieren.

2 | 986-2020-009-A DEU                                 Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren.
ILLUMINA CONNECTED ANALYTICS

                                                                      Erweiterbarkeit
                                                                        durch APIs

                                                                                               Sekundäranalyse

                                                                         Illumina®
                                                                        Connected
                                                                         Analytics

                                                                                                 Datenbank-
           Generierung         Sequenziersystem                                                  management
        eines Probenblatts                                                                       und -abfrage
             im LIMS

                                                                  Sichere Cloudumgebung
                                                                                              Datenwissenschaft

                                                   Cloudprozess

Abbildung 1: ICA bildet die Grundlage für Datenmanagement und -analyse.

Dank der automatisierten Workflows werden Daten                    Datenmanagement und Steuerung
während der Generierung in Echtzeit vom Gerät in die
Cloud übertragen. Dadurch sind die Reads so schnell
wie möglich für die Analyse verfügbar.                             Mir der steigenden Menge generierter Daten steigt auch
                                                                   der Bedarf an Infrastruktur für die Freigabe, Wieder­
Sobald sich die Daten in der ICA-Umgebung befinden,                verwendung und Integration von Daten in der Scientific
können sie, je nach angegebenem Workflow,                          Community, um den Wert einzelner Datensätze zu
automatisch mit gebrauchsfertigen DRAGEN- oder                     erhöhen. ICA ermöglicht dies mit zahlreichen Funktionen
anwenderspezifischen Pipelines analysiert werden.                  für die einfache Umsetzung von Best Practices für das
Der breite Umfang an Analyseoptionen reicht von                    Datenmanagement.
der Qualitätssicherung bis hin zu Datenaggregation
und fortschrittlichen Datenwissenschaftstools für die              Zugriffssteuerung
schnelle, skalierbare Datenverarbeitung. ICA bietet
eine erweiterbare Plattform mit zahlreichen RESTful-               Dank der differenzierten Zugriffssteuerung kann der
APIs (Application Program Interfaces) sowie einem                  Administrator Berechtigungen festlegen und vorhandene
Befehlszeilentool (Command-Line Interface, CLI).                   einrichtungsinterne Anmeldeinformationen für die
Diese APIs maximieren die Effizienz der Workflows,                 Zugriffssteuerung nutzen. Ereignisse und Änderungen
da Daten während ihres Lebenszyklus übertragen,                    werden in einem Auditprotokoll gespeichert.
abgerufen und verwendet werden, und umfassen
Global-Alliance-for-Genomics-and-Health (GA4GH)-
konforme APIs.3

Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren.                              986-2020-009-A DEU | 3
ILLUMINA CONNECTED ANALYTICS

Für jeden Benutzer wird protokolliert, wann der Zugriff             Reads in Daten umwandeln
auf die Plattform erfolgt und welche Aktionen auf der
Plattform ausgeführt werden. Dies ermöglicht die
Durchsetzung von Compliance und Verantwortlichkeit.                 ICA bietet zahlreiche Optionen für die Sekundäranalyse,
                                                                    wodurch der Reads-zu-Ergebnisse-Workflow
Offenes Format                                                      optimiert wird. Mit der Flexibilität, die die Wahl
                                                                    zwischen dem Einsatz vorgefertigter Pipelines und
ICA wurde als datentypunabhängige Plattform konzipiert              anwendungsspezifisch erstellter und konfigurierter
und eignet sich damit für die Anwendung von Multiomik-              Pipelines ermöglicht, eignet sich ICA für praktisch
Konzepten in der Forschung. Die Plattform unterstützt               jede Informatikanwendung.
die Analyse zahlreicher Datentypen, darunter Molekül-,
Klinik- und Phänotyp-Daten sowie unstrukturierte Daten              Gebrauchsfertige Optionen
wie Bilder.
                                                                    ICA umfasst leistungsstarke, sofort einsatzbereite Tools
Zusammenarbeit                                                      und Pipelines für die Datenverarbeitung wie den Zugriff
                                                                    auf die DRAGEN Bio-IT-Plattform,1 die eine schnelle,
ICA ermöglicht internationale Zusammenarbeit unter                  genaue Sekundäranalyse von Sequenzierungsdaten
Wahrung der Compliance. Daten und Tools lassen sich                 ermöglicht (Abbildung 2).
unmittelbar bereitstellen und mit anderen Anwendern
gemeinsam nutzen, wobei die Integrität der Daten sowie              Anwendungsspezifische Pipelines
der Datenschutz gewährleistet bleiben. Außerdem lassen
sich in externen Cloudquellen gespeicherte Daten zur                Bioinformatiker können vorhandene Tools aus einem
Analyse und Freigabe in die ICA-Umgebung importieren.               Docker-Image-Repository importieren oder neue
                                                                    Pipelines mithilfe von Common Workflow Language
                                                                    (CWL) und dem grafischen Pipeline-Editor erstellen
                                                                    und bearbeiten.

Abbildung 2: DRAGEN-Pipeline in ICA: Benutzer erhalten Zugriff auf gebrauchsfertige Pipelines der DRAGEN Bio-IT-Plattform für
die schnelle und genaue Reads-zu-Bericht-Sekundäranalyse.

4 | 986-2020-009-A DEU                                    Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren.
ILLUMINA CONNECTED ANALYTICS

Über die intuitive Benutzeroberfläche können                     Für praktisch alle Genomik­
Laboranwender und andere Wissenschaftler
Pipelines einfach ausführen. Der Zugang zu ICA                   anwendungen geeignet
Reference Solutions, einer Sammlung für spezifische
Anforderungen optimierbarer Pipelines, ermöglicht
Anwendern die schnellere Entwicklung von Pipelines.              Vor dem Hintergrund des Umfangs der laufenden
                                                                 Datenexploration ist die Möglichkeit zur Entwicklung und
                                                                 Anpassung von Algorithmen von höchster Bedeutung.
                                                                 Ein interaktives Programmiermodul auf Basis verbreiteter
Kontinuierliches Lernen                                          Jupyter Notebooks (Python und R) ermöglicht Daten­
                                                                 wissenschaftlern die Analyse aggregierter Daten in einer
                                                                 nahtlosen und sicheren Umgebung (Abbildung 4).
ICA automatisiert komplexe Aggregations- sowie
Integrationsschritte und schafft dadurch ein funktionales        Während der Entwicklung von Methoden und
Wissensmanagementsystem mit Daten aus Millionen von              Algorithmen können Anwender in einer Sandbox-
Proben (Abbildung 3). Die Plattform erfasst sämtliche            Umgebung eigene Pipelines entwickeln oder vorhandene
verfügbaren Datentypen, darunter Genomik-, Phänotyp-             anpassen. Hier besteht die Möglichkeit, Machine-
und Metadaten, Annotationen sowie weitere zugehörige             Learning-Modelle schnell zu erstellen, zu testen und
Informationen. Anwender können bedarfsabhängig                   fortlaufend zu optimieren. Benutzer haben Zugriff auf
eigene Datenmodelle definieren, eigene Abfragen                  zahlreiche Standardbibliotheken wie TensorFlow4 oder
erstellen und Beziehungen zwischen Datensätzen                   scikit-learn5 und können einfach eigene anwendungs­
untersuchen. Die auf der ICA-Plattform aggregierten              spezifische Bibliotheken integrieren. Beim Übergang in
Daten bilden einen Informationsschatz, in dem sich u. a.         die Produktionsphase können Anwender die Notebooks
neue Biomarker identifizieren, Patientenpopulationen             mit ICA in Tools konvertieren. Diese Tools stehen
stratifizieren und die Assay-Performance im Zeitverlauf          anschließend im ICA-Tools-Repository zur Verfügung
verfolgen lassen.                                                und werden in Produktionspipelines integriert.

Abbildung 3: ICA ermöglicht die Aggregation von Daten, Data Mining und kontinuierliches Lernen: Anwender können Zusammenhänge
zwischen Datensätzen untersuchen, um anwendungsspezifische Fragen zu beantworten.

Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren.                               986-2020-009-A DEU | 5
ILLUMINA CONNECTED ANALYTICS

Abbildung 4: Interaktive Analyse und Visualisierung: ICA unterstützt den Einsatz von Jupyter Notebooks zur visuellen Auswertung
mehrdimensionaler Daten.

Sichere Umgebung zur                                                ICA eignet sich auch für den Einsatz bei Kunden,
                                                                    die in regulierten Bereichen tätig sind, und erfüllt
Gewährleistung der Compliance                                       strenge Bestimmungen:

                                                                    • Aktuelle Datenschutzbestimmungen wie die
Sicherheit ist bei der Verarbeitung von Daten in einer                Datenschutz-Grundverordnung (DSGVO)7 und der
Cloudumgebung von höchster Bedeutung. ICA gewähr­                     Health Insurance Portability and Accountability Act
leistet mit unterschiedlichen physischen, elektronischen              (HIPAA)8
und administrativen Sicherheitsmaßnahmen, dass selbst               • Qualitätsmanagementsystem9 gemäß ISO
strengste Datenschutzbestimmungen erfüllt werden:                     (International Organization for Standardization) 13485
                                                                      und Informationssicherheitsmanagementsystem
• Von Sequenzierungsgeräten hochgeladene Daten                        gemäß ISO 2700110
  werden mit Standard AES 256 verschlüsselt und
  durch TLS (Transfer Layer Sekurit) geschützt.                     • Garantierter Datenspeicherort zur Gewährleistung
                                                                      der Einhaltung lokaler regulatorischer und
• Die in ICA enthaltenen Daten werden bei Amazon                      Compliance-Bestimmungen
  Web Services (AWS) gehostet. Hierbei kommen AWS
  Well-Architected-Best-Practices zum Einsatz, die mit
  zahlreichen branchenüblichen Sicherheitsstandards
  konform sind.6                                                    Flexible Optionen
• Der Authentifizierungsdienst ermöglicht die optionale
  Verwaltung von Benutzern und Kennwörtern der                      ICA ist in einem flexiblen Jahresabonnement erhältlich.
  Einrichtung per SAML 2.0.                                         Die Abrechnung erfolgt in iCredits anhand der Nutzung
• Auditberichte zur Nachverfolgbarkeit des Ursprungs                von Speicherplatz und Tools.11 iCredits können vorab
  von Daten.                                                        erworben oder monatlich in Rechnung gestellt werden.

6 | 986-2020-009-A DEU                                     Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren.
ILLUMINA CONNECTED ANALYTICS

Skalierbare Multiomik-Studien                                        8. US Department of Health & Human Services. Health
                                                                        Information Privacy. HHS-Website. hhs.gov/hipaa/index.html.
                                                                        Aufgerufen am 11. Januar 2021.
Die Generierung von NGS-Daten wird immer schneller                   9. International Organization for Standardization. ISO-ISO
und billiger. Daher benötigen Wissenschaftler unbedingt                 13485:2016-Medical devices—Quality management
fortschrittliche Datenplattformen, um schnell und                       systems—Requirements for regulatory purposes.
einfach von Reads zu Berichten zu gelangen. Mit                         ISO-Website. iso.org/standard/59752.html.
leistungsstarken Lösungen für die globale internationale                Aufgerufen am 11. Januar 2021.
Zusammenarbeit durch zentralen Zugriff auf verteilte                 10. International Organization for Standardization. ISO-ISO/IEC
Daten, gebrauchsfertige und anpassbare Pipelines,                       27001—Information security management. ISO-Website.
Zugriff auf Datenwissenschaftstools und eine sichere                    iso.org/isoiec-27001-information-security.html.
Umgebung, die weltweit mit gesetzlichen Vorgaben                        Aufgerufen am 11. Januar 2021.
konform ist, sorgt ICA dafür, dass Anwender das                      11. iCredits for Data Storage and Analysis | Illumina Analytics.
Potenzial ihrer Multiomik-Daten voll ausschöpfen können.                Illumina-Website. www.illumina.com/products/by-type/
                                                                        informatics-products/icredits.html. Aufgerufen am
                                                                        22. Oktober 2020.

Weitere Informationen
                                                                      Bestellinformationen
Besuchen Sie www.illumina.com/ConnectedAnalytics
                                                                      Produkt                                                 Katalog-Nr.

                                                                      ICA Enterprise                                             20038994

Quellen                                                               ICA Data Science                                           20044877

                                                                      Illumina Analytics – 1 iCredit                             20042038
1.   Illumina DRAGEN Bio-IT Platform | Variant calling & secondary
                                                                      Illumina Analytics – 1.000 iCredits                        20042039
     genomic analysis. Illumina-Website. www.illumina.com/
     products/by-type/informatics-products/dragen-bio-it-
                                                                      Illumina Analytics – 5.000 iCredits                        20042040
     platform.html. Aufgerufen am 22. Oktober 2020.
2. BaseSpace Sequence Hub | Cloud-based genomics                      Illumina Analytics – 50.000 iCredits                       20042041
     computing. Illumina-Website. www.illumina.com/basespace.
     Aufgerufen am 11. Januar 2021.                                   Illumina Analytics – 100.000 iCredits                      20042042
3. Enabling responsible genomic data sharing for the benefit
                                                                      Verbrauchsabhängige Abrechnung                             20012931
     of human health. Global Alliance for Genomics & Health-
     Website. www.ga4gh.org. Aufgerufen am 22. Oktober 2020.          a. Datenwissenschaftsfunktionen nicht enthalten.
4. TensorFlow. TensorFlow-Website. tensorflow.org.                    b. Bietet Zugriff auf Notebooks (Jupyter, R) und KI-/ML-Framework.
                                                                      c. Der Maximalbetrag entspricht dem Betrag im Angebot. Kunden erhalten
     Aufgerufen am 11. Januar 2021.                                      monatliche Rechnungen für Rechenkapazitäten, Speicherplatz und
5. scikit-learn: machine learning in Python. scikit-learn-Website.       Drittanbieter-Apps bis zum für Katalog-Nr. 20012931 gültigen Maximalbetrag.

     scikit-learn.org/stable/. Aufgerufen am 11. Januar 2021.
6. Cloud Security—Amazon Web Services (AWS). Amazon-
     Website. aws.amazon.com/security. Aufgerufen am
     22. Oktober 2020.
7.   General Data Protection Regulation (GDPR) Compliance
     Guidelines. GDPR-Website. gdpr.eu. Aufgerufen am
     11. Januar 2021.

Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren.                                              986-2020-009-A DEU              | 7
ILLUMINA CONNECTED ANALYTICS

1.800.809.4566 (USA, gebührenfrei) | +1.858.202.4566
(Tel. außerhalb der USA)
techsupport@illumina.com | www.illumina.com

© 2020 Illumina, Inc. Alle Rechte vorbehalten. Alle Marken sind
Eigentum von Illumina, Inc. bzw. der jeweiligen Eigentümer.
Spezifische Informationen zu Marken finden Sie unter
www.illumina.com/company/legal.html.
Pub.-Nr. 986-2020-009-A DEU. QB11606.

Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren.   986-2020-009-A DEU | 8
Sie können auch lesen