Illumina Connected Analytics - Wachsende Datenbestände für Erkenntnisgewinn nutzen
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
DATENBLATT Illumina Connected Analytics Wachsende Datenbestände für Erkenntnisgewinn nutzen • Optimierte Reads-zu-Ergebnisse-Lösung zur Verarbeitung von Multiomik-Workflows in großem Maßstab • Anwenderspezifische Benutzeroberflächen für individuell konfigurierte Worfkflows und fortschrittliche Datenwissenschaftstools • Sichere, im Hinblick auf Datenschutz konzipierte Umgebung Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren. 986-2020-009-A DEU | 1
ILLUMINA CONNECTED ANALYTICS Einleitung Tabelle 1: Übersicht über ICA Merkmal Vorteil Fortschritte bei der NGS-Technologie (Next-Generation Einhaltung lokaler, regionaler und globaler Sicherheit und Datenschutz Sequencing, Sequenzierung der nächsten Generation) Compliance gesetzlicher Vorgaben, des HIPPA und der DSGVO sowie der Zertifizierung nach haben die Taktfrequenz in den Biowissenschaften und ISO13485 und ISO27001 in der klinischen Forschung deutlich erhöht. Mit der Strikte Datentrennung, Verschlüsselung steigenden Sequenzierungsgeschwindigkeit und den Sicherheits mit TLS 1.2 (Übertragung) und AES 256 maßnahmen zugleich sinkenden Kosten übersteigen die Kapazitäten (Speicherung) zur Generierung von Daten die Kapazitäten zur Aktivitätsprotokoll mit Verfolgung, wer Auditpfad Gewinnung biologischer und klinischer Erkenntnisse aus wann welche Daten aufgerufen hat diesen Daten deutlich. Die Herausforderungen in Bezug Nutzung einrichtungsspezifischer Single Sign-on auf sicheres Datenmanagement, Zusammenarbeit, die (SSO) (optional) Anmeldeinformationen für die Zugriffskontrolle Analyse komplexer Daten und die Auswertung von Daten in großem Maßstab lassen sich nur bewältigen, wenn Computing- Geringere Kosten, indem nur Computing- Ressourcen Ressourcen in der Pipeline-Engine sich der Schritt von der Generierung zur Interpretation on demand abgerechnet werden der Daten einfach vollziehen lässt. Illumina Connected Resourcing Skalierung von Cloudspeicherplatz Analytics (ICA) wurde speziell für das Management, Skalierung und Computing-Kapazitäten je nach on demand die Analyse und die Interpretation dieser enormen aktuellem Bedarf Datenmengen entwickelt. Plattform- und Anzeigen des Ressourcenbedarfs zur Nutzungs- effizienten Übersicht, Verwaltung und Dashboard Anforderungsprognose Bei ICA handelt es sich um eine umfassende cloud Präzise Datenschutzeinstellungen durch Projekt- und die Verwaltung von Benutzerzugriff basierte Plattform für Datenmanagement und -analyse, Benutzerverwaltung und -aktivität Verwaltung über die Wissenschaftler große Mengen von Multiomik- Weltweite Zusammenarbeit in großem Daten in einer sicheren, skalierbaren und flexiblen Gemeinsame Maßstab dank der Überwindung von Nutzung von Daten Umgebung sammeln, untersuchen und teilen können Datensilos (Abbildung 1, Tabelle 1). Vorteile von ICA: Kostensenkung durch die Archivierung Datenarchiv nicht verwendeter Daten in günstigeren Speicherebenen • Direkte Integration in den Datengenerierungs- Workflow, einschließlich Illumina-Sequenziersystemen Direkte Integration Unmittelbare Übertragung der Daten von Sequenzier von Illumina-Sequenziersystemen • Leistungsstarke Sekundäranalyse auf der DRAGEN™ systemen Bio-IT-Plattform1 Anwenderfreundlichkeit Grafischer Erstellung von Pipelines ohne Pipeline-Builder Programmierung • Skalierbare Aggregation und sichere Speicherung von Daten Tools und Pipelines Nutzung von vorgefertigten Pipelines und Drittanbieter-Tools • Dynamische, interaktive Datenwissenschaftsumge Programmgesteuerte Verknüpfung bung für Machine Learning und künstliche Intelligenz APIs und CLI der Plattform mit vom Anwender bevorzugten Tools „Bring your own Optimierter Workflow Verknüpfung der privaten Cloud Cloud“-Konto Erstellung dynamischer Diagramme und Datenvisualisierung interaktiver Web-Apps zur Darstellung von Daten mit R- und Python-Paketen Bei ICA handelt es sich um eine zentrale Komponente Programmierung von Pipelines in einer für Labore, die Illumina-Sequenziersysteme für NGS- Unterstützung für gemeinsamen Workflow-Sprache und Fortschrittliche Tools Docker und CWL Studien nutzen. Dank der Vorteile, die die Flexibilität der einfacher Start von Analysen in der Cloud Rechenkapazitäten beim Cloud-Computing bietet, eignet Programmgesteuerter Zugriff auf Tools GA4GH-konforme sich ICA mit derselben Architektur für Anwendungen RESTful-APIs und Daten sowie Kompatibilität mit anderen Softwareumgebungen jeden Umfangs – vom gelegentlichen Screening Zehn tausender Zellen in komplexen Einzelzellprojekten bis JupyterLab- Ausführung erweiterter Datenanalysen: Erstellen und Trainieren von KI-/ hin zur Gesamtgenomsequenzierung bei Populationen. Integration ML-Modellen mit R und Python Über BaseSpace™ Sequence Hub2 können Anwender Datenaggregation Datenabfragen auf Populationsebene ihre Sequenzierungsplattform und entsprechende und -abfrage mithilfe von SQL Daten direkt in die ICA-Umgebung integrieren. 2 | 986-2020-009-A DEU Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren.
ILLUMINA CONNECTED ANALYTICS Erweiterbarkeit durch APIs Sekundäranalyse Illumina® Connected Analytics Datenbank- Generierung Sequenziersystem management eines Probenblatts und -abfrage im LIMS Sichere Cloudumgebung Datenwissenschaft Cloudprozess Abbildung 1: ICA bildet die Grundlage für Datenmanagement und -analyse. Dank der automatisierten Workflows werden Daten Datenmanagement und Steuerung während der Generierung in Echtzeit vom Gerät in die Cloud übertragen. Dadurch sind die Reads so schnell wie möglich für die Analyse verfügbar. Mir der steigenden Menge generierter Daten steigt auch der Bedarf an Infrastruktur für die Freigabe, Wieder Sobald sich die Daten in der ICA-Umgebung befinden, verwendung und Integration von Daten in der Scientific können sie, je nach angegebenem Workflow, Community, um den Wert einzelner Datensätze zu automatisch mit gebrauchsfertigen DRAGEN- oder erhöhen. ICA ermöglicht dies mit zahlreichen Funktionen anwenderspezifischen Pipelines analysiert werden. für die einfache Umsetzung von Best Practices für das Der breite Umfang an Analyseoptionen reicht von Datenmanagement. der Qualitätssicherung bis hin zu Datenaggregation und fortschrittlichen Datenwissenschaftstools für die Zugriffssteuerung schnelle, skalierbare Datenverarbeitung. ICA bietet eine erweiterbare Plattform mit zahlreichen RESTful- Dank der differenzierten Zugriffssteuerung kann der APIs (Application Program Interfaces) sowie einem Administrator Berechtigungen festlegen und vorhandene Befehlszeilentool (Command-Line Interface, CLI). einrichtungsinterne Anmeldeinformationen für die Diese APIs maximieren die Effizienz der Workflows, Zugriffssteuerung nutzen. Ereignisse und Änderungen da Daten während ihres Lebenszyklus übertragen, werden in einem Auditprotokoll gespeichert. abgerufen und verwendet werden, und umfassen Global-Alliance-for-Genomics-and-Health (GA4GH)- konforme APIs.3 Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren. 986-2020-009-A DEU | 3
ILLUMINA CONNECTED ANALYTICS Für jeden Benutzer wird protokolliert, wann der Zugriff Reads in Daten umwandeln auf die Plattform erfolgt und welche Aktionen auf der Plattform ausgeführt werden. Dies ermöglicht die Durchsetzung von Compliance und Verantwortlichkeit. ICA bietet zahlreiche Optionen für die Sekundäranalyse, wodurch der Reads-zu-Ergebnisse-Workflow Offenes Format optimiert wird. Mit der Flexibilität, die die Wahl zwischen dem Einsatz vorgefertigter Pipelines und ICA wurde als datentypunabhängige Plattform konzipiert anwendungsspezifisch erstellter und konfigurierter und eignet sich damit für die Anwendung von Multiomik- Pipelines ermöglicht, eignet sich ICA für praktisch Konzepten in der Forschung. Die Plattform unterstützt jede Informatikanwendung. die Analyse zahlreicher Datentypen, darunter Molekül-, Klinik- und Phänotyp-Daten sowie unstrukturierte Daten Gebrauchsfertige Optionen wie Bilder. ICA umfasst leistungsstarke, sofort einsatzbereite Tools Zusammenarbeit und Pipelines für die Datenverarbeitung wie den Zugriff auf die DRAGEN Bio-IT-Plattform,1 die eine schnelle, ICA ermöglicht internationale Zusammenarbeit unter genaue Sekundäranalyse von Sequenzierungsdaten Wahrung der Compliance. Daten und Tools lassen sich ermöglicht (Abbildung 2). unmittelbar bereitstellen und mit anderen Anwendern gemeinsam nutzen, wobei die Integrität der Daten sowie Anwendungsspezifische Pipelines der Datenschutz gewährleistet bleiben. Außerdem lassen sich in externen Cloudquellen gespeicherte Daten zur Bioinformatiker können vorhandene Tools aus einem Analyse und Freigabe in die ICA-Umgebung importieren. Docker-Image-Repository importieren oder neue Pipelines mithilfe von Common Workflow Language (CWL) und dem grafischen Pipeline-Editor erstellen und bearbeiten. Abbildung 2: DRAGEN-Pipeline in ICA: Benutzer erhalten Zugriff auf gebrauchsfertige Pipelines der DRAGEN Bio-IT-Plattform für die schnelle und genaue Reads-zu-Bericht-Sekundäranalyse. 4 | 986-2020-009-A DEU Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren.
ILLUMINA CONNECTED ANALYTICS Über die intuitive Benutzeroberfläche können Für praktisch alle Genomik Laboranwender und andere Wissenschaftler Pipelines einfach ausführen. Der Zugang zu ICA anwendungen geeignet Reference Solutions, einer Sammlung für spezifische Anforderungen optimierbarer Pipelines, ermöglicht Anwendern die schnellere Entwicklung von Pipelines. Vor dem Hintergrund des Umfangs der laufenden Datenexploration ist die Möglichkeit zur Entwicklung und Anpassung von Algorithmen von höchster Bedeutung. Ein interaktives Programmiermodul auf Basis verbreiteter Kontinuierliches Lernen Jupyter Notebooks (Python und R) ermöglicht Daten wissenschaftlern die Analyse aggregierter Daten in einer nahtlosen und sicheren Umgebung (Abbildung 4). ICA automatisiert komplexe Aggregations- sowie Integrationsschritte und schafft dadurch ein funktionales Während der Entwicklung von Methoden und Wissensmanagementsystem mit Daten aus Millionen von Algorithmen können Anwender in einer Sandbox- Proben (Abbildung 3). Die Plattform erfasst sämtliche Umgebung eigene Pipelines entwickeln oder vorhandene verfügbaren Datentypen, darunter Genomik-, Phänotyp- anpassen. Hier besteht die Möglichkeit, Machine- und Metadaten, Annotationen sowie weitere zugehörige Learning-Modelle schnell zu erstellen, zu testen und Informationen. Anwender können bedarfsabhängig fortlaufend zu optimieren. Benutzer haben Zugriff auf eigene Datenmodelle definieren, eigene Abfragen zahlreiche Standardbibliotheken wie TensorFlow4 oder erstellen und Beziehungen zwischen Datensätzen scikit-learn5 und können einfach eigene anwendungs untersuchen. Die auf der ICA-Plattform aggregierten spezifische Bibliotheken integrieren. Beim Übergang in Daten bilden einen Informationsschatz, in dem sich u. a. die Produktionsphase können Anwender die Notebooks neue Biomarker identifizieren, Patientenpopulationen mit ICA in Tools konvertieren. Diese Tools stehen stratifizieren und die Assay-Performance im Zeitverlauf anschließend im ICA-Tools-Repository zur Verfügung verfolgen lassen. und werden in Produktionspipelines integriert. Abbildung 3: ICA ermöglicht die Aggregation von Daten, Data Mining und kontinuierliches Lernen: Anwender können Zusammenhänge zwischen Datensätzen untersuchen, um anwendungsspezifische Fragen zu beantworten. Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren. 986-2020-009-A DEU | 5
ILLUMINA CONNECTED ANALYTICS Abbildung 4: Interaktive Analyse und Visualisierung: ICA unterstützt den Einsatz von Jupyter Notebooks zur visuellen Auswertung mehrdimensionaler Daten. Sichere Umgebung zur ICA eignet sich auch für den Einsatz bei Kunden, die in regulierten Bereichen tätig sind, und erfüllt Gewährleistung der Compliance strenge Bestimmungen: • Aktuelle Datenschutzbestimmungen wie die Sicherheit ist bei der Verarbeitung von Daten in einer Datenschutz-Grundverordnung (DSGVO)7 und der Cloudumgebung von höchster Bedeutung. ICA gewähr Health Insurance Portability and Accountability Act leistet mit unterschiedlichen physischen, elektronischen (HIPAA)8 und administrativen Sicherheitsmaßnahmen, dass selbst • Qualitätsmanagementsystem9 gemäß ISO strengste Datenschutzbestimmungen erfüllt werden: (International Organization for Standardization) 13485 und Informationssicherheitsmanagementsystem • Von Sequenzierungsgeräten hochgeladene Daten gemäß ISO 2700110 werden mit Standard AES 256 verschlüsselt und durch TLS (Transfer Layer Sekurit) geschützt. • Garantierter Datenspeicherort zur Gewährleistung der Einhaltung lokaler regulatorischer und • Die in ICA enthaltenen Daten werden bei Amazon Compliance-Bestimmungen Web Services (AWS) gehostet. Hierbei kommen AWS Well-Architected-Best-Practices zum Einsatz, die mit zahlreichen branchenüblichen Sicherheitsstandards konform sind.6 Flexible Optionen • Der Authentifizierungsdienst ermöglicht die optionale Verwaltung von Benutzern und Kennwörtern der ICA ist in einem flexiblen Jahresabonnement erhältlich. Einrichtung per SAML 2.0. Die Abrechnung erfolgt in iCredits anhand der Nutzung • Auditberichte zur Nachverfolgbarkeit des Ursprungs von Speicherplatz und Tools.11 iCredits können vorab von Daten. erworben oder monatlich in Rechnung gestellt werden. 6 | 986-2020-009-A DEU Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren.
ILLUMINA CONNECTED ANALYTICS Skalierbare Multiomik-Studien 8. US Department of Health & Human Services. Health Information Privacy. HHS-Website. hhs.gov/hipaa/index.html. Aufgerufen am 11. Januar 2021. Die Generierung von NGS-Daten wird immer schneller 9. International Organization for Standardization. ISO-ISO und billiger. Daher benötigen Wissenschaftler unbedingt 13485:2016-Medical devices—Quality management fortschrittliche Datenplattformen, um schnell und systems—Requirements for regulatory purposes. einfach von Reads zu Berichten zu gelangen. Mit ISO-Website. iso.org/standard/59752.html. leistungsstarken Lösungen für die globale internationale Aufgerufen am 11. Januar 2021. Zusammenarbeit durch zentralen Zugriff auf verteilte 10. International Organization for Standardization. ISO-ISO/IEC Daten, gebrauchsfertige und anpassbare Pipelines, 27001—Information security management. ISO-Website. Zugriff auf Datenwissenschaftstools und eine sichere iso.org/isoiec-27001-information-security.html. Umgebung, die weltweit mit gesetzlichen Vorgaben Aufgerufen am 11. Januar 2021. konform ist, sorgt ICA dafür, dass Anwender das 11. iCredits for Data Storage and Analysis | Illumina Analytics. Potenzial ihrer Multiomik-Daten voll ausschöpfen können. Illumina-Website. www.illumina.com/products/by-type/ informatics-products/icredits.html. Aufgerufen am 22. Oktober 2020. Weitere Informationen Bestellinformationen Besuchen Sie www.illumina.com/ConnectedAnalytics Produkt Katalog-Nr. ICA Enterprise 20038994 Quellen ICA Data Science 20044877 Illumina Analytics – 1 iCredit 20042038 1. Illumina DRAGEN Bio-IT Platform | Variant calling & secondary Illumina Analytics – 1.000 iCredits 20042039 genomic analysis. Illumina-Website. www.illumina.com/ products/by-type/informatics-products/dragen-bio-it- Illumina Analytics – 5.000 iCredits 20042040 platform.html. Aufgerufen am 22. Oktober 2020. 2. BaseSpace Sequence Hub | Cloud-based genomics Illumina Analytics – 50.000 iCredits 20042041 computing. Illumina-Website. www.illumina.com/basespace. Aufgerufen am 11. Januar 2021. Illumina Analytics – 100.000 iCredits 20042042 3. Enabling responsible genomic data sharing for the benefit Verbrauchsabhängige Abrechnung 20012931 of human health. Global Alliance for Genomics & Health- Website. www.ga4gh.org. Aufgerufen am 22. Oktober 2020. a. Datenwissenschaftsfunktionen nicht enthalten. 4. TensorFlow. TensorFlow-Website. tensorflow.org. b. Bietet Zugriff auf Notebooks (Jupyter, R) und KI-/ML-Framework. c. Der Maximalbetrag entspricht dem Betrag im Angebot. Kunden erhalten Aufgerufen am 11. Januar 2021. monatliche Rechnungen für Rechenkapazitäten, Speicherplatz und 5. scikit-learn: machine learning in Python. scikit-learn-Website. Drittanbieter-Apps bis zum für Katalog-Nr. 20012931 gültigen Maximalbetrag. scikit-learn.org/stable/. Aufgerufen am 11. Januar 2021. 6. Cloud Security—Amazon Web Services (AWS). Amazon- Website. aws.amazon.com/security. Aufgerufen am 22. Oktober 2020. 7. General Data Protection Regulation (GDPR) Compliance Guidelines. GDPR-Website. gdpr.eu. Aufgerufen am 11. Januar 2021. Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren. 986-2020-009-A DEU | 7
ILLUMINA CONNECTED ANALYTICS 1.800.809.4566 (USA, gebührenfrei) | +1.858.202.4566 (Tel. außerhalb der USA) techsupport@illumina.com | www.illumina.com © 2020 Illumina, Inc. Alle Rechte vorbehalten. Alle Marken sind Eigentum von Illumina, Inc. bzw. der jeweiligen Eigentümer. Spezifische Informationen zu Marken finden Sie unter www.illumina.com/company/legal.html. Pub.-Nr. 986-2020-009-A DEU. QB11606. Nur für Forschungszwecke. Nicht zur Verwendung in Diagnoseverfahren. 986-2020-009-A DEU | 8
Sie können auch lesen