Storage für VMware vSphere planen - Workshop: 5 I 15 Sonderdruck für Login Consultants
←
→
Transkription von Seiteninhalten
Wenn Ihr Browser die Seite nicht korrekt rendert, bitte, lesen Sie den Inhalt der Seite unten
5 I 15 Sonderdruck für Login Consultants Workshop: Storage für VMware vSphere planen www.it-administrator.de
SCHWERPUNKT I SAN für VMware Workshop Storage für VMware vSphere planen SANdkastenspiele von Bertram Wöhrmann Auch wenn immer mehr Unternehmen zur Anbindung virtueller Infrastrukturen auf IP setzen, ist ein eigenes SAN die schon immer unterstützte und von VMware empfohlene Vorgehensweise. Die in einem SAN zum Einsatz kommende Technik ist zwar mittlerweile erprobt, trotzdem haben manche Administratoren bei der Einrichtung eines Storage-Netzwerkes Probleme. Dieser Workshop erklärt, über was Sie sich bereits vor dem Aufbau eines SAN Gedanken machen sollten und wie die einzelnen Implementierungsschritte dann in der Praxis aussehen. Qu elle :S vet lan aG uca Vor dem Studium der Hersteller-Websei- ders dann eine Rolle, wenn zwei weiter lo– 12 3R ten sollten Sie zunächst einmal darauf auseinanderliegende Standorte mitei- F schauen, welche vSphere-Version zum nander verbunden werden sollen. ei der Auswahl der Hardwarekom- Einsatz kommt. Das hängt damit zusam- B ponenten im SAN-Umfeld ist es men, dass es einen richtigen End-to-End- Aus Topologie-Sicht gibt es zwei mögliche wichtig, die Hardware Compatibility List Support für 16 GBit-Fibre Channel erst Architekturen: den Arbitrated Loop und (HCL) im Auge zu behalten – und zwar seit vSphere 5.5 gibt. Beachten Sie dazu die Switched Fabric, wobei Letztere die allumfänglich bei den Herstellern für Ser- auch die Tabelle "Von vSphere unterstütz- mit Abstand weitest verbreitete Variante ver, FC-Karten, SAN-Komponenten und te SAN-Bandbreiten". ist. Arbitrated Loop wird von VMware nur Storage. Hier kann es Abhängigkeiten bis in Einzelfällen unterstützt, denn er gehört hinunter zur Firmware geben, die peinlich Grundsätzlich fasst ein SAN-Netzwerk zu den älteren Architekturen. Wie dem genau einzuhalten sind. Andernfalls kann unterschiedliche Komponenten zusam- Namen zu entnehmen ist, werden bei die- es zu Problemen in der Infrastruktur kom- men – in der Regel Server, Massenspei- ser Technologie alle Komponenten in ei- men, die dann wieder Schwierigkeiten cher und Backup-Komponenten. Ver- nem Ring verschaltet. Bei der Fabric mit der Unterstützung beim Support-Call antwortlich für die Konnektivität sind kommen FC-Switche zum Einsatz, um nach sich ziehen. zum einen die FC-Karten in der unter- eine sternförmige Konfiguration zu rea- schiedlichen Hardware und auf der an- lisieren. Bei der Minimalkonfiguration Gründliche SAN-Planung deren Seite die FC-Switche als zentrale sollten mindestens zwei Switche Verwen- Vor dem Betrieb steht die Planung der Schaltstellen. In Abhängigkeit der un- dung finden, damit im Falle einer Wartung Infrastruktur und da sind neben der HCL terschiedlichen Kabellängen sind unter beziehungsweise eines Ausfalls die Server auch diverse andere Faktoren zu berück- Umständen unterschiedliche optische noch mit den verbundenen SAN-Kom- sichtigen. Zu Beginn steht die Auswahl Module nötig. Das Thema spielt beson- ponenten kommunizieren können. der passenden Topologie, gefolgt von der Auswahl der Switch-Komponenten und dann der eigentlichen Storage-Systeme. Von vSphere unterstützte SAN-Bandbreiten Die Basisanschaffung ist der eine Teil, aber eine realistische Wachstumsprognose ist vSphere-Version Unterstützte SAN-Bandbreite für die Planung genauso wichtig, damit vSphere 5.0 16 GBit-Karten werden zwar unterstützt, die Kommunikation zwischen die ausgewählten Komponenten nicht den Komponenten erfolgt jedoch nur über 8 GBit. vorzeitig an ihre Grenzen stoßen bezie- vSphere 5.1 Unterstützung für 16 GBit-Karten, die volle Bandbreite wird aber nur durch hungsweise eine Erweiterung nicht schon die Bündelung von 8 GBit-Verbindungen innerhalb des Pfads erreicht. geplant werden muss, bevor der neue Sto- seit vSphere 5.5 16 GBit-Karten werden voll unterstützt. rage vollständig in Betrieb ist. 2 Auszug aus IT-Administrator Mai 2015 www.it-administrator.de
SAN für VMware I SCHWERPUNKT Als weiteres Glied in der Kette findet sich die vSphere Storage API – Data Protecti- on. Dieses Modul ist die API für die Da- tensicherung. Es geht also um Themen wie eine konsistente Datensicherung, Block- und File-Level-Backup sowie in- krementelle Sicherungen.Viele Hersteller von Backup-Software nutzen bereits diese Schnittstelle. Bei der vSphere Storage API – IO Filtering (VAIO) handelt es sich um eine Tech Preview, die im Laufe des Jahres mit Funktionen gefüllt werden soll – etwa der Möglichkeit, den I/O-Stream pro VM beziehungsweise pro virtueller Festplatte zu beeinflussen, zum Beispiel durch Ca- ching oder Replikation. Varianten der Storage-Anbindung Bild 1: Ist das SAN nach Switched Fabric aufgebaut, kommt eine sternförmige Topologie zum Einsatz. Nun müssen Sie eine Entscheidung tref- fen, wie die Anbindung am Storage er- Eine API für jeden Zweck vSphere 6 eingeführt wurden, kommt die folgen soll. Dabei stehen Ihnen drei mög- Bei der Auswahl der Storage-Boxen soll- vSphere Storage API for Storage Aware- liche Varianten zur Verfügung: ten Sie unbedingt darauf achten, dass die ness (VASA) zum Einsatz. Sie ist für un- - Active / Active vSphere Storage API unterstützt wird. terschiedliche Aufgabenbereiche zuständig, - Active / Passive Grundsätzlich dient die Schnittstelle der übermittelt etwa der vSphere-Umgebung - Pseudo Active / Active oder auch Optimierung der Kommunikation zwi- Informationen vom Storage. Auch der ak- Asymmetric Active / Active schen Storage und dem vSphere Host be- tuelle Zustand der Datenbereiche wird ziehungsweise dem vCenter-Server als übertragen, etwa deren Auslastung. Die Active / Active-Anbindung ist optimal auslösendes Frontend. aus Sicht der Geschwindigkeit und der Weiterhin bildet VASA die Basis für die optimierten Bandbreite. Die Daten wer- Bei der vSphere Storage API for Array In- Nutzung von vVols und Virtual SAN den über alle angebundenen Leitungen tegration (VAAI) handelt es sich um eine (VSAN). Zudem lassen sich damit Status gesendet. Im Falle eines Problems im Be- Schnittstelle, die einen Offload-Prozess für wie Replikation, Deduplizierung, Provi- reich der Verbindung zwischen Host und unterschiedliche Vorgänge ermöglicht. sionierungsart und RAID-Level auslesen. Storage fällt lediglich ein Pfad aus. Es lässt Das bedeutet, dass der vSphere-Host die Die Funktionen Storage DRS und das Sto- sich somit eine Kontroller-Redundanz Durchführung bestimmter Aufgaben an rage Policy-Based Management (SPBM) auf Host- und auf Storage-Seite realisie- den Storage ausgliedert und selbst nur als nutzen ebenfalls diese Erweiterung. ren. Bei der Nutzung von mindestens zwei Auftraggeber agiert, wie zum Beispiel Block-Kopiervorgänge, das Nullen von Datenbereichen, die Allokierung von un- genutztem Speicher und die Warnung vor fehlendem Plattenplatz bei Datenbereichen, die mit Thin Provisioning arbeiten. Auch wenn wir in diesem Workshop primär blockbasierten Storage betrachten, sei der Hinweis erlaubt, dass auch NAS-Systeme diese Schnittstelle unterstützen. Vorgänge wie Storage vMotion oder das Klonen von virtuellen Maschinen sind nur einige der möglichen Funktionen. Dabei ist immer zu beachten, dass die beteiligten LUNs eine identische Blockgröße haben müssen. Für viele weitergehende Funktionen wie etwa die Virtual Volumes (vVols), die mit Bild 2: VAAI stellt Funktionen wie Storage vMotion und Thin Provisioning sicher. www.it-administrator.de Auszug aus IT-Administrator Mai 2015 3
SCHWERPUNKT I SAN für VMware zwar abgebildet, aber es kann nur mit einem manuellen Loadbalancing gear- beitet werden. Bei der dritten Variante, Pseudo Active / Active, handelt es sich um eine Mischva- riante der ersten beiden Anbindungsarten. Es gibt auch hier einen Owner der LUN. Der zugehörige Storage-Prozessor kann wesentlich schneller auf die LUN zugrei- fen als über den zweiten Storage-Prozes- sor, was zu Engpässen führen kann, denn der Zugriff wird dann immer über den Owner umgeleitet. Der Zugriff kann sich somit schwierig gestalten. Hier unterstützen unter Umständen Multipathing-Produkte vom Storage- Hersteller. Bei den neueren Versionen von vSphere greift an dieser Stelle der Asymmetric LUN Unit Access (ALUA) ein. ALUA übermittelt den Status der Pfade und hilft somit, den besten zur Verfügung stehenden Weg zu nutzen. Mögliche Status sind: - active / optimized - active / unoptimized - standby - unavailable Trennung durch Zoning Die Verkabelung sollte so erfolgen, dass der Ausfall einer Komponente tolerierbar ist. Bei einer Bestückung mit zwei FC- Karten pro Server wird jeweils eine Karte mit einem FC-Switch verbunden. Jeder FC-Switch wiederum hat mindestens ei- Bild 3: Active / Active- und Active / Passive-Anbindung im Vergleich: ne Verbindung zu jedem Storage-Prozes- Für eine optimierte Bandbreite sollten Sie auf Active / Active setzen. sor der Storage-Box. So ist gewährleistet, FC-Switchen ist dies eine absolut krisen- feste Konfiguration. Mögliche Multipathing Policies Bei einer Active / Passive-Anbindung Funktionsweise Empfehlung ist die Konnektivität innerhalb des Sto- rage vereinfacht abgebildet. Somit kann Most Recently Der angegebene Pfad wird genutzt, solange Active / Passive-Storage-Systeme nur ein Storage-Prozessor auf eine Used (MRU) er zur Verfügung steht. Fällt er aus, wird der RAID-Gruppe zugreifen. Der aktive Ausweichpfad genutzt und dieser bleibt aktiv, Storage-Prozessor ist dann auch der bis er selbst ausfällt. Owner der auf der RAID-Gruppe ab- Fixed Der angegebene Pfad wird genutzt, solange er Manuelles Laodbalancing gebildeten LUNs. Im Falle eines Fehlers zur Verfügung steht. Fällt er aus, wird der Aus- übernimmt dann der passive Storage- weichpfad genutzt. Steht aber der erste Pfad wieder zur Verfügung, wird dieser wieder aktiv. Controller die Aufgaben. Die Übergabe erfolgt in einem sogenannten Trespas- Round-Robin Anhand des gemessenen Datendurchsatzes und Active / Active-Konfigurationen sing-Vorgang, der einige Sekunden dau- der Anzahl der Datenoperationen wird der Pfad immer aktuell gewählt ern kann. Eine Ausfallsicherheit ist damit 4 Auszug aus IT-Administrator Mai 2015 www.it-administrator.de
SAN für VMware I SCHWERPUNKT dass Wartung und Betrieb problemlos lau- Wie die Tabelle "Mögliche Multipathing ßere Mengen an Plattenplatzbedarf ent- fen. Zur Trennung von unterschiedlichen Policies" zeigt, liefert der Hersteller stehen. Werden virtuelle Festplatten "thin Systemen im SAN-Umfeld wird emp- selbst drei Policies mit. Zusätzlich zu provisioned" bereitgestellt, ist die Beob- fohlen, ein Zoning vorzunehmen. Zoning den herstellerseitigen Policies können achtung des Plattenplatzes noch wich- beschreibt die Zusammenfassung von Sie auch Drittanbieter-Module integrie- tiger. Meldet ein dort abgelegtes System Ports oder von SAN-Komponenten. Der ren, die dann den Datenverkehr zum den Bedarf an größeren Datenmengen, grundsätzliche Unterschied besteht darin, Storage optimal regeln. so kann eine LUN schon mal an ihre dass sich im Falle eines Port-Zonings eine Grenzen geraten. angeschlossene Komponente im Fehlerfall Besser mit Luft nach oben austauschen lässt, ohne Änderungen am Aus administrativer Sicht ist im SAN- Ein weiteres wichtiges Thema sind alte Zoning vornehmen zu müssen. In Bezug Umfeld nicht so viel zu tun. Der SAN- oder verwaiste Snapshots. Hier kann auch auf die Sicherheit ist das nicht optimal, Administrator wird seine Systeme im sehr schnell der Plattenplatz knapp wer- weil es dadurch die Möglichkeit gibt, eine Blick haben und er muss selbstverständ- den. Bedenken Sie stets, dass es sich bei Komponente relativ ungesehen ins FC- lich darauf achten, zu Beginn das Zoning einem Snapshot nicht um eine dauerhafte Netzwerk einbinden zu können. korrekt einzurichten, ebenso wie bei der Datensicherung handelt. Achten sie kon- Neuaufnahme von Systemen. Die opti- tinuierlich darauf, Snapshots wieder zu Bei einem Zoning über die SAN-Kom- male Bereitstellung der LUN setzt vo- löschen. Eine regelmäßige Kontrolle ist ponenten werden die World Wide raus, dass in einer RAID-Gruppe nicht gerade dann wichtig, wenn eine Daten- Numbers (WWN) der Komponenten LUNs mit identischer Auslastungs-Cha- sicherungssoftware genutzt wird, die ins Zoning eingetragen. WWNs sind rakteristik abgebildet werden. Damit ist Snapshots als Hilfsmittel nutzt. Zur regel- quasi die MAC-Adressen des SANs. gemeint, nicht nur Datenbereiche mit mäßigen Kontrolle bieten sich unter- Dies bedeutet, dass die beteiligten Kom- hoher Last auf der gleichen RAID- schiedliche Tools an. Alternativ hilft auch ponenten personalisiert eingetragen Gruppe zu lokalisieren. Hier ist eine ge- ein PowerCLI-Befehl: werden. Im Falle eines Tauschs einer sunde Mischung sehr wichtig und ge- SAN-Komponente sind auch die neuen währleistet einen entspannten Betrieb. get-vm get-snapshot format-list WWNs ins Zoning zu hinterlegen, da- Natürlich sind auch stets die Multipa- out-file snapshots.txt mit weiterhin eine Kommunikation ge- thing- und Loadbalancing-Policies nach währleistet ist. VMware empfiehlt das Herstellervorgaben umzusetzen. Treten grundsätzliche Probleme auf, ist Single-Initiator-Zoning, um zu verhin- der VMware-Administrator nicht auf sich dern, dass zu viele Broadcasts im Netz Behalten Sie stets den Füllgrad der Da- alleine gestellt. Bevor er mit den Sto- verschickt werden. In diesem Fall ist es tenbereiche im Auge. Häufig wird bei rage-Kollegen spricht, hat er selbst die notwendig, für jeden Initiator und deren der Mengenberechnung das Swapfile für Möglichkeit, sich mit unterschiedlichen Target(s) eine eigene Zone einzurichten. den nicht fest reservierten Arbeitsspei- VMware-Tools einen Überblick zu ver- So verhindern Sie, dass bei einer feh- cher der VM berücksichtigt. Je nach An- schaffen. So ist es möglich, den Kollegen lerhaften Komponente das gesamte FC- zahl der virtuellen Maschinen und der aus der Storage-Abteilung eine aussage- Netz behindert wird. Größe des Arbeitsspeichers können grö- kräftige Meldung weiterzugeben, die die Behebung des Fehlers enorm erleichtert. Monitoring in Grundzügen Im Webclient lassen sich auf einfache Art und Weise Informationen sammeln. So wird dort angezeigt, wenn der Füllgrad der Datenbereiche eine definierte Schwel- le überschreitet. Ursache kann ungeplantes Plattenwachstum sein, basierend auf den oben angeführten Gründen. Die Perfor- mance Charts im Client können ebenfalls eine erste Näherung für den Problemherd geben. Hier sollten Sie Ihr Augenmerk auf die Werte für den Durchsatz am HBA und am Storage legen. Nächstes Einsprungziel sind die Logfiles von VMware. Hier sollten Sie kontrollie- ren, ob es Fehlermeldungen oder War- Bild 4: Bei der Auswertung mit Esxtop ist es entscheidend, die Parameter richtig auszuwählen und zu interpretieren. nungen gibt, die auf ein Problem im www.it-administrator.de Auszug aus IT-Administrator Mai 2015 5
SCHWERPUNKT I SAN für VMware SCSI-Umfeld hinweisen. Das Logfile fin- Millisekunden oder mehr, liegt kein op- die dort ausgeführten Befehle exklusiven det sich hier unter /var/log/vmkernel.log. timales Verhalten vor. In den Advanced Zugriff auf die LUN benötigen.VMware Settings bei VMware sollten Sie dann die hat die Anzahl der Reservierungen über Am meisten Informationen liefert das Tool Werte für die Queue Depth Parameter die letzten vSphere- beziehungsweise esxtop von VMware. Sie rufen es übli- und die Failover Policy kontrollieren. Zu- vmfs-Versionen drastisch reduziert. Aus cherweise über die Kommandozeile auf. sätzlich kann auch eine falsche Firmware diesem Grund hat der Wert CONS/s kei- Wer Berührungsängste mit weißer Schrift des Adapters die Ursache des Problems ne allzu große Relevanz mehr. Sollten je- in schwarzen Fenstern hat, kann alternativ sein.Viele Storage-Hersteller machen hier doch mehr als 20 Reservierungen pro Se- das Werkzeug visualEsxtop nutzen, das Vorgaben, die Sie einhalten sollten, es sei kunde angezeigt werden, ist es sinnvoll, sich auf der VMware Fling-Webseite [1] denn der VMware- oder der Storage-Sup- hier weiter zu kontrollieren, welche Ak- findet. Mit der Software erfolgt die Ver- port gibt im Rahmen eines Support-Calls tionen diesen Zustand ausgelöst haben. arbeitung der esxtop-Werte in einer GUI. andere Werte heraus. QAVG gibt die La- Für die Fehleranalyse im Bereich des Sto- tenz in der abzuarbeitenden Queue an. Alle hier erklärten Werte werden pro Sto- rages ist primär der Disk Path relevant. Der Wert ist in KAVG bereits enthalten. rage-Adapter angegeben, sodass sich auf- tretende Probleme, sollten sie nicht globaler Latenzzeiten beobachten GAVG ist die Summation der Werte Natur sein, schnell auch einem Adapter Es gibt unterschiedliche Werte, die eine DAVG und KAVG, der Wert sollte in beziehungsweise Pfad zuordnen lassen. Relevanz für den Storage haben. Begin- Summe 25 Millisekunden nicht über- nen sollten Sie mit den Summenwerten schreiten. Drei weitere Werte geben Aus- Fazit "*/cmd". Erst wenn sich an dieser Stelle kunft über die Kommunikation zwischen Schon mit einfachen VMware-Bordmit- Abweichungen zeigen, sollten Sie die dem vSphere Host und dem angeschlos- teln ist es möglich, einen Fehler im Be- Werte getrennt nach lesen "*/rd" bezie- senen Storage. Die weiteren Werte bezie- reich des Storage zu isolieren. Dadurch hungsweise schreiben "*/wr" begutach- hen sich auf die Zeiteinheit Sekunden. können Sie die zuständigen Kollegen mit ten. Die Angaben für DAVG, KAVG und Eine Erhöhung der Anzahl von Komman- genauen Informationen für die Fehler- GAVG sind Latenzzeiten. Dabei ist DAVG do-Resets kann ebenfalls Fehlersituationen suche versorgen. Dies verringert die Pro- die durchschnittliche Antwortzeit in Mil- beschreiben. RESETS/s sollte den Wert blemlösungszeiten und stellt schnell den lisekunden pro abgesetzten Befehl. Wir "1" nicht übersteigen. Mit ABRTS/s zeigt gewünschten Betriebsstatus wieder her. bewegen uns hier auf dem Gerätetreiber- Esxtop die Anzahl der Abbrüche an, die All das setzt natürlich eine passende SAN- Level. Überschreiten die Angaben 25 ms, die virtuelle Maschine verursacht hat, weil Planung für die gegebenen Anforderun- weist dies auf Performanceprobleme hin der Storage nicht geantwortet hat. Die gen voraus. (ln) und es ist sinnvoll, sich näher mit dieser Ursache dafür sind Pfadfehler oder Situa- Ebene zu beschäftigen. tionen, bei denen der Storage keine I/O [1] VisualEsxtop mehr annimmt. F5Z51 Mit der Anzeige bei KAVG wird die Ver- weildauer des Befehls im vmkernel adres- Ein letztes Thema sind die SCSI-Reser- siert. Auch hier sollten Sie erst den Ge- vierungen. Bei einer Reservierung wird Link-Codes samtwert betrachten. Messen Sie hier zwei kurzzeitig der Datenbereich gesperrt, weil 6 Auszug aus IT-Administrator Mai 2015 Link-Codes eingaben auf www.it-administrator.de
Sie können auch lesen