PowerProtect Data Domain: Vorabprüfung des DDHA-Upgrades
요약: In diesem Wissensdatenbank-Artikel werden umfassende Richtlinien für die Vorbereitung eines DDHA-Systemupgrades (Data Domain High Availability) beschrieben. Die Befolgung dieser Anweisungen garantiert ein erfolgreiches Upgrade. ...
지침
Mit der HA-Funktion (High Availability, hohe Verfügbarkeit) können Sie zwei Schutzsysteme als Aktiv-Stand-by-Paar konfigurieren und so Redundanz bereitstellen, falls ein Systemausfall vorliegt. HA sorgt dafür, dass die aktiven und Stand-by-Systeme synchronisiert werden. Dies ist so, dass, wenn der aktive Node aufgrund von Hardware- oder Softwareproblemen ausfällt, der Stand-by-Node für diesen ausgefallenen Node einspringen kann.
HA wird auf den folgenden Systemen unterstützt:
- Data Domain DD6800
- PowerProtect DD6900
- Data Domain DD9300
- PowerProtect DD9400
- PowerProtect DD9410
- Data Domain DD9800
- PowerProtect DD9900
- PowerProtect DD9910
Vorbereiten von DDHA-Systemen für das Upgrade
Bevor Sie ein Upgrade starten, stellen Sie sicher, dass beide Nodes optimal funktionieren. Ein Upgrade bei einer Kompromittierung eines Nodes kann zu Ausfällen und Serviceunterbrechungen führen. Bevor Sie mit dem Upgrade fortfahren, führen Sie die folgenden Prüfungen aus:
Systeminformationen
Überprüfen Sie den Hostnamen des Systems, die Seriennummer, das Modell, die aktuelle DDOS-Version und die Betriebszeit.
| Aktiver Node | Stand-by-Node |
|
# Hostname # system show serialno # system show model # system show version # Betriebszeit |
# Hostname # system show serialno # system show model # system show version # Betriebszeit |
iDRAC-Konfiguration
Überprüfen Sie, ob iDRAC konfiguriert ist, da dies ein wertvolles Tool für die Überwachung und Fehlerbehebung von Problemen während eines Neustarts ist.
| Aktiver Node | Stand-by-Node |
| # ipmi show config | # ipmi show config |
Nicht, dass iDRAC auf den Dell Legacy-Systemen DD6800, DD9300 und DD9800 nicht verfügbar wäre.
Dateisystemstatus
Stellen Sie sicher, dass das Dateisystem aktiviert ist und ausgeführt wird.
| Aktiver Node | Stand-by-Node |
| # filesys status | Dieser Befehl ist auf diesem Node nicht verfügbar. |
Warnmeldungen und Hardwarefehler
Überprüfen Sie alle aktuellen Systemwarnungen und beheben Sie alle Hardwarefehler.
| Aktiver Node | Stand-by-Node |
| # alerts show current | # alerts show current |
Warnmeldungen werden nicht immer gemeinsam zwischen den aktiven und Stand-by-Nodes ausgegeben. Achten Sie darauf, beide Nodes einzeln auf aktive Warnmeldungen zu überprüfen, die auf zugrunde liegende Probleme hinweisen können. Die meisten Warnmeldungen werden nur auf einem Node angezeigt, sodass eine Überprüfung über zwei Nodes unerlässlich ist.
HA-Systemstatus
Stellen Sie sicher, dass sich das System in einem Hochverfügbarkeitsstatus befindet, bevor Sie das Upgrade initiieren.
| Aktiver Node | Stand-by-Node |
| # ha-Status detailliert | Weitere Informationen finden Sie in der Ausgabe des aktiven Node |
Systemkapazität
Bewerten Sie die Gesamtkapazität des Systems.
| Aktiver Node | Stand-by-Node |
| # df -h | Dieser Befehl ist auf diesem Node nicht verfügbar. |
Um einen reibungslosen DDOS-Upgradeprozess sicherzustellen, wird empfohlen, beim Upgrade auf DDOS-Versionen vor 7.x mindestens 10 % freien Speicherplatz auf dem Data Domain-System und mindestens 5 % freien Speicherplatz für Upgrades auf DDOS 7.x und höher freizuhalten. Dieser verfügbare Speicherplatz ist für die Verarbeitung temporärer Dateien und Änderungen am Index oder an den Metadaten unerlässlich. Dies trägt dazu bei, das Risiko von Upgradefehlern oder Leistungseinbußen während des Upgrades zu minimieren.
Firmware-Versionen
Vergewissern Sie sich, dass auf allen Systemkomponenten die neueste Firmware ausgeführt wird.
| Aktiver Node | Stand-by-Node |
| # system firmware show all | Weitere Informationen finden Sie in der Ausgabe des aktiven Node |
Wenn der Zielcode älter als 7.7.5.1, 7.10.1.0 oder 7.11.x ist, überprüfen Sie die Version der Festplattenfirmware und lesen Sie den KB-Artikel 000204252.
| Aktiver Node | Stand-by-Node |
| # disk show hardware | Weitere Informationen finden Sie in der Ausgabe des aktiven Node |
Netzwerkkonfiguration
Überprüfen Sie die Netzwerkkonfiguration des Systems und stellen Sie sicher, dass alle Schnittstellen mit den entsprechenden IP-Adressen betriebsbereit sind.
| Aktiver Node | Stand-by-Node |
| # net show settings | # net show settings |
Auf DDHA-Systemen werden Netzwerkschnittstellen entweder als Floating oder als fest konfiguriert. Jeder Typ hat spezifische Verhaltens- und Überprüfungsanforderungen:
- Floating-Schnittstellen: Überprüfen Sie bei Schnittstellen, die als Floating konfiguriert sind, ob sich jeder NIC-Port, jeder Alias oder jede virtuelle Ethernet-Schnittstelle (VETH) sowohl auf dem aktiven als auch auf dem Stand-by-Node in einem aktivierten und ausgeführten Status befindet. Es wird erwartet, dass Floating-Schnittstellen eine IP-Adresse auf dem aktiven Node anzeigen, während auf dem Stand-by-Node "N/A" angezeigt wird.
- Feste Schnittstellen: Stellen Sie bei Schnittstellen, die als fest gekennzeichnet sind, sicher, dass jeder konfigurierte NIC-Port, Alias oder VETH aktiviert ist und ausgeführt wird. Im Gegensatz zu Floating-Schnittstellen müssen feste Schnittstellen nicht über beide Nodes hinweg identische Konfigurationen aufweisen.
- HA-Interconnect (veth99): Vergewissern Sie sich, dass HA interconnect (veth99) vorhanden ist und dass alle erforderlichen Ports aktiviert sind und ausgeführt werden.
- Die Anzahl der erforderlichen Verbindungen und deren Steckplätze für veth99 variieren je nach Data Domain-Modell.
Festplattenstatus
Bewerten Sie den Festplattenstatus und stellen Sie sicher, dass keine fehlerhaften (F), rekonstruierenden (R), Kopie- (C) oder abwesenden (A) Festplatten vorhanden sind.
| Aktiver Node | Stand-by-Node |
| # disk show state | # disk show state |
In einer DDHA-Konfiguration verarbeitet oder bedient der Stand-by-Node keine Daten. Daher zeigen die mit dem Stand-by-Node verbundenen Gehäuselaufwerke nicht den Status "Festplatten in Verwendung" an. Stattdessen werden alle Festplatten im Status "Known Disks" angezeigt, was darauf hinweist, dass sie vom System erkannt, aber nicht aktiv sind. Dies ist erwartetes Verhalten, da der aktive Node alle Datenvorgänge verarbeitet.
Gehäusestatus
Stellen Sie sicher, dass alle Gehäusegeräte ordnungsgemäß funktionieren.
| Aktiver Node | Stand-by-Node |
| # enclosure show all | # enclosure show all |
Gehäusetopologie
Validieren Sie die Gehäusetopologie von beiden Nodes.
| Aktiver Node | Stand-by-Node |
| # enclosure show topology | # enclosure show topology |
Hinweise:
- Die Ausgaben sollten Spiegelungsbilder sein.
- Suchen Sie nach einem Sternchen (*) neben enc.ctrl.port und überprüfen Sie das Feld Error Message auf Probleme wie Controller- oder Kabelfehler.
- Symbole wie ?, !, oder !! Fehler anzeigen.
- Vergewissern Sie sich, dass alle Einschubnummern korrekt und konsistent sind.
Replikationsstatus
Stellen Sie sicher, dass die Replikation nicht initialisiert wird. Wenn dies der Fall ist, lesen Sie KB-Artikel 000014079.
| Aktiver Node | Stand-by-Node |
| # Replikationsstatus | Dieser Befehl ist auf diesem Node nicht verfügbar. |
Ab DDOS-Version 7.7.1 wird die Verzeichnisreplikation nicht mehr unterstützt. Wenn Sie ein Upgrade von einer Version vor 7.7.1 durchführen und die Verzeichnisreplikation konfiguriert ist, lesen Sie vor dem Upgrade den Abschnitt "Verzeichnis-zu-MTree-Replikationsmigration" im DDOS-Administrationshandbuch.
Beurteilung der Hardwareintegrität
Initiieren Sie eine umfassende Hardwareintegritätsprüfung auf Data Domain-Systemen.
| Aktiver Node | Stand-by-Node |
| # support healthcheck hardware | # support healthcheck hardware |
Dieser Befehl ist nicht mit allen DD-Plattformen kompatibel. Weitere Informationen finden Sie im KB-Artikel 000326481.
Dateisystembereinigung
Überprüfen Sie, ob die Dateisystembereinigung ausgeführt wird. Wenn er aktiv ist, warten Sie entweder zu, bis er abgeschlossen ist, oder beenden Sie ihn manuell, indem Sie den Befehl # filesys clean stop auf dem aktiven Node ausführen.
| Aktiver Node | Stand-by-Node |
| # filesys clean status | Dieser Befehl ist auf diesem Node nicht verfügbar. |
Cloud-Bereinigung
Überprüfen Sie, ob die Cloud-Bereinigung ausgeführt wird. Wenn er aktiv ist, warten Sie entweder, bis er abgeschlossen ist, oder beenden Sie ihn manuell, indem Sie den Befehl # cloud clean stop auf dem aktiven Node ausführen.
| Aktiver Node | Stand-by-Node |
| # Cloud-Bereinigungsstatus | Dieser Befehl ist auf diesem Node nicht verfügbar. |
Datenverschiebung
Überprüfen Sie bei Systemen mit Cloud Tier, ob eine Datenverschiebung ausgeführt wird. Wenn diese Option aktiv ist, beenden Sie sie manuell, indem Sie den Befehl # data-movement stop all auf dem aktiven Node ausführen.
| Aktiver Node | Stand-by-Node |
| # data-movement status | Dieser Befehl ist auf diesem Node nicht verfügbar. |
Sicherung und Wiederherstellung
Wenn eine Backup- oder Wiederherstellungsaktivität ausgeführt wird, halten oder stoppen Sie sie, bevor Sie fortfahren.
| Aktiver Node | Stand-by-Node |
| # system show stats | # system show stats |
HA-Failover-Test
Der Zweck des Failover-Tests besteht darin, die hohe Verfügbarkeit zu validieren, indem ein Failover vom aktiven Node zum Stand-by-Node initiiert wird. Sobald der Übergang abgeschlossen ist, führen Sie ein zweites Failover durch, um die Kontrolle an den ursprünglichen Node zurückzugeben und eine vollständige bidirektionale Failover-Funktionalität sicherzustellen.
Aktiver Node:
- Führen Sie
ha statusBefehl zur Bestätigung, dass sich das System in einem hochverfügbaren Zustand befindet und beide Nodes online sind. - Führen Sie
ha failover precheck(verfügbar in DDOS-Version 7.8 und höher), um die Bereitschaft für das Failover zu bestätigen. - Führen Sie
ha failoverAuf dem aktiven Node, um vom aktiven Node zum Stand-by-Node zu wechseln.
Neuer aktiver Node (vorheriger Stand-by-Node):
- Führen Sie
ha statusBefehl zur Bestätigung, dass sich das System in einem hochverfügbaren Zustand befindet und beide Nodes online sind. - Führen Sie
ha failover precheck(verfügbar in DDOS-Version 7.8 und höher), um sicherzustellen, dass das System für das Failover bereit ist. - Führen Sie
ha failoverAuf dem neuen aktiven Node, um wieder in den Stand-by-Modus zu wechseln.
RPM-Paket aktualisieren
Laden Sie das Upgrade-RPM-Paket auf den aktiven Node hoch. Sobald der Vorabprüfungsbefehl für das Systemupgrade ausgeführt wurde, wird das Paket automatisch auf den Stand-by-Node kopiert.
Die RPM-Upgradepakete sind auf der Seite Data Domain Deduplication Storage Systems verfügbar.
- Übertragen Sie die RPM-Datei mit dem folgenden Befehl vom Client-Server auf den aktiven Node:
client-server# scp <rpm file> sysadmin@<active-node-hostname-or-IP-address>:/ddr/var/releases/
-
- Das System fordert Sie zur Eingabe eines Kennworts auf, das der Kunde festgelegt hat. Das Zielverzeichnis auf dem aktiven Node ist /ddr/var/releases.
- Sobald die Dateiübertragung abgeschlossen ist, überprüfen Sie die Systempaketinformationen über den aktiven Node, indem Sie Folgendes ausführen:
active-node# system package list
Vorabprüfung des Systemupgrades
Führen Sie auf dem aktiven Node den Befehl system upgrade precheck <file> . Wenn die Vorabprüfung erfolgreich und ohne Fehler abgeschlossen wurde, kann das System mit dem DDOS-Upgrade fortfahren. Ausführliche Anleitungen zum Upgrade eines DDHA-Systems finden Sie in KB-Artikel 000009653.