PowerProtect Data Domain: Forhåndskontrol af opgradering af DDHA
Summary: Denne KB-artikel beskriver omfattende retningslinjer for forberedelse af en DDHA-systemopgradering (Data Domain High Availability). Overholdelse af disse instruktioner garanterer en vellykket opgraderingsoplevelse. ...
Instructions
Med funktionen High Availability (HA) kan du konfigurere to beskyttelsessystemer som et aktivt standbypar, hvilket giver redundans i tilfælde af systemfejl. HA holder de aktive systemer og standbysystemerne synkroniserede. Dette er for at hvis den aktive node mislykkedes på grund af hardware- eller softwareproblemer, kan standbynoden overtage for den defekte node.
HA understøttes på følgende systemer:
- Data Domain DD6800
- PowerProtect DD6900
- Data Domain DD9300
- PowerProtect DD9400
- PowerProtect DD9410
- Data Domain DD9800
- PowerProtect DD9900
- PowerProtect DD9910
Forberedelse af DDHA-systemer til opgradering
Før du starter en opgradering, skal du sikre dig, at begge noder fungerer optimalt. Opgradering, mens en af noderne er kompromitteret, kan føre til fejl og serviceafbrydelser. Før du går videre med opgraderingen, skal du køre følgende kontroller:
Systemoplysninger
Kontroller systemets værtsnavn, serienummer, model, aktuelle DDOS-version og oppetid.
| Aktiv node | Standbynode |
|
# værtsnavn # system show serialno # system show model # System Vis version # oppetid |
# værtsnavn # system show serialno # system show model # System Vis version # oppetid |
iDRAC-konfiguration
Bekræft, om iDRAC er konfigureret, da det er et værdifuldt værktøj til overvågning og fejlfinding af problemer under genstart.
| Aktiv node | Standbynode |
| # IPMI Vis konfiguration | # IPMI Vis konfiguration |
Ikke at iDRAC ikke er tilgængelig på Dell Legacy-systemerne DD6800, DD9300 og DD9800.
Filsystemstatus
Sørg for, at filsystemet er aktiveret og kører.
| Aktiv node | Standbynode |
| # filesys status | Denne kommando er ikke tilgængelig på denne node. |
Advarsler og hardwarefejl
Gennemse alle aktuelle systemadvarsler, og løs eventuelle hardwarefejl.
| Aktiv node | Standbynode |
| # advarsler viser aktuel | # advarsler viser aktuel |
Advarsler deles ikke altid mellem de aktive noder og standbynoder. Sørg for at kontrollere begge noder individuelt for aktive advarsler, der kan indikere underliggende problemer. De fleste advarsler er kun synlige på én node, så dobbeltnodebekræftelse er afgørende.
HA-systemstatus
Sørg for, at systemet er i tilstanden høj tilgængelighed, før du starter opgraderingen.
| Aktiv node | Standbynode |
| # HA status detaljeret | Se outputtet fra den aktive node |
Systemkapacitet
Vurder den samlede systemkapacitet.
| Aktiv node | Standbynode |
| # df -h | Denne kommando er ikke tilgængelig på denne node. |
For at sikre en problemfri DDOS-opgraderingsproces anbefales det at opretholde mindst 10 % ledig plads på Data Domain-systemet, når du opgraderer til DDOS-versioner, der er ældre end 7.x, og mindst 5 % ledig plads til opgraderinger til DDOS 7.x og nyere. Denne tilgængelige plads er afgørende for håndtering af midlertidige filer og eventuelle ændringer af indekset eller metadataene. Dette hjælper med at minimere risikoen for opgraderingsfejl eller forringelse af ydeevnen under opgraderingen.
Firmwareversioner
Bekræft, at alle systemkomponenter kører den nyeste firmware.
| Aktiv node | Standbynode |
| # systemfirmware vis alle | Se outputtet fra den aktive node |
Hvis destinationskoden er ældre end 7.7.5.1, 7.10.1.0 eller 7.11.x, skal du kontrollere diskens firmwareversion og se KB-artikel 000204252 for vejledning.
| Aktiv node | Standbynode |
| # disk show hardware | Se outputtet fra den aktive node |
Netværkskonfiguration
Kontroller systemets netværkskonfiguration, og sørg for, at alle grænseflader fungerer med passende IP-adresser.
| Aktiv node | Standbynode |
| # net show indstillinger | # net show indstillinger |
På DDHA-systemer konfigureres netværksgrænseflader som enten flydende eller faste. Hver type har specifikke adfærds- og bekræftelseskrav:
- Flydende grænseflader: For grænseflader, der er konfigureret som flydende, skal du kontrollere, at hver NIC-port (Network Interface Card), alias eller virtuel Ethernet-grænseflade (veth) er i aktiveret og kørende tilstand på både de aktive noder og standbynoder. Det forventes, at flydende grænseflader viser en IP-adresse på den aktive node, mens de viser N/A på standbynoden.
- Faste grænseflader: For grænseflader, der er markeret som faste, skal du sørge for, at hver konfigureret NIC-port, alias eller veth er i aktiveret og kørende tilstand. I modsætning til flydende grænseflader kræves det ikke, at faste grænseflader har identiske konfigurationer på tværs af begge noder.
- HA Interconnect (veth99): Bekræft, at HA-forbindelsen (veth99) er til stede, og at alle nødvendige porte er aktiveret og kører.
- Antallet af påkrævede forbindelser og deres slotplaceringer for veth99 varierer afhængigt af Data Domain-modellen.
Diskstatus
Vurder disktilstandene, og sørg for, at der ikke er nogen mislykkede (F), rekonstruerede (R), kopierede (C) eller fraværende (A) diske.
| Aktiv node | Standbynode |
| # disk show tilstand | # disk show tilstand |
I en DDHA-konfiguration behandler eller leverer standbynoden ikke data. Derfor viser kabinetdiskene, der er tilsluttet standbynoden, ikke tilstanden "I brug-diske". I stedet vises alle diske i tilstanden "Kendte diske", hvilket angiver, at systemet genkender dem, men de er ikke aktive. Dette er forventeligt, da den aktive node håndterer alle datahandlinger.
Status for kabinet
Sørg for, at alle kabinetenheder fungerer korrekt.
| Aktiv node | Standbynode |
| # kabinet vis alle | # kabinet vis alle |
Kabinettets topologi
Valider kabinettets topologi fra begge noder.
| Aktiv node | Standbynode |
| # kabinet vis topologi | # kabinet vis topologi |
Bemærk:
- Udgangene skal spejle billeder.
- Se efter en stjerne (*) ud for enc.ctrl.port, og gennemse feltet Fejlmeddelelse for problemer som f.eks. controller- eller kabelfejl.
- Symboler som ?, !, eller !! Angiv fejl.
- Bekræft, at alle hyldenumre er korrekte og ensartede.
Replikeringsstatus
Sørg for, at replikering ikke initialiseres. Hvis det er tilfældet, henvises der til KB-artikel 000014079.
| Aktiv node | Standbynode |
| # replikeringsstatus | Denne kommando er ikke tilgængelig på denne node. |
Fra og med DDOS version 7.7.1 understøttes biblioteksreplikering ikke længere. Hvis opgradering fra en version, der er ældre end 7.7.1, og biblioteksreplikering er konfigureret, skal du se afsnittet "Directory-to-MTree Replication Migration" i DDOS-administrationsvejledningen, før du opgraderer.
Vurdering af hardwaretilstand
Igangsæt et omfattende hardwaretilstandstjek på Data Domain-systemer.
| Aktiv node | Standbynode |
| # Støtte HealthCheck hardware | # Støtte HealthCheck hardware |
Denne kommando er ikke kompatibel med alle DD-platforme. Se KB-artiklen 000326481 for at få flere oplysninger.
Oprydning af filsystem
Kontroller, om rensningen af filsystemet kører. Hvis den er aktiv, skal du enten lade den fuldføre eller manuelt stoppe den ved at køre kommandoen # filesys clean stop på den aktive node.
| Aktiv node | Standbynode |
| # filesys ren status | Denne kommando er ikke tilgængelig på denne node. |
Cloud-rensning
Kontroller, om cloud-rensningen kører. Hvis den er aktiv, skal du enten lade den fuldføre eller manuelt stoppe den ved at køre kommando # cloud clean stop på den aktive node.
| Aktiv node | Standbynode |
| # Cloud ren status | Denne kommando er ikke tilgængelig på denne node. |
Dataflytning
For systemer med Cloud Tier skal du kontrollere, om dataflytningen kører. Hvis den er aktiv, skal du manuelt stoppe den ved at køre kommando # databevægelsesstop alt på den aktive node.
| Aktiv node | Standbynode |
| # data-movement status | Denne kommando er ikke tilgængelig på denne node. |
Sikkerhedskopier og gendan
Hvis nogen sikkerhedskopierings- eller gendannelsesaktivitet er i gang, skal du sætte den på pause eller stoppe den, før du fortsætter.
| Aktiv node | Standbynode |
| # system show statistik | # system show statistik |
HA-failover-test
Formålet med failover-testen er at validere høj tilgængelighed ved at starte en failover fra den aktive node til standbynoden. Når overgangen er fuldført, skal du udføre endnu en failover for at returnere kontrollen til den oprindelige node, hvilket sikrer fuld tovejs-failover-funktionalitet.
Aktiv node:
- Kør
ha statustil at bekræfte, at systemet er i en meget tilgængelig tilstand med begge noder online. - Kør
ha failover precheck(tilgængelig i DDOS version 7.8 og nyere) for at bekræfte, at du er klar til failover. - Kør
ha failoverpå den aktive node for at skifte fra den aktive node til standbynoden.
Ny aktiv node (tidligere standbynode):
- Kør
ha statustil at bekræfte, at systemet er i en meget tilgængelig tilstand med begge noder online. - Kør
ha failover precheck(tilgængelig i DDOS version 7.8 og nyere) for at sikre, at systemet er klar til failover. - Kør
ha failoverpå den nye aktive node for at skifte tilbage til standby.
Opgrader RPM-pakke
Upload opgraderings-RPM-pakken til den aktive node. Når precheck-kommandoen til systemopgradering er kørt, kopieres pakken automatisk til standbynoden.
Opgraderings-RPM-pakkerne er tilgængelige på siden Data Domain Deduplication Storage Systems .
- Overfør RPM-filen fra klientserveren til den aktive node ved hjælp af følgende kommando:
client-server# scp <rpm file> sysadmin@<active-node-hostname-or-IP-address>:/ddr/var/releases/
-
- Systemet beder om en adgangskode, som kunden har defineret. Destinationsmappen på den aktive node er /ddr/var/releases.
- Når filoverførslen er fuldført, skal du kontrollere systempakkens oplysninger om den aktive node ved at køre:
active-node# system package list
Forhåndskontrol af systemopgradering
Fra den aktive node skal du køre system upgrade precheck <file> kommando. Hvis forhåndskontrollen fuldføres korrekt uden fejl, er systemet klar til at fortsætte DDOS-opgraderingen. Du kan finde detaljeret vejledning i opgradering af et DDHA-system i KB-artikel 000009653.