DataDomain: Instrukcja aktualizacji systemu operacyjnego dla systemów o wysokiej dostępności (HA)

Summary: Omówienie procesu aktualizacji systemu Data Domain Operating System (DDOS) na urządzeniach Data Domain o wysokiej dostępności (DDHA).

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Check out other resources

Instructions

Planowana konserwacja systemu HA

W celu skrócenia planowanych przestojów konserwacyjnych architektura HA zawiera stopniową aktualizacje systemu. Stopniowa aktualizacja może najpierw uaktualnić węzeł w trybie gotowości, a następnie wykorzystać oczekiwane przełączenie awaryjne HA w celu przeniesienia usług z aktywnego węzła do węzła w trybie gotowości. Na koniec poprzednie aktywne węzły zostaną zaktualizowane i ponownie dołączą do klastra HA jako węzeł w trybie gotowości. Wszystkie procesy są wykonywane w jednym poleceniu.
Alternatywną metodą ręcznego uaktualnienia jest „uaktualnienie lokalne”. Najpierw ręcznie zaktualizuj węzeł w trybie gotowości, a następnie ręcznie zaktualizuj aktywny węzeł. Na koniec węzeł w trybie gotowości ponownie dołączy do klastra HA. Uaktualnienie lokalne można przeprowadzić albo w celu wykonania regularnej aktualizacji, albo rozwiązania problemów.
Wszystkie operacje aktualizacji systemu w aktywnym węźle wymagające konwersji danych mogą się nie rozpocząć, dopóki oba systemy nie zostaną zaktualizowane do tego samego poziomu i stan HA nie zostanie w pełni przywrócony.

Aktualizacja systemów DDHA

W wersji DDOS 5.7 i nowszych są dostępne dwie metody aktualizacji systemów HA:

Stopniowa aktualizacja — automatyczne uaktualnianie obu węzłów HA za pomocą jednego polecenia. Po uaktualnieniu usługa jest przenoszona do innego węzła.
Uaktualnienie lokalne — ręczne uaktualnianie węzłów HA po kolei. Po uaktualnieniu usługa jest zachowywana w tym samym węźle.

Stopniowa aktualizacja za pośrednictwem GUI:

Przygotuj system do aktualizacji:

System HA musi mieć stan „highly available”.

GUI logowania à Home à Dashboard

Plik RPM DDOS należy umieścić w aktywnym węźle, a aktualizacja powinna rozpocząć się od tego węzła.

- Jak znaleźć aktywny węzeł:
GUI logowania à Home à Dashboard

Strona Dashboard

Prześlij plik RPM do aktywnego węzła

GUI logowania à Maintenance à System à Kliknij przycisk UPLOAD UPGRADE PACKAGE

Strona Maintenance

Po przesłaniu plik RPM zostanie wyświetlony na liście.

Uruchom sprawdzanie wstępne na aktywnym węźle. W przypadku wystąpienia jakiegokolwiek błędu uaktualnienie powinno zostać przerwane.

GUI logowania à Maintenance à System à Kliknij plik RPM aktualizacji à Kliknij przycisk UPGRADE PRECHECK

Strona System

W zależności od potrzeb usługi te można wznowić po zakończeniu uaktualnienia za pomocą odpowiednich poleceń włączania. Więcej szczegółów można znaleźć w podręczniku administracyjnym.

W podręczniku administracyjnym opisano kilka innych ręcznych kontroli i poleceń, które nie są bezwzględnie konieczne dla systemu HA. Jako test dla systemów z jednym węzłem obecnie sugeruje się wykonanie zadania przed ponownym uruchomieniem. Nie jest to konieczne w przypadku systemów HA, ponieważ krok nr 5 „ha failover” poniżej obejmuje już automatyczne ponowne uruchomienie podczas procesu przełączania awaryjnego.

Opcjonalnie. Przed uruchomieniem stopniowej aktualizacji zaleca się dwukrotne ręczne przełączenie awaryjne systemu HA w aktywnym węźle. Celem jest przetestowanie funkcji przełączania awaryjnego. Operacja spowoduje ponowne uruchomienie aktywnego węzła, o czym należy pamiętać.

Najpierw przygotuj się do przełączenia awaryjnego, wyłączając GC, przenoszenie danych i replikację. Zapoznaj się z podręcznikiem administracyjnym, aby dowiedzieć się, jak to zrobić za pomocą GUI. Te usługi nie mają wpływu na obciążenia robocze tworzenia kopii zapasowych/przywracania klientów. Następnie wykonaj operację „ha failover”.

GUI logowania à Health à High Availability à Kliknij opcję Failover to XXX

(Gdy stan systemu HA ponownie stanie się „highly available”, wykonaj drugą operację „ha failover” i poczekaj, aż oba węzły będą w trybie online)

Po przełączeniu awaryjnym systemu HA można wznowić zatrzymane usługi przy użyciu odpowiednich poleceń włączania. Aby uzyskać więcej informacji, zapoznaj się z podręcznikiem administracyjnym.

Powyższe testy przełączania awaryjnego są opcjonalne i nie trzeba ich przeprowadzać bezpośrednio przed aktualizacją. Testy przełączania awaryjnego można przeprowadzić przed aktualizacją, na przykład dwa tygodnie wcześniej, aby można było wykorzystać krótszą przerwę konserwacyjną na późniejszą aktualizację. Czas przestoju usługi DDFS dla każdego przełączania awaryjnego wynosi około 10 minut (mniej więcej, w zależności od wersji DDOS i kilku innych czynników). DDOS w wersji 7.4 i nowszej będzie miał mniej przestojów ze względu na ciągłe udoskonalenia oprogramowania DDOS.

Uaktualnianie — procedura krok po kroku

Jeśli sprawdzanie wstępne zakończyło się bez żadnych problemów, kontynuuj stopniową aktualizację w aktywnym węźle.

GUI logowania à Maintenance à System à Kliknij plik RPM aktualizacji à Kliknij przycisk PERFORM SYSTEM UPGRADE

Poczekaj na zakończenie stopniowej aktualizacji. Do tego czasu nie należy wyzwalać żadnej operacji przełączania awaryjnego HA.

Dostępność DDFS podczas wykonywania powyższego polecenia:

Najpierw uaktualni węzeł w trybie gotowości, a następnie uruchomi go ponownie do nowej wersji. Zajmuje to około 20 do 30 minut w zależności od różnych czynników. Usługa DDFS jest włączona i działa w tym okresie na aktywnym węźle bez pogorszenia wydajności.
Po zastosowaniu nowego systemu DDOS system przełączy awaryjnie usługę DDFS do uaktualnionego węzła w trybie gotowości. Zajmuje to około 10 minut (mniej więcej, w zależności od różnych czynników).
1. Jednym z istotnych czynników jest aktualizacja oprogramowania wewnętrznego DAE. Może to wydłużyć przestój o ~20 minut w zależności od liczby skonfigurowanych DAE. Zapoznaj się z artykułem w bazie wiedzy „Data Domain: Stopniowa aktualizacja HA może zakończyć się niepowodzeniem w przypadku aktualizacji oprogramowania wewnętrznego obudowy zewnętrznej”, aby określić, czy wymagane jest uaktualnienie oprogramowania wewnętrznego DAE. Należy pamiętać, że począwszy od DDOS 7.5 wprowadzono udoskonalenie umożliwiające aktualizację oprogramowania wewnętrznego DAE online, eliminując ten problem.
2. W celu omówienia czynników, które mogą mieć wpływ na czas aktualizacji, można skontaktować się z działem pomocy technicznej firmy Dell. W zależności od systemu operacyjnego klienta, aplikacji oraz protokołu między klientem a systemem HA, czasami może zajść konieczność ręcznego wznowienia obciążeń roboczych klienta zaraz po przełączeniu awaryjnym. Jeśli na przykład w przypadku klientów DDBoost czas przełączania awaryjnego przekracza 10 minut, upłynie limit czasu klienta i użytkownik musi ręcznie wznowić obciążenia robocze. Jednak zwykle na klientach dostępne są opcje dostosowywane umożliwiające ustawienie wartości limitu czasu i czasy ponawiania prób.

Należy pamiętać, że usługa DDFS nie działa w okresie przełączania awaryjnego. Obserwując dane wyjściowe polecenia „filesys status” w uaktualnionym węźle, można ustalić, czy usługa DDFS została wznowiona, czy nie. Oczekuje się, że DDOS w wersji 7.4 i nowszej będzie miał coraz mniej przestojów ze względu na ulepszenia kodu DDOS.

Po przełączeniu awaryjnym poprzednio aktywny węzeł zostanie uaktualniony. Po zastosowaniu uaktualnienia zostanie on uruchomiony ponownie do nowej wersji, a następnie ponownie dołączy do klastra HA jako węzeł w trybie gotowości. Ten proces nie wpływa na usługę DDFS, ponieważ została ona już wznowiona w kroku nr II powyżej.

Weryfikacja:

Po zakończeniu stopniowej aktualizacji trzeba przejść do GUI logowania za pośrednictwem adresu IP węzła w trybie gotowości. W tym przypadku jest to węzeł 1.

GUI logowania à Maintenance à System à Sprawdź Upgrade History

Sprawdź, czy nie ma nieoczekiwanych alertów.

GUI logowania à Dashboard à Alerts

W tym momencie stopniowa aktualizacja zakończyła się pomyślnie.

Stopniowa aktualizacja za pośrednictwem CLI:
Przygotuj system do aktualizacji:

System HA musi mieć stan „highly available”.

#ha status

     

            HA System name:       HA-system    
     HA System status:     highly available         ç
     Node Name                       Node id   Role      HA State
     -----------------------------   -------   -------   --------
     Node0   0         active    online    
     Node1   1         standby   online
     -----------------------------   -------   -------   --------

Plik RPM DDOS należy umieścić w aktywnym węźle, a aktualizacja powinna rozpocząć się od tego węzła.

- Jak znaleźć aktywny węzeł:
#ha status

      HA System name:       HA-system    
      HA System status:     highly available
      Node Name                       Node id   Role      HA State
      -----------------------------   -------   -------   --------
      Node0   0         active    online    ß Node0 is active node
      Node1   1         standby   online
      -----------------------------   -------   -------   --------

Prześlij plik RPM do aktywnego węzła

Client-server # scp <rpm file> sysadmin@HA-system.active_node:/ddr/var/releases/
Password: (customer defined it.)

(From client server, target path is “/ddr/var/releases”)

            Po wykonaniu polecenia „scp” sprawdź informacje o pakiecie systemu
Active-node # system package list

File                 Size (KiB)   Type     Class        Name    Version
------------------   ----------   ------   ----------   -----   -------
x.x.x.x-12345.rpm    2927007.3   System   Production   DD OS   x.x.x.x
------------------   ---------- ------   ----------   ----- -------

Uruchom sprawdzanie wstępne na aktywnym węźle. W przypadku wystąpienia jakiegokolwiek błędu uaktualnienie powinno zostać przerwane.

Active-node # system upgrade precheck <rpm file>

     Upgrade precheck in progress:
     Node 0: phase 1/1 (Precheck 100%) , Node 1: phase 1/1 (Precheck 100%)
     Upgrade precheck found no issues.

Przed rozpoczęciem uaktualniania (krok nr 6) należy również wyłączyć GC, przenoszenie danych i replikację, aby te zadania nie prowadziły do dłuższego czasu zamykania DDFS podczas uaktualniania. Krótszy czas wyłączenia DDFS pomoże zminimalizować wpływ na klientów. Te obciążenia robocze nie mają wpływu na operacje tworzenia kopii zapasowych/przywracania klientów. W zależności od potrzeb usługi te można wznowić po zakończeniu uaktualnienia za pomocą odpowiednich poleceń włączania. Więcej szczegółów można znaleźć w podręczniku administracyjnym.
  Active-node # filesys clean stop Active-node # cloud clean stop Active-node # data-movement suspend Active-node # data-movement stop to-tier active Active-node # replication disable all

Zauważ, że istnieje kilka poleceń „watch” do sprawdzania, czy powyższe operacje zostały wykonane.
  Active-node # filesys clean watch Active-node # cloud clean watch Active-node # data-movement watch

  W podręczniku administracyjnym opisano kilka innych ręcznych kontroli i poleceń, które nie są bezwzględnie konieczne dla systemu HA. Jako test dla systemów z jednym węzłem obecnie sugeruje się wykonanie zadania przed ponownym uruchomienie. Nie jest to konieczne w przypadku systemów HA, ponieważ krok nr 5 „ha failover” poniżej obejmuje już automatyczne ponowne uruchomienie podczas procesu przełączania awaryjnego.

Opcjonalnie. Przed uruchomieniem stopniowej aktualizacji zaleca się dwukrotne ręczne przełączenie awaryjne systemu HA w aktywnym węźle. Celem jest przetestowanie funkcji przełączania awaryjnego. Operacja spowoduje ponowne uruchomienie aktywnego węzła, o czym należy pamiętać.

  Najpierw przygotuj się do przełączenia awaryjnego, wyłączając GC, przenoszenie danych i replikację. Te usługi nie mają wpływu na obciążenia robocze tworzenia kopii zapasowych/przywracania klientów. Następnie wykonaj operację „ha failover”.

Robi się to za pomocą następujących poleceń:
  Active-node # filesys clean stop Active-node # cloud clean stop Active-node # data-movement suspend Active-node # data-movement stop to-tier active Active-node # replication disable all
Zauważ, że istnieje kilka poleceń „watch” do sprawdzania, czy powyższe operacje zostały wykonane.
  Active-node # filesys clean watch Active-node # cloud clean watch Active-node # data-movement watch
Następnie uruchom polecenie przełączania awaryjnego:

Active-node # ha failover
This operation will initiate a failover from this node. The local node will reboot.
Do you want to proceed? (yes|no) [no]: yes
Failover operation initiated. Run 'ha status' to monitor the status
(Gdy stan systemu HA ponownie stanie się „highly available”, wykonaj drugą operację „ha failover” i poczekaj, aż oba węzły będą w trybie online)

Po przełączeniu awaryjnym systemu HA można wznowić zatrzymane usługi przy użyciu odpowiednich poleceń włączania. Aby uzyskać więcej informacji, zapoznaj się z podręcznikiem administracyjnym.
Powyższe testy przełączania awaryjnego są opcjonalne i nie trzeba ich przeprowadzać bezpośrednio przed aktualizacją. Testy przełączania awaryjnego można przeprowadzić przed aktualizacją, na przykład dwa tygodnie wcześniej, aby można było wykorzystać krótszą przerwę konserwacyjną na późniejszą aktualizację. Czas przestoju usługi DDFS dla każdego przełączania awaryjnego wynosi około 10 minut (mniej więcej, w zależności od wersji DDOS i kilku innych czynników). DDOS w wersji 7.4 i nowszej będzie miał mniej przestojów ze względu na ciągłe udoskonalenia oprogramowania DDOS.

Uaktualnianie — procedura krok po kroku

Jeśli sprawdzanie wstępne zakończyło się bez żadnych problemów, kontynuuj stopniową aktualizację w aktywnym węźle.

             Active-node # system upgrade start <rpm file>

The 'system upgrade' command upgrades the Data Domain OS. File access
is interrupted during the upgrade. The system reboots automatically
after the upgrade.
Are you sure? (yes|no) [no]: yes
ok, proceeding.
Upgrade in progress:
Node   Severity   Issue                           Solution
----   --------   ------------------------------ --------
0      WARNING    1 component precheck
script(s) failed to complete
0      INFO       Upgrade time est: 60 mins
1      WARNING    1 component precheck
script(s) failed to complete
1      INFO       Upgrade time est: 80 mins
----   --------   ------------------------------ --------
Node 0: phase 2/4 (Install    0%) , Node 1: phase 1/4 (Precheck 100%)
Upgrade phase status legend:
DU : Data Upgrade
FO : Failover
..
PC : Peer Confirmation
VA : Volume Assembly

Node 0: phase 3/4 (Reboot     0%) , Node 1: phase 4/4 (Finalize   5%) FO
Upgrade has started. System will reboot.

Dostępność DDFS podczas wykonywania powyższego polecenia:

Najpierw uaktualni węzeł w trybie gotowości, a następnie uruchomi go ponownie do nowej wersji. Zajmuje to około 20 do 30 minut w zależności od różnych czynników. Usługa DDFS jest włączona i działa w tym okresie na aktywnym węźle bez pogorszenia wydajności.
Po zastosowaniu nowego systemu DDOS system przełączy awaryjnie usługę DDFS do uaktualnionego węzła w trybie gotowości. Zajmuje to około 10 minut (mniej więcej, w zależności od różnych czynników).
1. Jednym z istotnych czynników jest aktualizacja oprogramowania wewnętrznego DAE. Może to wydłużyć przestój o ~20 minut w zależności od liczby skonfigurowanych DAE. Zapoznaj się z artykułem w bazie wiedzy „Data Domain: Stopniowa aktualizacja HA może zakończyć się niepowodzeniem w przypadku aktualizacji oprogramowania wewnętrznego obudowy zewnętrznej”, aby określić, czy wymagane jest uaktualnienie oprogramowania wewnętrznego DAE. Należy pamiętać, że począwszy od DDOS 7.5 wprowadzono udoskonalenie umożliwiające aktualizację oprogramowania wewnętrznego DAE online, eliminując ten problem.
2. W celu omówienia czynników, które mogą mieć wpływ na czas aktualizacji, można skontaktować się z działem pomocy technicznej firmy Dell. W zależności od systemu operacyjnego klienta, aplikacji oraz protokołu między klientem a systemem HA, czasami może zajść konieczność ręcznego wznowienia obciążeń roboczych klienta zaraz po przełączeniu awaryjnym. Jeśli na przykład w przypadku klientów DDBoost czas przełączania awaryjnego przekracza 10 minut, upłynie limit czasu klienta i użytkownik musi ręcznie wznowić obciążenia robocze. Jednak zwykle na klientach dostępne są opcje dostosowywane umożliwiające ustawienie wartości limitu czasu i czasy ponawiania prób.

Po przełączeniu awaryjnym poprzednio aktywny węzeł zostanie uaktualniony. Po zastosowaniu uaktualnienia zostanie on uruchomiony ponownie do nowej wersji, a następnie ponownie dołączy do klastra HA jako węzeł w trybie gotowości. Ten proces nie wpływa na usługę DDFS, ponieważ została ona już wznowiona w kroku nr II powyżej.

Należy pamiętać, że usługa DDFS nie działa w okresie przełączania awaryjnego. Obserwując dane wyjściowe polecenia „filesys status” w uaktualnionym węźle, można ustalić, czy usługa DDFS została wznowiona, czy nie. Oczekuje się, że DDOS w wersji 7.4 i nowszej będzie miał coraz mniej przestojów ze względu na ulepszenia kodu DDOS.

Po ponownym uruchomieniu węzła w trybie gotowości (węzeł 1) i uzyskaniu dostępu można zalogować się do węzła w trybie gotowości w celu monitorowania stanu/postępu aktualizacji.

Node1 # system upgrade status
Current Upgrade Status: DD OS upgrade In Progress
Node 0: phase 3/4 (Reboot     0%)
Node 1: phase 4/4 (Finalize 100%) waiting for peer confirmation

Poczekaj na zakończenie stopniowej aktualizacji. Do tego czasu nie należy wyzwalać żadnej operacji przełączania awaryjnego HA.

Node1 # system upgrade status
Current Upgrade Status: DD OS upgrade Succeeded
End time: 20xx.xx.xx:xx:xx

Sprawdź, czy stan HA obu węzłów to „online”, a stan systemu HA to „highly available”.

Node1 # ha status detailed
HA System name:               HA-system
HA System Status:             highly available
Interconnect Status:          ok
Primary Heartbeat Status:      ok
External LAN Heartbeat Status: ok
Hardware compatibility check: ok
Software Version Check:       ok
Node  Node1:
      Role:          active
      HA State:      online
      Node Health: ok
Node Node0:
      Role:          standby
      HA State:      online
      Node Health: ok
Mirroring Status:
Component Name   Status
--------------   ------
nvram            ok
registry         ok
sms              ok
ddboost          ok
cifs             ok
--------------   ------

Weryfikacja:

Sprawdź, czy oba węzły mają tę samą wersję DDOS.

Node1 # system show version
Data Domain OS x.x.x.x-12345
Node0 # system show version                   
Data Domain OS x.x.x.x-12345

Sprawdź, czy nie ma nieoczekiwanych alertów.

Node1 # alert show current
Node0 # alert show current

W tym momencie stopniowa aktualizacja zakończyła się pomyślnie.

Uwaga: W przypadku wystąpienia jakichkolwiek problemów z uaktualnieniem należy skontaktować się z działem pomocy technicznej Data Domain, aby uzyskać dalsze instrukcje i wsparcie.

UAKTUALNIENIE LOKALNE dla pary DDHA:
Uaktualnienie lokalne działa zasadniczo w następujący sposób:

Przygotuj system do aktualizacji:

Sprawdź stan systemu HA. Nawet jeśli stan to „degraded”, uaktualnienie lokalne może działać w tej sytuacji.

#ha status
HA System name:       HA-system
HA System status:     highly available <-
Node Name                       Node id   Role      HA State
-----------------------------   -------   -------   --------
Node0   0         active    online
Node1   1         standby   online
-----------------------------   -------   -------   --------

Plik RPM DDOS należy umieścić w obu węzłach, a aktualizacja powinna rozpocząć się od węzła w trybie gotowości.

- Jak znaleźć węzeł w trybie gotowości:

#ha status
HA System name:       HA-system    
HA System status:     highly available
Node Name                       Node id   Role      HA State
-----------------------------   -------   -------   --------
Node0   0         active    online    
Node1   1         standby   online   <- Node1 is standby node
-----------------------------   -------   -------   --------

Prześlij plik RPM do obu węzłów.

Client-server # scp <rpm file> sysadmin@HA- system.active_node:/ddr/var/releases/

Client-server # scp <rpm file> sysadmin@HA-system.standby_node:/ddr/var/releases/
Password: (customer defined it.)

(From client server, target path is “/ddr/var/releases”)

            Po wykonaniu polecenia „scp” sprawdź informacje o pakiecie systemu.
Active-node # system package list
     File                 Size (KiB)   Type     Class        Name    Version
------------------   ----------   ------   ----------   -----   -------
x.x.x.x-12345.rpm    2927007.3   System   Production   DD OS   x.x.x.x
------------------   ----------   ------   ---------- -----   ------
Standby-node # system package list
     File                 Size (KiB)   Type     Class        Name    Version
------------------   ----------   ------   ----------   -----   -------
x.x.x.x-12345.rpm    2927007.3   System   Production   DD OS   x.x.x.x
------------------   ----------   ------   ----------   -----   ------

Uruchom sprawdzanie wstępne na aktywnym węźle, jeśli stan HA to „highly available”. W przypadku wystąpienia jakiegokolwiek błędu uaktualnienie powinno zostać przerwane.

Active-node # system upgrade precheck <rpm file>

Upgrade precheck in progress:
Node 0: phase 1/1 (Precheck 100%) , Node 1: phase 1/1 (Precheck 100%)
Upgrade precheck found no issues.

Jeśli stan HA to „degraded”, należy wykonać sprawdzanie wstępne na obu węzłach.

    Active-node # system upgrade precheck <rpm file> local

              Upgrade precheck in progress:
      Node 0: phase 1/1 (Precheck 100%)
      Upgrade precheck found no issues.


              Standby-node # system upgrade precheck <rpm file> local

              Upgrade precheck in progress:
      Node 1: phase 1/1 (Precheck 100%)
      Upgrade precheck found no issues.

Uaktualnianie — procedura krok po kroku

Przełącz węzeł w trybie gotowości rezerwowy w tryb offline.

   Standby-node # ha offline
      This operation will cause the ha system to no longer be highly  available.
      Do you want to proceed? (yes|no) [no]: yes
      Standby node is now offline.

(UWAGA: Jeśli operacja w trybie offline nie powiodła się lub stan HA to „degraded”, kontynuuj uaktualnienie lokalne, ponieważ wykonanie kolejnych kroków może wyeliminować błędy).

Węzeł w trybie gotowości musi mieć stan „offline”.

      Standby-node # ha status
    HA System name:       HA-system
    HA System status:     degraded
    Node Name                       Node id   Role      HA State
    -----------------------------   -------   -------   --------
    Node1   1         standby   offline
    Node0   0         active    degraded
    -----------------------------   -------   -------   --------

Przeprowadź aktualizację w węźle w trybie gotowości. Ta operacja wywoła ponowne uruchomienie węzła w trybie gotowości.

Standby-node # system upgrade start <rpm file> local
The 'system upgrade' command upgrades the Data Domain OS. File access
is interrupted during the upgrade. The system reboots automatically
after the upgrade.
Are you sure? (yes|no) [no]: yes
ok, proceeding.
The 'local' flag is highly disruptive to HA systems and should be used only as a repair operation.
Are you sure? (yes|no) [no]: yes
ok, proceeding.
Upgrade in progress:
Node 1: phase 3/4 (Reboot 0%)
Upgrade has started. System will reboot.

Węzeł w trybie gotowości uruchomi się ponownie z nową wersją DDOS, ale pozostanie w trybie offline.
Sprawdź stan aktualizacji systemu. Uaktualnianie systemu operacyjnego może potrwać ponad 30 minut.

Standby-node # system upgrade status
      Current Upgrade Status: DD OS upgrade Succeeded
      End time: 20xx.xx.xx:xx:xx

Sprawdź, czy stan HA węzła w trybie gotowości (w tym przypadku to węzeł 1) to „offline”, a stan systemu HA to „degraded”.

Standby-node # ha status
      HA System name:       HA-system
      HA System status:     degraded
      Node Name                       Node id   Role      HA State
      -----------------------------   -------   -------   --------
      Node1   1         standby   offline
      Node0   0         active    degraded
      -----------------------------   -------   -------   --------

Wykonaj uaktualnienie lokalne w aktywnym węźle. Ta operacja spowoduje ponowne uruchomienie aktywnego węzła.

Active-node # system upgrade start <rpm file> local
    The 'system upgrade' command upgrades the Data Domain OS.  File access
    is interrupted during the upgrade.  The system reboots automatically
    after the upgrade.
               Are you sure? (yes|no) [no]: yes
    ok, proceeding.
    The 'local' flag is highly disruptive to HA systems and should be used        only as a repair operation.
               Are you sure? (yes|no) [no]: yes
    ok, proceeding.
    Upgrade in progress:
    Node   Severity   Issue                           Solution
    ----   --------   ------------------------------  --------
    0      WARNING    1 component precheck
             script(s) failed to complete
    0      INFO       Upgrade time est: 60 mins
    ----   --------   ------------------------------  --------
    Node 0: phase 3/4 (Reboot     0%)
    Upgrade has started.  System will reboot.

Sprawdź stan aktualizacji systemu. Uaktualnianie systemu operacyjnego może potrwać ponad 30 minut.

Active-node # system upgrade status
    Current Upgrade Status: DD OS upgrade Succeeded
    End time: 20xx.xx.xx:xx:xx

Po zakończeniu uaktualniania aktywnego węzła stan systemu HA to nadal „degraded”. Wykonaj następujące polecenie, aby przełączyć węzeł w trybie gotowości w tryb online, co spowoduje ponowne uruchomienie węzła w trybie gotowości.

Standby-node # ha online
The operation will reboot this node.
Do you want to proceed? (yes|no) [no]: yes
Broadcast message from root (Wed Oct 14 22:38:53 2020):
The system is going down for reboot NOW!
**** Error communicating with management service.
(UWAGA: Jeśli w poprzednich krokach nie uruchomiono polecenia „ha offline”, zignoruj ten krok)

Węzeł w trybie gotowości uruchomi się ponownie i ponownie dołączy do klastra. Wtedy stan systemu HA ponownie przyjmie wartość „highly available”.

   Active-node # ha status detailed
     HA System name:               Ha-system
     HA System Status:             highly available
     Interconnect Status:          ok
     Primary Heartbeat Status:      ok
     External LAN Heartbeat Status: ok
     Hardware compatibility check: ok
     Software Version Check:       ok
     Node node0:
               Role:          active
               HA State:      online
               Node Health: ok
     Node node1:
               Role:          standby
               HA State:      online
               Node Health: ok
     Mirroring Status:
     Component Name   Status
     --------------   ------
     nvram            ok
     registry         ok
     sms              ok
     ddboost          ok
     cifs             ok
     --------------   ------

Weryfikacja:

Sprawdź, czy oba węzły mają tę samą wersję DDOS.

Node1 # system show version
   Data Domain OS x.x.x.x-12345
   Node0 # system show version                  
   Data Domain OS x.x.x.x-12345

Sprawdź, czy nie ma nieoczekiwanych alertów.

Node1 # alert show current
   Node0 # alert show current

W tym momencie stopniowa aktualizacja zakończyła się pomyślnie.

Uwaga: W przypadku wystąpienia jakichkolwiek problemów z uaktualnieniem należy skontaktować się z działem pomocy technicznej Data Domain, aby uzyskać dalsze instrukcje i wsparcie.

Additional Information

Stopniowa aktualizacja:

Należy pamiętać, że podczas uaktualniania zostaje wykonane jedno przełączenie awaryjne, więc role się zamienią
Informacje o uaktualnieniu są nadal przechowywane w dzienniku infra.log, ale w dzienniku ha.log mogą pojawić się dodatkowe informacje
Postęp aktualizacji można monitorować za pomocą funkcji monitorowania aktualizacji systemu

Uaktualnienie węzła lokalnego:

Uaktualnienie węzła lokalnego nie wykonuje przełączenia awaryjnego HA
W rezultacie podczas aktualizacji / uruchamiania / wykonywania czynności aktualizacyjnych po ponownym uruchomieniu aktywnego węzła nastąpi długi przestój, co prawdopodobnie spowoduje przekroczenie limitu czasu i niepowodzenie tworzenia/przywracania kopii zapasowych. Wymagaj przydzielenia serwisowego okna czasowego dla uaktualnienia lokalnego.
Nawet jeśli stan systemu HA to „degraded”, można kontynuować lokalne uaktualnianie.
Z jakiegoś powodu stopniowa aktualizacja może nieoczekiwanie zakończyć się niepowodzeniem. W tej sytuacji za metodę naprawy można uznać uaktualnienie lokalne.

Affected Products

Data Domain

Products

Data Domain, DD OS

Article Number: 000009653

Article Type: How To

Last Modified: 07 Oct 2025

Version: 8

Check if your device is covered by Support Services.

DataDomain: Instrukcja aktualizacji systemu operacyjnego dla systemów o wysokiej dostępności (HA)

Summary: Omówienie procesu aktualizacji systemu Data Domain Operating System (DDOS) na urządzeniach Data Domain o wysokiej dostępności (DDHA).

Instructions

Additional Information

Affected Products

Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services

DataDomain: Instrukcja aktualizacji systemu operacyjnego dla systemów o wysokiej dostępności (HA)

Summary: Omówienie procesu aktualizacji systemu Data Domain Operating System (DDOS) na urządzeniach Data Domain o wysokiej dostępności (DDHA).

Detailed Article

Instructions

Additional Info

Affected Products

Instructions

Additional Information

Affected Products

Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services