DataDomain: Instrukcja aktualizacji systemu operacyjnego dla systemów o wysokiej dostępności (HA)

Summary: Omówienie procesu aktualizacji systemu Data Domain Operating System (DDOS) na urządzeniach Data Domain o wysokiej dostępności (DDHA).

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Planowana konserwacja systemu HA

W celu skrócenia planowanych przestojów konserwacyjnych architektura HA zawiera stopniową aktualizacje systemu. Stopniowa aktualizacja może najpierw uaktualnić węzeł w trybie gotowości, a następnie wykorzystać oczekiwane przełączenie awaryjne HA w celu przeniesienia usług z aktywnego węzła do węzła w trybie gotowości. Na koniec poprzednie aktywne węzły zostaną zaktualizowane i ponownie dołączą do klastra HA jako węzeł w trybie gotowości. Wszystkie procesy są wykonywane w jednym poleceniu.
Alternatywną metodą ręcznego uaktualnienia jest „uaktualnienie lokalne”. Najpierw ręcznie zaktualizuj węzeł w trybie gotowości, a następnie ręcznie zaktualizuj aktywny węzeł.  Na koniec węzeł w trybie gotowości ponownie dołączy do klastra HA. Uaktualnienie lokalne można przeprowadzić albo w celu wykonania regularnej aktualizacji, albo rozwiązania problemów.
Wszystkie operacje aktualizacji systemu w aktywnym węźle wymagające konwersji danych mogą się nie rozpocząć, dopóki oba systemy nie zostaną zaktualizowane do tego samego poziomu i stan HA nie zostanie w pełni przywrócony.


W wersji DDOS 5.7 i nowszych są dostępne dwie metody aktualizacji systemów HA:
  • Stopniowa aktualizacja — automatyczne uaktualnianie obu węzłów HA za pomocą jednego polecenia. Po uaktualnieniu usługa jest przenoszona do innego węzła.

  • Uaktualnienie lokalne — ręczne uaktualnianie węzłów HA po kolei. Po uaktualnieniu usługa jest zachowywana w tym samym węźle.

 

Stopniowa aktualizacja za pośrednictwem GUI:

Przygotuj system do aktualizacji:

  1. System HA musi mieć stan „highly available”.

 GUI logowania  à Home à Dashboard

Strona Dashboard
  1. Plik RPM DDOS należy umieścić w aktywnym węźle, a aktualizacja powinna rozpocząć się od tego węzła.
- Jak znaleźć aktywny węzeł:
  GUI logowania  à Home à Dashboard

Strona Dashboard               
 
  1. Prześlij plik RPM do aktywnego węzła
GUI logowania à Maintenance à System à Kliknij przycisk UPLOAD UPGRADE PACKAGE

 Strona Maintenance 
Po przesłaniu plik RPM zostanie wyświetlony na liście.
 
  1. Uruchom sprawdzanie wstępne na aktywnym węźle. W przypadku wystąpienia jakiegokolwiek błędu uaktualnienie powinno zostać przerwane.
GUI logowania à Maintenance à System à Kliknij plik RPM aktualizacji à Kliknij przycisk UPGRADE PRECHECK

 Strona System 
 

         Przed rozpoczęciem uaktualniania (krok nr 6) należy również wyłączyć GC, przenoszenie danych i replikację, aby te zadania nie prowadziły do dłuższego czasu zamykania DDFS podczas uaktualniania. Krótszy czas wyłączenia DDFS pomoże zminimalizować wpływ na klientów. Te obciążenia robocze nie mają wpływu na operacje tworzenia kopii zapasowych/przywracania klientów.

         W zależności od potrzeb usługi te można wznowić po zakończeniu uaktualnienia za pomocą odpowiednich poleceń włączania. Więcej szczegółów można znaleźć w podręczniku administracyjnym.

         W podręczniku administracyjnym opisano kilka innych ręcznych kontroli i poleceń, które nie są bezwzględnie konieczne dla systemu HA. Jako test dla systemów z jednym węzłem obecnie sugeruje się wykonanie zadania przed ponownym uruchomieniem. Nie jest to konieczne w przypadku systemów HA, ponieważ krok nr 5 „ha failover” poniżej obejmuje już automatyczne ponowne uruchomienie podczas procesu przełączania awaryjnego.

  1. Opcjonalnie. Przed uruchomieniem stopniowej aktualizacji zaleca się dwukrotne ręczne przełączenie awaryjne systemu HA w aktywnym węźle. Celem jest przetestowanie funkcji przełączania awaryjnego. Operacja spowoduje ponowne uruchomienie aktywnego węzła, o czym należy pamiętać.

   
              Najpierw przygotuj się do przełączenia awaryjnego, wyłączając GC, przenoszenie danych i replikację. Zapoznaj się z podręcznikiem administracyjnym, aby dowiedzieć się, jak to zrobić za pomocą GUI. Te usługi nie mają wpływu na obciążenia robocze tworzenia kopii zapasowych/przywracania klientów. Następnie wykonaj operację „ha failover”.
 

GUI logowania à Health à High Availability à Kliknij opcję Failover to XXX


(Gdy stan systemu HA ponownie stanie się „highly available”, wykonaj drugą operację „ha failover” i poczekaj, aż oba węzły będą w trybie online)

 

Po przełączeniu awaryjnym systemu HA można wznowić zatrzymane usługi przy użyciu odpowiednich poleceń włączania. Aby uzyskać więcej informacji, zapoznaj się z podręcznikiem administracyjnym.

Powyższe testy przełączania awaryjnego są opcjonalne i nie trzeba ich przeprowadzać bezpośrednio przed aktualizacją. Testy przełączania awaryjnego można przeprowadzić przed aktualizacją, na przykład dwa tygodnie wcześniej, aby można było wykorzystać krótszą przerwę konserwacyjną na późniejszą aktualizację. Czas przestoju usługi DDFS dla każdego przełączania awaryjnego wynosi około 10 minut (mniej więcej, w zależności od wersji DDOS i kilku innych czynników). DDOS w wersji 7.4 i nowszej będzie miał mniej przestojów ze względu na ciągłe udoskonalenia oprogramowania DDOS.

 

      Uaktualnianie — procedura krok po kroku
  1. Jeśli sprawdzanie wstępne zakończyło się bez żadnych problemów, kontynuuj stopniową aktualizację w aktywnym węźle.
GUI logowania à Maintenance à System à Kliknij plik RPM aktualizacji à Kliknij przycisk PERFORM SYSTEM UPGRADE
 
 Strona System
  1. Poczekaj na zakończenie stopniowej aktualizacji. Do tego czasu nie należy wyzwalać żadnej operacji przełączania awaryjnego HA.

Dostępność DDFS podczas wykonywania powyższego polecenia:

  1. Najpierw uaktualni węzeł w trybie gotowości, a następnie uruchomi go ponownie do nowej wersji. Zajmuje to około 20 do 30 minut w zależności od różnych czynników. Usługa DDFS jest włączona i działa w tym okresie na aktywnym węźle bez pogorszenia wydajności.

  2. Po zastosowaniu nowego systemu DDOS system przełączy awaryjnie usługę DDFS do uaktualnionego węzła w trybie gotowości. Zajmuje to około 10 minut (mniej więcej, w zależności od różnych czynników).

    1. Jednym z istotnych czynników jest aktualizacja oprogramowania wewnętrznego DAE. Może to wydłużyć przestój o ~20 minut w zależności od liczby skonfigurowanych DAE. Zapoznaj się z artykułem w bazie wiedzy „Data Domain: Stopniowa aktualizacja HA może zakończyć się niepowodzeniem w przypadku aktualizacji oprogramowania wewnętrznego obudowy zewnętrznej”, aby określić, czy wymagane jest uaktualnienie oprogramowania wewnętrznego DAE. Należy pamiętać, że począwszy od DDOS 7.5 wprowadzono udoskonalenie umożliwiające aktualizację oprogramowania wewnętrznego DAE online, eliminując ten problem.

    2. W celu omówienia czynników, które mogą mieć wpływ na czas aktualizacji, można skontaktować się z działem pomocy technicznej firmy Dell. W zależności od systemu operacyjnego klienta, aplikacji oraz protokołu między klientem a systemem HA, czasami może zajść konieczność ręcznego wznowienia obciążeń roboczych klienta zaraz po przełączeniu awaryjnym. Jeśli na przykład w przypadku klientów DDBoost czas przełączania awaryjnego przekracza 10 minut, upłynie limit czasu klienta i użytkownik musi ręcznie wznowić obciążenia robocze. Jednak zwykle na klientach dostępne są opcje dostosowywane umożliwiające ustawienie wartości limitu czasu i czasy ponawiania prób. 

Należy pamiętać, że usługa DDFS nie działa w okresie przełączania awaryjnego. Obserwując dane wyjściowe polecenia „filesys status” w uaktualnionym węźle, można ustalić, czy usługa DDFS została wznowiona, czy nie. Oczekuje się, że DDOS w wersji 7.4 i nowszej będzie miał coraz mniej przestojów ze względu na ulepszenia kodu DDOS.

Po przełączeniu awaryjnym poprzednio aktywny węzeł zostanie uaktualniony.  Po zastosowaniu uaktualnienia zostanie on uruchomiony ponownie do nowej wersji, a następnie ponownie dołączy do klastra HA jako węzeł w trybie gotowości. Ten proces nie wpływa na usługę DDFS, ponieważ została ona już wznowiona w kroku nr II powyżej.


     Weryfikacja:
  1. Po zakończeniu stopniowej aktualizacji trzeba przejść do GUI logowania za pośrednictwem adresu IP węzła w trybie gotowości. W tym przypadku jest to węzeł 1.
GUI logowania  à Maintenance à System à Sprawdź Upgrade History
 Strona System
  1. Sprawdź, czy nie ma nieoczekiwanych alertów.
GUI logowania  à Dashboard à Alerts
  1. W tym momencie stopniowa aktualizacja zakończyła się pomyślnie.

Stopniowa aktualizacja za pośrednictwem CLI:
      Przygotuj system do aktualizacji:
  1. System HA musi mieć stan „highly available”.
#ha status
     
     HA System name:       HA-system   

     HA System status:     highly available         ç
     Node Name                       Node id   Role      HA State
     -----------------------------   -------   -------   --------
     Node0   0         active    online   
     Node1   1         standby   online
     -----------------------------   -------   -------   --------
  1. Plik RPM DDOS należy umieścić w aktywnym węźle, a aktualizacja powinna rozpocząć się od tego węzła.
- Jak znaleźć aktywny węzeł:
 
#ha status

 
      HA System name:       HA-system   
      HA System status:     highly available
      Node Name                       Node id   Role      HA State
      -----------------------------   -------   -------   --------
      Node0   0         active    online    ß Node0 is active node
      Node1   1         standby   online
      -----------------------------   -------   -------   --------
  1. Prześlij plik RPM do aktywnego węzła
Client-server # scp <rpm file> sysadmin@HA-system.active_node:/ddr/var/releases/
Password: (customer defined it.)

(From client server, target path is “/ddr/var/releases”)
            Po wykonaniu polecenia „scp” sprawdź informacje o pakiecie systemu
     Active-node # system package list

     File                 Size (KiB)   Type     Class        Name    Version
     ------------------   ----------   ------   ----------   -----   -------
     x.x.x.x-12345.rpm    2927007.3   System   Production   DD OS   x.x.x.x
     ------------------   ----------   ------   ----------   -----  -------         
  1. Uruchom sprawdzanie wstępne na aktywnym węźle. W przypadku wystąpienia jakiegokolwiek błędu uaktualnienie powinno zostać przerwane.
Active-node # system upgrade precheck <rpm file>

     Upgrade precheck in progress:
     Node 0: phase 1/1 (Precheck 100%) , Node 1: phase 1/1 (Precheck 100%)
     Upgrade precheck found no issues.

     Przed rozpoczęciem uaktualniania (krok nr 6) należy również wyłączyć GC, przenoszenie danych i replikację, aby te zadania nie prowadziły do dłuższego czasu zamykania DDFS podczas uaktualniania. Krótszy czas wyłączenia DDFS pomoże zminimalizować wpływ na klientów. Te obciążenia robocze nie mają wpływu na operacje tworzenia kopii zapasowych/przywracania klientów. W zależności od potrzeb usługi te można wznowić po zakończeniu uaktualnienia za pomocą odpowiednich poleceń włączania. Więcej szczegółów można znaleźć w podręczniku administracyjnym.
      
Active-node # filesys clean stop
   Active-node # cloud clean stop
   Active-node # data-movement suspend
   Active-node # data-movement stop to-tier active
   Active-node # replication disable all

       

     Zauważ, że istnieje kilka poleceń „watch” do sprawdzania, czy powyższe operacje zostały wykonane.
      Active-node # filesys clean watch 
   Active-node # cloud clean watch
   Active-node # data-movement watch


      W podręczniku administracyjnym opisano kilka innych ręcznych kontroli i poleceń, które nie są bezwzględnie konieczne dla systemu HA. Jako test dla systemów z jednym węzłem obecnie sugeruje się wykonanie zadania przed ponownym uruchomienie. Nie jest to konieczne w przypadku systemów HA, ponieważ krok nr 5 „ha failover” poniżej obejmuje już automatyczne ponowne uruchomienie podczas procesu przełączania awaryjnego.

  1. Opcjonalnie. Przed uruchomieniem stopniowej aktualizacji zaleca się dwukrotne ręczne przełączenie awaryjne systemu HA w aktywnym węźle. Celem jest przetestowanie funkcji przełączania awaryjnego. Operacja spowoduje ponowne uruchomienie aktywnego węzła, o czym należy pamiętać.

        Najpierw przygotuj się do przełączenia awaryjnego, wyłączając GC, przenoszenie danych i replikację. Te usługi nie mają wpływu na obciążenia robocze tworzenia kopii zapasowych/przywracania klientów. Następnie wykonaj operację „ha failover”.

       Robi się to za pomocą następujących poleceń:
          
Active-node # filesys clean stop
     Active-node # cloud clean stop
     Active-node # data-movement suspend
     Active-node # data-movement stop to-tier active
     Active-node # replication disable all

        Zauważ, że istnieje kilka poleceń „watch” do sprawdzania, czy powyższe operacje zostały wykonane.
          
Active-node # filesys clean watch 
     Active-node # cloud clean watch
     Active-node # data-movement watch

        Następnie uruchom polecenie przełączania awaryjnego:

Active-node # ha failover
          This operation will initiate a failover from this node. The local node will reboot.
      Do you want to proceed? (yes|no) [no]: yes
    Failover operation initiated. Run 'ha status' to monitor the status

(Gdy stan systemu HA ponownie stanie się „highly available”, wykonaj drugą operację „ha failover” i poczekaj, aż oba węzły będą w trybie online)

Po przełączeniu awaryjnym systemu HA można wznowić zatrzymane usługi przy użyciu odpowiednich poleceń włączania. Aby uzyskać więcej informacji, zapoznaj się z podręcznikiem administracyjnym.
Powyższe testy przełączania awaryjnego są opcjonalne i nie trzeba ich przeprowadzać bezpośrednio przed aktualizacją. Testy przełączania awaryjnego można przeprowadzić przed aktualizacją, na przykład dwa tygodnie wcześniej, aby można było wykorzystać krótszą przerwę konserwacyjną na późniejszą aktualizację. Czas przestoju usługi DDFS dla każdego przełączania awaryjnego wynosi około 10 minut (mniej więcej, w zależności od wersji DDOS i kilku innych czynników). DDOS w wersji 7.4 i nowszej będzie miał mniej przestojów ze względu na ciągłe udoskonalenia oprogramowania DDOS. 

  

      Uaktualnianie — procedura krok po kroku      
  1. Jeśli sprawdzanie wstępne zakończyło się bez żadnych problemów, kontynuuj stopniową aktualizację w aktywnym węźle.
             Active-node # system upgrade start <rpm file>

      The 'system upgrade' command upgrades the Data Domain OS.  File access
      is interrupted during the upgrade.  The system reboots automatically
      after the upgrade.
              Are you sure? (yes|no) [no]: yes
      ok, proceeding.
      Upgrade in progress:
      Node   Severity   Issue                           Solution
      ----   --------   ------------------------------  --------
      0      WARNING    1 component precheck
         script(s) failed to complete
      0      INFO       Upgrade time est: 60 mins
      1      WARNING    1 component precheck
          script(s) failed to complete
      1      INFO       Upgrade time est: 80 mins
      ----   --------   ------------------------------  --------
      Node 0: phase 2/4 (Install    0%) , Node 1: phase 1/4 (Precheck 100%)
      Upgrade phase status legend:
      DU : Data Upgrade
      FO : Failover
      ..               
      PC : Peer Confirmation
      VA : Volume Assembly

      Node 0: phase 3/4 (Reboot     0%) , Node 1: phase 4/4 (Finalize   5%) FO
      Upgrade has started.  System will reboot.   

        

       Dostępność DDFS podczas wykonywania powyższego polecenia:

  1. Najpierw uaktualni węzeł w trybie gotowości, a następnie uruchomi go ponownie do nowej wersji. Zajmuje to około 20 do 30 minut w zależności od różnych czynników. Usługa DDFS jest włączona i działa w tym okresie na aktywnym węźle bez pogorszenia wydajności.

  2. Po zastosowaniu nowego systemu DDOS system przełączy awaryjnie usługę DDFS do uaktualnionego węzła w trybie gotowości. Zajmuje to około 10 minut (mniej więcej, w zależności od różnych czynników).

    1. Jednym z istotnych czynników jest aktualizacja oprogramowania wewnętrznego DAE. Może to wydłużyć przestój o ~20 minut w zależności od liczby skonfigurowanych DAE. Zapoznaj się z artykułem w bazie wiedzy „Data Domain: Stopniowa aktualizacja HA może zakończyć się niepowodzeniem w przypadku aktualizacji oprogramowania wewnętrznego obudowy zewnętrznej”, aby określić, czy wymagane jest uaktualnienie oprogramowania wewnętrznego DAE. Należy pamiętać, że począwszy od DDOS 7.5 wprowadzono udoskonalenie umożliwiające aktualizację oprogramowania wewnętrznego DAE online, eliminując ten problem.

    2. W celu omówienia czynników, które mogą mieć wpływ na czas aktualizacji, można skontaktować się z działem pomocy technicznej firmy Dell. W zależności od systemu operacyjnego klienta, aplikacji oraz protokołu między klientem a systemem HA, czasami może zajść konieczność ręcznego wznowienia obciążeń roboczych klienta zaraz po przełączeniu awaryjnym. Jeśli na przykład w przypadku klientów DDBoost czas przełączania awaryjnego przekracza 10 minut, upłynie limit czasu klienta i użytkownik musi ręcznie wznowić obciążenia robocze. Jednak zwykle na klientach dostępne są opcje dostosowywane umożliwiające ustawienie wartości limitu czasu i czasy ponawiania prób. 

  1. Po przełączeniu awaryjnym poprzednio aktywny węzeł zostanie uaktualniony.  Po zastosowaniu uaktualnienia zostanie on uruchomiony ponownie do nowej wersji, a następnie ponownie dołączy do klastra HA jako węzeł w trybie gotowości. Ten proces nie wpływa na usługę DDFS, ponieważ została ona już wznowiona w kroku nr II powyżej.

Należy pamiętać, że usługa DDFS nie działa w okresie przełączania awaryjnego. Obserwując dane wyjściowe polecenia „filesys status” w uaktualnionym węźle, można ustalić, czy usługa DDFS została wznowiona, czy nie. Oczekuje się, że DDOS w wersji 7.4 i nowszej będzie miał coraz mniej przestojów ze względu na ulepszenia kodu DDOS.
  1. Po ponownym uruchomieniu węzła w trybie gotowości (węzeł 1) i uzyskaniu dostępu można zalogować się do węzła w trybie gotowości w celu monitorowania stanu/postępu aktualizacji.
Node1 # system upgrade status
Current Upgrade Status: DD OS upgrade In Progress
Node 0: phase 3/4 (Reboot     0%)
Node 1: phase 4/4 (Finalize 100%) waiting for peer confirmation
  1. Poczekaj na zakończenie stopniowej aktualizacji. Do tego czasu nie należy wyzwalać żadnej operacji przełączania awaryjnego HA.
Node1 # system upgrade status
Current Upgrade Status: DD OS upgrade Succeeded
End time: 20xx.xx.xx:xx:xx
  1. Sprawdź, czy stan HA obu węzłów to „online”, a stan systemu HA to „highly available”.
Node1 # ha status detailed
HA System name:               HA-system
HA System Status:             highly available
Interconnect Status:          ok
Primary Heartbeat Status:      ok
External LAN Heartbeat Status: ok
Hardware compatibility check: ok
Software Version Check:       ok
Node  Node1:
      Role:          active
      HA State:      online
      Node Health: ok
Node Node0:
      Role:          standby
      HA State:      online
      Node Health: ok
Mirroring Status:
Component Name   Status
--------------   ------
nvram            ok
registry         ok
sms              ok
ddboost          ok
cifs             ok
--------------   ------
            

     Weryfikacja:
  1. Sprawdź, czy oba węzły mają tę samą wersję DDOS.
Node1 # system show version
Data Domain OS x.x.x.x-12345
Node0 # system show version                  
Data Domain OS x.x.x.x-12345
  1. Sprawdź, czy nie ma nieoczekiwanych alertów.
Node1 # alert show current
Node0 # alert show current
  1. W tym momencie stopniowa aktualizacja zakończyła się pomyślnie. 

Uwaga: W przypadku wystąpienia jakichkolwiek problemów z uaktualnieniem należy skontaktować się z działem pomocy technicznej Data Domain, aby uzyskać dalsze instrukcje i wsparcie.


UAKTUALNIENIE LOKALNE dla pary DDHA: 
Uaktualnienie lokalne działa zasadniczo w następujący sposób:

      Przygotuj system do aktualizacji:

  1. Sprawdź stan systemu HA. Nawet jeśli stan to „degraded”, uaktualnienie lokalne może działać w tej sytuacji.

     #ha status
     HA System name:       HA-system   
     HA System status:     highly available   <-      
     Node Name                       Node id   Role      HA State
     -----------------------------   -------   -------   --------
     Node0   0         active    online   
     Node1   1         standby   online
     -----------------------------   -------   -------   --------

  1. Plik RPM DDOS należy umieścić w obu węzłach, a aktualizacja powinna rozpocząć się od węzła w trybie gotowości.
- Jak znaleźć węzeł w trybie gotowości:
#ha status
HA System name:       HA-system   
HA System status:     highly available
Node Name                       Node id   Role      HA State
-----------------------------   -------   -------   --------
Node0   0         active    online   
Node1   1         standby   online   <- Node1 is standby node
-----------------------------   -------   -------   --------
  1. Prześlij plik RPM do obu węzłów.
       Client-server # scp <rpm file> sysadmin@HA-  system.active_node:/ddr/var/releases/
Client-server # scp <rpm file> sysadmin@HA-system.standby_node:/ddr/var/releases/
Password: (customer defined it.)

(From client server, target path is “/ddr/var/releases”)
 
            Po wykonaniu polecenia „scp” sprawdź informacje o pakiecie systemu.
     Active-node # system package list
     File                 Size (KiB)   Type     Class        Name    Version
     ------------------   ----------   ------   ----------   -----   -------
     x.x.x.x-12345.rpm    2927007.3   System   Production   DD OS   x.x.x.x
     ------------------   ----------   ------   ---------- -----   ------       
     Standby-node # system package list
     File                 Size (KiB)   Type     Class        Name    Version
     ------------------   ----------   ------   ----------   -----   -------
     x.x.x.x-12345.rpm    2927007.3   System   Production   DD OS   x.x.x.x
     ------------------   ----------   ------   ----------   -----   ------
  1. Uruchom sprawdzanie wstępne na aktywnym węźle, jeśli stan HA to „highly available”. W przypadku wystąpienia jakiegokolwiek błędu uaktualnienie powinno zostać przerwane.
            Active-node # system upgrade precheck <rpm file>

      Upgrade precheck in progress:
      Node 0: phase 1/1 (Precheck 100%) , Node 1: phase 1/1 (Precheck 100%)
      Upgrade precheck found no issues.

            Jeśli stan HA to „degraded”, należy wykonać sprawdzanie wstępne na obu węzłach.

            Active-node # system upgrade precheck <rpm file> local
      Upgrade precheck in progress:

      Node 0: phase 1/1 (Precheck 100%)
      Upgrade precheck found no issues.

      Standby-node # system upgrade precheck <rpm file> local
      Upgrade precheck in progress:

      Node 1: phase 1/1 (Precheck 100%)
      Upgrade precheck found no issues.    
      
     Uaktualnianie — procedura krok po kroku   
     
  1. Przełącz węzeł w trybie gotowości rezerwowy w tryb offline.
            Standby-node # ha offline
      This operation will cause the ha system to no longer be highly  available.
      Do you want to proceed? (yes|no) [no]: yes
      Standby node is now offline.

           (UWAGA: Jeśli operacja w trybie offline nie powiodła się lub stan HA to „degraded”, kontynuuj uaktualnienie lokalne, ponieważ wykonanie kolejnych kroków może wyeliminować błędy).
  1. Węzeł w trybie gotowości musi mieć stan „offline”.
       Standby-node # ha status
    HA System name:       HA-system
    HA System status:     degraded
    Node Name                       Node id   Role      HA State
    -----------------------------   -------   -------   --------
    Node1   1         standby   offline
    Node0   0         active    degraded
    -----------------------------   -------   -------   --------
    1. Przeprowadź aktualizację w węźle w trybie gotowości. Ta operacja wywoła ponowne uruchomienie węzła w trybie gotowości.
             Standby-node # system upgrade start <rpm file> local
        The 'system upgrade' command upgrades the Data Domain OS.  File access
        is interrupted during the upgrade.  The system reboots automatically
        after the upgrade.
                Are you sure? (yes|no) [no]: yes
        ok, proceeding.
        The 'local' flag is highly disruptive to HA systems and should be used only as a repair operation.
               Are you sure? (yes|no) [no]: yes
        ok, proceeding.
        Upgrade in progress:
        Node 1: phase 3/4 (Reboot     0%)
        Upgrade has started.  System will reboot.
    1. Węzeł w trybie gotowości uruchomi się ponownie z nową wersją DDOS, ale pozostanie w trybie offline.
    2. Sprawdź stan aktualizacji systemu. Uaktualnianie systemu operacyjnego może potrwać ponad 30 minut.
                 Standby-node # system upgrade status
          Current Upgrade Status: DD OS upgrade Succeeded
          End time: 20xx.xx.xx:xx:xx
    1. Sprawdź, czy stan HA węzła w trybie gotowości (w tym przypadku to węzeł 1) to „offline”, a stan systemu HA to „degraded”.
                 Standby-node # ha status
          HA System name:       HA-system
          HA System status:     degraded
          Node Name                       Node id   Role      HA State
          -----------------------------   -------   -------   --------
          Node1   1         standby   offline
          Node0   0         active    degraded
          -----------------------------   -------   -------   --------
    1. Wykonaj uaktualnienie lokalne w aktywnym węźle. Ta operacja spowoduje ponowne uruchomienie aktywnego węzła.
            Active-node # system upgrade start <rpm file> local
        The 'system upgrade' command upgrades the Data Domain OS.  File access
        is interrupted during the upgrade.  The system reboots automatically
        after the upgrade.
                   Are you sure? (yes|no) [no]: yes
        ok, proceeding.
        The 'local' flag is highly disruptive to HA systems and should be used        only as a repair operation.
                   Are you sure? (yes|no) [no]: yes
        ok, proceeding.
        Upgrade in progress:
        Node   Severity   Issue                           Solution
        ----   --------   ------------------------------  --------
        0      WARNING    1 component precheck
                 script(s) failed to complete
        0      INFO       Upgrade time est: 60 mins
        ----   --------   ------------------------------  --------
        Node 0: phase 3/4 (Reboot     0%)
        Upgrade has started.  System will reboot.
    1. Sprawdź stan aktualizacji systemu. Uaktualnianie systemu operacyjnego może potrwać ponad 30 minut.
             Active-node # system upgrade status
        Current Upgrade Status: DD OS upgrade Succeeded
        End time: 20xx.xx.xx:xx:xx
    1. Po zakończeniu uaktualniania aktywnego węzła stan systemu HA to nadal „degraded”. Wykonaj następujące polecenie, aby przełączyć węzeł w trybie gotowości w tryb online, co spowoduje ponowne uruchomienie węzła w trybie gotowości.
             Standby-node # ha online
        The operation will reboot this node.
            Do you want to proceed? (yes|no) [no]: yes
        Broadcast message from root (Wed Oct 14 22:38:53 2020):
        The system is going down for reboot NOW!
        **** Error communicating with management service.
        (UWAGA: Jeśli w poprzednich krokach nie uruchomiono polecenia „ha offline”, zignoruj ten krok)
    1. Węzeł w trybie gotowości uruchomi się ponownie i ponownie dołączy do klastra. Wtedy stan systemu HA ponownie przyjmie wartość „highly available”.
              Active-node # ha status detailed
         HA System name:               Ha-system
         HA System Status:             highly available
         Interconnect Status:          ok
         Primary Heartbeat Status:      ok
         External LAN Heartbeat Status: ok
         Hardware compatibility check: ok
         Software Version Check:       ok
         Node node0:
                   Role:          active
                   HA State:      online
                   Node Health: ok
         Node node1:
                   Role:          standby
                   HA State:      online
                   Node Health: ok
         Mirroring Status:
         Component Name   Status
         --------------   ------
         nvram            ok
         registry         ok
         sms              ok
         ddboost          ok
         cifs             ok
         --------------   ------

    Weryfikacja:
    1. Sprawdź, czy oba węzły mają tę samą wersję DDOS.
           Node1 # system show version
       Data Domain OS x.x.x.x-12345
       Node0 # system show version                  
       Data Domain OS x.x.x.x-12345
    1. Sprawdź, czy nie ma nieoczekiwanych alertów.
           Node1 # alert show current
       Node0 # alert show current
    1. W tym momencie stopniowa aktualizacja zakończyła się pomyślnie.
               
    Uwaga: W przypadku wystąpienia jakichkolwiek problemów z uaktualnieniem należy skontaktować się z działem pomocy technicznej Data Domain, aby uzyskać dalsze instrukcje i wsparcie.

    Additional Information

    Stopniowa aktualizacja:

    • Należy pamiętać, że podczas uaktualniania zostaje wykonane jedno przełączenie awaryjne, więc role się zamienią

    • Informacje o uaktualnieniu są nadal przechowywane w dzienniku infra.log, ale w dzienniku ha.log mogą pojawić się dodatkowe informacje

    • Postęp aktualizacji można monitorować za pomocą funkcji monitorowania aktualizacji systemu 

    Uaktualnienie węzła lokalnego:

    • Uaktualnienie węzła lokalnego nie wykonuje przełączenia awaryjnego HA

    • W rezultacie podczas aktualizacji / uruchamiania / wykonywania czynności aktualizacyjnych po ponownym uruchomieniu aktywnego węzła nastąpi długi przestój, co prawdopodobnie spowoduje przekroczenie limitu czasu i niepowodzenie tworzenia/przywracania kopii zapasowych. Wymagaj przydzielenia serwisowego okna czasowego dla uaktualnienia lokalnego.

    • Nawet jeśli stan systemu HA to „degraded”, można kontynuować lokalne uaktualnianie.

    • Z jakiegoś powodu stopniowa aktualizacja może nieoczekiwanie zakończyć się niepowodzeniem. W tej sytuacji za metodę naprawy można uznać uaktualnienie lokalne.

       

    Affected Products

    Data Domain

    Products

    Data Domain, DD OS
    Article Properties
    Article Number: 000009653
    Article Type: How To
    Last Modified: 07 Oct 2025
    Version:  8
    Find answers to your questions from other Dell users
    Support Services
    Check if your device is covered by Support Services.