DataDomain: Instrukcja aktualizacji systemu operacyjnego dla systemów o wysokiej dostępności (HA)
Summary: Omówienie procesu aktualizacji systemu Data Domain Operating System (DDOS) na urządzeniach Data Domain o wysokiej dostępności (DDHA).
Instructions
W celu skrócenia planowanych przestojów konserwacyjnych architektura HA zawiera stopniową aktualizacje systemu. Stopniowa aktualizacja może najpierw uaktualnić węzeł w trybie gotowości, a następnie wykorzystać oczekiwane przełączenie awaryjne HA w celu przeniesienia usług z aktywnego węzła do węzła w trybie gotowości. Na koniec poprzednie aktywne węzły zostaną zaktualizowane i ponownie dołączą do klastra HA jako węzeł w trybie gotowości. Wszystkie procesy są wykonywane w jednym poleceniu.
Alternatywną metodą ręcznego uaktualnienia jest „uaktualnienie lokalne”. Najpierw ręcznie zaktualizuj węzeł w trybie gotowości, a następnie ręcznie zaktualizuj aktywny węzeł. Na koniec węzeł w trybie gotowości ponownie dołączy do klastra HA. Uaktualnienie lokalne można przeprowadzić albo w celu wykonania regularnej aktualizacji, albo rozwiązania problemów.
Wszystkie operacje aktualizacji systemu w aktywnym węźle wymagające konwersji danych mogą się nie rozpocząć, dopóki oba systemy nie zostaną zaktualizowane do tego samego poziomu i stan HA nie zostanie w pełni przywrócony.
W wersji DDOS 5.7 i nowszych są dostępne dwie metody aktualizacji systemów HA:
-
Stopniowa aktualizacja — automatyczne uaktualnianie obu węzłów HA za pomocą jednego polecenia. Po uaktualnieniu usługa jest przenoszona do innego węzła.
-
Uaktualnienie lokalne — ręczne uaktualnianie węzłów HA po kolei. Po uaktualnieniu usługa jest zachowywana w tym samym węźle.
Przygotuj system do aktualizacji:
-
System HA musi mieć stan „highly available”.
GUI logowania à Home à Dashboard
- Plik RPM DDOS należy umieścić w aktywnym węźle, a aktualizacja powinna rozpocząć się od tego węzła.
GUI logowania à Home à Dashboard
- Prześlij plik RPM do aktywnego węzła
Po przesłaniu plik RPM zostanie wyświetlony na liście.
- Uruchom sprawdzanie wstępne na aktywnym węźle. W przypadku wystąpienia jakiegokolwiek błędu uaktualnienie powinno zostać przerwane.
Przed rozpoczęciem uaktualniania (krok nr 6) należy również wyłączyć GC, przenoszenie danych i replikację, aby te zadania nie prowadziły do dłuższego czasu zamykania DDFS podczas uaktualniania. Krótszy czas wyłączenia DDFS pomoże zminimalizować wpływ na klientów. Te obciążenia robocze nie mają wpływu na operacje tworzenia kopii zapasowych/przywracania klientów.
W zależności od potrzeb usługi te można wznowić po zakończeniu uaktualnienia za pomocą odpowiednich poleceń włączania. Więcej szczegółów można znaleźć w podręczniku administracyjnym.
W podręczniku administracyjnym opisano kilka innych ręcznych kontroli i poleceń, które nie są bezwzględnie konieczne dla systemu HA. Jako test dla systemów z jednym węzłem obecnie sugeruje się wykonanie zadania przed ponownym uruchomieniem. Nie jest to konieczne w przypadku systemów HA, ponieważ krok nr 5 „ha failover” poniżej obejmuje już automatyczne ponowne uruchomienie podczas procesu przełączania awaryjnego.
- Opcjonalnie. Przed uruchomieniem stopniowej aktualizacji zaleca się dwukrotne ręczne przełączenie awaryjne systemu HA w aktywnym węźle. Celem jest przetestowanie funkcji przełączania awaryjnego. Operacja spowoduje ponowne uruchomienie aktywnego węzła, o czym należy pamiętać.
Najpierw przygotuj się do przełączenia awaryjnego, wyłączając GC, przenoszenie danych i replikację. Zapoznaj się z podręcznikiem administracyjnym, aby dowiedzieć się, jak to zrobić za pomocą GUI. Te usługi nie mają wpływu na obciążenia robocze tworzenia kopii zapasowych/przywracania klientów. Następnie wykonaj operację „ha failover”.

(Gdy stan systemu HA ponownie stanie się „highly available”, wykonaj drugą operację „ha failover” i poczekaj, aż oba węzły będą w trybie online)
Po przełączeniu awaryjnym systemu HA można wznowić zatrzymane usługi przy użyciu odpowiednich poleceń włączania. Aby uzyskać więcej informacji, zapoznaj się z podręcznikiem administracyjnym.
Powyższe testy przełączania awaryjnego są opcjonalne i nie trzeba ich przeprowadzać bezpośrednio przed aktualizacją. Testy przełączania awaryjnego można przeprowadzić przed aktualizacją, na przykład dwa tygodnie wcześniej, aby można było wykorzystać krótszą przerwę konserwacyjną na późniejszą aktualizację. Czas przestoju usługi DDFS dla każdego przełączania awaryjnego wynosi około 10 minut (mniej więcej, w zależności od wersji DDOS i kilku innych czynników). DDOS w wersji 7.4 i nowszej będzie miał mniej przestojów ze względu na ciągłe udoskonalenia oprogramowania DDOS.
- Jeśli sprawdzanie wstępne zakończyło się bez żadnych problemów, kontynuuj stopniową aktualizację w aktywnym węźle.
- Poczekaj na zakończenie stopniowej aktualizacji. Do tego czasu nie należy wyzwalać żadnej operacji przełączania awaryjnego HA.
Dostępność DDFS podczas wykonywania powyższego polecenia:
-
Najpierw uaktualni węzeł w trybie gotowości, a następnie uruchomi go ponownie do nowej wersji. Zajmuje to około 20 do 30 minut w zależności od różnych czynników. Usługa DDFS jest włączona i działa w tym okresie na aktywnym węźle bez pogorszenia wydajności.
-
Po zastosowaniu nowego systemu DDOS system przełączy awaryjnie usługę DDFS do uaktualnionego węzła w trybie gotowości. Zajmuje to około 10 minut (mniej więcej, w zależności od różnych czynników).
-
Jednym z istotnych czynników jest aktualizacja oprogramowania wewnętrznego DAE. Może to wydłużyć przestój o ~20 minut w zależności od liczby skonfigurowanych DAE. Zapoznaj się z artykułem w bazie wiedzy „Data Domain: Stopniowa aktualizacja HA może zakończyć się niepowodzeniem w przypadku aktualizacji oprogramowania wewnętrznego obudowy zewnętrznej”, aby określić, czy wymagane jest uaktualnienie oprogramowania wewnętrznego DAE. Należy pamiętać, że począwszy od DDOS 7.5 wprowadzono udoskonalenie umożliwiające aktualizację oprogramowania wewnętrznego DAE online, eliminując ten problem.
-
W celu omówienia czynników, które mogą mieć wpływ na czas aktualizacji, można skontaktować się z działem pomocy technicznej firmy Dell. W zależności od systemu operacyjnego klienta, aplikacji oraz protokołu między klientem a systemem HA, czasami może zajść konieczność ręcznego wznowienia obciążeń roboczych klienta zaraz po przełączeniu awaryjnym. Jeśli na przykład w przypadku klientów DDBoost czas przełączania awaryjnego przekracza 10 minut, upłynie limit czasu klienta i użytkownik musi ręcznie wznowić obciążenia robocze. Jednak zwykle na klientach dostępne są opcje dostosowywane umożliwiające ustawienie wartości limitu czasu i czasy ponawiania prób.
-
Należy pamiętać, że usługa DDFS nie działa w okresie przełączania awaryjnego. Obserwując dane wyjściowe polecenia „filesys status” w uaktualnionym węźle, można ustalić, czy usługa DDFS została wznowiona, czy nie. Oczekuje się, że DDOS w wersji 7.4 i nowszej będzie miał coraz mniej przestojów ze względu na ulepszenia kodu DDOS.
Po przełączeniu awaryjnym poprzednio aktywny węzeł zostanie uaktualniony. Po zastosowaniu uaktualnienia zostanie on uruchomiony ponownie do nowej wersji, a następnie ponownie dołączy do klastra HA jako węzeł w trybie gotowości. Ten proces nie wpływa na usługę DDFS, ponieważ została ona już wznowiona w kroku nr II powyżej.
Weryfikacja:
- Po zakończeniu stopniowej aktualizacji trzeba przejść do GUI logowania za pośrednictwem adresu IP węzła w trybie gotowości. W tym przypadku jest to węzeł 1.
- Sprawdź, czy nie ma nieoczekiwanych alertów.
- W tym momencie stopniowa aktualizacja zakończyła się pomyślnie.
Stopniowa aktualizacja za pośrednictwem CLI:
Przygotuj system do aktualizacji:
- System HA musi mieć stan „highly available”.
#ha status
HA System name: HA-system
HA System status: highly available ç
Node Name Node id Role HA State
----------------------------- ------- ------- --------
Node0 0 active online
Node1 1 standby online
----------------------------- ------- ------- --------
- Plik RPM DDOS należy umieścić w aktywnym węźle, a aktualizacja powinna rozpocząć się od tego węzła.
#ha status
HA System name: HA-system
HA System status: highly available
Node Name Node id Role HA State
----------------------------- ------- ------- --------
Node0 0 active online ß Node0 is active node
Node1 1 standby online
----------------------------- ------- ------- --------
- Prześlij plik RPM do aktywnego węzła
Client-server # scp <rpm file> sysadmin@HA-system.active_node:/ddr/var/releases/
Password: (customer defined it.)
(From client server, target path is “/ddr/var/releases”)
Active-node # system package list
File Size (KiB) Type Class Name Version ------------------ ---------- ------ ---------- ----- ------- x.x.x.x-12345.rpm 2927007.3 System Production DD OS x.x.x.x ------------------ ---------- ------ ---------- ----- -------
- Uruchom sprawdzanie wstępne na aktywnym węźle. W przypadku wystąpienia jakiegokolwiek błędu uaktualnienie powinno zostać przerwane.
Active-node # system upgrade precheck <rpm file>
Upgrade precheck in progress:
Node 0: phase 1/1 (Precheck 100%) , Node 1: phase 1/1 (Precheck 100%)
Upgrade precheck found no issues.
Przed rozpoczęciem uaktualniania (krok nr 6) należy również wyłączyć GC, przenoszenie danych i replikację, aby te zadania nie prowadziły do dłuższego czasu zamykania DDFS podczas uaktualniania. Krótszy czas wyłączenia DDFS pomoże zminimalizować wpływ na klientów. Te obciążenia robocze nie mają wpływu na operacje tworzenia kopii zapasowych/przywracania klientów. W zależności od potrzeb usługi te można wznowić po zakończeniu uaktualnienia za pomocą odpowiednich poleceń włączania. Więcej szczegółów można znaleźć w podręczniku administracyjnym.
Active-node # filesys clean stop
Active-node # cloud clean stop
Active-node # data-movement suspend
Active-node # data-movement stop to-tier active
Active-node # replication disable all
Zauważ, że istnieje kilka poleceń „watch” do sprawdzania, czy powyższe operacje zostały wykonane.
Active-node # filesys clean watch
Active-node # cloud clean watch
Active-node # data-movement watch
W podręczniku administracyjnym opisano kilka innych ręcznych kontroli i poleceń, które nie są bezwzględnie konieczne dla systemu HA. Jako test dla systemów z jednym węzłem obecnie sugeruje się wykonanie zadania przed ponownym uruchomienie. Nie jest to konieczne w przypadku systemów HA, ponieważ krok nr 5 „ha failover” poniżej obejmuje już automatyczne ponowne uruchomienie podczas procesu przełączania awaryjnego.
- Opcjonalnie. Przed uruchomieniem stopniowej aktualizacji zaleca się dwukrotne ręczne przełączenie awaryjne systemu HA w aktywnym węźle. Celem jest przetestowanie funkcji przełączania awaryjnego. Operacja spowoduje ponowne uruchomienie aktywnego węzła, o czym należy pamiętać.
Najpierw przygotuj się do przełączenia awaryjnego, wyłączając GC, przenoszenie danych i replikację. Te usługi nie mają wpływu na obciążenia robocze tworzenia kopii zapasowych/przywracania klientów. Następnie wykonaj operację „ha failover”.
Robi się to za pomocą następujących poleceń:
Active-node # filesys clean stop
Active-node # cloud clean stop
Active-node # data-movement suspend
Active-node # data-movement stop to-tier active
Active-node # replication disable all
Zauważ, że istnieje kilka poleceń „watch” do sprawdzania, czy powyższe operacje zostały wykonane.
Active-node # filesys clean watch
Active-node # cloud clean watch
Active-node # data-movement watch
Następnie uruchom polecenie przełączania awaryjnego:
Active-node # ha failoverThis operation will initiate a failover from this node. The local node will reboot.
Do you want to proceed? (yes|no) [no]: yes
Failover operation initiated. Run 'ha status' to monitor the status
(Gdy stan systemu HA ponownie stanie się „highly available”, wykonaj drugą operację „ha failover” i poczekaj, aż oba węzły będą w trybie online)
Po przełączeniu awaryjnym systemu HA można wznowić zatrzymane usługi przy użyciu odpowiednich poleceń włączania. Aby uzyskać więcej informacji, zapoznaj się z podręcznikiem administracyjnym.
Powyższe testy przełączania awaryjnego są opcjonalne i nie trzeba ich przeprowadzać bezpośrednio przed aktualizacją. Testy przełączania awaryjnego można przeprowadzić przed aktualizacją, na przykład dwa tygodnie wcześniej, aby można było wykorzystać krótszą przerwę konserwacyjną na późniejszą aktualizację. Czas przestoju usługi DDFS dla każdego przełączania awaryjnego wynosi około 10 minut (mniej więcej, w zależności od wersji DDOS i kilku innych czynników). DDOS w wersji 7.4 i nowszej będzie miał mniej przestojów ze względu na ciągłe udoskonalenia oprogramowania DDOS.
- Jeśli sprawdzanie wstępne zakończyło się bez żadnych problemów, kontynuuj stopniową aktualizację w aktywnym węźle.
Active-node # system upgrade start <rpm file> The 'system upgrade' command upgrades the Data Domain OS. File access
is interrupted during the upgrade. The system reboots automatically
after the upgrade.
Are you sure? (yes|no) [no]: yes ok, proceeding. Upgrade in progress: Node Severity Issue Solution ---- -------- ------------------------------ -------- 0 WARNING 1 component precheck script(s) failed to complete 0 INFO Upgrade time est: 60 mins 1 WARNING 1 component precheck script(s) failed to complete 1 INFO Upgrade time est: 80 mins ---- -------- ------------------------------ -------- Node 0: phase 2/4 (Install 0%) , Node 1: phase 1/4 (Precheck 100%) Upgrade phase status legend: DU : Data Upgrade FO : Failover .. PC : Peer Confirmation VA : Volume Assembly Node 0: phase 3/4 (Reboot 0%) , Node 1: phase 4/4 (Finalize 5%) FO Upgrade has started. System will reboot.
Dostępność DDFS podczas wykonywania powyższego polecenia:
-
Najpierw uaktualni węzeł w trybie gotowości, a następnie uruchomi go ponownie do nowej wersji. Zajmuje to około 20 do 30 minut w zależności od różnych czynników. Usługa DDFS jest włączona i działa w tym okresie na aktywnym węźle bez pogorszenia wydajności.
-
Po zastosowaniu nowego systemu DDOS system przełączy awaryjnie usługę DDFS do uaktualnionego węzła w trybie gotowości. Zajmuje to około 10 minut (mniej więcej, w zależności od różnych czynników).
-
Jednym z istotnych czynników jest aktualizacja oprogramowania wewnętrznego DAE. Może to wydłużyć przestój o ~20 minut w zależności od liczby skonfigurowanych DAE. Zapoznaj się z artykułem w bazie wiedzy „Data Domain: Stopniowa aktualizacja HA może zakończyć się niepowodzeniem w przypadku aktualizacji oprogramowania wewnętrznego obudowy zewnętrznej”, aby określić, czy wymagane jest uaktualnienie oprogramowania wewnętrznego DAE. Należy pamiętać, że począwszy od DDOS 7.5 wprowadzono udoskonalenie umożliwiające aktualizację oprogramowania wewnętrznego DAE online, eliminując ten problem.
-
W celu omówienia czynników, które mogą mieć wpływ na czas aktualizacji, można skontaktować się z działem pomocy technicznej firmy Dell. W zależności od systemu operacyjnego klienta, aplikacji oraz protokołu między klientem a systemem HA, czasami może zajść konieczność ręcznego wznowienia obciążeń roboczych klienta zaraz po przełączeniu awaryjnym. Jeśli na przykład w przypadku klientów DDBoost czas przełączania awaryjnego przekracza 10 minut, upłynie limit czasu klienta i użytkownik musi ręcznie wznowić obciążenia robocze. Jednak zwykle na klientach dostępne są opcje dostosowywane umożliwiające ustawienie wartości limitu czasu i czasy ponawiania prób.
-
-
Po przełączeniu awaryjnym poprzednio aktywny węzeł zostanie uaktualniony. Po zastosowaniu uaktualnienia zostanie on uruchomiony ponownie do nowej wersji, a następnie ponownie dołączy do klastra HA jako węzeł w trybie gotowości. Ten proces nie wpływa na usługę DDFS, ponieważ została ona już wznowiona w kroku nr II powyżej.
- Po ponownym uruchomieniu węzła w trybie gotowości (węzeł 1) i uzyskaniu dostępu można zalogować się do węzła w trybie gotowości w celu monitorowania stanu/postępu aktualizacji.
Node1 # system upgrade status
Current Upgrade Status: DD OS upgrade In Progress
Node 0: phase 3/4 (Reboot 0%)
Node 1: phase 4/4 (Finalize 100%) waiting for peer confirmation
- Poczekaj na zakończenie stopniowej aktualizacji. Do tego czasu nie należy wyzwalać żadnej operacji przełączania awaryjnego HA.
Node1 # system upgrade status
Current Upgrade Status: DD OS upgrade Succeeded
End time: 20xx.xx.xx:xx:xx
- Sprawdź, czy stan HA obu węzłów to „online”, a stan systemu HA to „highly available”.
Node1 # ha status detailed
HA System name: HA-system
HA System Status: highly available
Interconnect Status: ok
Primary Heartbeat Status: ok
External LAN Heartbeat Status: ok
Hardware compatibility check: ok
Software Version Check: ok
Node Node1:
Role: active
HA State: online
Node Health: ok
Node Node0:
Role: standby
HA State: online
Node Health: ok
Mirroring Status:
Component Name Status
-------------- ------
nvram ok
registry ok
sms ok
ddboost ok
cifs ok
-------------- ------
Weryfikacja:
- Sprawdź, czy oba węzły mają tę samą wersję DDOS.
Node1 # system show version
Data Domain OS x.x.x.x-12345
Node0 # system show version
Data Domain OS x.x.x.x-12345
- Sprawdź, czy nie ma nieoczekiwanych alertów.
Node1 # alert show current
Node0 # alert show current
- W tym momencie stopniowa aktualizacja zakończyła się pomyślnie.
Uwaga: W przypadku wystąpienia jakichkolwiek problemów z uaktualnieniem należy skontaktować się z działem pomocy technicznej Data Domain, aby uzyskać dalsze instrukcje i wsparcie.
UAKTUALNIENIE LOKALNE dla pary DDHA:
Uaktualnienie lokalne działa zasadniczo w następujący sposób:
Przygotuj system do aktualizacji:
- Sprawdź stan systemu HA. Nawet jeśli stan to „degraded”, uaktualnienie lokalne może działać w tej sytuacji.
#ha status HA System name: HA-system HA System status: highly available <- Node Name Node id Role HA State ----------------------------- ------- ------- -------- Node0 0 active online Node1 1 standby online ----------------------------- ------- ------- --------
- Plik RPM DDOS należy umieścić w obu węzłach, a aktualizacja powinna rozpocząć się od węzła w trybie gotowości.
#ha status
HA System name: HA-system
HA System status: highly available
Node Name Node id Role HA State
----------------------------- ------- ------- --------
Node0 0 active online
Node1 1 standby online <- Node1 is standby node
----------------------------- ------- ------- --------
- Prześlij plik RPM do obu węzłów.
Client-server # scp <rpm file> sysadmin@HA- system.active_node:/ddr/var/releases/
Client-server # scp <rpm file> sysadmin@HA-system.standby_node:/ddr/var/releases/
Password: (customer defined it.)
(From client server, target path is “/ddr/var/releases”)
Active-node # system package list File Size (KiB) Type Class Name Version ------------------ ---------- ------ ---------- ----- ------- x.x.x.x-12345.rpm 2927007.3 System Production DD OS x.x.x.x ------------------ ---------- ------ ---------- ----- ------ Standby-node # system package list File Size (KiB) Type Class Name Version ------------------ ---------- ------ ---------- ----- ------- x.x.x.x-12345.rpm 2927007.3 System Production DD OS x.x.x.x ------------------ ---------- ------ ---------- ----- ------
- Uruchom sprawdzanie wstępne na aktywnym węźle, jeśli stan HA to „highly available”. W przypadku wystąpienia jakiegokolwiek błędu uaktualnienie powinno zostać przerwane.
Active-node # system upgrade precheck <rpm file>
Upgrade precheck in progress: Node 0: phase 1/1 (Precheck 100%) , Node 1: phase 1/1 (Precheck 100%) Upgrade precheck found no issues.
Jeśli stan HA to „degraded”, należy wykonać sprawdzanie wstępne na obu węzłach.
Active-node # system upgrade precheck <rpm file> local
Upgrade precheck in progress:
Node 0: phase 1/1 (Precheck 100%)
Upgrade precheck found no issues.
Standby-node # system upgrade precheck <rpm file> local
Upgrade precheck in progress:
Node 1: phase 1/1 (Precheck 100%)
Upgrade precheck found no issues.
- Przełącz węzeł w trybie gotowości rezerwowy w tryb offline.
Standby-node # ha offline
This operation will cause the ha system to no longer be highly available.
Do you want to proceed? (yes|no) [no]: yes
Standby node is now offline.
(UWAGA: Jeśli operacja w trybie offline nie powiodła się lub stan HA to „degraded”, kontynuuj uaktualnienie lokalne, ponieważ wykonanie kolejnych kroków może wyeliminować błędy).
- Węzeł w trybie gotowości musi mieć stan „offline”.
Standby-node # ha status
HA System name: HA-system
HA System status: degraded
Node Name Node id Role HA State
----------------------------- ------- ------- --------
Node1 1 standby offline
Node0 0 active degraded
----------------------------- ------- ------- --------
- Przeprowadź aktualizację w węźle w trybie gotowości. Ta operacja wywoła ponowne uruchomienie węzła w trybie gotowości.
The 'system upgrade' command upgrades the Data Domain OS. File access
is interrupted during the upgrade. The system reboots automatically
after the upgrade.
Are you sure? (yes|no) [no]: yes
ok, proceeding.
The 'local' flag is highly disruptive to HA systems and should be used only as a repair operation.
Are you sure? (yes|no) [no]: yes
ok, proceeding.
Upgrade in progress:
Node 1: phase 3/4 (Reboot 0%)
Upgrade has started. System will reboot.
- Węzeł w trybie gotowości uruchomi się ponownie z nową wersją DDOS, ale pozostanie w trybie offline.
- Sprawdź stan aktualizacji systemu. Uaktualnianie systemu operacyjnego może potrwać ponad 30 minut.
Standby-node # system upgrade status
Current Upgrade Status: DD OS upgrade Succeeded
End time: 20xx.xx.xx:xx:xx
- Sprawdź, czy stan HA węzła w trybie gotowości (w tym przypadku to węzeł 1) to „offline”, a stan systemu HA to „degraded”.
Standby-node # ha status
HA System name: HA-system
HA System status: degraded
Node Name Node id Role HA State
----------------------------- ------- ------- --------
Node1 1 standby offline
Node0 0 active degraded
----------------------------- ------- ------- --------
- Wykonaj uaktualnienie lokalne w aktywnym węźle. Ta operacja spowoduje ponowne uruchomienie aktywnego węzła.
Active-node # system upgrade start <rpm file> local
The 'system upgrade' command upgrades the Data Domain OS. File access
is interrupted during the upgrade. The system reboots automatically
after the upgrade.
Are you sure? (yes|no) [no]: yes
ok, proceeding.
The 'local' flag is highly disruptive to HA systems and should be used only as a repair operation.
Are you sure? (yes|no) [no]: yes
ok, proceeding.
Upgrade in progress:
Node Severity Issue Solution
---- -------- ------------------------------ --------
0 WARNING 1 component precheck
script(s) failed to complete
0 INFO Upgrade time est: 60 mins
---- -------- ------------------------------ --------
Node 0: phase 3/4 (Reboot 0%)
Upgrade has started. System will reboot.
- Sprawdź stan aktualizacji systemu. Uaktualnianie systemu operacyjnego może potrwać ponad 30 minut.
Active-node # system upgrade status
Current Upgrade Status: DD OS upgrade Succeeded
End time: 20xx.xx.xx:xx:xx
- Po zakończeniu uaktualniania aktywnego węzła stan systemu HA to nadal „degraded”. Wykonaj następujące polecenie, aby przełączyć węzeł w trybie gotowości w tryb online, co spowoduje ponowne uruchomienie węzła w trybie gotowości.
Standby-node # ha online The operation will reboot this node. Do you want to proceed? (yes|no) [no]: yes Broadcast message from root (Wed Oct 14 22:38:53 2020): The system is going down for reboot NOW! **** Error communicating with management service.(UWAGA: Jeśli w poprzednich krokach nie uruchomiono polecenia „ha offline”, zignoruj ten krok)
- Węzeł w trybie gotowości uruchomi się ponownie i ponownie dołączy do klastra. Wtedy stan systemu HA ponownie przyjmie wartość „highly available”.
Active-node # ha status detailed
HA System name: Ha-system
HA System Status: highly available
Interconnect Status: ok
Primary Heartbeat Status: ok
External LAN Heartbeat Status: ok
Hardware compatibility check: ok
Software Version Check: ok
Node node0:
Role: active
HA State: online
Node Health: ok
Node node1:
Role: standby
HA State: online
Node Health: ok
Mirroring Status:
Component Name Status
-------------- ------
nvram ok
registry ok
sms ok
ddboost ok
cifs ok
-------------- ------
Weryfikacja:
- Sprawdź, czy oba węzły mają tę samą wersję DDOS.
Node1 # system show version
Data Domain OS x.x.x.x-12345
Node0 # system show version
Data Domain OS x.x.x.x-12345
- Sprawdź, czy nie ma nieoczekiwanych alertów.
Node1 # alert show current
Node0 # alert show current
- W tym momencie stopniowa aktualizacja zakończyła się pomyślnie.
Additional Information
Stopniowa aktualizacja:
-
Należy pamiętać, że podczas uaktualniania zostaje wykonane jedno przełączenie awaryjne, więc role się zamienią
-
Informacje o uaktualnieniu są nadal przechowywane w dzienniku infra.log, ale w dzienniku ha.log mogą pojawić się dodatkowe informacje
-
Postęp aktualizacji można monitorować za pomocą funkcji monitorowania aktualizacji systemu
Uaktualnienie węzła lokalnego:
-
Uaktualnienie węzła lokalnego nie wykonuje przełączenia awaryjnego HA
-
W rezultacie podczas aktualizacji / uruchamiania / wykonywania czynności aktualizacyjnych po ponownym uruchomieniu aktywnego węzła nastąpi długi przestój, co prawdopodobnie spowoduje przekroczenie limitu czasu i niepowodzenie tworzenia/przywracania kopii zapasowych. Wymagaj przydzielenia serwisowego okna czasowego dla uaktualnienia lokalnego.
-
Nawet jeśli stan systemu HA to „degraded”, można kontynuować lokalne uaktualnianie.
-
Z jakiegoś powodu stopniowa aktualizacja może nieoczekiwanie zakończyć się niepowodzeniem. W tej sytuacji za metodę naprawy można uznać uaktualnienie lokalne.