Data Domain: HA(High Availability) 시스템용 OS 업그레이드 가이드

摘要: DDHA(Data Domain "Highly Availability") 어플라이언스에서 DDOS(Data Domain Operation System) 업그레이드를 위한 프로세스 개요입니다.

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

说明

HA 시스템 계획된 유지 보수

계획된 유지 보수 다운타임을 줄이기 위해 시스템 롤링 업그레이드가 HA 아키텍처에 포함되어 있습니다. 점진적 업그레이드로 인해 대기 노드가 먼저 업그레이드된 다음 예상 HA 페일오버를 사용하여 서비스를 활성 노드에서 대기 노드로 이동할 수 있습니다. 마지막으로 이전 활성 노드가 업그레이드되고 HA 클러스터를 대기 노드로 다시 연결합니다. 모든 프로세스는 하나의 명령으로 수행됩니다.
대체 수동 업그레이드 방법은 "로컬 업그레이드"입니다. 먼저 대기 노드를 수동으로 업그레이드한 다음 액티브 노드를 수동으로 업그레이드합니다.  마지막으로 대기 노드가 HA 클러스터에 다시 연결됩니다. 로컬 업그레이드는 정기적인 업그레이드 또는 문제 해결을 위해 수행할 수 있습니다.
활성 노드의 모든 시스템 업그레이드 작업에는 반드시 데이터 전환이 수행되며 두 시스템이 동일한 수준으로 업그레이드되고 HA 상태가 완전히 복원될 때까지 업그레이드 작업이 시작되지 않을 수 있습니다.


DDOS 5.7 이상은 HA 시스템의 두 가지 업그레이드 방법을 지원합니다.
  • 롤링 업그레이드 - 하나의 명령으로 두 HA 노드를 자동으로 업그레이드합니다. 업그레이드 후 서비스가 다른 노드로 이동됩니다.

  • 로컬 업그레이드 - HA 노드를 하나씩 수동으로 업그레이드합니다. 서비스는 업그레이드 후 동일한 노드에 유지됩니다.

 

GUI를 통한 롤링 업그레이드:

업그레이드를 위해 시스템을 준비합니다.

  1. HA 시스템 상태가 '고가용성'인지 확인하십시오.

 Login GUI  à Home à Dashboard

Dashboard 페이지
  1. DDOS RPM 파일은 액티브 노드에 배치하고 이 노드에서 업그레이드를 시작해야 합니다.
- 액티브 노드를 찾는 방법:
  Login GUI  à Home à Dashboard

Dashboard 페이지               
 
  1. 액티브 노드에 RPM 파일 업로드
Login GUI  à Maintenance à System à UPLOAD UPGRADE PACKAGE 버튼 클릭

 Maintenance 페이지 
업로드 후 업그레이드 패키지 버튼을 클릭하면 RPM 파일이 나열됩니다.
 
  1. 활성 노드에서 사전 검사를 실행하십시오. 오류가 발생하면 업그레이드를 중단해야 합니다.
Login GUI  à Maintenance à System à RPM 업그레이드 파일 클릭 à UPGRADE PRECHECK 클릭

 System 페이지 
 

         업그레이드를 시작하기 전에 GC, 데이터 이동, 복제를 종료하십시오(6단계). 이렇게 하면 업그레이드 중에 DDFS 종료 시간이 길어지지 않습니다. DDFS 종료 시간이 짧을수록 클라이언트에 미치는 영향을 최소화할 수 있습니다. 이러한 워크로드는 클라이언트 백업/복원 작업에 영향을 주지 않습니다.

         필요에 따라 업그레이드가 완료된 후 해당 활성 명령을 사용하여 이러한 서비스를 재개할 수 있습니다. 자세한 내용은 관리 가이드를 참조하십시오.

         HA 시스템에는 엄격하게 필요하지 않은 다른 수동 검사 및 명령이 관리 가이드에 설명되어 있습니다. 현재 단일 노드 시스템에 대한 테스트로 사전 재부팅이 권장되고 있습니다. 아래의 #5 "ha failover"에는 이미 페일오버 프로세스 중에 자동 재부팅이 포함되어 있으므로 HA 시스템에는 사전 재부팅이 필요하지 않습니다.

  1. 선택 사항 롤링 업그레이드를 실행하기 전에 액티브 노드에서 HA 페일오버를 수동으로 두 번 수행하는 것이 좋습니다. 그 목적은 페일오버 기능을 테스트하는 것입니다. 작업을 수행하면 액티브 노드가 재부팅됩니다. 주의하십시오.

   
              먼저 GC, 데이터 이동, 복제를 종료하여 페일오버를 준비합니다. GUI를 통해 수행하는 방법은 관리 가이드를 참조하십시오. 이러한 서비스는 클라이언트 백업/복원 워크로드에 영향을 주지 않습니다. 그런 다음 "ha failover"를 진행합니다.
 

Login GUI  à Health à High Availability à Failover to XXX 클릭


(HA 시스템 상태가 다시 'highly available'이 되면 두 번째 'ha failover'를 실행하고 두 노드가 모두 온라인 상태가 될 때까지 기다리십시오.)

 

HA 페일오버 후 해당 활성화 명령을 사용하여 중지된 서비스를 재개할 수 있습니다. 자세한 내용은 관리 가이드를 참조하십시오.

위의 페일오버 테스트는 선택 사항이며 업그레이드 직전에 수행할 필요가 없습니다. 페일오버 테스트는 업그레이드 전에(예: 2주) 수행할 수 있으므로 이후 업그레이드 시에는 유지 보수 기간을 단축할 수 있습니다. 각 페일오버에 대한 DDFS 서비스 중단 시간은 약 10분(DDOS 버전과 기타 요인에 따라 더 짧거나 더 길 수 있음)입니다. DDOS 버전 7.4 이상에서는 지속적인 DDOS SW 개선 사항으로 인해 릴리스별로 다운타임이 줄어듭니다.

 

      단계별 업그레이드 절차
  1. 사전 검사가 문제 없이 완료된 경우 액티브 노드에서 롤링 업그레이드를 진행합니다.
Login GUI  à Maintenance à System à 업그레이드 RPM 파일 클릭 à PERFORM SYSTEM UPGRADE 클릭
 
 System 페이지
  1. 롤링 업그레이드가 완료될 때까지 기다립니다. 그 전에 HA 페일오버 작업을 트리거하지 마십시오.

위 명령 중 DDFS 가용성:

  1. 대기 노드를 먼저 업그레이드하고 새 버전으로 재부팅합니다. 다양한 요인에 따라 약 20분에서 30분 정도 소요됩니다. DDFS 서비스가 가동되어 이 기간 동안 성능 저하 없이 액티브 노드에서 작동합니다.

  2. 새 DDOS가 적용된 후 시스템은 DDFS 서비스를 업그레이드된 대기 노드로 페일오버합니다. 약 10분 정도 소요됩니다(다양한 요인에 따라 더 적거나 더 많을 수 있음).

    1. 한 가지 중요한 요소는 DAE FW 업그레이드입니다. 구성된 DAE 수에 따라 최대 20분 더 많은 다운타임이 발생할 수 있습니다. DAE FW 업그레이드가 필요한지 확인하려면 KB "Data Domain: 외부 인클로저 펌웨어가 업그레이드된 경우 HA 롤링 업그레이드가 실패할 수 있음"을 참조하십시오. DDOS 7.5부터는 온라인 업그레이드 DAE FW를 활성화할 수 있게 개선되어 이 문제가 해결되었습니다.

    2. Dell 지원 부서에 연락하여 업그레이드 시간에 영향을 미칠 수 있는 요인에 대해 논의할 수 있습니다. 클라이언트 OS, 애플리케이션 및 클라이언트와 HA 시스템 간의 프로토콜에 따라 달라지며, 사용자가 페일오버 직후 클라이언트 워크로드를 수동으로 재개해야 하는 경우가 있습니다. 예를 들어 DDBoost 클라이언트를 사용하는 경우 페일오버 시간이 10분 이상이면 클라이언트가 시간 초과되어 사용자가 워크로드를 수동으로 재개해야 합니다. 그러나 일반적으로 클라이언트에서 시간 초과 값과 재시도 시간을 설정할 수 있습니다. 

페일오버 기간 동안 DDFS 서비스가 중단됩니다. 업그레이드된 노드에서 "filesys status" 명령 출력을 확인하면 DDFS 서비스가 재개되었는지 여부를 알 수 있습니다. 7.4 이상의 DDOS 버전은 DDOS 코드 개선으로 인해 다운타임이 점점 줄어들 것으로 예상됩니다.

페일오버 후 이전 액티브 노드가 업그레이드됩니다.  업그레이드가 적용되면 새 버전으로 재부팅된 다음 HA 클러스터를 대기 노드로 다시 연결합니다. DDFS 서비스는 위의 #II에서 이미 재개되었으므로 이 프로세스 중에 영향을 받지 않습니다.


     확인:
  1. 롤링 업그레이드가 완료되면 사전 대기 노드의 IP 주소를 통한 로그인 GUI가 필요합니다(이 경우 노드 1).
Login GUI  à Maintenance à System à Upgrade History 확인
 System 페이지
  1. 예기치 않은 알림이 있는지 확인하십시오.
Login GUI  à Dashboard à Alerts
  1. 이 시점에서 롤링 업그레이드가 성공적으로 완료되었습니다.

CLI를 통한 롤링 업그레이드:
      업그레이드를 위해 시스템을 준비합니다.
  1. HA 시스템 상태가 'highly available'인지 확인하십시오.
#ha status
     
     HA System name:       HA-system   

     HA System status:     highly available         ç
     Node Name                       Node id   Role      HA State
     -----------------------------   -------   -------   --------
     Node0   0         active    online   
     Node1   1         standby   online
     -----------------------------   -------   -------   --------
  1. DDOS RPM 파일은 액티브 노드에 배치하고 이 노드에서 업그레이드를 시작해야 합니다.
- 액티브 노드를 찾는 방법:
 
#ha status

 
      HA System name:       HA-system   
      HA System status:     highly available
      Node Name                       Node id   Role      HA State
      -----------------------------   -------   -------   --------
      Node0   0         active    online    ß Node0 is active node
      Node1   1         standby   online
      -----------------------------   -------   -------   --------
  1. 액티브 노드에 RPM 파일 업로드
Client-server # scp <rpm file> sysadmin@HA-system.active_node:/ddr/var/releases/
Password: (customer defined it.)

(From client server, target path is “/ddr/var/releases”)
            "scp" 명령이 완료되면 시스템 패키지 정보를 확인합니다.
     Active-node # system package list

     File                 Size (KiB)   Type     Class        Name    Version
     ------------------   ----------   ------   ----------   -----   -------
     x.x.x.x-12345.rpm    2927007.3   System   Production   DD OS   x.x.x.x
     ------------------   ----------   ------   ----------   -----  -------         
  1. 활성 노드에서 사전 검사를 실행하십시오. 오류가 발생하면 업그레이드를 중단해야 합니다.
Active-node # system upgrade precheck <rpm file>

     Upgrade precheck in progress:
     Node 0: phase 1/1 (Precheck 100%) , Node 1: phase 1/1 (Precheck 100%)
     Upgrade precheck found no issues.

     업그레이드를 시작하기 전에 GC, 데이터 이동, 복제를 종료하십시오(6단계). 이렇게 하면 업그레이드 중에 DDFS 종료 시간이 길어지지 않습니다. DDFS 종료 시간이 짧을수록 클라이언트에 미치는 영향을 최소화할 수 있습니다. 이러한 워크로드는 클라이언트 백업/복원 작업에 영향을 주지 않습니다. 필요에 따라 업그레이드가 완료된 후 해당 활성화 명령을 사용하여 이러한 서비스를 재개할 수 있습니다. 자세한 내용은 관리 가이드를 참조하십시오.
      
Active-node # filesys clean stop
   Active-node # cloud clean stop
   Active-node # data-movement suspend
   Active-node # data-movement stop to-tier active
   Active-node # replication disable all

       

     위의 작업이 완료되었는지 확인하는 몇 가지 "watch" 명령이 있습니다.
      Active-node # filesys clean watch 
   Active-node # cloud clean watch
   Active-node # data-movement watch


      HA 시스템에는 엄격하게 필요하지 않은 다른 수동 검사 및 명령이 관리 가이드에 설명되어 있습니다. 현재 단일 노드 시스템에 대한 테스트로 사전 재부팅이 권장됩니다. 아래의 #5 "ha failover"에는 이미 페일오버 프로세스 중에 자동 재부팅이 포함되어 있으므로 HA 시스템에는 사전 재부팅이 필요하지 않습니다.

  1. 선택 사항. 롤링 업그레이드를 실행하기 전에 액티브 노드에서 HA 페일오버를 수동으로 두 번 수행하는 것이 좋습니다. 그 목적은 페일오버 기능을 테스트하는 것입니다. 작업을 수행하면 액티브 노드가 재부팅됩니다. 주의하십시오.

        먼저 GC, 데이터 이동, 복제를 비활성화하여 페일오버를 준비합니다. 이러한 서비스는 클라이언트 백업/복원 워크로드에 영향을 주지 않습니다. 그런 다음 "ha failover"를 실행합니다.

       ha failover를 실행하는 명령은 다음과 같습니다.
          
Active-node # filesys clean stop
     Active-node # cloud clean stop
     Active-node # data-movement suspend
     Active-node # data-movement stop to-tier active
     Active-node # replication disable all

        위의 작업이 완료되었는지 확인하는 몇 가지 "watch" 명령이 있습니다.
          
Active-node # filesys clean watch 
     Active-node # cloud clean watch
     Active-node # data-movement watch

        그런 다음 failover 명령을 실행합니다.

Active-node # ha failover
          This operation will initiate a failover from this node. The local node will reboot.
      Do you want to proceed? (yes|no) [no]: yes
    Failover operation initiated. Run 'ha status' to monitor the status

(HA 시스템 상태가 다시 'highly available'이 되면 두 번째 'ha failover'를 실행하고 두 노드가 모두 온라인 상태가 될 때까지 기다리십시오.)

HA 페일오버 후 해당 활성화 명령을 사용하여 중지된 서비스를 재개할 수 있습니다. 자세한 내용은 관리 가이드를 참조하십시오.
위의 페일오버 테스트는 선택 사항이며 업그레이드 직전에 수행할 필요가 없습니다. 페일오버 테스트는 업그레이드 전에(예: 2주) 수행할 수 있으므로 이후 업그레이드 시에는 유지 보수 기간을 단축할 수 있습니다. 각 페일오버에 대한 DDFS 서비스 중단 시간은 약 10분(DDOS 버전과 기타 요인에 따라 더 짧거나 더 길 수도 있음)입니다. DDOS 버전 7.4 이후부터는 지속적인 DDOS SW 개선으로 인해 릴리스마다 다운타임이 줄어들 것입니다. 

  

      단계별 업그레이드 절차      
  1. 사전 검사가 문제 없이 완료된 경우 액티브 노드에서 롤링 업그레이드를 진행합니다.
             Active-node # system upgrade start <rpm file>

      'system upgrade' 명령은 Data Domain OS를 업그레이드합니다.  파일 액세스가
      업그레이드 중에 중단됩니다.  업그레이드 후 시스템이 자동으로
      재부팅됩니다.
              Are you sure? (yes|no) [no]: yes
      ok, proceeding.
      Upgrade in progress:
      Node   Severity   Issue                           Solution
      ----   --------   ------------------------------  --------
      0      WARNING    1 component precheck
         script(s) failed to complete
      0      INFO       Upgrade time est: 60 mins
      1      WARNING    1 component precheck
          script(s) failed to complete
      1      INFO       Upgrade time est: 80 mins
      ----   --------   ------------------------------  --------
      Node 0: phase 2/4 (Install    0%) , Node 1: phase 1/4 (Precheck 100%)
      Upgrade phase status legend:
      DU : Data Upgrade
      FO : Failover
      ..               
      PC : Peer Confirmation
      VA : Volume Assembly

      Node 0: phase 3/4 (Reboot     0%) , Node 1: phase 4/4 (Finalize   5%) FO
      Upgrade has started.  System will reboot.   

        

       위 명령 중 DDFS 가용성:

  1. 대기 노드를 먼저 업그레이드하고 새 버전으로 재부팅합니다. 다양한 요인에 따라 약 20분에서 30분 정도 소요됩니다. DDFS 서비스가 가동되어 이 기간 동안 성능 저하 없이 액티브 노드에서 작동합니다.

  2. 새 DDOS가 적용된 후 시스템은 DDFS 서비스를 업그레이드된 대기 노드로 페일오버합니다. 약 10분 정도 소요됩니다(다양한 요인에 따라 더 적거나 더 많을 수 있음).

    1. 한 가지 중요한 요소는 DAE FW 업그레이드입니다. 구성된 DAE 수에 따라 최대 20분 더 많은 다운타임이 발생할 수 있습니다. DAE FW 업그레이드가 필요한지 확인하려면 KB "Data Domain: 외부 인클로저 펌웨어가 업그레이드된 경우 HA 롤링 업그레이드가 실패할 수 있음"을 참조하십시오. DDOS 7.5부터는 온라인 업그레이드 DAE FW를 활성화할 수 있게 개선되어 이 문제가 해결되었습니다.

    2. Dell 지원 부서에 연락하여 업그레이드 시간에 영향을 미칠 수 있는 요인에 대해 논의할 수 있습니다. 클라이언트 OS, 애플리케이션 및 클라이언트와 HA 시스템 간의 프로토콜에 따라 달라지며, 사용자가 페일오버 직후 클라이언트 워크로드를 수동으로 재개해야 하는 경우가 있습니다. 예를 들어 DDBoost 클라이언트를 사용하는 경우 페일오버 시간이 10분 이상이면 클라이언트가 시간 초과되어 사용자가 워크로드를 수동으로 재개해야 합니다. 그러나 일반적으로 클라이언트에서 시간 초과 값과 재시도 시간을 설정할 수 있습니다. 

  1. 페일오버 후 이전 액티브 노드가 업그레이드됩니다.  업그레이드가 적용되면 새 버전으로 재부팅된 다음 HA 클러스터를 대기 노드로 다시 연결합니다. DDFS 서비스는 위의 #II에서 이미 재개되었으므로 이 프로세스 중에 영향을 받지 않습니다.

페일오버 기간 동안 DDFS 서비스가 중단됩니다. 업그레이드된 노드에서 "filesys status" 명령 출력을 확인하면 DDFS 서비스가 재개되었는지 여부를 알 수 있습니다. 7.4 이상의 DDOS 버전은 DDOS 코드 개선으로 인해 다운타임이 점점 줄어들 것으로 예상됩니다.
  1. 대기 노드(node1)가 재부팅되고 액세스할 수 있게 되면 대기 노드에 로그인하여 업그레이드 상태/진행률을 모니터링할 수 있습니다.
Node1 # system upgrade status
Current Upgrade Status: DD OS upgrade In Progress
Node 0: phase 3/4 (Reboot     0%)
Node 1: phase 4/4 (Finalize 100%) waiting for peer confirmation
  1. 롤링 업그레이드가 완료될 때까지 기다립니다. 그 전에 HA 페일오버 작업을 트리거하지 마십시오.
Node1 # system upgrade status
Current Upgrade Status: DD OS upgrade Succeeded
End time: 20xx.xx.xx:xx:xx
  1. HA 상태를 확인하십시오. 두 노드가 모두 온라인 상태이고 HA 시스템 상태가 'highly available'인지 확인하십시오.
Node1 # ha status detailed
HA System name:               HA-system
HA System Status:             highly available
Interconnect Status:          ok
Primary Heartbeat Status:      ok
External LAN Heartbeat Status: ok
Hardware compatibility check: ok
Software Version Check:       ok
Node  Node1:
      Role:          active
      HA State:      online
      Node Health: ok
Node Node0:
      Role:          standby
      HA State:      online
      Node Health: ok
Mirroring Status:
Component Name   Status
--------------   ------
nvram            ok
registry         ok
sms              ok
ddboost          ok
cifs             ok
--------------   ------
            

     확인:
  1. 두 노드의 DDOS 버전이 동일한지 확인하십시오.
Node1 # system show version
Data Domain OS x.x.x.x-12345
Node0 # system show version                  
Data Domain OS x.x.x.x-12345
  1. 예기치 않은 알림이 있는지 확인하십시오.
Node1 # alert show current
Node0 # alert show current
  1. 이 시점에서 롤링 업그레이드가 성공적으로 완료되었습니다. 

참고: 업그레이드에 문제가 있는 경우 Data Domain 지원 팀에 문의하여 추가 지침 및 지원을 받으십시오.


DDHA 쌍에 대한 로컬 업그레이드: 
로컬 업그레이드는 다음과 같이 광범위하게 작동합니다.

      업그레이드를 위해 시스템을 준비합니다.

  1. HA 시스템 상태를 확인합니다. 상태가 저하되더라도 로컬 업그레이드를 통해 이 상황을 개선할 수 있습니다.

     #ha status
     HA System name:       HA-system   
     HA System status:     highly available   <-      
     Node Name                       Node id   Role      HA State
     -----------------------------   -------   -------   --------
     Node0   0         active    online   
     Node1   1         standby   online
     -----------------------------   -------   -------   --------

  1. DDOS RPM 파일은 두 노드 모두에 배치해야 하며 업그레이드는 대기 노드에서 시작해야 합니다.
- 대기 노드를 찾는 방법:
#ha status
HA System name:       HA-system   
HA System status:     highly available
Node Name                       Node id   Role      HA State
-----------------------------   -------   -------   --------
Node0   0         active    online   
Node1   1         standby   online   <- Node1 is standby node
-----------------------------   -------   -------   --------
  1. 두 노드 모두에 RPM 파일을 업로드합니다.
       Client-server # scp <rpm file> sysadmin@HA-  system.active_node:/ddr/var/releases/
Client-server # scp <rpm file> sysadmin@HA-system.standby_node:/ddr/var/releases/
Password: (customer defined it.)

(From client server, target path is “/ddr/var/releases”)
 
            "scp" 명령이 완료되면 시스템 패키지 정보를 확인합니다.
     Active-node # system package list
     File                 Size (KiB)   Type     Class        Name    Version
     ------------------   ----------   ------   ----------   -----   -------
     x.x.x.x-12345.rpm    2927007.3   System   Production   DD OS   x.x.x.x
     ------------------   ----------   ------   ---------- -----   ------       
     Standby-node # system package list
     File                 Size (KiB)   Type     Class        Name    Version
     ------------------   ----------   ------   ----------   -----   -------
     x.x.x.x-12345.rpm    2927007.3   System   Production   DD OS   x.x.x.x
     ------------------   ----------   ------   ----------   -----   ------
  1. HA 상태가 'highly available'인 경우 액티브 노드에서 사전 검사를 실행하십시오. 오류가 발생하면 업그레이드를 중단해야 합니다.
            Active-node # system upgrade precheck <rpm file>

      Upgrade precheck in progress:
      Node 0: phase 1/1 (Precheck 100%) , Node 1: phase 1/1 (Precheck 100%)
      Upgrade precheck found no issues.

            HA 상태가 "degraded"인 경우 두 노드 모두에서 사전 검사를 수행해야 합니다.

            Active-node # system upgrade precheck <rpm file> local
      Upgrade precheck in progress:

      Node 0: phase 1/1 (Precheck 100%)
      Upgrade precheck found no issues.

      Standby-node # system upgrade precheck <rpm file> local
      Upgrade precheck in progress:

      Node 1: phase 1/1 (Precheck 100%)
      Upgrade precheck found no issues.    
      
     단계별 업그레이드 절차   
     
  1. 대기 노드를 오프라인 상태로 전환하십시오.
            Standby-node # ha offline
      This operation will cause the ha system to no longer be highly  available.
      Do you want to proceed? (yes|no) [no]: yes
      Standby node is now offline.

           (참고: 오프라인 작업이 실패했거나 ha 상태가 저하된 경우 로컬 업그레이드를 계속하십시오. 이후 단계에서 장애를 처리할 수 있기 때문입니다.)
  1. 대기 노드 상태가 오프라인 상태인지 확인합니다.
       Standby-node # ha status
    HA System name:       HA-system
    HA System status:     degraded
    Node Name                       Node id   Role      HA State
    -----------------------------   -------   -------   --------
    Node1   1         standby   offline
    Node0   0         active    degraded
    -----------------------------   -------   -------   --------
    1. 대기 노드에서 업그레이드를 수행합니다. 이 작업은 대기 노드 재부팅을 호출합니다.
             Standby-node # system upgrade start <rpm file> local
        The 'system upgrade' command upgrades the Data Domain OS.  File access
        is interrupted during the upgrade.  The system reboots automatically
        after the upgrade.
                Are you sure? (yes|no) [no]: yes
        ok, proceeding.
        The 'local' flag is highly disruptive to HA systems and should be used only as a repair operation.
               Are you sure? (yes|no) [no]: yes
        ok, proceeding.
        Upgrade in progress:
        Node 1: phase 3/4 (Reboot     0%)
        Upgrade has started.  System will reboot.
    1. 대기 노드가 새 버전의 DDOS로 재부팅되지만 오프라인 상태로 유지됩니다.
    2. 시스템 업그레이드 상태를 확인하십시오. OS 업그레이드를 완료하는 데 30분 이상 걸릴 수 있습니다.
                 Standby-node # system upgrade status
          Current Upgrade Status: DD OS upgrade Succeeded
          End time: 20xx.xx.xx:xx:xx
    1. HA 시스템 상태, 대기 노드(이 경우 노드 1)가 오프라인 상태이고 HA 상태가 'degraded'인지 확인하십시오.
                 Standby-node # ha status
          HA System name:       HA-system
          HA System status:     degraded
          Node Name                       Node id   Role      HA State
          -----------------------------   -------   -------   --------
          Node1   1         standby   offline
          Node0   0         active    degraded
          -----------------------------   -------   -------   --------
    1. 액티브 노드에서 로컬 업그레이드를 수행합니다. 이 작업은 활성 노드를 재부팅합니다.
            Active-node # system upgrade start <rpm file> local
        The 'system upgrade' command upgrades the Data Domain OS.  File access
        is interrupted during the upgrade.  The system reboots automatically
        after the upgrade.
                   Are you sure? (yes|no) [no]: yes
        ok, proceeding.
        The 'local' flag is highly disruptive to HA systems and should be used        only as a repair operation.
                   Are you sure? (yes|no) [no]: yes
        ok, proceeding.
        Upgrade in progress:
        Node   Severity   Issue                           Solution
        ----   --------   ------------------------------  --------
        0      WARNING    1 component precheck
                 script(s) failed to complete
        0      INFO       Upgrade time est: 60 mins
        ----   --------   ------------------------------  --------
        Node 0: phase 3/4 (Reboot     0%)
        Upgrade has started.  System will reboot.
    1. 시스템 업그레이드 상태를 확인하십시오. OS 업그레이드를 완료하는 데 30분 이상 걸릴 수 있습니다.
             Active-node # system upgrade status
        Current Upgrade Status: DD OS upgrade Succeeded
        End time: 20xx.xx.xx:xx:xx
    1. 액티브 노드 업그레이드가 완료된 후에도 HA 시스템 상태는 여전히 저하됩니다. 대기 노드를 온라인 상태로 만들기 위해 다음 명령을 실행합니다. 그러면 대기 노드가 재부팅됩니다.
             Standby-node # ha online
        The operation will reboot this node.
            Do you want to proceed? (yes|no) [no]: yes
        Broadcast message from root (Wed Oct 14 22:38:53 2020):
        The system is going down for reboot NOW!
        **** Error communicating with management service.
        (참고: 이전 단계에서 'ha offline'이 실행되지 않은 경우 이       단계를 무시하십시오.)
    1. 대기 노드가 재부팅되고 클러스터에 다시 연결됩니다. 그런 다음 HA 상태가 다시 'highly available'로 바뀝니다.
              Active-node # ha status detailed
         HA System name:               Ha-system
         HA System Status:             highly available
         Interconnect Status:          ok
         Primary Heartbeat Status:      ok
         External LAN Heartbeat Status: ok
         Hardware compatibility check: ok
         Software Version Check:       ok
         Node node0:
                   Role:          active
                   HA State:      online
                   Node Health: ok
         Node node1:
                   Role:          standby
                   HA State:      online
                   Node Health: ok
         Mirroring Status:
         Component Name   Status
         --------------   ------
         nvram            ok
         registry         ok
         sms              ok
         ddboost          ok
         cifs             ok
         --------------   ------

    확인:
    1. 두 노드의 DDOS 버전이 동일한지 확인하십시오.
           Node1 # system show version
       Data Domain OS x.x.x.x-12345
       Node0 # system show version                  
       Data Domain OS x.x.x.x-12345
    1. 예기치 않은 알림이 있는지 확인하십시오.
           Node1 # alert show current
       Node0 # alert show current
    1. 이 시점에서 롤링 업그레이드가 성공적으로 완료되었습니다.
               
    참고: 업그레이드에 문제가 있는 경우 Data Domain 지원 팀에 문의하여 추가 지침 및 지원을 받으십시오.

    其他信息

    롤링 업그레이드:

    • 업그레이드 중에 단일 페일오버가 수행되므로 역할이 바뀝니다.

    • 업그레이드 정보는 infra.log에 계속 보관되지만 ha.log에 추가 정보가 있을 수 있습니다.

    • 시스템 업그레이드 감시를 통해 업그레이드 진행 상황을 모니터링할 수 있습니다. 

    로컬 노드 업그레이드:

    • 로컬 노드 업그레이드가 HA 페일오버를 수행하지 않음

    • 따라서 활성 노드가 업그레이드/재부팅/업그레이드 후 작업을 수행하는 동안 다운타임이 연장되어 백업/복원이 시간 초과되고 실패할 수 있습니다. 로컬 업그레이드를 위해 유지 보수 기간을 할당해야 합니다.

    • HA 시스템 상태가 'degraded'인 경우에도 로컬 업그레이드를 진행할 수 있습니다.

    • 어떤 이유로 롤링 업그레이드가 예기치 않게 실패할 수 있습니다. 이 상황에서는 로컬 업그레이드를 수정 방법으로 고려할 수 있습니다.

       

    受影响的产品

    Data Domain

    产品

    Data Domain, DD OS
    文章属性
    文章编号: 000009653
    文章类型: How To
    上次修改时间: 07 10月 2025
    版本:  8
    从其他戴尔用户那里查找问题的答案
    支持服务
    检查您的设备是否在支持服务涵盖的范围内。