PowerStore: DP 메모리 부족으로 인해 PowerStoreOS 4.0.x로의 업그레이드(NDU) 실패
요약: NVMe 확장 인클로저 OOM(메모리 부족) 해결 방법이 구현된 어플라이언스에서 DP 메모리 부족으로 인해 PowerStoreOS 3.6 미만 버전에서 PowerStoreOS 4.0.x로의 업그레이드(NDU)가 실패할 수 있습니다.
증상
- NVMe 확장 인클로저가 설치된 PowerStore 어플라이언스
- PowerStoreOS가 3.6.x 이하 버전입니다.
- KBA PowerStore에 대한 NVMe 확장 인클로저 OOM(메모리 부족) 해결 방법: KBA에 제공된 스크립트를 사용하여 NVMe 확장 인클로저가 구현된 어플라이언스에서 예기치 않은 노드 재부팅이 발생할 수 있습니다. cyc-dp-mem-override.txt 파일의 존재로 표시되는 svc_reduce_dp_mem_allocation(NVMe 확장 인클로저)가 있는 어플라이언스에서 메모리 할당을 조정하는 방법
Live Analysis (as service user): ls -al /cyc_var/cyc-cfg.txt.d/
DC Analysis: ls -ail node_*/cyc_var/cyc-cfg.txt.d/
node_a/cyc_var/cyc-cfg.txt.d/:
total 79
7899986223 drwxrwsr-x 2 stormr eql_diag_group_data 41 Dec 3 05:31 ./
7879617078 drwxrwsr-x 23 stormr eql_diag_group_data 4082 Dec 3 05:31 ../
7850319521 -rwxrwxr-x 1 stormr eql_diag_group_data 42 Dec 3 05:31 cyc-dp-mem-override.txt*
node_b/cyc_var/cyc-cfg.txt.d/:
total 79
7861150504 drwxrwsr-x 2 stormr eql_diag_group_data 41 Dec 3 05:14 ./
7895530462 drwxrwsr-x 22 stormr eql_diag_group_data 3635 Dec 3 05:21 ../
7903976575 -rwxrwxr-x 1 stormr eql_diag_group_data 42 Dec 3 05:14 cyc-dp-mem-override.txt*
시나리오 1:
많은 Indus 드라이브가 구성되어 있고 재정의 DP 메모리가 예상 DP 메모리 예산보다 낮은 경우. DP 메모리가 부족하여 PowerStoreOS 버전 4.0.x로의 NDU(PowerStoreOS 업그레이드)가 실패하고 새 코드를 실행하는 노드에서 DP가 시작되지 않습니다. 이 시나리오에서는 NDU가 실패하고 롤백이 성공합니다.
시나리오 2:
재정의 DP 메모리가 4.0.x의 예상 DP 메모리 예산보다 약간 낮으면 DP가 시작되고 NDU가 성공할 수 있습니다. 그러나 나중에 DP 구성이 변경되면 DP가 오프라인 상태가 될 수 있습니다.
시나리오 3:
재정의 DP 메모리가 4.0.x의 예상 DP 메모리 용량을 초과하는 경우 나중에 NVMe 확장 인클로저에 드라이브가 더 추가되면 노드에서 NVMe OOM 상태가 발생할 수 있습니다.
원인
PowerStoreOS 4.0.x로 업그레이드하는 동안 KBA PowerStore에 대한 OOM 해결 방법이 다음과 같은 경우: NVMe 확장 인클로저가 감지된 어플라이언스에서 예기치 않은 노드 재부팅이 발생할 수 있습니다. /cyc_var/cyc-cfg.txt.d/cyc-dp-mem-override.txt 파일 이름이 바뀝니다. /cyc_var/cyc-cfg.txt.d/cyc-dp-mem-override.txt.bak PLT 업그레이드 중. 그러나 코드 문제로 인해 파일이 계속 실행되므로 4.0.x 코드를 실행할 때 DP 메모리 재정의가 계속 적용됩니다. 따라서 DP 메모리가 부족하여 DP를 시작하지 못하면 NDU가 실패합니다.
해결
NDU 오류가 발생한 경우의 해결 방법:
NDU 장애가 발생한 경우 Dell 기술 지원 부서로 에스컬레이션하고 이 기술 자료 문서를 참조하여 두 노드 모두에서 /cyc_var/cyc-cfg.txt.d/cyc-dp-mem-override.txt 파일을 제거하고 UI에서 NDU를 다시 시도하기 위한 POA에 대한 지원을 받으십시오.
해결 방법: NDU 전에 cyc-dp-mem-override.txt 파일이 있는 것으로 확인되는 경우:
옵션 1:
Dell 기술 지원 부서로 에스컬레이션하고 이 기술 자료 문서를 참조하여 지원을 요청합니다. cyc-dp-mem-override.txt 파일은 PowerStoreOS 4.0.x로 예약된 업그레이드 직전에 제거해야 합니다.
옵션 2:
최신 3.6.1.x 코드로 업그레이드한 다음 4.0.x 코드로 업그레이드하여 2단계 업그레이드를 수행합니다.
수정:
이 문제는 PowerStoreOS 4.1.0.0-2435323에서 해결되었습니다. 4.1.0.0-2435323으로의 업그레이드는 이 문제에 노출되지 않습니다.